
Aquí hemos hablado ya varias veces sobre protoindoeuropeo y sobre su evolución al latín y del latín al español (y, de pasada, a alguna otra lengua). Hoy vamos a hacernos detectives filológicos y jugar a la reconstrucción lingüística.
Cuando hablamos de protoindoeuropeo, hablamos de una lengua reconstruida, es decir, de la que no hay (ni habrá jamás) testimonios escritos. ¿Cómo podemos hablar de una lengua de la que no tenemos constancia de ningún tipo y que incluso es probable que nunca haya existido como tal (es decir, nunca haya habido una población que hablara protoindoeuropeo tal y como los eruditos lo han reconstruido)?
En los inicios de la lingüística indoeuropea, los estudiosos hubieron de enfrentarse a la reconstrucción de raíces de esta supuesta lengua.¿Cómo pudieron hacer eso?
Yendo hacia atrás, es decir, tomando palabras de lenguas actuales (o al menos testimoniadas) y comparándolas, estableciendo cambios regulares entre los sonidos de unas lenguas y otras y acordando la reconstrucción más plausible.
Hoy nosotros vamos a intentar emular a estos lingüistas. Como ni yo ni la mayoría de los presentes sabrán más de un puñado de idiomas, y aún menos sus respectivas evoluciones, tendremos que contentarnos con reconstruir latín a partir de palabras de las lenguas romances, que es más o menos equivalente a reconstruir el protoindoeuropeo a partir del latín, del griego clásico, del gótico, del protoeslavo, del avéstico, del hitita, etc.
Contenidos del artículo
Reconstrucción lingüística: ¿cómo era «caballo» en latín?
Además, haremos algo de trampas, porque sabemos que la palabra (vulgar) para «caballo» era caballus, caballi. Pero finjamos que no lo sabemos; finjamos que a día de hoy no se conserva ningún texto en latín (igual que no tenemos ningún texto en protoindoeuropeo) y queremos saber cómo se decía «caballo».
Para este menester tenemos que tomar las palabras que significan ‘caballo’ en las lenguas que sabemos que proceden del latín, por ejemplo:
- español: «caballo» [kaˈβaʝo]
- portugués: cavalo [kaˈvalu]
- italiano: cavallo [kaˈval:o]
- catalán: cavall [kaˈβaʎ]
- francés: cheval [ʃəˈval]
Más contenidos exclusivos, ¡gratis!
¿Te apasionan las lenguas? ¿Su historia y evolución? ¿Su cultura?
Envío un boletín diario con enlaces y recursos de lenguas. También te cuento mi vida de filólogo y lingüista.
No es el típico boletín aburrido que borras sin abrir porque te da pereza buscar el enlace para desuscribirte. Es gratis.
Comparación de las palabras en las lenguas hijas
Ahora tenemos que comparar todas las palabras y establecer semejanzas y diferencias. Para esto hay que fijarse principalmente en la pronunciación real, aunque la grafía también da pistas.
En primer lugar, podemos reconstruir la palabra latina tomando el sonido que más se repite entre las lenguas, lo cual nos dejaría con:
- [k] (solo el francés tiene un sonido distinto, [ʃ])
- [a] (solo el francés tiene un sonido distinto, [ə], históricamente [e], deducido a través de la grafía)
- [v] (solo el español y el catalán —por influencia del español— tienen un sonido distinto [β], pese a escribirse con ‹b› y ‹v›)
- [a]
- ‹ll› (aunque esta grafía represente sonidos distintos en español, italiano y catalán —[ʝ], [l:], [ʎ], respectivamente—, el hecho de que sea la misma es lo suficientemente significativo)
- [o] (solo el francés y el catalán la pierden, lo cual es normal en estas lenguas; el portugués brasileño [kaˈvalo] y la propia grafía con ‹o› nos indican que históricamente el portugués tenía una [o] también)
- el acento recae sobre la segunda sílaba (en francés porque además coincide que es la última)
Comprobación de los resultados
Por tanto, la reconstrucción sería *[kaˈval:o]. Ahora tendríamos que tratar de explicar las excepciones en cada lengua y ver si tienen sentido. Por no extendernos mucho, nos limitaremos un poco:
- La [ʃ] < *[k] del francés tiene sentido porque el fenómeno de palatalización es frecuente en las lenguas en general. Además, muchas otras palabras francesas tienen [ʃ] donde las demás tienen [k]: chien ↔ «can» ↔ cão ↔ cane; château ↔ «castillo» ↔ castelo ↔ castello.
- La ([ə] <) [e] < *[a] del francés podría tener sentido porque muchas otras palabras francesas tienen ([ə] <) [e] donde las demás tienen [a]: mer ↔ «mar» ↔ mar ↔ mare; cher ↔ «caro» ↔ caro ↔ caro. A priori, nada más habla a favor o en contra de este cambio.
- La [β] < *[v] del español (y del catalán por influencia de aquel) podría tener sentido porque muchas otras palabras españolas tienen [β] donde las demás tienen [v]. Sin embargo, el hecho de que [β] sea un sonido diacrónicamente inestable que suele evolucionar a [v] (y no al revés, es decir, [β] > [v] tiene sentido; [v] > [β], no) nos debería hacer saltar las alarmas: el español [β] probablemente no ha evolucionado de una supuesta *[v] latina, como hemos reconstruido.
Aunque la estadística (por inmensa mayoría) nos dice que *[kaˈval:o] sería la reconstrucción del latín «caballo», la viñeta anterior nos debe hacer dudar hasta el punto de que tendríamos que reconstruir *[kaˈβal:o], ya que es estadísticamente más débil, pero lingüísticamente más fuerte.
La relativa poca frecuencia del sonido [β] en las lenguas —cuestión de universales lingüísticos—, a su vez, nos debería hacer plantearnos si nuestra nueva reconstrucción es viable.
El sonido [β] suele proceder del debilitamiento de una [b] cuando esta va entre vocales; también [v] procede a menudo del debilitamiento de una [b] intervocálica. El sonido [b] es básico en la gran mayoría de las lenguas del mundo, por lo que tendría sentido que tanto la [β] española (y catalana) como la [v] de las otras lenguas hayan evolucionado desde una primitiva [b] latina.
🚯 ¿Te molesta la publicidad? ¡Aquí te digo cómo eliminarla!
Conclusión de nuestra reconstrucción
Esta vez sí, reconstruimos *[kaˈbal:o] (aquí ignoramos la cantidad de las vocales latinas e incluso la terminación ‑o < ‑um), es decir, con [b], no [β] ni [v]. Y como hemos estado haciendo algo de fullería, puesto que estábamos reconstruyendo una palabra que sí que sabemos cómo es, ahora podemos comparar y ver que, efectivamente, el latín ‹caballum› refleja [kaˈbal:um].
Alguno dirá que la grafía ‹b› del español nos habría ayudado a saber desde un principio que en latín era ‹caball‑›. Sin embargo, recordemos que la grafía con ‹b› fue restaurada etimológicamente por la RAE en el siglo XVIII, y la única razón era que la RAE sabía de antemano que en latín caballus, caballi era con ‹b›; si no lo hubiera sabido (como nosotros en este juego detectivesco), no podría haber restaurado nada (de hecho la grafía ‹cavallo› está documentada en el español más de 10 000 veces según el CORDE).
¡Por cierto! Puedes aprender mucho más con mis cursos de gramática histórica, latín, griego antiguo..., en los que explico de viva voz este y otros temas relacionados.
¿Eres estudiante de español como lengua extranjera o profesor de español (para extranjeros o nativos)? En ese caso te invito a EspañolPlus.com, mi academia para estudiantes de español de nivel avanzado, donde podrás encontrar completos contenidos para perfeccionar tu español de verdad. ¡Te espero allí!

Un ejercicio interesante. Las lenguas americanas suelen tener /kawaʝo/ o /kawaʎo/. El caso del mapudungun es sorprendente, es /kaweʎ/ o /kaweʎu/ a pesar de que el préstamo fue tomado por gente que usaba v y lo esperable habría sido */kavaʎu/ (*/kafaʎu/ en las variedades supervivientes, que tienen f y z frente a las v y d de la zona sometida de forma permanente por los españoles). Como otras palabras que en castellano tienen b pasan al mapudungun con p (napor < nabos, mempür/emperillu < membrillo, kapüra < cabra), se ha pensado que los conquistadores distinguían b de v o que incluso decían cauallo. Yo no sé qué creer, porque también hay ejemplos en contra, como awar < habas o wangku < banco (para sentarse, el financiero es un préstamo moderno y se dice fangku). Saludos. Roberto.
Muchas gracias por tu comentario, Roberto. Es muy instructivo y especialmente interesante por la rareza de esas lenguas.
Únicamente una aclaración: en mi variedad dialectal, castellano del Paraguay, se dice [kaˈβaʎo], no [kaˈβaʝo].
Claro, porque Paraguay es zona no yeísta. Pero la mayor parte de la población hispanohablante (incluyéndome) es yeísta: por eso lo pongo así 🙂
¿Estás seguro de eso? ¿No diréis más bien [ka’βajo]? Porque en España eso que tú dices es lo que afirman quienes se dicen no yeístas, cuando realmente sí lo son.
No. La inmensa mayoría de españoles usan la fricativa palatal sonora /ʝ/ tanto para ‹y› como para ‹ll› (yeísmo). La pronunciación como [j] es solo propia de zonas centroamericanas. Lo explico aquí. También lo puedes consultar en cualquier manual de fonología del español.
Te cito también algo más de Wikipedia: «En general, existe confusión entre la “y” consonántica, pronunciada [ʝ], [ɟ], [ʒ] o [ʃ], y la “ll”, originalmente [ʎ], salvo en diversas zonas de España (en regresión) y, en América, en el español paraguayo y en los dialectos con sustratos de lenguas en que existe dicha diferencia, como en las zonas bilingües español-quechua o español-aimara. Esta falta de distinción se conoce como yeísmo».