Los algoritmos que permiten recuperar idiomas perdidos
Un sistema de inteligencia artificial desarrollado por el MIT pretende descifrar lenguas desaparecidas y conocer m¨¢s sobre las personas que las hablaron
Los registros que han llegado a nuestros d¨ªas de los idiomas que se han perdido a lo largo de la historia son tan m¨ªnimos que la mayor¨ªa de las tecnolog¨ªas actuales no son capaces de descifrarlos. Algunos de los que se est¨¢n intentando recuperar coexistieron con el griego y el hebreo o son incluso m¨¢s antiguos. Los traductores autom¨¢ticos tradicionales, como el de Google, solo son eficientes para traducir palabras entre dos idiomas que siguen utiliz¨¢ndose: su forma de funcionar no sirve si queremos inferir informaci¨®n de lenguas que ya han desaparecido. Consciente de esta situaci¨®n, un equipo de investigadores del MIT lleva a?os trabajando en un sistema de inteligencia artificial capaz de descifrar lenguajes que ya no se usan, sin necesidad de conocimientos sobre su relaci¨®n con otros idiomas recientes.
Este estudio, cuentan los investigadores, ¡°no es una mera curiosidad acad¨¦mica: cuando se pierde un idioma, se pierde tambi¨¦n todo el conjunto de conocimientos sobre las personas que lo hablaron¡±. La mayor¨ªa de los que han existido ya no se hablan y otros, considerados ¡°muertos¡±, est¨¢n perdidos o no descifrados, es decir, no se sabe lo suficiente sobre su gram¨¢tica, vocabulario o sintaxis para poder comprender los textos. ¡°Desafortunadamente, la mayor¨ªa de ellos tienen registros tan m¨ªnimos que no tienen un lenguaje parecido o de la misma ¨¦poca con el que compararlos¡±, cuenta la profesora Regina Barzilay, una de las investigadoras del MIT. ¡°A menudo, carecen de separadores tradicionales como los espacios en blanco y la puntuaci¨®n¡±.
Estos son los problemas que se propuso resolver el equipo que lidera Barzilay del Laboratorio de Ciencias de la Computaci¨®n e Inteligencia Artificial del MIT (CSAIL). Los algoritmos que han dise?ado han sido capaces de descifrar autom¨¢ticamente un lenguaje perdido utilizando solo unos pocos miles de palabras (muchos menos datos de los que se usan habitualmente para entrenar a los algoritmos). Tambi¨¦n demostraron que su sistema puede determinar por s¨ª mismo las relaciones entre idiomas.
El equipo aplic¨® su algoritmo al castellano compar¨¢ndolo con el vasco y con otros candidatos de las familias romance, germ¨¢nica, turca y ur¨¢lica. Como resultado, encontraron que, aunque el vasco y el lat¨ªn estaban m¨¢s cerca del castellano que otros idiomas, todav¨ªa eran demasiado diferentes para considerarlos relacionados. Esta conclusi¨®n corrobora estudios recientes que sugieren que el castellano no est¨¢ relacionado con el vasco: el sistema de IA lleg¨® a la misma conclusi¨®n que los humanos.
?C¨®mo funciona exactamente?
Los programadores utilizaron nociones b¨¢sicas de ling¨¹¨ªstica cl¨¢sica, como el hecho de que los idiomas evolucionan de formas predecibles, para entrenar a los algoritmos. Por ejemplo, cuando var¨ªa la pronunciaci¨®n, es m¨¢s probable que se produzcan ciertas sustituciones de sonido que otras. "Una palabra con una p en el idioma principal puede evolucionar a una b en el idioma descendente, pero el cambio a una k es menos probable por lo diferente que suenan ambas letras", explica la profesora Barzilay. Con esta y otras instrucciones b¨¢sicas como punto de partida, desarrollaron un sistema capaz de analizar las transformaciones a partir de pocos datos de entrenamiento, lo cual era clave porque existen muy pocos datos de los idiomas que se quieren recuperar.??
Este proyecto es la continuaci¨®n de un estudio publicado el a?o pasado en el que los mismos investigadores consiguieron descifrar los idiomas muertos del ugar¨ªtico y el lineal B. Este ¨²ltimo empez¨® a utilizarse en torno al 1400 antes de Cristo y los humanos tardamos d¨¦cadas en descifrarlo. Sin embargo, una diferencia clave con ese proyecto fue que el equipo sab¨ªa que estos idiomas estaban relacionados con las primeras formas del hebreo y el griego, respectivamente. Con el nuevo sistema, el algoritmo infiere tambi¨¦n la relaci¨®n entre los idiomas.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.