Un algoritmo para descifrar la piedra de Rosetta
Los sistemas de traducci¨®n autom¨¢tica pueden ayudar a los ling¨¹istas a comprender lenguas muertas. Por el momento, han conseguido traducir tablillas mic¨¦nicas de hace m¨¢s de tres mil a?os
Una de las joyas m¨¢s preciadas del Museo Brit¨¢nico es una piedra de poco m¨¢s de un metro de alto por 75 cent¨ªmetros de ancho que pesa m¨¢s de 700 kilos. Una piedra que, a diferencia de buena parte de las obras de arte que alberga la galer¨ªa, no est¨¢ esculpida, sino tallada. La piedra de Rosetta no es famosa por su est¨¦tica ni por su contenido literario, sino por lo que signific¨® para descifrar los jerogl¨ªficos egipcios. A partir de un texto tallado con tres sistemas de escritura diferentes, fue posible construir un alfabeto fon¨¦tico de caracteres jerogl¨ªficos que se convirti¨® en un inestimable punto de partida para la posterior transliteraci¨®n de estos s¨ªmbolos egipcios.
Para el ser humano, fue necesario contar con una transcripci¨®n del mismo texto utilizando tres sistemas de escritura, pero, para una m¨¢quina, tal vez no sea necesaria tanta informaci¨®n. Los sistemas de traducci¨®n autom¨¢tica evolucionan a un ritmo imparable gracias a la inteligencia artificial y al machine learning. Aunque su funci¨®n principal es indiscutible ¡ªayudar a las personas a comunicarse con quienes hablan o escriben en un idioma diferente al suyo¡ª, tambi¨¦n pueden ser de utilidad para descifrar lenguas de las que ya no se conocen interlocutores.
Un equipo de investigadores del laboratorio de inteligencia artificial de Google en Mountain View (California) ha desarrollado un sistema de aprendizaje autom¨¢tico capaz de traducir lenguas muertas. Su mayor hallazgo ha sido descifrar, por primera vez de forma autom¨¢tica, el sistema de escritura lineal B, aunque para ello han recurrido a t¨¦cnicas muy diferentes de las que utilizan habitualmente los algoritmos de traducci¨®n simult¨¢nea.
- ?Lineal qu¨¦?
Para entender de qu¨¦ estamos hablando, empecemos por presentar a sir Arthur Evans, un arque¨®logo brit¨¢nico que, en 1900, desenterr¨® el Palacio de Cnosos en Creta. All¨ª encontr¨® multitud de tablillas y piedras con inscripciones que supon¨ªan los primeros vestigios de dos sistemas de escritura extintos: lineal A, que se utiliz¨® entre 1800 y 1400 antes de Cristo; y lineal B, que se emple¨® despu¨¦s de esta fecha.
Por mucho que Evans y otros expertos trataran una y otra vez de descifrar ambos lenguajes, fue Michael Ventris, un arquitecto aficionado a la ling¨¹¨ªstica, quien, medio siglo m¨¢s tarde, fue capaz de dar sentido al sistema lineal B. Su punto de partida fue que algunas de las palabras que m¨¢s se repet¨ªan en el vocabulario de este sistema eran top¨®nimos cretenses y que las graf¨ªas representaban una forma temprana del griego antiguo. Su trabajo fue un gran ¨¦xito, pero, hasta la fecha, nadie ha sido capaz de descifrar lineal A. ?Podr¨¢n hacerlo alg¨²n d¨ªa las m¨¢quinas?
Los algoritmos de Google consiguieron descifrar los textos escritos en lineal B con un 67,3% de precisi¨®n. No obstante, hay que reconocer que part¨ªan con cierta ventaja: sab¨ªan que esta escritura codifica una versi¨®n temprana del griego antiguo. El caso de lineal A, con el que no se han atrevido todav¨ªa, es m¨¢s complejo, ya que no se conoce que idioma codifica este sistema y, sin un punto de partida, la inteligencia artificial todav¨ªa no puede hacer demasiado. La ventaja del enfoque inform¨¢tico es que la m¨¢quina podr¨ªa probar con diferentes idiomas una y otra vez hasta encontrar una aproximaci¨®n que tenga cierto sentido. Pero, una vez que lo encuentre, ?c¨®mo har¨¢ para descifrarlo?
- ?C¨®mo traduce un algoritmo una lengua muerta?
Los algoritmos pueden trabajar con enormes bases de datos de distintos idiomas que pueden comparar, un proceso del que aprenden a medida que avanzan y del que pueden sacar conclusiones interesantes. Como consecuencia de esto, la traducci¨®n se ha convertido para las m¨¢quinas en una tarea rutinaria que constituye en s¨ª misma una nueva manera de pensar sobre el lenguaje.
Como explican en la revista MIT Technology Review, la gran idea que persiste detr¨¢s de la traducci¨®n autom¨¢tica es comprender que las palabras est¨¢n relacionadas entre s¨ª de manera similar, independientemente del idioma involucrado. El proceso de aprendizaje de la m¨¢quina comienza en la b¨²squeda de patrones en un lenguaje espec¨ªfico. El sistema procesa millones de l¨ªneas de texto y detecta pautas, como la frecuencia con la que aparece una palabra junto a otra. Esto sit¨²a cada palabra en un marco, como un vector dentro de un espacio, restringiendo la forma en la que puede aparecer en una oraci¨®n.
Estos vectores, se?alan desde el MIT, obedecen reglas matem¨¢ticas simples. Reglas que designan g¨¦nero y n¨²mero (un actor con el rasgo femenino es una actriz; con el rasgo plural, hablaremos de actrices), relaciones entre palabras (un padre requiere de la existencia de un hijo; un verbo transitivo, de la existencia de sujeto y complemento directo) y otras cuestiones que permiten enmarcar cada palabra en un espacio muy similar independientemente del idioma que empleemos. Con este enfoque, los algoritmos pueden traducir oraciones encontrando trayectorias similares en el espacio sin tener por qu¨¦ saber lo que significan.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
?Tienes una suscripci¨®n de empresa? Accede aqu¨ª para contratar m¨¢s cuentas.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.