Google Translate: fortalezas y l¨ªmites de la amenaza que los traductores convirtieron en herramienta
El uso de la inteligencia artificial hace que los textos se entiendan en su contexto, pero puede generar sesgos y distorsiones
Como profeta, Warren Weaver era malo, pero como estratega era un genio. Cuando en los a?os 50, este matem¨¢tico estadounidense vaticin¨® que las m¨¢quinas ser¨ªan capaces de traducir autom¨¢ticamente en el plazo de cinco a?os sus colegas arquearon la ceja. Y los inversores aflojaron la cartera. Puede que Weaver se viniera arriba, pero lo hizo con un prop¨®sito: conseguir que le financiaran una investigaci¨®n que hoy a¨²n se est¨¢ perfeccionando: la traducci¨®n autom¨¢tica.
El pasado mes de enero, Google anunci¨® que su servicio de traducci¨®n, Google Translate, ser¨¢ capaz de realizar traducci¨®n simult¨¢nea oral. Este hito conseguir¨ªa que dos personas se entendieran hablando distintos idiomas sin necesidad de escribir previamente lo que quieren traducir, como hasta ahora. Los cascos de la compa?¨ªa ser¨¢n capaces de susurrarnos al o¨ªdo en nuestra lengua todo lo que se habla, pongamos, en un bar de Jakarta. Se cumple as¨ª una de las predicciones con las que lleva d¨¦cadas fantaseando la ciencia ficci¨®n, desde Star Trek hasta Gu¨ªa para el autoestopista gal¨¢ctico. Los inversores y los compradores ya est¨¢n listos para aflojar la cartera, pero en esta ocasi¨®n los expertos no han mostrado sorpresa alguna. La traducci¨®n autom¨¢tica lleva un par de lustros cambiando la forma de entender (y de entenderse en) el mundo. Esto es solo un paso m¨¢s.
Las declaraciones de Weaver dieron el pistoletazo de salida, y el anuncio de Google podr¨ªa suponer el esprint final en una marat¨®n que dura ya 80 a?os. Los traductores autom¨¢ticos detectan 180 lenguas, hacen que podamos leer (a¨²n sin mucha precisi¨®n) toda la web, limitan las situaciones de incomunicaci¨®n en los viajes y prometen un futuro que difumine las barreras ling¨¹¨ªsticas, culturales e incluso de clase. Pero antes de analizar las potencialidades futuras merece la pena analizar los riesgos presentes.
¡°Si no lo sabes usar, Google Translate puede hacer que hables peor ingl¨¦s¡±, confirma Celia Rico, experta en tecnolog¨ªas de la traducci¨®n de la Universidad Europea de Madrid. ¡°Se basa en un corpus de palabras y estas pueden ser limitadas, degenerando el lenguaje. No podemos limitarnos a usarlo pensando que todo lo que sale de ah¨ª es perfecto¡±. Rico es traductora, pero su aseveraci¨®n no surge de una rivalidad mal entendida. De hecho ella lleva 30 a?os estudiando la traducci¨®n autom¨¢tica con pasi¨®n. ¡°Todo el mundo nos imagina con una pluma y un diccionario, pero la de traductor es una profesi¨®n muy tecnol¨®gica¡±, explica con sorna. ¡°Casi todos usamos herramientas de traducci¨®n autom¨¢tica, nos hacen el trabajo m¨¢s f¨¢cil, lo que pasa es que hay que saber usarlas¡±.
Entonces, ?c¨®mo deber¨ªamos usar Google Translate? ¡°Si es sobre un idioma que conocemos nos puede servir como una primera pasada, casi como inspiraci¨®n¡±, asegura Rico. ¡°Tambi¨¦n nos puede ayudar si no conocemos ciertas palabras¡±. A partir de aqu¨ª hay que revisar, modificar y pulir el texto. Y esto, concluye la traductora, no lo puede hacer una m¨¢quina.
El hacedor de la m¨¢quina, ir¨®nicamente, se muestra de acuerdo. Desde Google insisten en que su herramienta no va a sustituir jam¨¢s la labor de un buen traductor, y cuando se le pide un consejo para los usuarios anuncian: ¡°Google Translate funciona mejor cuando se trata de fragmentos cortos de texto, como men¨²s, letreros o art¨ªculos, y puede resultar muy ¨²til en conversaciones breves cuando necesitamos, por ejemplo, preguntar por una direcci¨®n, verificar qu¨¦ ingredientes lleva un plato o averiguar el precio de algo. No pretende reemplazar la fluidez en otro idioma¡±.
Otro extremo a tener en cuenta al usar esta herramienta es que las formas de expresarse difieren seg¨²n el idioma. ¡°Puede que la traducci¨®n sea exacta, pero muchas veces al leerla te das cuenta de que hay algo que no est¨¢ bien¡±, considera Rico. ¡°Por ejemplo, en el espa?ol nos explayamos m¨¢s sobre una misma idea, damos m¨¢s rodeos, mientras que el ingl¨¦s utiliza frases m¨¢s cortas y directas. La gente razona de forma distinta seg¨²n el idioma y esto se nota en la manera de estructurar los textos¡±. Ah¨ª es donde entra en juego la labor de un buen traductor, para cambiar la literalidad sin alterar el esp¨ªritu de un texto.
Carmen Torrijos lleva toda la vida dedicada a hacer que nos entendamos mejor. Antes lo hac¨ªa mediando entre personas de diferentes lenguas. Ahora lo hace mediando entre humanos y m¨¢quinas. Esta antigua traductora se ha reciclado en ling¨¹¨ªstica computacional, labor que ejerce para el Instituto de Ingenier¨ªa del Conocimiento. Por eso tiene una visi¨®n m¨¢s global de la traducci¨®n realizada por las m¨¢quinas. Para explicar su idea acerca de esta tecnolog¨ªa tira de una an¨¦cdota: ¡°En una ocasi¨®n pregunt¨¦ a Google Translate por la traducci¨®n exacta al ingl¨¦s de la expresi¨®n ¡°trata de personas¡±, y me respondi¨® ¡°Is about people¡± (¡±va sobre las personas¡±). Entonces acud¨ª al traductor DeepL, que respondi¨® ¡°human trafficking¡± (¡±tr¨¢fico de personas¡±). La diferencia era grande, pero ambas respuestas eran estrictamente v¨¢lidas ¡°Solo yo pod¨ªa decidir cu¨¢l era la correcta, porque conoc¨ªa el car¨¢cter del texto, el contexto y el cliente¡±. Por eso, ella recomienda hacer una lectura comprensiva del texto a traducir antes de darle al bot¨®n y confiar en que las m¨¢quinas hagan su magia.
La burocracia es la nueva piedra Rosetta
Esta magia, sin embargo, es cada vez m¨¢s sofisticada. En sus ¨²ltimas versiones los traductores autom¨¢ticos tienen en cuenta el contexto antes de traducir. ¡°Creo que el gran cambio sucedi¨® en 2014, cuando Google empez¨® a utilizar la red neuronal para la traducci¨®n¡±, reflexiona Rico. Hasta entonces, los traductores autom¨¢ticos se basaban en una traducci¨®n sint¨¢ctica y estad¨ªstica, entendiendo las palabras de forma aislada. El uso de la inteligencia artificial ha hecho que empiecen a entender los textos como un entero, poniendo en contexto los detalles.
Para conseguirlo, las empresas tecnol¨®gicas alimentan a los algoritmos con una enorme cantidad de textos traducidos a varios idiomas. Y buscando en las bases de datos disponibles han encontrado un fil¨®n en el rinc¨®n m¨¢s insospechado de internet: donde se apolilla la burocracia internacional. Los tratados de comercio, los protocolos de las Naciones Unidas o las leyes de la Uni¨®n Europea, escritas en decenas de idiomas de los pa¨ªses miembros, son el alimento perfecto para estos algoritmos. La burocracia es la nueva piedra Rosetta. Quiz¨¢ por eso los traductores autom¨¢ticos se muestran mucho m¨¢s fiables en el lenguaje formal y acad¨¦mico, y fallan m¨¢s a la hora de traducir expresiones y jerga callejera, que adem¨¢s est¨¢ en constante evoluci¨®n.
Esta forma de entrenar a los traductores autom¨¢ticos puede dar lugar a sesgos y distorsiones. ¡°Por ejemplo, si ha visto textos de pol¨ªtica para entrenar o aprender, traducir¨¢ bastante mal unos textos de medicina¡±, explica Marta R. Costa-Juss¨¤, investigadora de la Universidad Polit¨¦cnica de Catalu?a. ¡°Tambi¨¦n puede amplificar los sesgos de g¨¦nero¡±, opina. Un ejemplo: en ingl¨¦s, los nombres no tienen g¨¦nero, as¨ª que las profesiones son neutras. Pero a la hora de traducirlas a otras lenguas, por ejemplo a las de ascendencia latina, se les tiene que asignar un g¨¦nero. Y este reproduce lo que ha le¨ªdo en Internet. As¨ª, durante muchos a?os, los doctores han sido hombres y las enfermeras mujeres. En 2018, Google Translate corrigi¨® este problema a?adiendo una doble ventana con las traducciones en ambos g¨¦neros. Sin embargo, como denunciaba Algorithm Watch, algunos sesgos machistas han sobrevivido al cambio.
Otro de los efectos secundarios que tiene el alimentar a la inteligencia artificial con textos y audios disponibles en la red es la diferencia que hay entre idiomas. Obviamente no hay la misma cantidad de textos en kazajo de los que hay en japon¨¦s. Por lo tanto la traducci¨®n no funciona igual de bien. Esto se traslada, en menor medida, a lenguas intermedias. ¡°Los reconocedores de voz funcionan mejor en alem¨¢n que en finland¨¦s. La traducci¨®n autom¨¢tica entre ingl¨¦s y portugu¨¦s es significativamente mejor que la se puede dar entre holand¨¦s y espa?ol¡±, asegura Costa-Juss¨¤. Precisamente ella est¨¢ trabajando para que deje de ser as¨ª. No lo quiere conseguir a trav¨¦s de las palabras sino a trav¨¦s de los n¨²meros.
El proyecto LUNAR, que dirige Costa-Juss¨¤, pretende crear una especie de esperanto matem¨¢tico. ¡°Nuestra idea es encontrar una representaci¨®n matem¨¢tica del lenguaje, hablado y escrito¡±, explica la investigadora. ¡°Los sistemas actuales de traducci¨®n utilizan algoritmos de aprendizaje profundo que transforman el lenguaje en una representaci¨®n matem¨¢tica¡±. Lo que LUNAR pretende hacer es utilizar la capacidad de abstracci¨®n de estos algoritmos y conseguir una representaci¨®n universal del lenguaje. Reducir un idioma a una f¨®rmula. Esta representaci¨®n permitir¨¢ tener sistemas de traducci¨®n autom¨¢tica que mejoren la calidad de traducci¨®n de idiomas m¨¢s minoritarios en los que la traducci¨®n a¨²n no es muy buena. O como los llama Costa-Juss¨¤ ¡°idiomas de pocos recursos¡±.
Proyectos como LUNAR pretenden seguir rompiendo las barreras idiom¨¢ticas, pero no quieren (ni pueden) sustituir el proceso de aprender un idioma o la labor humana de traducirlo. La riqueza cultural, personal y ling¨¹¨ªstica que supone aprender una nueva lengua. Dec¨ªa Umberto Eco en su libro Dire quasi la stessa cosa (traducido por Google y por Debolsillo como Decir casi lo mismo) que la traducci¨®n es una cuesti¨®n de negociaci¨®n, no se puede reducir a un pu?ado de f¨®rmulas y algoritmos. Tampoco parece que sea esa la intenci¨®n de estas herramientas y de los investigadores que las mejoran. ¡°No buscamos reemplazar a los int¨¦rpretes y traductores o disuadir a alguien de aprender un nuevo idioma¡±, aseguran desde Google. ¡°Nos enfocamos en romper las barreras del idioma y facilitar la comunicaci¨®n de las personas. El lenguaje es m¨¢s que palabras, y apoyamos y alentamos de todo coraz¨®n el aprendizaje de nuevos idiomas y de diferentes culturas¡±.
Warren Weaver no solo era un gran estratega, tambi¨¦n fue un coleccionista voraz. El matem¨¢tico estaba obsesionado con Alicia en el pa¨ªs de las maravillas. Lleg¨® a acumular hasta 160 versiones del libro de Lewis Carroll en 42 lenguas distintas. Incluso escribi¨® un libro, Alice in many tongues, analizando la calidad de las versiones, centr¨¢ndose especialmente en lo que consideraba m¨¢s dif¨ªcil de traducir, los juegos de palabras y bromas l¨®gicas del Sombrerero Loco. Algo que, pensaba, jam¨¢s ser¨ªa capaz de traducir con soltura una m¨¢quina. De momento la realidad parece darle la raz¨®n. Aunque ya hemos dicho que como profeta, Weaver no fue especialmente bueno.
Puedes seguir a EL PA?S TECNOLOG?A RETINA en Facebook, Twitter, Instagram o suscribirte aqu¨ª a nuestra Newsletter.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.