El ingeniero que te permite hablar m¨¢s de 100 idiomas
Macduff Hughes lidera el equipo de desarrollo de Google Translate. El sistema utiliza patrones de millones de traducciones existentes en la web
Aprender un idioma cuesta. Esfuerzo, tiempo y, en ocasiones, tambi¨¦n dinero. Pero en pleno siglo XXI no siempre es necesario estudiar una lengua para poder comunicarse en cualquier parte del mundo. Basta con sacar el m¨®vil del bolsillo, abrir un traductor y escribir o dictar una frase. Inmediatamente despu¨¦s, como por arte de magia, el smartphone la traduce a casi cualquier idioma. El traductor m¨¢s popular es el de Google, que cada d¨ªa es utilizado por millones de usuarios en todo el mundo y es capaz de traducir m¨¢s de 100 idiomas. Pero detr¨¢s de esa magia que parece tener lugar dentro del terminal hay truco y se llama inteligencia artificial.
Para Macduff Hughes, director de ingenier¨ªa de Google Translate, el gran cambio en el modo en el que se realizan las traducciones se produjo en 2016. Fue entonces cuando Google incorpor¨® un sistema de traducci¨®n autom¨¢tica neuronal: "El antiguo m¨¦todo de traducci¨®n funcionaba frase por frase y palabra por palabra mientras que el nuevo coge la oraci¨®n completa". ¡°Este nuevo sistema es, parad¨®jicamente, mucho m¨¢s simple, ya que el anterior ten¨ªa en cuenta muchas reglas sobre c¨®mo unir frases y reordenar las palabras¡±, explica Hughes, que no concreta el n¨²mero de empleados que trabajan en su equipo.
Google Translate utiliza patrones de millones de traducciones existentes en la web para ayudar a decidir la mejor traducci¨®n. La cantidad de traducciones con la que ha sido entrenada la red neuronal condiciona la calidad de la traducci¨®n: ¡°Cuantos m¨¢s datos tenemos, mejor es la traducci¨®n". Por lo tanto, cuando se decide a?adir un idioma al traductor, el primer paso es asegurarse de que existe en la web un conjunto de datos fiables para entrenar al sistema.
"Nos tenemos que preguntar si hay suficientes datos para crear un modelo que cumpla con nuestros est¨¢ndares de calidad. Si lo hay, normalmente podemos desarrollarlo en pocos meses¡±, explica. Cuando dos idiomas son muy diferentes entre s¨ª, se precisa una cantidad mayor de datos. Por ejemplo, gramaticalmente el ingl¨¦s es muy diferente del chino y el japon¨¦s, por lo que se necesita una mayor cantidad de informaci¨®n para obtener la misma calidad que al hacer una misma traducci¨®n del ingl¨¦s al espa?ol.
Para garantizar que el conjunto de datos con el que se entrena el sistema sea de buena calidad, Google cuenta con lectores humanos. Aunque Hughes advierte: "La calidad es importante, pero la cantidad siempre gana a largo plazo". Mientras que la Uni¨®n Europea ¡°ha hecho un trabajo maravilloso al proporcionar al mundo traducciones porque muchos documentos tienen que ser traducidos por ley a otros idiomas¡±, no todas las lenguas cuentan con la misma suerte. Existe, seg¨²n reconoce Hughes, "un desequilibrio entre los idiomas representados en el traductor y la cantidad de hablantes que hay en el mundo".
"Nos tenemos que preguntar si hay suficientes datos para crear un modelo que cumpla con nuestros est¨¢ndares de calidad. Si lo hay, normalmente podemos desarrollarlo en pocos meses¡±
Adem¨¢s de la calidad y la cantidad, tambi¨¦n es importante que los sitios web traducidos traten de una amplia gama de tem¨¢ticas. ¡°Los sitios webs de viajes tienen muchas traducciones y nos volvemos muy buenos traduciendo cosas sobre viajes, pero no tanto cuando por ejemplo se trata de bot¨¢nica", explica Hughes en un evento en Z¨²rich sobre inteligencia artificial al que EL PA?S ha sido invitado por Google. A esto se suma que la mayor¨ªa de traducciones disponibles en la web est¨¢n realizadas en un contexto profesional. El registro utilizado, por lo tanto, difiere de la forma en la que los usuarios hablan realmente en su d¨ªa a d¨ªa.
Sesgos y errores de traducci¨®n
Cuando las traducciones no son precisas, algunos usuarios alertan a Google a trav¨¦s de mensajes o en redes sociales. Los trabajadores tambi¨¦n pueden reportar r¨¢pidamente cualquier error. ¡°No arreglamos cada traducci¨®n incorrecta porque nos gusta ser lo m¨¢s estrictamente algor¨ªtmicos posible y dejar que el modelo haga su trabajo, pero a veces s¨ª lo hacemos cuando una traducci¨®n es ofensiva o enga?osa y puede causar alg¨²n tipo de da?o¡±, explica.
Hughes recuerda un error de traducci¨®n en junio. En medio de las protestas de Hong Kong, el sistema tradujo la frase "estoy triste de ver a Hong Kong convertirse en parte de China" a "estoy feliz de ver a Hong Kong convertirse en parte de China". Es decir, la traducci¨®n sugerida en chino simplificado y tradicional convirti¨® la palabra "triste" en "feliz". El error, que caus¨® revuelo entre diversos usuarios, se corrigi¨® el mismo d¨ªa.
Estos errores no son el ¨²nico problema al que se tiene que enfrentar la compa?¨ªa. El traductor es sexista. Por ejemplo, asume que ¡°a doctor¡± es un m¨¦dico hombre. Mientras tanto, ¡°a nurse¡± es una enfermera mujer. Hughes reconoce que para solventarlo a¨²n queda trabajo por hacer: ¡°El dise?o b¨¢sico de los sistemas de aprendizaje autom¨¢tico es encontrar la respuesta m¨¢s probable. Pero cuando haces esto millones de veces, est¨¢s reforzando algunos estereotipos sociales¡±.
Para combatir este tipo de sesgos, Google Translate trata de mostrar m¨²ltiples opciones de g¨¦nero cuando existen. El objetivo es que esta funci¨®n, que a d¨ªa de hoy solo est¨¢ disponible para algunas palabras en idiomas como el espa?ol, el franc¨¦s o el portugu¨¦s, llegue a todas las lenguas en el futuro.
Otros desaf¨ªos
El director de ingenier¨ªa de Google Translate ve probable que en un futuro dos personas que hablen idiomas diferentes puedan tener una conversaci¨®n totalmente natural en tiempo real: "Creo que todas las piezas necesarias est¨¢n ah¨ª. Solo necesitamos algunas mejoras en el reconocimiento de voz para que funcione en ambientes ruidosos, en la calidad de la traducci¨®n, en la comprensi¨®n del contexto y en el paso de texto a voz para que suene de forma m¨¢s natural¡±.
?Se convertir¨¢ el traductor de Google a una alternativa al aprendizaje de idiomas? Hughes, que sabe alem¨¢n y un poco de espa?ol y gal¨¦s, considera que se trata de "una experiencia diferente". "Viajar y usar el traductor es mucho m¨¢s f¨¢cil que aprender un idioma, pero aprender un idioma es una experiencia muy gratificante y hay mucho que puedes hacer si realmente eres capaz de hablarlo", a?ade.
Uno de los objetivos de su equipo es desarrollar modelos que puedan ser entrenados con una cantidad mucho menor de datos. Para aprender un idioma ¡°no necesitas ver mil millones de oraciones¡±, sino que puede valer con ¡°unos pocos miles de ejemplos y un diccionario". Conseguir una traducci¨®n continua y totalmente instant¨¢nea ¡ªque el sistema empiece a traducir incluso antes de que el usuario termine las oraciones¡ª y lograr la traducci¨®n de varios idiomas con una sola red neuronal son tambi¨¦n algunos de los retos principales.
Los sistemas actuales sirven para hasta cinco u ocho idiomas. "En nuestros laboratorios estamos tratando de conseguir un modelo que sirva para los 103 idiomas", cuenta. Pero en el mundo hay muchas m¨¢s lenguas que las que actualmente soporta el traductor de Google ¡ªse estima que alrededor de 7.000¡ª: "Nuestra gran esperanza es desarrollar modelos que puedan generalizar lo que significa entender y aprender un idioma y, con suerte, pasar de los cientos a los miles de idiomas".
Inteligencia artificial para detectar ¡®spam¡¯
La inteligencia artificial no solo est¨¢ detr¨¢s del traductor de Google. Tambi¨¦n est¨¢ presente en los emails de los usuarios para detectar spam o en los teclados de sus m¨®viles para realizar predicciones. Con esta tecnolog¨ªa, se persiguen adem¨¢s objetivos mucho m¨¢s ambiciosos. La compa?¨ªa de Mountain View impulsa diferentes proyectos para facilitar la vida a personas con discapacidad. Por ejemplo, Lookout es una app que asiste a personas ciegas o con problemas visuales y les proporciona informaci¨®n de lo que hay a su alrededor. Tambi¨¦n desarrolla aplicaciones y dispositivos que permiten a personas con dificultad en el habla comunicarse. Google, al igual que otras compa?¨ªas como Microsoft, utiliza adem¨¢s la inteligencia artificial para buscar soluciones a los desaf¨ªos medioambientales del planeta. Por ejemplo, para monitorizar la vida marina, luchar contra la pesca ilegal, llevar un control de diferentes animales en peligro de extinci¨®n o predecir desastres naturales.
Amnist¨ªa Internacional acusa a Google de amenazar los derechos humanos
Amnist¨ªa Internacional acusa en su ¨²ltimo informe?Gigantes de la vigilancia?a Google y Facebook de amenazar los derechos humanos con su modelo de negocio. Para la organizaci¨®n, dicho modelo est¨¢ basado en la vigilancia y "es intr¨ªnsecamente incompatible" con el derecho a la privacidad. La compa?¨ªa de Mountain View recopila en todo momento una cantidad ingente de datos de los usuarios: sabe todo lo que un usuario compra por Internet, los lugares que visita, las apps que utiliza e incluso el porno que ve ¡ªaunque lo haga en modo inc¨®gnito¡ª. Olivier Bousquet, ingeniero jefe de Google AI Europe, niega cualquier tipo de vigilancia y se escuda en que Google cuenta con el consentimiento de los usuarios: "La pregunta es: ?sabes o tienes acceso a la informaci¨®n que se est¨¢ recopilando? El usuario puede consultar en la web qu¨¦ datos se recopilan y tiene el control sobre ellos". Adem¨¢s, asegura que los datos siempre se usan con un fin espec¨ªfico y que el usuario tiene que ser informado de qu¨¦ se va a hacer con ellos. "El consentimiento no es suficiente si no tienes transparencia", concluye.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.