Meta desarrolla un traductor simult¨¢neo de hasta 101 idiomas con una mayor precisi¨®n que los sistemas actuales
La inteligencia artificial imita la voz de los interlocutores, filtra m¨¢s del 40% de los ruidos y, en contra de la estrategia en redes de Zuckerberg, mitiga la ¡°toxicidad¡± al moderar los mensajes violentos
Meta quiere recuperar la ambici¨®n que impuls¨® la b¨ªblica torre que, seg¨²n el relato del G¨¦nesis (11:1-9), la humanidad quiso construir para llegar al cielo. ¡°Son un solo pueblo y todos ellos tienen la misma lengua. (¡) Ahora, nada de lo que se propongan les ser¨¢ imposible. Vamos, bajemos y all¨ª confundamos su lengua, para que nadie entienda el lenguaje del otro¡±, reaccion¨® Jehov¨¢. La compa?¨ªa de Mark Zuckerberg, la multinacional de Facebook, Instagram y WhatsApp quiere conjurar esta maldici¨®n y mantener el liderazgo en las comunicaciones personales, para lo que ha desarrollado, seg¨²n publica hoy mi¨¦rcoles la revista Nature, un modelo de inteligencia artificial (IA) capaz de traducir de forma instant¨¢nea comunicaciones de voz a voz o de texto a voz y viceversa en hasta 101 idiomas, imitando la voz y el tono de los interlocutores.
El modelo, llamado SEAMLESSM4T, ¡°supera a los sistemas existentes¡±, seg¨²n la investigadora principal Marta Costa-Juss¨¤, de la divisi¨®n de inteligencia artificial de Meta (FAIR, Foundational AI Research), y se pondr¨¢ a disposici¨®n del p¨²blico siempre que no se utilice con fines comerciales.
SEAMLESSM4T puede reconocer hasta 101 idiomas (escritos o hablados) y es capaz de traducirlos a 36 en formato de voz y a 96 en un archivo de texto. De acuerdo con los resultados de Costa-Juss¨¤, ¡°traduce con entre un 8% y un 23% m¨¢s de precisi¨®n [de acuerdo con la Bilingual Evaluation Understudy] que los sistemas existentes, puede filtrar el ruido de fondo [entre un 42% y un 66% m¨¢s] y se ajusta a la variaci¨®n de voces¡±.
Direcci¨®n opuesta a las redes
Por otra parte, mientras Meta ha eliminado el sistema de verificaci¨®n de datos y la moderaci¨®n de contenidos en sus plataformas de comunicaci¨®n, abriendo la puerta a bulos, sesgos y discursos de odio, con el sistema de traducci¨®n simult¨¢nea, ha optado por la estrategia contraria y se ha centrado en la ¡°mitigaci¨®n de la toxicidad¡± que se puede inferir al sistema durante el aprendizaje autom¨¢tico o en la traducci¨®n. En este sentido, Olga Koreneva Antonova, profesora de la Facultad de Traducci¨®n e Interpretaci¨®n de la Universidad Pablo de Olavide (UPO), advierte que, por ejemplo, los traductores inform¨¢ticos actuales ¡°no consideran la igualdad de g¨¦nero¡± y tienden a sustituir el femenino por el masculino porque las fuentes con la que se entrena ya incluyen ese sesgo.
Meta considera toxicidad las blasfemias o resultados que pueden incitar al odio, la violencia o el abuso contra una persona o un grupo (como una religi¨®n, raza o g¨¦nero). Para mitigarla, ha desarrollado una herramienta, denominada Etox, especialmente entrenada en elementos t¨®xicos procedentes del habla.
Otra de las limitaciones que intenta superar el nuevo sistema es la escasez de idiomas operativos. Aunque m¨¢s de la mitad de la humanidad habla principalmente media docena de idiomas, la diversidad es tan amplia que quedan fuera del servicio los m¨¢s de 7.000 existentes en el mundo. El modelo de meta ha intentado paliar esta deficiencia incorporando hasta 101 lenguas, a pesar de la escasez de datos de audio y modelos para incorporarlos a la IA.
Tanel Alum?e, del laboratorio de tecnolog¨ªa del lenguaje de la Universidad de Tallin (Estonia) destaca en Nature la alta capacidad del sistema para traducir de forma simult¨¢nea el habla gracias a los datos de 4,5 millones de horas de audio hablado multiling¨¹e. ¡°Este tipo de entrenamiento ayuda al modelo a aprender los patrones de los datos, lo que facilita el ajuste para tareas espec¨ªficas sin necesidad de grandes cantidades de datos de entrenamiento personalizados¡±, explica.
No obstante, en su opini¨®n, ¡°la mayor virtud de este trabajo no es la idea o el m¨¦todo propuesto, sino el hecho de que todos los datos y el c¨®digo para ejecutar y optimizar esta tecnolog¨ªa est¨¦n disponibles p¨²blicamente, aunque el modelo en s¨ª solo se puede utilizar para usos no comerciales¡±.
Allison Koenecke, del departamento de Ciencias de la Informaci¨®n en la Universidad de Cornell, advierte, tambi¨¦n en Nature, de las limitaciones de estos sistemas de traducci¨®n, a pesar de su progreso, en entornos donde la precisi¨®n es fundamental, como en actividades m¨¦dicas o legales: ¡°Modelos como el ideado por SEAMLESS est¨¢n acelerando el progreso en este ¨¢mbito, pero los usuarios de estos modelos (m¨¦dicos y funcionarios de los tribunales, por ejemplo) deben ser conscientes de la falibilidad de las tecnolog¨ªas del habla¡±.
En este sentido, abunda: ¡°Este tipo de error inducido por la m¨¢quina podr¨ªa inducir un da?o real, como recetar err¨®neamente un medicamento o acusar a una persona. Y el da?o afecta de manera desproporcionada a las poblaciones marginadas, que probablemente ser¨¢n mal escuchadas¡±.
Koenecke celebra los esfuerzos por eliminar la ¡°toxicidad¡± de las traducciones, pero aboga por ¡°ampliar el alcance de los sesgos ling¨¹¨ªsticos estudiados¡± y advertir a los usuarios de las posibilidades de error.
Cr¨ªticas
A pesar del avance en el sistema de traducci¨®n, el modelo despierta recelos entre algunos investigadores. Uno de los m¨¢s cr¨ªticos es V¨ªctor Etxebarria, catedr¨¢tico de Ingenier¨ªa de Sistemas y Autom¨¢tica en la Universidad del Pa¨ªs Vasco (UPV/EHU). ¡°No contribuye al avance cient¨ªfico, ya que, partiendo de lo publicado, los especialistas independientes no tienen permiso para reproducir, comprobar o incluso mejorar sus bases tecnol¨®gicas. Tan solo tienen acceso a conectarse al traductor para efectuar traducciones superficiales. Este software [programa] no cumple los principios de la IA en c¨®digo abierto, tal y como lo define la Open Source Initiative: usar, estudiar, modificar y compartir para cualquier prop¨®sito. Esto no lo permite este traductor y, por tanto, no es coherente con los principios de la ciencia abierta¡±, declara a Science Media Centre (SMC) Espa?a.
Y aun reconociendo alguna virtud como herramienta de ayuda, el investigador a?ade: ¡°El producto no evita los retardos de traducci¨®n ni los errores, que no enmienda en tiempo real, como s¨ª realizan las personas traductoras. Otra limitaci¨®n es que solo puede utilizarse por internet a trav¨¦s de la API (Application Programming Interface) que impone la empresa. En conjunto, el traductor es un producto tecnol¨®gico avanzado y probablemente muy ¨²til, pero cerrado a los principios de la ciencia abierta y con m¨²ltiples limitaciones tecnol¨®gicas y legales¡±.
Maite Mart¨ªn, catedr¨¢tica de Inform¨¢tica de la Universidad de Ja¨¦n e investigadora del grupo SINAI (Sistemas INteligentes de Acceso a la Informaci¨®n), destaca la incorporaci¨®n de idiomas de pocos recursos (m¨¢s minoritarios), aunque a costa de una mayor tasa de errores. ¡°Este esfuerzo no solo mejora la accesibilidad de las tecnolog¨ªas de traducci¨®n para estas comunidades, sino que tambi¨¦n marca un avance en la inclusi¨®n ling¨¹¨ªstica al democratizar el acceso a herramientas avanzadas de comunicaci¨®n¡±, explica.
Al contrario que Etxebarria, la investigadora s¨ª considera que s¨ª se garantiza el acceso a la comunidad cient¨ªfica, y alaba ¡°la interacci¨®n en tiempo real, la expresividad de la voz traducida y la mitigaci¨®n de sesgos de g¨¦nero y toxicidad¡±. ¡°Aunque SEAMLESSM4T supone un avance significativo, todav¨ªa queda trabajo por hacer para optimizar su implementaci¨®n en escenarios pr¨¢cticos¡±, concluye en SMC.
En relaci¨®n con la toxicidad, Andreas Kaltenbrunner, investigador l¨ªder del grupo AI and Data for Society de la UOC, recuerda la contradicci¨®n de Meta con su reciente estrategia de suprimir la moderaci¨®n de contenidos y promoverla en el traductor. ¡°Es digno de elogio que el estudio incluya un an¨¢lisis sobre si las traducciones incrementan la toxicidad de los textos o c¨®mo abordan posibles sesgos de g¨¦nero. Sin embargo, resulta desafortunado que Meta, la empleadora de los investigadores de este estudio, parece haber decidido recientemente abandonar los esfuerzos en este sentido con su nueva pol¨ªtica de moderaci¨®n de contenidos¡±.
Kaltenbrunner recuerda en SMC que el desarrollo es una variante de uno presentado en agosto de 2023, pero con mejoras en la unificaci¨®n del entorno de uso, los idiomas incluidos, los filtros de ruido y la diversidad de acentos.