Cuando la gastronom¨ªa termina como intervenci¨®n quir¨²rgica: los traductores autom¨¢ticos se encasquillan en los errores
Las m¨¢quinas que facilitan la comprensi¨®n de textos y di¨¢logos de otro idioma replican, sustituyen u obvian los errores originales con consecuencias relevantes en contextos legales, m¨¦dicos o de conflicto
Casi todos los profesionales de la traducci¨®n recuerdan en defensa de su oficio frente a las opciones autom¨¢ticas una ya famosa promoci¨®n en web de la ciudad de Santander, traducida de forma mec¨¢nica y sin supervisi¨®n humana posterior, que incluy¨® referencias al Centro Bot¨ªn (el apellido de la conocida familia financiera de origen local) como ¡°Loot center¡± (centro del pillaje) o el casco hist¨®rico como ¡°historic helmet¡± (artefacto hist¨®rico para proteger la cabeza). Una ...
Casi todos los profesionales de la traducci¨®n recuerdan en defensa de su oficio frente a las opciones autom¨¢ticas una ya famosa promoci¨®n en web de la ciudad de Santander, traducida de forma mec¨¢nica y sin supervisi¨®n humana posterior, que incluy¨® referencias al Centro Bot¨ªn (el apellido de la conocida familia financiera de origen local) como ¡°Loot center¡± (centro del pillaje) o el casco hist¨®rico como ¡°historic helmet¡± (artefacto hist¨®rico para proteger la cabeza). Una investigaci¨®n reciente del profesor de la Universidad Pablo de Olavide (UPO) Santiago Rodr¨ªguez-Rubio a?ade un elemento m¨¢s para tener en cuenta en estas ya comunes herramientas inform¨¢ticas de traducci¨®n: las erratas. Los errores originales se replican, se sustituyen por otros o se obvian y en textos m¨¦dicos o en traductores ideados para zonas de conflicto o en referencias financieras y legales las consecuencias pueden ser relevantes.
Stephen Ibaraki, asesor internacional tecnol¨®gico que defiende las ventajas de los ¨²ltimos desarrollos y fundador de AI For Good, aporta ejemplos de buen uso: ¡°Un agricultor indio no puede hablar las 22 lenguas oficiales. Ahora, con solo un tel¨¦fono, pueden comunicar sus necesidades para conseguir ayuda. O en ?frica, donde la inteligencia artificial se propaga ampliamente, la gente com¨²n puede obtener asistencia m¨¦dica o favorecer su inclusi¨®n financiera. Las ¨²ltimas gafas de Meta tienen capacidades de traducci¨®n simult¨¢nea y estas tecnolog¨ªas terminar¨¢n siendo accesibles en todas partes¡±
Pero las aplicaciones cotidianas se hacen m¨¢s vulnerables en escenarios complejos. La Agencia de Proyectos de Investigaci¨®n Avanzados de Defensa de Estados Unidos (DARPA, por sus siglas en ingl¨¦s), encarg¨® hace 14 a?os el proyecto Transtac, un sistema de traducci¨®n para usos t¨¢cticos en 25 escenarios de conflicto, como puestos de control, comunicaci¨®n de informaci¨®n clave, interrupci¨®n de suministros, inspecci¨®n de instalaciones o evaluaciones m¨¦dicas. El desarrollo alcanz¨® un 80% de precisi¨®n, considerado bastante, pero insuficiente para su uso en circunstancias delicadas donde un error puede desencadenar una reacci¨®n violenta.
El ¨¢mbito m¨¦dico tambi¨¦n precisa de traducciones m¨¢s espec¨ªficas que eviten los errores. Investigadores de las universidades de Michigan, Nueva York y Washington han analizado las transcripciones de Whisper, una aplicaci¨®n de OpenAI, e identificado alucinaciones (errores y frases inventadas con apariencia de resultado correcto) en entre el 38% y el 80% de los casos analizados, especialmente de audio a texto. Whisper se usa en diferentes entornos para traducir reuniones o generar subt¨ªtulos, pero los t¨¦cnicos que han examinado la herramienta han alertado de que tambi¨¦n se est¨¢ utilizando en centros m¨¦dicos para transcribir consultas de pacientes.
¡°Tales errores podr¨ªan tener consecuencias realmente graves, particularmente en entornos hospitalarios. Nadie quiere un diagn¨®stico err¨®neo. Deber¨ªa haber un list¨®n m¨¢s alto¡±, afirma Alondra Nelson, profesora en Princeton y exdirectora de la Oficina de Pol¨ªtica Cient¨ªfica y Tecnol¨®gica de la Casa Blanca a Associated Press. En una transcripci¨®n analizada, Whisper invent¨® un medicamento inexistente llamado ¡°antibi¨®ticos hiperactivados¡±. Un portavoz de OpenAI ha respondido tras las investigaciones que la compa?¨ªa estudia continuamente c¨®mo reducir las alucinaciones, aprecia los hallazgos y advierte: ¡°La herramienta no debe usarse en entornos de alto riesgo¡±.
Lo mismo sucede en contextos legales, donde es imprescindible conocer con exactitud los t¨¦rminos que se firman, o financieros. Rodr¨ªguez Rubio pone de ejemplo c¨®mo la expresi¨®n err¨®nea que quer¨ªa decir ¡°exceso de pasivo¡± se tradujo al ingl¨¦s por ¡°hachas¡± de pasivo.
Para poner a prueba los sistemas de traducci¨®n autom¨¢tica, el profesor de la universidad sevillana ha introducido intencionadamente 1.820 errores tipogr¨¢ficos en textos de origen encontrados en un trabajo previo sobre diccionarios especializados espa?ol-ingl¨¦s. El trabajo detect¨® que ¡°la repetici¨®n de la errata de origen es el fen¨®meno m¨¢s frecuente¡± en los dos sistemas analizados: Google Translate y DeepL. Aunque el primero arroj¨® mejores resultados, ambos incurrieron en estas y otras deficiencias, como adaptar el error intencionado (la errata excusive se traduce por excusivo), suprimirlo o transformar una palabra en otra (al escribir vancies en lugar de vacancies el traductor convirti¨® el error en furgonetas, vans).
Rodr¨ªguez-Rubio, doctor por la UPO y miembro del departamento de Filolog¨ªa y Traducci¨®n, no desde?a los traductores autom¨¢ticos sino todo lo contrario. Su investigaci¨®n pretende ¡°arrojar luz sobre la capacidad de los sistemas para hacer frente a los errores tipogr¨¢ficos del texto de origen y proporcionar un punto de partida para su perfeccionamiento¡±.
¡°Las aplicaciones de la IA [inteligencia artificial] a la correcci¨®n del lenguaje son innegables. La tecnolog¨ªa siempre ha sido y seguir¨¢ siendo un pilar fundamental, lo que no quiere decir que no se deban analizar los desarreglos y efectos indeseados que esa tecnolog¨ªa pueda generar, por ejemplo, en relaci¨®n con el ruido informativo, la cultura de la inmediatez, la confianza ciega y la falta de reflexi¨®n que todo ello pudiera conllevar. El factor humano debe seguir siendo fundamental, como expresa muy bien la reciente Declaraci¨®n de UniCo [Uni¨®n de Correctores] sobre el uso indiscriminado de la inteligencia artificial generativa en la correcci¨®n¡±, explica el profesor.
En este sentido, para el investigador, la proliferaci¨®n de errores ¡°es un s¨ªntoma de un problema mayor¡±. ¡°Las erratas que plagan los textos modernos son un indicador del problema de fondo de las disfunciones de la revoluci¨®n tecnol¨®gica, de la reconfiguraci¨®n del papel del hombre y la m¨¢quina en los procesos de trabajo, de la cultura de las prisas y de la inmediatez¡±, asegura.
Rodr¨ªguez-Rubio advierte del ¡°alcance limitado¡± de su estudio al centrarse en el aspecto formal y acotado al impacto de las erratas del texto original en el resultado de la traducci¨®n de palabras aisladas o de frases cortas. Pero admite que es una indicaci¨®n para mejorar los sistemas basados en inteligencia artificial.
En concreto, se?ala nuevas ¨¢reas de posible estudio que su trabajo ha abordado de forma tangencial, como la sinonimia, cuando cambiar una palabra como rejection por su sin¨®nimo refusal puede marcar una diferencia sustancial; la antonimia, cuando las sustituciones autom¨¢ticas de palabras invierten el sentido, como la traducci¨®n de DeepL de la palabra err¨®nea por la omisi¨®n de una letra undestanding por sin entender; y la paronimia, la dificultad de detectar erratas en palabras similares, especialmente, las que empiezan y terminan igual, como gastronomy (arte culinario) por gastrostom¨ªa (gastrostomy), intervenci¨®n quir¨²rgica para introducir una sonda de alimentaci¨®n en el est¨®mago.
La clave de estos traductores autom¨¢ticos es la informaci¨®n de la que se alimentan, la columna vertebral de cualquier aplicaci¨®n de inteligencia artificial. Si el error de origen se replica o se modifica para generar un resultado peor que el original, la precisi¨®n de los sistemas fracasa. ¡°Contar con una base de datos s¨®lida es fundamental para ofrecer capacidades de IA generativa¡±, advierte Baris Gultekin, responsable de IA de Snowflake en la presentaci¨®n de un estudio en colaboraci¨®n con MIT Technology Review Insights.
En este mismo sentido, una investigaci¨®n publicada en Nature muestra que los resultados de la IA se degradan cuando esta se entrena con datos generados tambi¨¦n por inteligencia artificial. Ilia Shumailov, cient¨ªfico inform¨¢tico de la Universidad de Oxford que dirigi¨® el estudio, compara el proceso con tomar fotos de fotos: ¡°Si tomas una imagen y la escaneas y luego la imprimes y repites este proceso, con el tiempo, b¨¢sicamente el ruido abruma todo el proceso¡±. Es lo que llama ¡°colapso del modelo¡±.
Google es consciente de las limitaciones y trabaja en su mitigaci¨®n. En este sentido, un portavoz de la compa?¨ªa explica: ¡°Translate funciona aprendiendo patrones a partir de muchos millones de ejemplos de traducciones vistas en la web. Por desgracia, algunos de esos patrones pueden dar lugar a traducciones incorrectas. Agradecemos a los usuarios que nos avisan de estos errores para poder actuar con rapidez y solucionarlos. Para garantizar la calidad de nuestras traducciones, entrenamos y probamos rigurosamente nuestros sistemas, al igual que hacemos con todas nuestras herramientas y productos en Google¡±.