Cuando la gastronom��a termina como intervenci��n quir��rgica: los traductores autom��ticos se encasquillan en los errores

Las m��quinas que facilitan la comprensi��n de textos y di��logos de otro idioma replican, sustituyen u obvian los errores originales con consecuencias relevantes en contextos legales, m��dicos o de conflicto

Una traductora escucha la intervenci��n de la representante de China en una sesi��n del Consejo de Seguridad de la ONU el pasado marzo en Nueva York.Liao Pan (China News Service via Getty Ima)

Ra��l Lim��n

11 nov 2024 - 05:07CET

Casi todos los profesionales de la traducci��n recuerdan en defensa de su oficio frente a las opciones autom��ticas una ya famosa promoci��n en web de la ciudad de Santander, traducida de forma mec��nica y sin supervisi��n humana posterior, que incluy�� referencias al Centro Bot��n (el apellido de la conocida familia financiera de origen local) como ��Loot center�� (centro del pillaje) o el casco hist��rico como ��historic helmet�� (artefacto hist��rico para proteger la cabeza). Una investigaci��n reciente del profesor de la Universidad Pablo de Olavide (UPO) Santiago Rodr��guez-Rubio a?ade un elemento m��s para tener en cuenta en estas ya comunes herramientas inform��ticas de traducci��n: las erratas. Los errores originales se replican, se sustituyen por otros o se obvian y en textos m��dicos o en traductores ideados para zonas de conflicto o en referencias financieras y legales las consecuencias pueden ser relevantes.

Stephen Ibaraki, asesor internacional tecnol��gico que defiende las ventajas de los ��ltimos desarrollos y fundador de AI For Good, aporta ejemplos de buen uso: ��Un agricultor indio no puede hablar las 22 lenguas oficiales. Ahora, con solo un tel��fono, pueden comunicar sus necesidades para conseguir ayuda. O en ?frica, donde la inteligencia artificial se propaga ampliamente, la gente com��n puede obtener asistencia m��dica o favorecer su inclusi��n financiera. Las ��ltimas gafas de Meta tienen capacidades de traducci��n simult��nea y estas tecnolog��as terminar��n siendo accesibles en todas partes��

Pero las aplicaciones cotidianas se hacen m��s vulnerables en escenarios complejos. La Agencia de Proyectos de Investigaci��n Avanzados de Defensa de Estados Unidos (DARPA, por sus siglas en ingl��s), encarg�� hace 14 a?os el proyecto Transtac, un sistema de traducci��n para usos t��cticos en 25 escenarios de conflicto, como puestos de control, comunicaci��n de informaci��n clave, interrupci��n de suministros, inspecci��n de instalaciones o evaluaciones m��dicas. El desarrollo alcanz�� un 80% de precisi��n, considerado bastante, pero insuficiente para su uso en circunstancias delicadas donde un error puede desencadenar una reacci��n violenta.

El ��mbito m��dico tambi��n precisa de traducciones m��s espec��ficas que eviten los errores. Investigadores de las universidades de Michigan, Nueva York y Washington han analizado las transcripciones de Whisper, una aplicaci��n de OpenAI, e identificado alucinaciones (errores y frases inventadas con apariencia de resultado correcto) en entre el 38% y el 80% de los casos analizados, especialmente de audio a texto. Whisper se usa en diferentes entornos para traducir reuniones o generar subt��tulos, pero los t��cnicos que han examinado la herramienta han alertado de que tambi��n se est�� utilizando en centros m��dicos para transcribir consultas de pacientes.

��Tales errores podr��an tener consecuencias realmente graves, particularmente en entornos hospitalarios. Nadie quiere un diagn��stico err��neo. Deber��a haber un list��n m��s alto��, afirma Alondra Nelson, profesora en Princeton y exdirectora de la Oficina de Pol��tica Cient��fica y Tecnol��gica de la Casa Blanca a Associated Press. En una transcripci��n analizada, Whisper invent�� un medicamento inexistente llamado ��antibi��ticos hiperactivados��. Un portavoz de OpenAI ha respondido tras las investigaciones que la compa?��a estudia continuamente c��mo reducir las alucinaciones, aprecia los hallazgos y advierte: ��La herramienta no debe usarse en entornos de alto riesgo��.

Lo mismo sucede en contextos legales, donde es imprescindible conocer con exactitud los t��rminos que se firman, o financieros. Rodr��guez Rubio pone de ejemplo c��mo la expresi��n err��nea que quer��a decir ��exceso de pasivo�� se tradujo al ingl��s por ��hachas�� de pasivo.

Para poner a prueba los sistemas de traducci��n autom��tica, el profesor de la universidad sevillana ha introducido intencionadamente 1.820 errores tipogr��ficos en textos de origen encontrados en un trabajo previo sobre diccionarios especializados espa?ol-ingl��s. El trabajo detect�� que ��la repetici��n de la errata de origen es el fen��meno m��s frecuente�� en los dos sistemas analizados: Google Translate y DeepL. Aunque el primero arroj�� mejores resultados, ambos incurrieron en estas y otras deficiencias, como adaptar el error intencionado (la errata excusive se traduce por excusivo), suprimirlo o transformar una palabra en otra (al escribir vancies en lugar de vacancies el traductor convirti�� el error en furgonetas, vans).

Rodr��guez-Rubio, doctor por la UPO y miembro del departamento de Filolog��a y Traducci��n, no desde?a los traductores autom��ticos sino todo lo contrario. Su investigaci��n pretende ��arrojar luz sobre la capacidad de los sistemas para hacer frente a los errores tipogr��ficos del texto de origen y proporcionar un punto de partida para su perfeccionamiento��.

��Las aplicaciones de la IA [inteligencia artificial] a la correcci��n del lenguaje son innegables. La tecnolog��a siempre ha sido y seguir�� siendo un pilar fundamental, lo que no quiere decir que no se deban analizar los desarreglos y efectos indeseados que esa tecnolog��a pueda generar, por ejemplo, en relaci��n con el ruido informativo, la cultura de la inmediatez, la confianza ciega y la falta de reflexi��n que todo ello pudiera conllevar. El factor humano debe seguir siendo fundamental, como expresa muy bien la reciente Declaraci��n de UniCo [Uni��n de Correctores] sobre el uso indiscriminado de la inteligencia artificial generativa en la correcci��n��, explica el profesor.

En este sentido, para el investigador, la proliferaci��n de errores ��es un s��ntoma de un problema mayor��. ��Las erratas que plagan los textos modernos son un indicador del problema de fondo de las disfunciones de la revoluci��n tecnol��gica, de la reconfiguraci��n del papel del hombre y la m��quina en los procesos de trabajo, de la cultura de las prisas y de la inmediatez��, asegura.

Rodr��guez-Rubio advierte del ��alcance limitado�� de su estudio al centrarse en el aspecto formal y acotado al impacto de las erratas del texto original en el resultado de la traducci��n de palabras aisladas o de frases cortas. Pero admite que es una indicaci��n para mejorar los sistemas basados en inteligencia artificial.

En concreto, se?ala nuevas ��reas de posible estudio que su trabajo ha abordado de forma tangencial, como la sinonimia, cuando cambiar una palabra como rejection por su sin��nimo refusal puede marcar una diferencia sustancial; la antonimia, cuando las sustituciones autom��ticas de palabras invierten el sentido, como la traducci��n de DeepL de la palabra err��nea por la omisi��n de una letra undestanding por sin entender; y la paronimia, la dificultad de detectar erratas en palabras similares, especialmente, las que empiezan y terminan igual, como gastronomy (arte culinario) por gastrostom��a (gastrostomy), intervenci��n quir��rgica para introducir una sonda de alimentaci��n en el est��mago.

La clave de estos traductores autom��ticos es la informaci��n de la que se alimentan, la columna vertebral de cualquier aplicaci��n de inteligencia artificial. Si el error de origen se replica o se modifica para generar un resultado peor que el original, la precisi��n de los sistemas fracasa. ��Contar con una base de datos s��lida es fundamental para ofrecer capacidades de IA generativa��, advierte Baris Gultekin, responsable de IA de Snowflake en la presentaci��n de un estudio en colaboraci��n con MIT Technology Review Insights.

En este mismo sentido, una investigaci��n publicada en Nature muestra que los resultados de la IA se degradan cuando esta se entrena con datos generados tambi��n por inteligencia artificial. Ilia Shumailov, cient��fico inform��tico de la Universidad de Oxford que dirigi�� el estudio, compara el proceso con tomar fotos de fotos: ��Si tomas una imagen y la escaneas y luego la imprimes y repites este proceso, con el tiempo, b��sicamente el ruido abruma todo el proceso��. Es lo que llama ��colapso del modelo��.

Google es consciente de las limitaciones y trabaja en su mitigaci��n. En este sentido, un portavoz de la compa?��a explica: ��Translate funciona aprendiendo patrones a partir de muchos millones de ejemplos de traducciones vistas en la web. Por desgracia, algunos de esos patrones pueden dar lugar a traducciones incorrectas. Agradecemos a los usuarios que nos avisan de estos errores para poder actuar con rapidez y solucionarlos. Para garantizar la calidad de nuestras traducciones, entrenamos y probamos rigurosamente nuestros sistemas, al igual que hacemos con todas nuestras herramientas y productos en Google��.

Tu suscripci��n se est�� usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci��n?

A?adir usuario Continuar leyendo aqu��

Si contin��as leyendo en este dispositivo, no se podr�� leer en el otro.

?Por qu�� est��s viendo esto?

Flecha

Tu suscripci��n se est�� usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci��n a la modalidad Premium, as�� podr��s a?adir otro usuario. Cada uno acceder�� con su propia cuenta de email, lo que os permitir�� personalizar vuestra experiencia en EL PA?S.

En el caso de no saber qui��n est�� usando tu cuenta, te recomendamos cambiar tu contrase?a aqu��.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar�� en tu dispositivo y en el de la otra persona que est�� usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu�� los t��rminos y condiciones de la suscripci��n digital.

Sobre la firma

Ra��l Lim��n

Licenciado en Ciencias de la Informaci��n por la Universidad Complutense, m��ster en Periodismo Digital por la Universidad Aut��noma de Madrid y con formaci��n en EEUU, es redactor de la secci��n de Ciencia. Colabora en televisi��n, ha escrito dos libros (uno de ellos Premio Lorca) y fue distinguido con el galard��n a la Difusi��n en la Era Digital.