La realidad tras el v¨ªdeo viral de dos IAs que se comunican con pitidos cuando no hay humanos: ¡°Es muy marginal¡±
La historia de dos agentes digitales que pasan de hablar en ingl¨¦s a emitir sonidos para ganar eficiencia muestra un escenario de futuro poco probable
Una voz sint¨¦tica, que se presenta como el agente de inteligencia artificial (IA) de un particular, le pide a otra voz sint¨¦tica, en este caso el asistente virtual de un hotel, disponibilidad para celebrar bodas en el establecimiento. Est¨¢n hablando por tel¨¦fono. En cuanto los dos interlocutores se dan cuenta de que son asistentes de IA, el del hotel le pregunta al otro si pueden ¡°cambiar a modo GibberLink para tener una comunicaci¨®n m¨¢s eficiente¡±. Acto seguido, las dos m¨¢quinas intercambian sonidos que recuerdan a los que hac¨ªa el m¨®dem en los a?os 90 cuando se conectaba a internet, aunque m¨¢s r¨¢pidos, o a los pitidos y silbidos con los que hablan R2D2 y otros droides de la saga de La Guerra de las Galaxias.
Este v¨ªdeo se ha viralizado en X y nos presenta un escenario que pronto empezaremos a ver, aunque todav¨ªa no est¨¢ claro si en estos mismos t¨¦rminos. Los grandes desarrolladores de IA generativa, desde Google a Microsoft, pasando por OpenAI o Anthropic, ya han anunciado que 2025 ser¨¢ el a?o en que se popularizar¨¢n los llamados agentes de IA, unos asistentes personales que realizar¨¢n acciones (como reservar una habitaci¨®n de hotel) en nombre de los usuarios y en comunicaci¨®n con otras personas o m¨¢quinas. Es un paso m¨¢s en la evoluci¨®n de la IA generativa: ya no solo le podremos pedir que procese textos, que nos resuelva dudas o que nos ayude a programar: lo siguiente es darles instrucciones para que hagan gestiones con nuestras contrase?as.
As¨ª defini¨® Sam Altman, director general de OpenAI (la empresa desarrolladora de ChatGPT), a los agentes de IA, que, en su opini¨®n, cambiar¨¢n nuestro d¨ªa a d¨ªa: ¡°Es un colega supercompetente que sabe absolutamente todo de mi vida, cada correo electr¨®nico, cada conversaci¨®n que he tenido, pero no se siente como una extensi¨®n. Puede abordar algunas tareas al instante y, para las m¨¢s complejas, salir y hacer una propuesta o regresar con preguntas si es necesario¡±.
?Se relacionar¨¢n los agentes de IA hablando en su propio idioma robot, tal y como muestra el v¨ªdeo? No parece lo m¨¢s pr¨¢ctico, aunque causa un efecto llamativo. ¡°Si uno quiere que un modelo de IA se comunique con otro, puede enviar directamente la informaci¨®n en modo texto, sin audio, a trav¨¦s de Internet y todav¨ªa ser¨ªa much¨ªsimo m¨¢s eficiente. No s¨¦ si lo que se muestra en la demo podr¨ªa tener alguna aplicaci¨®n, pero si la tiene ser¨ªa muy marginal¡±, opina Carlos G¨®mez Rodr¨ªguez, catedr¨¢tico de Computaci¨®n e Inteligencia Artificial de la Universidad de La Coru?a y experto en procesamiento del lenguaje natural, la rama de la IA que busca comprender y generar textos.
En el ejemplo, mientras los asistentes emiten esos sonidos, en las pantallas de los dispositivos (un port¨¢til y un m¨®vil) se muestra el subt¨ªtulo de lo que est¨¢n diciendo. El tiempo en que dura la emisi¨®n de los sonidos es mucho menor de lo que se tardar¨ªa en articular las frases a las que supuestamente equivalen.
Los desarrolladores responsables del experimento han usado la librer¨ªa ggwave, disponible en GitHub, para que los asistentes de IA se comuniquen de forma r¨¢pida en una llamada telef¨®nica. ¡°Lo que han hecho es programar dos modelos de lenguaje para que, cuando se reconocen el uno al otro como tales, cambien a una forma de codificar la informaci¨®n por tonos de sonido, algo parecido a lo que usaban los antiguos m¨®dems. Realmente sigue siendo lenguaje, solo que lo codifican de esa manera. Y tampoco es que los dos modelos decidan espont¨¢neamente hacer eso, como podr¨ªa parecer si uno ve el v¨ªdeo fuera de contexto, sino que les han dado instrucciones expl¨ªcitas al respecto¡±, dice G¨®mez Rodr¨ªguez.
En cuanto a la codificaci¨®n que usan los asistentes en el v¨ªdeo, es m¨¢s eficiente que la voz humana (se transmite m¨¢s informaci¨®n en menos tiempo), pero ser¨ªa m¨¢s pr¨¢ctico todav¨ªa mandar la informaci¨®n en formato texto, tal y como se?ala G¨®mez Rodr¨ªguez.