La nueva inteligencia artificial cava la tumba de los buscadores y asistentes tradicionales
Los ¨²ltimos avances se dirigen a sistemas humanizados capaces de planificar y ejecutar tareas complejas igual o mejor que las personas
Los ¨²ltimos avances de la inteligencia artificial (IA) presentados esta semana no son nimios. ?Hacia d¨®nde va? Demis Hassabis, director de Google DeepMind, la divisi¨®n de investigaci¨®n de la compa?¨ªa, lo tiene claro: ¡°Hacia la inteligencia artificial general, la que iguala o supera a la humana¡±. En la ¨²ltima d¨¦cada hemos contado con dispositivos, como los asistentes Siri, Alexa, Hey Google o Bixby, con capacidades limitadas para responder y ejecutar acciones en electrodom¨¦sticos vinculados. Por otro lado, desde finales del pasado siglo, los buscadores han ayudado a encontrar respuestas y ofertas a demandas de los usuarios. Ambos tienen los d¨ªas contados. Los avances de la IA han comenzado a cavar las tumbas para ambos servicios con el fin de unificarlos en una ¨²nica plataforma capaz de dialogar como un humano, analizar documentos (de texto, im¨¢genes o v¨ªdeos) en distintos dominios, ofrecer respuestas y soluciones complejas y ejecutarlas en nombre del usuario. El buscador y el asistente van a convertirse en una sola herramienta, en un agente, ¡°en un colega supercompetente¡± ¡ªseg¨²n Sam Altman, m¨¢ximo responsable de OpenAI¡ª que estar¨¢ presente en todas las acciones de nuestras vidas.
Los nuevos desarrollos suponen un paso crucial en la inteligencia artificial. Hasta ahora cont¨¢bamos con herramientas de IA, como los asistentes de voz (Siri o Alexa), que ya entend¨ªan el lenguaje natural, o con aplicaciones para convertir una petici¨®n de texto en im¨¢genes o v¨ªdeos (Sora) o con chats (robots conversacionales) que creaban texto o resum¨ªan una reuni¨®n o varios documentos (ChatGPT). Las evoluciones lanzadas esta semana tanto por Google como por Open AI son mucho m¨¢s. Un documento de DeepMind y una decena de universidades y entidades los define: ¡°Son agentes artificiales que utilizan el lenguaje natural y cuya funci¨®n es planificar y ejecutar secuencias de acciones en nombre de un usuario, en uno o m¨¢s dominios [en la web, en documentos propios o en interrelaci¨®n con otros humanos y m¨¢quinas], de acuerdo con las expectativas de la persona¡±.
La clave est¨¢, de acuerdo con esta investigaci¨®n, en la utilizaci¨®n del lenguaje natural, que facilita la interacci¨®n con la m¨¢quina, en su autonom¨ªa para elaborar planes y llevarlos a cabo ¡°en nombre del usuario¡±, en su transversalidad en cuanto a las fuentes que puede utilizar y en su capacidad de contextualizar la situaci¨®n del demandante para ajustarse a sus expectativas. Ya no es una simple herramienta, es un complejo robot que sabe con qui¨¦n habla y qu¨¦ resultados debe arrojar. ¡°Tendr¨¢n un profundo impacto en nuestras vidas individuales y colectivas¡±, advierte el documento.
Al margen de los innumerables problemas ¨¦ticos, que este mismo trabajo identifica, la transici¨®n que ahora comienza tiene una consecuencia tecnol¨®gica pr¨®xima: las herramientas de IA que hemos venido utilizando quedan obsoletas de forma singular y pasan a integrarse en el complejo sistema de los agentes. La evoluci¨®n de la IA ha comenzado a cavar las fosas del buscador y de los asistentes tal y como los hemos conocido hasta ahora.
El buscador convencional agoniza
Larry Page y Sergey Brin fundaron Google en 1998 tras conocerse en la Universidad de Stanford y publicar La anatom¨ªa de un motor de b¨²squeda web hipertextual a gran escala. Con esa investigaci¨®n desarrollaron un buscador que en solo un a?o pas¨® a registrar 3,5 millones de consultas al d¨ªa y hoy se ha convertido en el m¨¢s utilizado del mundo, con m¨¢s de 3.500 millones de demandas de informaci¨®n diarias.
Pero en esta ¨¦poca de eras ef¨ªmeras, la del buscador de Google tal y como lo conocemos comienza su decadencia. El propio Sergey Brin asisti¨® el pasado martes a este proceso en la sede del gigante en Mountain View (California).
¡°Durante los ¨²ltimos 25 a?os, hemos invertido mucho en el buscador. Pero necesitamos pensar en c¨®mo podemos satisfacer las nuevas necesidades de los usuarios y realmente creo que es la b¨²squeda en Gemini [nombre de la IA y del chat inteligente de la compa?¨ªa, competidor de ChatGPT de Open AI]¡±, afirma Liz Reid, directora de Google Search para dar paso a la nueva era.
Durante los ¨²ltimos 25 a?os, hemos invertido mucho en el buscador, que ha sido una herramienta incre¨ªblemente poderosa, pero requiere mucho trabajo. Necesitamos pensar en c¨®mo podemos satisfacer las nuevas necesidades de los usuariosLiz Reid, directora de Google Search
Reid explica que el sistema convencional, aunque admite que ha sido una ¡°herramienta incre¨ªblemente poderosa¡±, ¡°requiere mucho trabajo¡±. La b¨²squeda tradicional (conocida como googlear) de un restaurante o cualquier otro servicio cerca de la ubicaci¨®n del usuario ofrece un mapa de sus localizaciones y una ristra de sus p¨¢ginas webs donde el demandante de la informaci¨®n tiene que completar el proceso consultando una a una y sorteando, si quiere, las que pagan por situarse en la cabeza de los resultados. O tambi¨¦n puede ir acotando y precisando qu¨¦ tipo de comida o servicio espec¨ªfico necesita hasta conseguir listas de webs m¨¢s precisas.
Este tedioso proceso llega a su fin. ¡°Modificamos radicalmente c¨®mo funciona¡±, afirma Sundai Pichai, m¨¢ximo responsable de Google. Y Reid lo completa: ¡°Hemos construido un modelo personalizado de Gemini dise?ado espec¨ªficamente para la b¨²squeda que combina nuestra informaci¨®n en tiempo real con sistemas de clasificaci¨®n y calidad sin precedentes¡±.
La directiva asegura que, en las pruebas realizadas, ¡°la gente tambi¨¦n hace clic en una mayor diversidad de sitios web¡±. Esta tendencia obligar¨¢ a modificar las estrategias de SEO, siglas en ingl¨¦s de Search Engine Optimization (Optimizaci¨®n para Motores de B¨²squeda) y que son las t¨¦cnicas para mejorar la posici¨®n de un sitio web en los resultados de los motores de b¨²squeda. Ahora se tendr¨¢n que adaptar a la forma de procesar la informaci¨®n de la inteligencia artificial.
Los nuevos motores escuchan, entienden el contexto del usuario, razonan, planifican y, a petici¨®n de la persona, pueden ejecutar la orden de compra de un producto o servicio, sugerir complementos y reservar un servicio.
Entiende, ve, razona y planifica
Los nuevos buscadores tienen capacidad de razonar por pasos. De esta forma, le podemos pedir por voz un men¨² semanal que, con la interacci¨®n del usuario o con sus precisiones, ajustar¨¢ a sus gustos. El siguiente paso puede ser que lo adapte a un vegetariano y modificar¨¢ las recetas ya seleccionadas a esta petici¨®n.
Tambi¨¦n planifican. El usuario le puede pedir que programe un viaje a cualquier parte con actividades para ni?os y adultos, uno amante de la naturaleza y otro apasionado de la cultura.
Del mismo modo, pueden comprar por imagen. El usuario solo tiene que introducir un v¨ªdeo e indicar por voz o texto qu¨¦ personaje lleva la prenda que busca y los resultados mostrar¨¢n localizaciones, precios y disponibilidad. O simplemente rodear con el dedo la imagen de la ropa precisa en cuesti¨®n. O incluso mostrar la secuencia de una aver¨ªa y los resultados llevar¨¢n a informaci¨®n para repararla o servicios que lo hacen.
Google ha sido el primero en lanzar su nuevo buscador, pero otras compa?¨ªas, como Microsoft, avanzan con Copilot en similares caracter¨ªsticas y con el apoyo de OpenAI.
Agentes
Precisamente OpenAI, que ha servido de motor en el vertiginoso desarrollo de la inteligencia artificial, a¨²n no ha presentado un producto similar, pero s¨ª ha abierto la brecha con el otro gran avance de esta semana, aunque Google ya lo present¨® en abril para sus clientes de Cloud, la nube que alberga gran parte de los trabajos de los desarrolladores. Se trata de los agentes o asistentes avanzados de inteligencia artificial, los que est¨¢n cavando la tumba de Siri, Alexa o el propio Hey Google.
Solo 24 horas antes que Google anunciara Astra, el nombre de su futuro agente, OpenAI present¨® ChatGPT-4o, un robot conversacional que tambi¨¦n es capaz de ver, o¨ªr, resolver y ejecutar tareas en nombre del usuario. Ser¨¢ accesible a trav¨¦s de la web y de la aplicaci¨®n m¨®vil de forma gratuita, aunque la versi¨®n m¨¢s avanzada (cinco veces m¨¢s capaz) costar¨¢ 20 d¨®lares al mes (18 euros).
Sam Altman, m¨¢ximo responsable OpenAI, coincide con DeepMind en que estos revolucionar¨¢n las vidas, seg¨²n publica MIT Technology Review. Altman tambi¨¦n considera en que las aplicaciones de IA como el generador de im¨¢genes mediante peticiones de voz o texto, como DALL-E o Sora, o de textos, como las primeras versiones de ChatGPT, han sido solo eso, herramientas simples. ¡°Nos han cautivado, pero, en su mayor¨ªa, las usamos para tareas aisladas y tienen una capacidad limitada para aprender sobre nosotros a partir de nuestras conversaciones con ellos¡±, afirma.
El agente es un colega supercompetente que sabe absolutamente todo de mi vida, cada correo electr¨®nico, cada conversaci¨®n que he tenido, pero no se siente como una extensi¨®n. Puede abordar algunas tareas al instante y, para las m¨¢s complejas, salir y hacer una propuesta o regresar con preguntas si es necesarioSam Altman, m¨¢ximo responsable de OpenAI
El asistente avanzado de IA o agente, seg¨²n el directivo responsable de ChatGPT-4o, ¡°es capaz de ayudarnos fuera de la interfaz de chat [el acceso conversacional] y quitarnos de encima las tareas del mundo real¡±. ¡°Es un colega supercompetente que sabe absolutamente todo de mi vida, cada correo electr¨®nico, cada conversaci¨®n que he tenido, pero no se siente como una extensi¨®n. Puede abordar algunas tareas al instante y, para las m¨¢s complejas, salir y hacer una propuesta o regresar con preguntas si es necesario¡±, a?ade.
Chirag Shah, profesor de la Universidad de Washington y ajeno a los desarrollos de las grandes compa?¨ªas coincide. ¡°Este agente realmente te conoce bien, puede hacer muchas cosas por ti y puede trabajar en m¨²ltiples tareas y dominios¡±, afirma tambi¨¦n en MIT Technology Review.
El de Google se denomina Astra y estar¨¢ plenamente operativo a finales de a?o. Su versi¨®n m¨¢s avanzada estar¨¢ disponible en la versi¨®n IA Premium de Google One y se ofrecer¨¢ (ha comenzado en EEUU antes de extenderse) de forma gratuita dos meses para pasar a costar unos 20 d¨®lares al mes (21,99 euros en Espa?a). Google trabaja para incluirlo, adem¨¢s de en el m¨®vil, en gafas inteligentes y otros dispositivos. ¡°Estamos abiertos a todas las formas, pero si OpenAI mantiene una versi¨®n limitada gratuita, es posible que tengamos que hacer lo mismo¡±, admite un directivo que pide no ser identificado durante un encuentro en EE UU .
Estos agentes pueden ver y escuchar mejor lo que hacemos, entienden el contexto en el que nos encontramos y responden r¨¢pidamente en la conversaci¨®nDemis Hassabis, director de Google DeepMind
Astra combina las nuevas capacidades del buscador Gemini con habilidades rob¨®ticas humanizadas, como empat¨ªa y sentidos del o¨ªdo y vista para analizar y registrar el contexto con el fin de responder a cualquier interacci¨®n relacionada con lo que pasa por la c¨¢mara y los micr¨®fonos. Demis Hassabis, lo explica: ¡°Estamos procesando un flujo de informaci¨®n sensorial diferente. Estos agentes pueden ver y escuchar mejor lo que hacemos, entienden el contexto en el que nos encontramos y responden r¨¢pidamente en la conversaci¨®n, haciendo que el ritmo y la calidad de la interacci¨®n sean mucho m¨¢s naturales¡±.
Con estas habilidades, Astra y ChatGPT-4o son capaces de acompa?ar al usuario desde el m¨®vil y ver el contexto en el que se produce la interacci¨®n para responder c¨®mo se llama la parte espec¨ªfica de un objeto que se?ala o resolver un problema matem¨¢tico escrito sobre un papel o identificar una p¨¢gina de c¨®digos o saber d¨®nde hemos dejado un objeto que haya pasado por sus ojos.
Pero, aunque estas capacidades sean espectaculares, su mayor utilidad est¨¢ en el ¨¢mbito cotidiano de trabajo o dom¨¦stico. El usuario puede pedirle que identifique todos los gastos destinados a una partida, como los seguros o la electricidad, los analice, los muestre en una hoja ordenada por cuant¨ªas e incluso identifique opciones de ahorro.
El agente se mover¨¢ por los correos, los documentos almacenados y cualquier archivo o web que contenga esa informaci¨®n y al que se le autorice el acceso, lo resumir¨¢ y ordenar¨¢, navegar¨¢ por las p¨¢ginas de proveedores de los servicios en cuesti¨®n, propondr¨¢ un plan de ahorro y, si el usuario lo demanda, ejecutar¨¢ las renovaciones, bajas o sustituciones.
Las aplicaciones son varias y el objetivo es contar con m¨¢quinas asistentes de forma general. Minsu Jang, investigador principal del Laboratorio de Rob¨®tica Social del Instituto de Investigaci¨®n en Electr¨®nica y Telecomunicaciones de Corea, trabaja el desarrollo de la IA para planificaci¨®n de tareas: ¡°Planeamos investigar y desarrollar tecnolog¨ªas que puedan predecir fallos en tareas en situaciones inciertas y mejorar la respuesta al humano cuando pida ayuda. Esta tecnolog¨ªa es esencial para hacer realidad la era de un robot por hogar¡±.
Ventajas y riesgos
El trabajo de una decena de universidades y entidades para DeepMind sobre los nuevos desarrollos identifica ventajas y riesgos de estos.
En el primer grupo, destacan que estos agentes o asistentes avanzados pueden ¡°empoderar a los usuarios¡± para alcanzar sus metas o su bienestar o actuar como ¡°mentores, amigos o asesores de confianza¡±. En este sentido, un nuevo estudio publicado recientemente en el Journal of the American Medical Informatics Association (JAMIA), revela c¨®mo la inteligencia artificial es capaz de responder a diferentes estados motivacionales. En una evaluaci¨®n de ChatGPT, Gemini y Llama (Meta), la Universidad de Illinois ha mostrado la importancia de esta habilidad. ¡°Los agentes pueden ayudar a aumentar, por ejemplo, la conciencia sobre los comportamientos saludables, a comprometerse emocionalmente con los cambios y a darse cuenta de c¨®mo sus h¨¢bitos podr¨ªan afectar a las personas que los rodean¡±, explica Michelle Bak, investigadora de los modelos.
Tambi¨¦n pueden ayudar a los usuarios a tomar decisiones m¨¢s informadas o a desarrollar su creatividad o la formaci¨®n personal o a la resoluci¨®n de problemas, aportando m¨¢s tiempo para otras actividades, como la relaci¨®n personal o familiar.
Pero este mundo ideal tiene tambi¨¦n sus sombras. Esta misma semana se ha producido una dimisi¨®n en el departamento de seguridad de OpenAI. Jan Leike, uno de sus directores, ha sido tajante al escribir en X que la empresa valora m¨¢s la creaci¨®n de nuevos productos que la seguridad y ha acompa?ado el portazo de una reflexi¨®n. ¡°Construir m¨¢quinas m¨¢s inteligentes que los humanos es una empresa intr¨ªnsecamente peligrosa¡±.
Estos robots que pueden acompa?arnos en nuestros bolsillos pueden equivocarse al interpretar los intereses de los usuarios y de la sociedad o utilizar fuentes de informaci¨®n imprecisas e incluso falsas para lanzar sus propuestas y conclusiones o priorizar soluciones a corto plazo frente a las consecuencias a largo plazo.
Los asistentes de IA tambi¨¦n podr¨ªan vulnerar la privacidad y ser potencialmente inseguros si arrojan una respuesta incorrecta o incluso da?ina para el usuario con apariencia de veracidad. Las alucinaciones, como se denominan estos errores, son habituales en las herramientas existentes.
Del mismo modo, pueden responder a intereses particulares de los desarrolladores y limitar las respuestas solo a los objetivos de estos, que pueden ser econ¨®micos, y no de los usuarios o incluso primar el beneficio de estos ¨²ltimos frente a las consecuencias en la colectividad.
Y estos agentes pueden imponer valores a la sociedad, creando corrientes de opini¨®n determinadas, o ser utilizados para campa?as maliciosas de ataques inform¨¢ticos. ¡°Hemos investigado 36 elecciones parlamentarias, regionales y presidenciales celebradas entre septiembre de 2023 y febrero de 2024 y descubierto que, en al menos 10 casos, se utilizaron v¨ªdeos y grabaciones de audio con clonaci¨®n de voz para campa?as de desinformaci¨®n. En el contexto de las elecciones europeas, podemos esperar una nueva oleada de enga?os en todos los pa¨ªses¡±, explica Sergey Shykevich, director del grupo de inteligencia sobre amenazas de Check Point Research.
Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y X o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.