Google lanza Gemini, un modelo de inteligencia artificial capaz de superar a los humanos en comprensi¨®n del lenguaje multitarea
La multinacional presenta versiones de la nueva plataforma para su aplicaci¨®n en todas las utilidades de su entorno, desde Bard hasta los tel¨¦fonos
La carrera por la inteligencia artificial (IA) se ha convertido en una prueba de velocidad. A los avances en ChatGPT, que ya va por su cuarta versi¨®n, y los consecutivos anuncios de las grandes multinacionales de sus propios sistemas, Google ha respondido este mi¨¦rcoles con el lanzamiento de Gemini, una plataforma de inteligencia artificial multimodal que puede procesar y generar texto, c¨®digo, im¨¢genes, audio y v¨ªdeo desde distintas fuentes de datos. La versi¨®n Ultra, ¡°disponible a comienzos del pr¨®ximo a?o¡±, seg¨²n ha anunciado Eli Collins, vicepresidente de productos en Google DeepMind, supera a los humanos en comprensi¨®n masiva del lenguaje multitarea (MMLU, por sus siglas en ingl¨¦s), una referencia de evaluaci¨®n creada a partir de 57 materias de ciencias, tecnolog¨ªa, ingenier¨ªa, matem¨¢ticas (STEM), humanidades y ciencias sociales.
¡°Gemini es nuestro mayor y m¨¢s capaz modelo de IA¡±, asegura Collins, quien explica que est¨¢ ¡°inspirado en la forma en que las personas entienden el mundo e interact¨²an con ¨¦l¡±. ¡°Se percibe m¨¢s como un colaborador ¨²til y menos como una pieza inteligente de programaci¨®n¡±, afirma.
Durante la presentaci¨®n, Gemini ha sido capaz de identificar una forma geom¨¦trica, analizar la formulaci¨®n para hallar su ¨¢rea y descubrir un error en la misma para proponer y explicar un resultado acertado al problema. De esta forma, es capaz de arrojar resultados a partir de datos de imagen, texto alfanum¨¦rico y voz. Tambi¨¦n ha identificado diferentes formas y dibujos, algunos a partir solo de puntos dispersos, y proponer usos de las figuras o de los objetos presentados o elaborar un relato a partir de propuestas alternativas o desarrollar gr¨¢ficos actualizados con la informaci¨®n buscada por la propia plataforma.
Seg¨²n el vicepresidente de DeepMind, ha obtenido m¨¢s de un 90% de puntuaci¨®n en MMLU, el sistema de evaluaci¨®n para comprensi¨®n del lenguaje multitarea. ¡°Es el primer modelo de IA que supera a los expertos humanos en este punto de referencia est¨¢ndar de la industria¡±, afirma. Gemini tambi¨¦n ha aprobado (59,4%) el examen de ¡°comprensi¨®n de tareas multimodales que incluyen demandas que requieren un razonamiento deliberado¡±.
Gemini no es una aplicaci¨®n sino la plataforma para llevar este ¨²ltimo modelo de inteligencia artificial a los servicios existentes, desde Bard, el chat de Google competidor de ChatGPT, hasta el buscador o los gestores de servicios o los m¨®viles con Android o los centros de datos a gran escala.
Para esto, estar¨¢n disponibles tres ¡°tama?os¡± de Gemini: el Nano, que ya se puede usar por parte de los desarrolladores de Android; el Pro, que estar¨¢ disponible a partir del 13 de diciembre y el Ultra, que se podr¨¢ implementar a partir de principios de a?o en una fecha a¨²n por determinar. Los desarrolladores y clientes empresariales podr¨¢n acceder a Pro a trav¨¦s de la API Gemini en Google AI Studio o Vertex AI. A trav¨¦s de AICore, los desarrolladores de Android tambi¨¦n podr¨¢n crear aplicaciones con Nano.
Bard
Sissie Hsiao, responsable de asistentes y Bard ha anunciado que Gemini se incorpora ya a este ¨²ltimo chat en ingl¨¦s para 180 pa¨ªses y se extender¨¢ al resto de idiomas progresivamente, aunque ha admitido que tendr¨¢n que confirmar que su desarrollo es compatible con la inminente normativa europea sobre inteligencia artificial, que incluye estas plataformas de di¨¢logo entre sus desarrollos regulables. Y con su inclusi¨®n en Bard, se extender¨¢ a todas las aplicaciones compatibles.
El proceso ser¨¢ en dos fases: la primera utilizar¨¢ una versi¨®n de Pro, que dotar¨¢ al chat de ¡°razonamiento m¨¢s avanzado, planificaci¨®n, comprensi¨®n y otras capacidades¡±, seg¨²n Hsiao; y la segunda, a principios del pr¨®ximo a?o, con mejoras que culminar¨¢n con la adopci¨®n de la versi¨®n Ultra.
Gemini ha nacido como multimodal, es decir, no se ha entrenado con diferentes modalidades de datos y se han unificado luego las capacidades diferenciadas, sino que su programaci¨®n ya parte de la diversidad de fuentes. Seg¨²n explica Collins, ¡°esto ayuda a Gemini a comprender sin problemas todo tipo de entradas mucho mejor que los modelos existentes y sus capacidades son de ¨²ltima generaci¨®n¡±.
Tambi¨¦n es capaz de programar incluyendo desarrollos complejos. En este sentido, Amin Vahdat, vicepresidente en Google Cloud, asegura: ¡°En el futuro, veremos a los programadores haciendo uso de modelos de IA de alta capacidad como herramientas colaborativas que ayudan con todo el proceso de desarrollo de software, desde el razonamiento sobre los problemas hasta la asistencia con la implementaci¨®n, el rendimiento y las capacidades¡±.
Sobre la seguridad, Google afirma que Gemini supera ¡°las evaluaciones m¨¢s completas de todos los modelos hasta la fecha¡±. La compa?¨ªa asegura que ha sometido a la plataforma a todos los riesgos existentes y potenciales y que mantiene un examen continuo que incluye ¡°pruebas de estr¨¦s¡±. Tambi¨¦n se han aplicado los principios de IA de la propia compa?¨ªa, que establecen las normas ¨¦ticas de sus desarrollos.
Pese a los avances, Gemini no es infalible, seg¨²n reconocen sus responsables. Admiten que arrojar¨¢ errores y alucinaciones (respuestas de apariencia segura no justificada por datos). ¡°Hemos progresado mucho y Gemini es nuestro mejor modelo en ese sentido, pero todav¨ªa es, dir¨ªa yo, un problema de investigaci¨®n sin resolver¡±, admite Collins.
Puedes seguir a EL PA?S Tecnolog¨ªa en Facebook y X o apuntarte aqu¨ª para recibir nuestra newsletter semanal.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.