Dar��o Gil, IBM Research: ��Este a?o estar�� el primer modelo de inteligencia artificial en espa?ol con casos de uso��

El responsable del centro de investigaci��n mundial es el valedor de la IA para hispanohablantes, que se alimentar�� con datos p��blicos, incluidos debates parlamentarios, y de ��cualquiera que quiera aportar��

08 abr 2024 - 05:20CEST

Dar��o Gil, vicepresidente de IBM y m��ximo responsable de la divisi��n mundial de investigaci��n de la compa?��a.

El cerebro humano es la estructura natural m��s compleja del universo conocido, con 86.000 millones de neuronas que transmiten 1.000 impulsos por segundo. Imitar solo una parte de esa extraordinaria maquinaria biol��gica para aprender, entender y responder en el espa?ol que hablan m��s de 500 millones de personas es la monumental tarea encargada por el Gobierno y en la que se han embarcado el Barcelona Supercomputing Center (BSC) con su superordenador MareNostrum y la multinacional IBM, que pondr�� a disposici��n del proyecto todo su po...

Suscr��bete para seguir leyendo

Lee sin l��mites

Seguir leyendo Seguir leyendo

Ya soy suscriptor

Dar��o Gil, murciano criado en Madrid que este 2024 cumple 49 a?os, ha sido el principal valedor tecnol��gico de esta aventura como m��ximo responsable de la divisi��n mundial de investigaci��n de IBM. Participa en esta entrevista poco despu��s de firmar el acuerdo que dar�� lugar al primer gran modelo de lenguaje de inteligencia artificial nacido en espa?ol. Convencido de que este avance es exponencial y s��lido �D��una revoluci��n��, proclama�D, apuesta por una arquitectura abierta y colaborativa donde quepa todo, desde las actas de sesiones parlamentarias hasta la Real Academia Espa?ola o cualquier universidad o colectivo hispanohablante. Calcula que el primer desarrollo se podr�� mostrar este a?o.

Pregunta. ?Por qu�� apuesta IBM por la inteligencia artificial en espa?ol?

Respuesta. Nuestro punto de vista sobre la inteligencia artificial nos permite alinearnos con la estrategia que tiene el Gobierno. Creemos firmemente que el futuro de la inteligencia artificial se va a crear y definir a trav��s de un ecosistema abierto y eso contrasta con otras empresas. Sucedi�� con los sistemas operativos hace m��s de 20 a?os y se hizo bien en su momento. Fue una apuesta decidida para que el futuro de los sistemas operativos, tanto en supercomputaci��n como para todos los sistemas distribuidos de internet y dem��s, est��n basados en c��digo abierto. Nosotros hemos llegado al mismo convencimiento y la comunidad quiere participar en la creaci��n de la inteligencia artificial.

P. ?C��mo ser�� la participaci��n?

R. Vamos a crear entornos colaborativos para desarrollar modelos fundacionales basados en c��digo abierto donde haya transparencia en los datos que se van a utilizar para el preentrenamiento y una metodolog��a. Es muy importante para incrementar la capacidad de los modelos de manera discreta y d��a a d��a. Los modelos fundacionales existentes necesitan de seis a nueve meses de preentrenamiento y sacan versiones una vez al a?o. Si nosotros tenemos un modelo base para toda la comunidad de desarrolladores, para todo el que quiera a a?adir conocimiento o capacidades, vamos a trabajar conjuntamente para crear los mejores modelos fundacionales abiertos en espa?ol y las lenguas cooficiales.

Si hay burbuja es de catastrofistas, pero la base tecnol��gica de la inteligencia artificial es potente y s��lida

P. C��mo se va a desarrollar?

R. Desde el punto de vista de computaci��n, utilizaremos las capacidades existentes en el BSC. Con su MareNostrum hay un compromiso del ministro [para la Transici��n Digital, Jos�� Luis Escriv��] de seguir invirtiendo para acelerar el paso del MareNostrum 5 al 6. Por nuestra parte, aportamos centros de supercomputaci��n dedicados a inteligencia artificial y los ��ltimos avances de IBM Research.

P. ?Cu��les son los sectores prioritarios a los que va dirigido el modelo?

R. A todos, pero el Gobierno tiene inter��s en garantizar que se beneficie la peque?a y mediana empresa, donde hay mayor inhibici��n o complejidad a la hora de adoptar ese tipo de innovaciones, y la Administraci��n del Estado. Hemos definido casos de uso para implementar la difusi��n de la inteligencia artificial en estos dos sectores.

El modelo utilizar�� datos p��blicos, pero hay un deseo de utilizar documentos que son propiedad del Estado, que es una cuesti��n muy singular e interesante. Las transcripciones de todos los debates del Parlamento es un ejemplo

P. ?Cu��nto cuesta?

R. No hay una respuesta concreta. Pero, si sirve para hacer una aproximaci��n, puedo decir que para crear un modelo fundacional de alto rendimiento se necesitan miles de unidades de procesamiento que cuestan, cada una, 35.000 d��lares [32.300 euros] como m��nimo. Son proyectos muy ambiciosos; esto no es dos personas que hablan una tarde y hacen un PowerPoint. En IBM Research tenemos 3.600 cient��ficos e ingenieros que participar��n y nuestros propios equipos de supercomputaci��n dedicados exclusivamente a crear modelos fundacionales. Y, como es un sistema abierto, habr��a que sumar la comunidad de desarrolladores hispanohablantes que quieran participar. Son esfuerzos que van en paralelo.

P. ?De d��nde saldr��n los datos para alimentar el modelo?

R. Ser��n datos p��blicos, pero hay un deseo de utilizar documentos que son propiedad del Estado, que es una cuesti��n muy singular e interesante. Las transcripciones de todos los debates del parlamento es un ejemplo. Pero tambi��n se prev�� la colaboraci��n de las bibliotecas nacionales y la Real Academia Espa?ola. Ser��n datos que son p��blicos.

Al modelo le puedes pedir respuestas consistentes con la experiencia argentina y se comportar�� de esa manera, aprender�� del contexto desde donde se genera la interacci��n

P. ?Y c��mo se salva la diversidad de hablas del espa?ol?

R. Desde el punto de vista matem��tico, se pueden incorporar una gran diversidad de idiomas. La diversidad est�� dentro de la misma red neuronal y luego, cuando se hace el fine tuning [ajuste o perfeccionamiento], se adapta, aunque se haya entrenado con los documentos base, a las diferentes variaciones del espa?ol. Al modelo le puedes pedir respuestas consistentes con la experiencia argentina y se comportar�� de esa manera, aprender�� del contexto desde donde se genera la interacci��n.

P. Pero ��coger una cita�� en castellano puede no tener el mismo significado en algunos pa��ses de Hispanoam��rica, por poner un ejemplo para un caso de uso administrativo.

R. El modelo base aumentar��, se especializar�� y ganar�� habilidades con el esfuerzo de todos para que entienda contextos espec��ficos. El modelo de c��digo abierto permite esa enorme diversidad. Y el objetivo es expandirlo lo m��s posible, incluso a Brasil. Iberoam��rica es un mercado enorme de oportunidades y es importante aprovechar la ventaja competitiva del espa?ol.

El objetivo es expandirlo lo m��s posible, incluso a Brasil. Iberoam��rica es un mercado enorme de oportunidades y es importante aprovechar la ventaja competitiva del espa?ol

P. ?Cu��ndo estar�� disponible el primer modelo?

R. El objetivo es hacer algo este a?o y, en paralelo, desarrollar algunos casos de uso en las mismas fechas. En este mundo [de la inteligencia artificial], que es muy din��mico, a nadie le interesan los plazos de a?os.

P. ?Y qu�� gana IBM?

R. Pondr�� el ejemplo de Red Hat [multinacional de programaci��n de c��digo abierto cuya empresa matriz es IBM]. Factura miles de millones de d��lares anuales y es la mayor empresa del mundo de software abierto. El modelo es facilitar el programa a empresas y gobiernos que, luego, querr��n mantenimiento o seguridad compatible con los equipos. A ese modelo comercial estamos acostumbrados. No lo hacemos porque seamos altruistas, sino porque creemos en ese modelo. Queremos socios estrat��gicos y hemos encontrado much��simas resonancias en el Gobierno de Espa?a. En la alianza de inteligencia artificial que tenemos hay m��s de 80 instituciones que forman parte de este compromiso.

P. ?Hay burbuja de la inteligencia artificial?

R. La tecnolog��a en s�� est�� evolucionando a una velocidad como nunca he visto hacerlo a ninguna otra. Y ya no planificamos a un a?o o dos, sino para dentro de un mes, semanas o d��as. No veo burbuja. Si la hay es de catastrofistas, pero la base tecnol��gica es potente y s��lida.

Puedes seguir a EL PA?S Tecnolog��a en Facebook y X o apuntarte aqu�� para recibir nuestra newsletter semanal.

Sobre la firma

Ra��l Lim��n

M��s informaci��n

Menos hamburguesas y m��s paellas: as�� ser�� el ChatGPT espa?ol anunciado por Pedro S��nchez

Jordi P��rez Colom��

Microsoft anuncia la mayor inversi��n de su historia en Espa?a para infraestructura de IA

Patricia Fern��ndez de Lis