Asunci¨®n G¨®mez-P¨¦rez, acad¨¦mica de la RAE: ¡°La tecnolog¨ªa es neutra, el problema somos nosotros¡±
?Una cient¨ªfica inform¨¢tica en la RAE? ?Sacrilegio? No: esta eminencia espa?ola en el campo de la inteligencia artificial desembarc¨® hace unos meses en el templo de la palabra para velar por la coherencia entre el lenguaje humano de siempre y el lenguaje de las m¨¢quinas.
Asunci¨®n G¨®mez-P¨¦rez (Azuaga, Badajoz, 56 a?os) es una eminencia en el campo de la inteligencia artificial (IA). Figura entre el 2% de las autoridades acad¨¦micas m¨¢s citadas en el mundo, seg¨²n el ¨ªndice de la Universidad de Stanford, donde estudi¨®, adem¨¢s de formarse en la Polit¨¦cnica de Madrid, de la que es hoy vicerrectora de Investigaci¨®n, Innovaci¨®n y Doctorado. De lo que se ocupa esta cient¨ªfica inform¨¢tica es de la...
Asunci¨®n G¨®mez-P¨¦rez (Azuaga, Badajoz, 56 a?os) es una eminencia en el campo de la inteligencia artificial (IA). Figura entre el 2% de las autoridades acad¨¦micas m¨¢s citadas en el mundo, seg¨²n el ¨ªndice de la Universidad de Stanford, donde estudi¨®, adem¨¢s de formarse en la Polit¨¦cnica de Madrid, de la que es hoy vicerrectora de Investigaci¨®n, Innovaci¨®n y Doctorado. De lo que se ocupa esta cient¨ªfica inform¨¢tica es de la ontolog¨ªa de la IA, es decir, de traducir y definir en las m¨¢quinas el lenguaje com¨²n que deben utilizar para razonar e identificar a lo que se refieren. Por eso, desde el pasado 21 de mayo ocupa el sill¨®n q de la Real Academia Espa?ola (RAE), para acompa?ar a la instituci¨®n en los retos que su campo afronta respecto al idioma. Su perfil es tan ins¨®lito dentro de la instituci¨®n que la respuesta a su discurso de ingreso ¡ªInteligencia artificial y lengua espa?ola¡ª fue respondido por Santiago Mu?oz Machado, el director. Los retos de la carrera del idioma en el espacio tecnol¨®gico son enormes. Las empresas de este campo desarrollan sus propios programas y corpus con fuentes no del todo rigurosas y la RAE ha decidido implicarse para que Google, Amazon o Microsoft, por ejemplo, utilicen bien el idioma en ese ¨¢mbito.
Su ingreso en la RAE ?no ser¨¢ una argucia para que cuando se re¨²nan los jueves aprovechen para consultarle a usted sus problemas con los m¨®viles?
No, no, no¡
?Seguro?
Nada, nada. Tienen un departamento en la casa que se ocupa de eso. No est¨¢n abusando, te digo yo que no.
?Siguieron bien su discurso? Era muy t¨¦cnico.
Yo creo que s¨ª, muchos est¨¢n interesados en temas de corpus, derechos de propiedad intelectual y que la inteligencia artificial sea respetuosa con las creaciones previas.
?Cu¨¢ndo vio por primera vez un ordenador?
En tercero de BUP, deb¨ªa de tener 15 o 16 a?os.
?Qu¨¦ le contaron que hab¨ªa dentro?
Me lo ense?¨® un amigo m¨ªo que se llama Manuel Monterrubio, ¨¦l ya hab¨ªa hecho sus pinitos con Basic y los Spectrum que exist¨ªan entonces, pero yo llego a la inform¨¢tica cuando en el COU decido hacer una carrera que tuviera m¨¢s matem¨¢ticas y f¨ªsica en vez de Farmacia. Mi familia procede de ese campo. Mi padre era m¨¦dico.
Y se traslad¨® a Madrid¡
S¨ª, mi prima estaba haciendo Ciencias Exactas en la rama de Computaci¨®n y me convenci¨®. Me dijo que al parecer eso iba a tener mucho futuro como pre¨¢mbulo de la Inform¨¢tica. Entr¨¦ en el a?o 1985 en la Polit¨¦cnica.
Aquello entonces era un lenguaje ignoto.
S¨ª, en esos a?os solo se pod¨ªa estudiar Inform¨¢tica en Madrid, Pa¨ªs Vasco y Catalu?a. Vine aqu¨ª porque estaba a siete horas de Badajoz, m¨¢s cerca. No se sab¨ªa muy bien entonces lo que era la computaci¨®n. Hac¨ªamos pr¨¢cticas en ordenadores que estaban en un centro de c¨¢lculo y hab¨ªa que reservar las horas. Fui descubriendo lo que era la computaci¨®n a medida que hice los seis a?os de carrera.
?Cu¨¢ndo se dio cuenta de que lo que hab¨ªa elegido iba a ser lo que cambiar¨ªa el mundo hasta lo que tenemos hoy?
Creo que me di cuenta ya terminando la carrera. En tercero percib¨ª el futuro que tendr¨ªa la digitalizaci¨®n, pero lo que me enganch¨® fue la inteligencia artificial. Ya en tercero realiz¨¢bamos sistemas expertos para detectar fallos en trenes. Algo pr¨¢ctico para aplicar en la vida real.
?Lleg¨® del mundo anal¨®gico y entendi¨® que acabar¨ªamos abocados al mundo digital?
S¨ª. Exacto. A finales de los ochenta y principios de los noventa est¨¢bamos en procesos elementales que se convertir¨ªan en fundamentales para todo el mundo.
Y la inteligencia artificial entonces, ?en qu¨¦ estadio andaba?
La IA trata de dotar a las m¨¢quinas de capacidades cognitivas. Intent¨¢bamos ver c¨®mo cierto tipo de problemas que resuelve el hombre pod¨ªan ser afrontados por programas inform¨¢ticos. Los sistemas expertos permit¨ªan conceptualizar problemas y soluciones que luego se implementaban en un lenguaje computacional. Internet entonces no estaba al alcance de todo el mundo. Los ordenadores no ten¨ªan una capacidad de c¨¢lculo como la que tienen hoy. Trabaj¨¢bamos con problemas de juguete, acotados por la cantidad de datos que pod¨ªan manejar. No como ahora, que haces cualquier consulta en internet y autom¨¢ticamente te responde.
Como cont¨® usted en su discurso, el ordenador de IBM m¨¢s potente de la ¨¦poca hab¨ªa costado unos 25 millones de d¨®lares y ten¨ªa menos capacidad que un m¨®vil que hoy cueste 200 euros. Ese dato ?cuantifica el salto que hemos dado en pocas d¨¦cadas?
Cuando surgen esos ordenadores lo hacen para facilitar el c¨¢lculo num¨¦rico. Para eso los inventan. Pero llega un momento en que tratan de ver si pueden ir m¨¢s all¨¢ del mero c¨¢lculo y ah¨ª nace la inteligencia artificial, para ver si las m¨¢quinas pueden emular el razonamiento de los seres humanos. La IA se enuncia en 1956, en la Conferencia de Dartmouth, ah¨ª comienzan las universidades y las empresas a trabajar, pero el gran salto se da en los a?os noventa. Alan Turing, con su m¨¢quina Enigma para descifrar mensajes de espionaje, es un precedente en la Segunda Guerra Mundial. Pero a m¨ª me gusta mencionar a Leonardo Torres Quevedo, que dise?¨® dos m¨¢quinas para jugar al ajedrez.
Alguien a reivindicar mucho, efectivamente.
Fue un inventor ¨²nico en su tiempo, no solo hizo eso, tambi¨¦n otras muchas cosas, como el transbordador del Ni¨¢gara¡
La IA sigui¨® muy unida en el desarrollo de sus investigaciones al ajedrez, ?por qu¨¦?
Porque es un juego complejo. Acota en un espacio, el tablero, con un n¨²mero finito de piezas y reglas que se pueden ejecutar. Puedes elaborar una estrategia, por eso permite explorar con todo eso las posibles soluciones hasta un determinado punto. As¨ª hasta que, en 1996, la m¨¢quina Deep Blue derrot¨® a Kasp¨¢rov.
La rama en la que usted se ha especializado es la ontolog¨ªa de la IA, ?en qu¨¦ consiste?
Podr¨ªamos dividir el campo en dos ramas. Una de ellas es la simb¨®lica, utiliza palabras, la ontolog¨ªa. Otra es subsimb¨®lica, aprende. La primera razona y explica, la segunda, como digo, aprende.
?Esta segunda es la que m¨¢s temor nos produce?
Es la que a mucha gente le da miedo, s¨ª. Pero bueno, no s¨¦ si hay que decirlo as¨ª.
Hombre, produce tanto miedo que hasta quienes la han llevado hasta sus mayores l¨ªmites hoy, como Sam Altman, piden que se regule.
S¨ª, pero lo ha hecho despu¨¦s de que su empresa, OpenAI, lance el ChatGPT, es decir, de poner el producto en el mercado. El problema no es la IA, sino c¨®mo se utiliza.
Es decir, ?el problema somos nosotros?
Eso es. La tecnolog¨ªa es neutra. El problema viene del uso que le demos. Siempre ha sido as¨ª. El problema somos nosotros.
Como la ontolog¨ªa utiliza palabras, eso explica que usted haya entrado en la RAE. ?Para qu¨¦?
El diccionario incluye definiciones de palabras para que nosotros seamos capaces de entender conductas u objetos. La ontolog¨ªa ayuda al ordenador a identificar las propiedades de un objeto y diferenciarlo de otros.
Concreta, por tanto.
S¨ª, y adem¨¢s indica que existen ciertas relaciones entre los objetos, que la mesa y la silla suelen acompa?arse, por ejemplo.
Es decir, ?elaboran diccionarios para ordenadores en su campo?
Eso es, s¨ª, pero va m¨¢s all¨¢. Los sistemas cogen palabras, las transforman en n¨²meros y luego vuelven a generar palabras, con lo que pueden haber perdido el significado de la primera fuente.
?C¨®mo la convencieron para entrar en la RAE?
La RAE ha decidido introducir todas las tecnolog¨ªas de IA en sus procesos de trabajo con el lenguaje. La instituci¨®n est¨¢ preocupada por el hecho de que las grandes empresas tecnol¨®gicas no generen, digamos, dialectos propios del espa?ol, no se inventen una gram¨¢tica propia y definiciones porque para eso est¨¢ la RAE desde hace 300 a?os. La Academia est¨¢ preocupada por velar por el buen uso del espa?ol en las redes sociales y los medios de comunicaci¨®n en las distintas ¨¢reas geogr¨¢ficas que unen en la lengua a m¨¢s de 500 millones de personas.
A eso unen la inquietud por el hecho de que, en el ¨¢mbito tecnol¨®gico e internet, la lengua dominante sea el ingl¨¦s.
Es un problema tambi¨¦n importante. La tecnolog¨ªa se crea principalmente en ingl¨¦s, en eso vamos por detr¨¢s. Por eso, las grandes empresas tecnol¨®gicas, cuando traducen, deben apostar por utilizar la base de sus programas en espa?ol, pero en un espa?ol correcto. Eso requiere materiales de mucha calidad y bastante inversi¨®n. En eso se basa el proyecto LEIA, b¨¢sicamente, donde se han realizado avances con las empresas tecnol¨®gicas.
?Cu¨¢les?
Google, Amazon, Microsoft y Telef¨®nica, hasta la fecha.
?Y Meta?
Hoy en d¨ªa, no.
?No la consideran prioritaria?
Para m¨ª en esto influye m¨¢s Google, por ejemplo. Cuando alguien buscaba no hace mucho una palabra en espa?ol, la definici¨®n que aparec¨ªa en primer lugar era la del Diccionario Oxford, hoy aparece la de la RAE, lo cual est¨¢ muy bien. Otro objetivo del proyecto LEIA es tambi¨¦n construir una plataforma abierta en la nube con todas las obras y trabajos de la RAE, con recursos, diccionarios, gram¨¢tica, corpus. As¨ª construiremos nuevas aplicaciones que sirvan a la Academia y a los hispanohablantes en un sistema de innovaci¨®n compartida. Estamos empezando a trabajar en eso.
?Y cuentan con fondos suficientes? La RAE ha sido hasta hace muy poco una instituci¨®n en la que pr¨¢cticamente hab¨ªa que pedir por favor fondos y ayudas al Estado cuando se ocupa de algo que nos concierne a todos: la lengua.
Esto cuesta dinero. El Gobierno ha aportado unos fondos, pero hace falta inversi¨®n importante que vaya m¨¢s all¨¢ de los fondos del Plan de Recuperaci¨®n Europeo que tenemos previsto.
En total, para la RAE y otras instituciones, 340 millones, tal como anunci¨® Nadia Calvi?o en el ¨²ltimo Congreso del Espa?ol en C¨¢diz. ?Suficiente?
Nunca es suficiente. Tiene que abordarse como una inversi¨®n sostenible en el tiempo. Eso lo tenemos clar¨ªsimo.
?Desde cu¨¢ndo existen modelos de lenguaje en espa?ol de la IA?
La primera apuesta fue un sistema que se llamaba Mar¨ªa, para los corpus de la Biblioteca Nacional y el Centro de Supercomputaci¨®n de Barcelona. Luego van otros: uno llamado Rigoberta, BETO en 2019 y BERT en 2018, que se desarrolla en Chile. Pero ahora, ninguno llega a los 30 millones de par¨¢metros que tienen los que desarrollan las empresas tecnol¨®gicas. Esos son el GPT del espa?ol.
Si los que ha citado primero surgen del ?mundo acad¨¦mico e instituciones, ?existe una pugna abierta entre esos y los que desarrollan las ?empresas?
Bueno, los de la iniciativa privada tienen m¨¢s computaci¨®n, m¨¢s corpus. La clave est¨¢ en el proceso. Toman grandes cantidades de textos y palabras y responden en virtud de esos par¨¢metros. A la hora de generar modelos de lenguaje es important¨ªsimo disponer de corpus que est¨¢n formados con rigor. Los sesgos ser¨¢n menores, el lenguaje m¨¢s rico y la variedad geogr¨¢fica mayor. El idioma ser¨¢ mucho m¨¢s fiable y no tendr¨¢, digamos, alucinaciones al mezclar contenidos no relacionados.
Si no, en las respuestas, ?puede salir un poema dad¨¢?
Exactamente.
?Lo mejor en este ¨¢mbito es el famoso ChatGPT?
Es el que tiene ahora mismo mayor cuota de mercado. Pero todas las empresas est¨¢n desarrollando el suyo.
?Cu¨¢l cree que se impondr¨¢?
Las predicciones en tecnolog¨ªa suelen dar error. Se impondr¨¢ la que mayores recursos computacionales de infraestructura tenga, la que est¨¦ entrenada con mejores textos y disponga de buenos ingenieros para los algoritmos. Todas andan en eso.
?Cree que en los ¨²ltimos a?os ha mejorado la conciencia ¨¦tica en el mundo del poder digital y tecnol¨®gico?
Creo que s¨ª, que empieza a surgir una clara conciencia, por ejemplo, respecto a aspectos que tienen que ver con la sostenibilidad o la ecolog¨ªa. Se ha dado un gran paso en la regulaci¨®n con las dos leyes aprobadas en la Uni¨®n Europea, la Digital Act y la de IA. Esta debe ser regulada responsablemente. Varios pa¨ªses, organismos y empresas son conscientes de eso. Ahora ya no partimos de cero en este sentido. Adem¨¢s, disponemos de leyes de protecciones de datos en varios campos o en el sector p¨²blico y el sistema sanitario. Ya tenemos reglas.
?Hemos aprendido suficiente de la jungla que supuso la irrupci¨®n de internet a finales del siglo pasado?
La tecnolog¨ªa va siempre por delante, pero su uso responsable depende tambi¨¦n de las empresas para que saquen a la venta productos seguros, que generen confianza en el ciudadano y respeten los derechos fundamentales.
?Es importante, por otra parte, no incrementar el p¨¢nico?
S¨ª, la tecnolog¨ªa ayuda al progreso. Es cierto que otros la utilizan para generar divisi¨®n, enfrentamiento, bulos, hacer mucho da?o.
Lo malo es que suelen ser elementos que quieren alcanzar el poder.
Hay que buscar el equilibrio. Insisto, las empresas tecnol¨®gicas deben pensar en los aspectos ut¨®picos y dist¨®picos que pueden generar sus productos en el mercado cuando los sacan. En las tesis doctorales que dirigimos aqu¨ª intentamos siempre ver el lado positivo y analizar el negativo. En la escuela tenemos una asignatura de alcances ¨¦ticos y legales, obligamos a ejercer contrapesos, crear conciencia entre los alumnos de c¨®mo pueden contribuir al bien com¨²n como ciudadanos. Muchos productos han pasado del laboratorio a la sociedad con un impacto enorme. No ha existido un proceso intermedio que evite determinados efectos.
Luego son ellos los que se asustan con el uso que les da cierta gente, repito. Los monstruos creados cuando ya no hay marcha atr¨¢s.
Volviendo a Altman, ¨¦l fue quien puso el producto en el mercado y se lo pod¨ªa haber pensado dos veces. Pas¨® con Microsoft y un programa, el TAY, en 2017, que lo retiraron a los dos d¨ªas al ver que produc¨ªa conductas no apropiadas, como comentarios racistas y dem¨¢s. Luego se han aliado con OpenAI, pero en fin¡
Hac¨ªa 90 a?os que el director de la RAE no respond¨ªa un discurso de ingreso.
Fue un honor.
?Indica eso hasta qu¨¦ punto su perfil era tan raro dentro de la instituci¨®n y que solo pod¨ªa ser explicado por una necesidad de estrategia con vistas al futuro?
El director ya hab¨ªa empezado a lanzar esos mensajes dentro de la instituci¨®n. Estaban preocupados y concernidos sobre el efecto de la inteligencia artificial en el ¨¢mbito del espa?ol.
?Hasta el punto de poner en riesgo la buena salud del idioma?
En la comunicaci¨®n entre personas con medios digitales, tenemos aplicaciones en la mensajer¨ªa que nos recomiendan una palabra. Lo hacen a trav¨¦s de lo que aprenden de nosotros por el uso m¨¢s frecuente.
Y son muy puritanos, les cuesta reconocer, por ejemplo, un taco pertinente y bien metido en el WhatsApp.
Bueno, en parte, s¨ª.
?Pero si est¨¢n en el diccionario!
Ya, pero lo grave es que esas palabras que usan ellos produzcan un empobrecimiento o una confusi¨®n a la hora de expresarlas. Si cuentan con un buen diccionario se enriquecer¨¢ con sin¨®nimos y sin faltas de ortograf¨ªa.
Tambi¨¦n Santiago Mu?oz Machado, en su discurso, remarc¨® que usted est¨¢ entre el 2% de las autoridades acad¨¦micas m¨¢s citadas en el mundo seg¨²n el ¨ªndice de la Universidad de Stanford. ?La tengo que tratar de eminencia?
?No, hombre, no! Hay muchos investigadores, a m¨ª estas cosas me dan mucha verg¨¹enza.
?Se sonroj¨® cuando el director lo mencion¨®?
No s¨¦, quiz¨¢s se me notar¨ªa el colorete¡