Que no te den gato por liebre�� ?o s��?

Las m��quinas ya son capaces de imaginar y crear caras de personas nuevas, indistinguibles de personas reales

Victor Gallego David Gordo G��mez Roi Naveiro

07 jun 2019 - 16:09CEST

El escritor de ciencia ficci��n Philip K. Dick no iba desencaminado cuando planteaba que los androides pudieran so?ar con ovejas el��ctricas. Hoy en d��a, las m��quinas ya son capaces de imaginar y crear caras de personas nuevas, indistinguibles de personas reales. Esta aplicaci��n de la inteligencia artificial (IA) ha originado desarrollos sin precedentes en ciertos campos de la modelizaci��n matem��tica, llegando a interaccionar incluso con un rama aparentemente lejana de las exactas, la teor��a de juegos. Repasemos c��mo se ha llegado a este punto.

En los albores de la IA, los padres de esta disciplina se devanaban los sesos en dilucidar de qu�� manera una m��quina pod��a aprender a distinguir, en un sentido amplio: diferenciar una transacci��n fraudulenta de una leg��tima, un correo basura de uno ordinario, o un gato de una liebre, entre muchos ejemplos.

Los modelos matem��ticos subyacentes a esta apasionante tarea se han dado en llamar, en un alarde de originalidad, modelos discriminativos. Tras a?os de esfuerzo hemos visto c��mo, en efecto, las m��quinas aprenden a distinguir, siendo capaces incluso de diferenciar el rostro de un usuario del de cualquier intruso para desbloquear o no su tel��fono m��vil. Pero los investigadores en IA no parecen satisfechos con el logro�� ?realmente entienden las m��quinas lo que est��n haciendo? En la l��nea de lo que proclamaba el f��sico Richard Feynmann ��aquello que no puedo crear, no lo entiendo��, la investigaci��n se ha centrado en lograr que las m��quinas aprendan a crear. Crear correos spam, correos leg��timos, fotos de liebres, de gatos e incluso de personas. Y como habr�� adivinado el lector despierto, los modelos matem��ticos que se utilizan en este ��mbito se denominan modelos generativos.

Pero una cosa est�� clara, si la m��quina es capaz de aprender a generar una foto de un gato o de una liebre, es decir, ha ��entendido�� la anatom��a de estos mam��feros, tambi��n ser�� capaz de distinguir un gato de un liebre. Por tanto, no nos equivocamos al pensar que la tarea de generar es intr��nsecamente m��s compleja que la de discriminar. Uno de los grandes retos de los modelos generativos se encuentra en la dificultad de cuantificar el error: es dif��cil medir c��mo de bien est�� generando la m��quina. En la tarea de discriminar, cuantificar el error cometido por una m��quina al distinguir gatos de liebres ser��a tan sencillo como ordenarle etiquetar millones de fotos como gato o liebre y contar cu��ntas veces se ha equivocado. Pero, ?qu�� sucede si la m��quina genera im��genes de gatos?, ?c��mo se mide la calidad de un gato generado?, ?un gato bonito es m��s gato que uno feo?, ?en qu�� momento un gato generado deja de serlo? Cuantificar el error en esta situaci��n es, adem��s de subjetivo, bastante complejo.

Ian Goodfellow, investigador de la Universidad de Montreal, resolvi�� este entuerto de una manera singular: visto que no existe criterio claro para medir c��mo de buenas son las liebres generadas respecto de las reales, dejemos que esta tarea la haga otro. ?Y qui��n puede cuantificar mejor la calidad de las im��genes generadas que un modelo discriminativo que haya aprendido, precisamente, a distinguir im��genes reales de im��genes generadas? La idea es la siguiente: enfrentaremos a dos m��quinas, una generativa, que produce im��genes y otra discriminativa que aprende a distinguir im��genes reales de im��genes generadas. Esperamos que, cuando las generadas sean suficientemente ��buenas�� (suele ocurrir tras unas cuantas horas de c��lculo en las cuales el generador va aprendiendo con el feedback del discriminador), la m��quina generativa pueda enga?ar al discriminador. De esta manera, la capacidad de enga?ar al discriminador es una medida de lo buenas que son las im��genes generadas. Matem��ticamente, el conflicto entre generador y discriminador se aborda desde la teor��a de juegos: cada uno de los dos actores tiene su propio objetivo que debe ser alcanzado simult��neamente, hasta llegar a un punto donde ninguno de los dos pueda mejorar unilateralmente. Una vez m��s, se aprecia la sinergia entre ��reas (aparentemente) diferentes de las exactas.

Si la m��quina es capaz de aprender a generar una foto de un gato o de una liebre, es decir, ha ��entendido�� la anatom��a de estos mam��feros, tambi��n ser�� capaz de distinguir un gato de un liebre

La idea de Goodfellow se conoce como red generativa antag��nica (del ingl��s, GAN). Tras su aparici��n en 2014, las GANs han calado hondo entre los investigadores en IA. Gran parte del inter��s que han suscitado se debe a la capacidad de las GANs de generar im��genes realistas. No obstante, no hay nada que impida aplicar la misma idea a otro tipo de datos. La estructura matem��tica subyacente es lo suficientemente general para poder utilizarse en campos realmente diversos como la simulaci��n de eventos en colisionadores de part��culas, la creaci��n de piezas musicales o la generaci��n de texto. Un ejemplo del realismo alcanzado es el algoritmo de la compa?��a NVIDIA, que permite generar fotos de caras especificando atributos, como el color de ojos o pelo.

Por supuesto, los grandes avances que est��n surgiendo en el campo acarrean consigo una fuerte pol��mica sobre sus posibles aplicaciones maliciosas. En una ��poca en la que las tristemente famosas fake news han cobrado gran importancia pol��tica, la automatizaci��n de la creaci��n de noticias falsas est�� a la vuelta de la esquina. El monopolio de este desarrollo se concentra en manos de grandes empresas que compiten por liderar esta revoluci��n. ?Quiz��s en aras de una sociedad mejor informada??

Victor Gallego y Roi Naveiro son investigadores predoctorales en el ICMAT.?David Gordo G��mez es investigador postdoctora en el ICMAT,

Caf�� y Teoremas es una secci��n dedicada a las matem��ticas y al entorno en el que se crean, coordinado por el Instituto de Ciencias Matem��ticas (ICMAT), en la que los investigadores y miembros del centro describen los ��ltimos avances de esta disciplina, comparten puntos de encuentro entre las matem��ticas y otras expresiones sociales y culturales y recuerdan a quienes marcaron su desarrollo y supieron transformar caf�� en teoremas. El nombre evoca la definici��n del matem��tico h��ngaro Alfred R��nyi: "Un matem��tico es una m��quina que transforma caf�� en teoremas".

Edici��n y coordinaci��n:?gata Tim��n (ICMAT).

Puedes seguir a MATERIA en Facebook, Twitter, Instagram o suscribirte aqu�� a nuestra newsletter?

Tu suscripci��n se est�� usando en otro dispositivo

?Quieres a?adir otro usuario a tu suscripci��n?

A?adir usuario Continuar leyendo aqu��

Si contin��as leyendo en este dispositivo, no se podr�� leer en el otro.

?Por qu�� est��s viendo esto?

Flecha

Tu suscripci��n se est�� usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripci��n a la modalidad Premium, as�� podr��s a?adir otro usuario. Cada uno acceder�� con su propia cuenta de email, lo que os permitir�� personalizar vuestra experiencia en EL PA?S.

?Tienes una suscripci��n de empresa? Accede aqu�� para contratar m��s cuentas.

En el caso de no saber qui��n est�� usando tu cuenta, te recomendamos cambiar tu contrase?a aqu��.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrar�� en tu dispositivo y en el de la otra persona que est�� usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu�� los t��rminos y condiciones de la suscripci��n digital.