?Se te hace bola el ¡®deep learning¡¯? Te lo explica un premio Turing
Yann Lecun, director de investigaci¨®n en inteligencia artificial de Facebook, pone los puntos sobre las ¨ªes al potencial y los l¨ªmites de la tecnolog¨ªa de moda
La nueva inteligencia artificial est¨¢ basada en deep learning y este est¨¢ casi totalmente fundamentado en el aprendizaje supervisado". Yann Lecun acaba de entrar en escena. El premio Turing, profesor de la Universidad de Nueva York y cient¨ªfico jefe en el departamento de investigaci¨®n en inteligencia artificial de Facebook se dispone a poner los puntos sobre las ¨ªes a esa inteligencia que tienen las m¨¢quinas modernas, que tan pronto nos maravilla como nos defrauda. No est¨¢ despeinado ahora y no va a estarlo dentro de sesenta minutos, cuando concluya su intervenci¨®n en las TechTalks que organiza peri¨®dicamente la Association for Computer Machinery (ACM): los entresijos de la inteligencia artificial son para ¨¦l tan obvios como para el com¨²n de los mortales es el funcionamiento de una rueda.
- Primera parada: aprendizaje supervisado
"La idea de esto es que entrenas a una m¨¢quina con ejemplos supervisados, para distinguir, por ejemplo, im¨¢genes de coches o aviones", explica Lecun. Despu¨¦s se pone a prueba el sistema. Si no acierta, se ajustan los par¨¢metros de la m¨¢quina, de manera que en la siguiente vuelta aumente la precisi¨®n. Despu¨¦s de haber estado expuestos a suficientes ejemplos y haber recibido suficientes ajustes, alcanzan rendimientos decentes. "Este sistema es muy exitoso en las ¨¢reas para las que hay muchos datos o bien estos son f¨¢cilmente recopilables. Por ejemplo, reconocimiento de texto, im¨¢genes, caras, traducciones...".
El origen de esta t¨¦cnica est¨¢ en el perceptr¨®n, un algoritmo para el aprendizaje supervisado de clasificadores binarios. En 1957, Frank Rosenblat, padre del perceptr¨®n, -que estaba pensado m¨¢s como una m¨¢quina que como un programa-, explicaba su criatura en estos t¨¦rminos:? "Podr¨ªamos hacer que el perceptr¨®n aprenda los conceptos de cuadrado y c¨ªrculo, y que encienda la luz 1 para los cuadrados y la 2 para los c¨ªrculos. Despu¨¦s proceder¨ªamos a mostrar al sistema un amplio conjunto de cuadrados de diferentes tama?os en diferentes entornos al tiempo que mantenemos la luz 1, forzando as¨ª al sistema a responder. Despu¨¦s le mostrar¨ªamos un conjunto de c¨ªrculos manteniendo la luz 2". Perceptr¨®n acababa siendo efectivo en lo suyo, pero poco adaptable a formas y conceptos m¨¢s complejos. "Era lo que hoy llamar¨ªamos una red neuronal de una sola capa", se?ala Lecun.
- M¨¢s y mejor: redes neuronales multicapa
La respuesta a estas limitaciones fueron las redes neuronales multicapa. "La raz¨®n de estas m¨²ltiples capas es el hecho de que el mundo de la percepci¨®n es esencialmente compositivo. De modo que los objetos est¨¢n hechos de partes y las partes de subpartes que est¨¢n hechas de combinaciones de l¨ªmites en una imagen que a su vez est¨¢ hecha de p¨ªxeles", explica el profesor de la Universidad de Nueva York.
Esta matrioska es lo que nos obliga a buscar arquitecturas de m¨²ltiples capas, capaces de detectar rasgos relevantes en distintos niveles. "Si quieres reconocer un coche, es probable que sea buena idea tener algo capaz de detectar formas redondeadas, para poder determinar si hay ruedas en la imagen", contin¨²a Lecun. "Y todo esto se llama deep learning, ¨²nicamente porque hay m¨²ltiples capas. Es as¨ª de sencillo".
- Sin pistas: aprendizaje por refuerzo
El aprendizaje supervisado no es la ¨²nica aproximaci¨®n a las m¨¢quinas moderadamente inteligentes. Otra posibilidad es lo que se conoce como aprendizaje por refuerzo: "Este sistema es fascinante porque a diferencia de lo que ocurre con el aprendizaje supervisado, no necesitas decir a la m¨¢quina cu¨¢l es la respuesta correcta", precisa. La estrategia en este caso es que el sistema interact¨²e un gran n¨²mero de veces con el entorno en cuesti¨®n para lograr el aprendizaje.
?D¨®nde est¨¢ el problema? En que estas cosas llevan tiempo, incluso para conceptos relativamente simples. "Por ejemplo, para entrenar a una red neuronal profunda para jugar a juegos de Atari, la pones a mirar la pantalla y a jugar muchos juegos y va deduciendo qu¨¦ acciones tomar para maximizar la puntuaci¨®n, pero toma unas 83 horas alcanzar el rendimiento que cualquier humano puede alcanzar en 15 minutos de juego", explica Lecun. Incluso en los avances m¨¢s recientes y sofisticados, como el caso de AlphaStar, el programa creado por DeepMind para jugar a Starcraft II, el tiempo de entrenamiento resulta desorbitado: la victoria cost¨® el equivalente a 200 a?os de entrenamiento en tiempo real (el truco es que los agentes artificiales desarrollaron su aprendizaje en un entorno de juego con el ritmo acelerado).
"Estos sistemas son pr¨¢cticos, por ejemplo, para ense?ar a un robot a asir objetos, o a un coche a conducir solo. El coche tendr¨ªa que conducir millones de horas y caer por un precipicio varios miles de veces para aprender a evitarlo", precisa el profesor. El problema es que estas m¨¢quinas no nacen?albergando en su interior un modelo del funcionamiento del mundo: lo construyen a base de ensayo y error. "Esto es una de las limitaciones de las aproximaciones actuales a la inteligencia artificial".
- ?C¨®mo lo hacen los humanos? Aprendizaje autosupervisado
La respuesta a esta cuesti¨®n es, tal vez, la clave para derrumbar la barrera que suponen las limitaciones del aprendizaje por refuerzo. "Los beb¨¦s aprenden fundamentalmente a trav¨¦s de la observaci¨®n. Mi propuesta es lo que llamo aprendizaje autosupervisado. La idea es entrenar a una red neuronal muy grande para entender el mundo a trav¨¦s de la predicci¨®n", avanza el experto.
Por ejemplo, ante una porci¨®n de un v¨ªdeo, este sistema tendr¨ªa que ser capaz de determinar lo que va a ocurrir a continuaci¨®n. "En este modelo no hay etiquetas externas asignadas por humanos", se?ala Lecun. Parte del input sirve de entrenamiento para predecir el resto y avanzar en el aprendizaje.
El aprendizaje autosupervisado ya se emplea con cierto ¨¦xito en contextos de procesamiento del lenguaje natural, pero pierde fuelle cuando se enfrenta a im¨¢genes. La clave es que en el caso del lenguaje, las posibilidades son en cierto sentido finitas, pero cuando la informaci¨®n es visual, aumenta la incertidumbre. Lecun pone el ejemplo de una ni?a que se dispone a soplar las velas de su tarta de cumplea?os. Cuando llega el momento de que el sistema proponga un resultado para la acci¨®n, la imagen se torna borrosa. ¡°El sistema no sabe realmente qu¨¦ va a ocurrir, as¨ª que predice la media de todos los futuros escenarios posibles¡±.
- La imaginaci¨®n de la m¨¢quina: entrenamiento adversarial
Para que la m¨¢quina aprenda lo que pasa cuando una ni?a rodeada de ni?os se inclina sobre una tarta coronada por una vela encendida, necesitamos el trabajo conjunto de dos redes neuronales. Una se encarga de generar escenarios y la otra de determinar c¨®mo de probables o aut¨¦nticos son. Ambas redes se entrenan mutuamente: una es cada vez m¨¢s veros¨ªmil, la otra es cada vez m¨¢s dif¨ªcil de enga?ar.
Estos sistemas tambi¨¦n los hemos visto en acci¨®n: inventando caras, creando nuevos patrones para estampados de ropa e incluso en los coches aut¨®nomos, determinando cu¨¢l es la trayectoria m¨¢s probable para el resto de los veh¨ªculos. "La generaci¨®n y reconstrucci¨®n de im¨¢genes es un ¨¢rea fascinante, los modelos generativos de los ¨²ltimos a?os han tra¨ªdo much¨ªsimos progresos a este campo. Esto podr¨ªa ser la clave para resolver el problema de la incertidumbre en los modelos predictivos. Si podemos resolver esto, tendremos una herramienta para hacer progresos significativos en el mundo de la inteligencia artificial", explica Lecun. Seg¨²n ¨¦l, al final de todos estos avances las m¨¢quinas subir¨ªan un escal¨®n clave en su aproximaci¨®n al ser humano: podr¨ªan desarrollar algo parecido al sentido com¨²n.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.