El ajedrez ha muerto, larga vida al ajedrez
El nuevo rey de este juego ya no es subsidiario de la maestr¨ªa humana
La expresi¨®n ¡°el rey ha muerto, larga vida al rey¡± se ha hecho popular en algunas monarqu¨ªas para despedir a un rey fallecido, dar la bienvenida a su sucesor y evitar adem¨¢s la incertidumbre que en general se sit¨²a en los interregnos. La frase bien podr¨ªa aplicarse tambi¨¦n a la historia del ajedrez desde que las computadoras han comenzado a disputarnos el reinado en el juego. Ve¨¢moslo.
El primer programa para jugar al ajedrez nunca se lleg¨® a ejecutar. Lo escribi¨® a mediados del siglo pasado Alan Turing, genial matem¨¢tico y uno de los padres de la computaci¨®n y la Inteligencia artificial. Hubo que esperar hasta finales de los setenta para disponer de programas inform¨¢ticos capaces de jugar al ajedrez a un gran nivel. Dos d¨¦cadas m¨¢s tarde, en 1997, Deep Blue, una m¨¢quina dise?ada por IBM, gan¨® al entonces campe¨®n del mundo de ajedrez, Gari Kasp¨¢rov. El reinado humano acab¨® ah¨ª.
La proeza de Deep Blue se logr¨® tras invertir IBM varios a?os en investigaci¨®n y muchos millones de d¨®lares. La estrategia seguida por este y otros programas inform¨¢ticos ha consistido b¨¢sicamente en aunar capacidad de c¨¢lculo y conocimiento estrat¨¦gico en el juego. El conocimiento humano directamente inyectado en el software y el extra¨ªdo de ingentes repositorios de partidas sirve para guiar qu¨¦ movimientos explorar y c¨®mo decidir cu¨¢l ser¨¢ finalmente el elegido para pasar del an¨¢lisis a la acci¨®n.
La estrategia seguida por 'Deep Blue' y otros programas inform¨¢ticos ha consistido b¨¢sicamente en aunar capacidad de c¨¢lculo y conocimiento estrat¨¦gico en el juego
A finales de 2018 se vivi¨® un nuevo hito en el mundo del ajedrez, yo dir¨ªa que un hito mundial, sin m¨¢s apelativos. Una empresa brit¨¢nica, Deep Mind, adquirida por Google en 2014, dise?¨® un programa denominado AlphaZero, capaz de aprender a jugar al ajedrez y a algunos otros juegos, como el Go, partiendo ¨²nicamente del conocimiento de sus reglas. Para ello no necesita m¨¢s que jugar contra s¨ª misma, e ir mejorando su competencia a medida que lo hace.
Despu¨¦s de dedicar unas pocas horas a aprender a jugar, AlphaZero se enfrent¨® a Stockfish, el mejor programa de ajedrez hasta la fecha, jugando un centenar de partidas. AlphaZero gan¨® 28 y empat¨® las restantes. Eso s¨ª, Stockfish jug¨®, dig¨¢moslo as¨ª, con un mano atada a la espalda, al serle limitada su librer¨ªa de aperturas y el tiempo disponible para cada movimiento.
En diciembre de 2018 se publicaron los resultados de una nueva contienda con reglas del juego menos restrictivas. AlphaZero volvi¨® a apabullar a Stockfish. De un millar de partidas gan¨® 155 y solo perdi¨® 6, empatando el resto.
AlphaZero aprende a trav¨¦s de complejos algoritmos que se basan en el denominado aprendizaje por refuerzo, com¨²n en el aprendizaje humano y de otros seres vivos. Si se toma una decisi¨®n que con el tiempo se muestra adecuada, se obtiene un refuerzo positivo que reafirma dicha decisi¨®n para el futuro. Del mismo modo, se penalizan decisiones equivocadas. Esto permite a la m¨¢quina aprender sin ning¨²n conocimiento previo, m¨¢s all¨¢, evidentemente, del de las reglas del juego y su objetivo. Tras el aprendizaje, AlphaZero opera en general como cualquier programa de ajedrez, analizando un gran conjunto de posibles movimientos y eligiendo finalmente el m¨¢s prometedor de ellos.
Estamos muy lejos de lograr que una m¨¢quina tenga la capacidad de aprendizaje general de una persona. Eso s¨ª, esperemos que antes de que lo logren hayamos previsto c¨®mo hacer que sea solo para nuestro bien
Pero tambi¨¦n aqu¨ª hay una diferencia importante con programas como Stockfish. AlphaZero reduce en un millar de veces el n¨²mero de movimientos explorados en cada etapa por este. A¨²n as¨ª, la cantidad sigue siendo muy superior a los pocos cientos de movimientos que en general tiene en cuenta un experto en el juego antes de mover una de sus piezas, lo que pone en evidencia que la habilidad humana en el juego es una obra maestra de la inteligencia natural. Adem¨¢s, un experto humano podr¨ªa de pronto jugar a una variante del ajedrez en la que, pongamos por caso, los caballos en lugar de moverse en ¡°L¡± se moviesen en diagonal, como los alfiles. Sin embargo, AlphaZero tendr¨ªa que volver a aprender a jugar desde el principio a este?nuevo juego. Estamos muy lejos de lograr que una m¨¢quina tenga la capacidad de aprendizaje general de una persona. Eso s¨ª, esperemos que antes de que lo logren hayamos previsto c¨®mo hacer que sea solo para nuestro bien.
Uno de los resultados que m¨¢s ha sorprendido a los expertos es que AlphaZero ha aprendido estrategias que se hab¨ªan escapado hasta ahora al desarrollo humano del ajedrez. Quiz¨¢s la mejor forma de describirlo la ha dado el gran maestro del ajedrez Peter Heine, al afirmar que siempre se hab¨ªa preguntado c¨®mo jugar¨ªan al ajedrez seres de una especie superior, m¨¢s inteligente que la nuestra, pero que ya ten¨ªa la respuesta.
De nuevo, a rey muerto, rey puesto, pero en este caso con ambos reyes pertenecientes a una nueva dinast¨ªa, la de las m¨¢quinas inteligentes. Al rey muerto le ense?amos sobre todo nosotros a jugar pero el nuevo rey del ajedrez ya no es subsidiario de la maestr¨ªa humana en el juego. Incluso ha aprendido y nos ense?a cosas que desconoc¨ªamos. Eso s¨ª, nos debe su creaci¨®n como una asombrosa m¨¢quina de aprendizaje de problemas espec¨ªficos y muy sencillos de describir, aunque enormemente complejos de resolver.
Sen¨¦n Barro. CiTIUS, Centro Singular en TI de la Universidad de Santiago de Compostela
Cr¨®nicas del Intangible es un espacio de divulgaci¨®n sobre las ciencias de la computaci¨®n, coordinado por la sociedad acad¨¦mica SISTEDES (Sociedad de Ingenier¨ªa de Software y de Tecnolog¨ªas de Desarrollo de Software). El intangible es la parte no material de los sistemas inform¨¢ticos (es decir, elsoftware), y aqu¨ª se relatan su historia y su devenir. Los autores son profesores de las universidades espa?olas, coordinados por Ricardo Pe?a Mar¨ª (catedr¨¢tico de la Universidad Complutense de Madrid) y Macario Polo Usaola (profesor titular de la Universidad de Castilla-La Mancha).
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.