- NeoFronteras - http://neofronteras.com -

AlphaGo gana a Lee Sedol

El programa AlphaGo gana cuatro de las cinco partidas al campeón mundial Lee Sedol en el torneo celebrado recientemente.

Foto

Hace poco veíamos en NeoFronteras el éxito cosechado por el programa AlphaGo jugando al go. También decíamos que iba a jugar frente al campeón del mundo de este juego: Lee Sedol.

Se esperaba que la máquina perdiera frente al humano, pero las partidas ya se han jugado y AlphaGo ha ganado a Lee Sedol por 4 a 1. El premio, de un millón de dólares, no irá al humano, sino que se donará para obras de caridad. Algo similar ya pasó en 1997 cuando el campeón mundial Garry Kasparov perdió frente al programa Deep Blue jugando al ajedrez.

A diferencia del caso del ajedrez con Deep Blue, que usaba la fuerza bruta, AlphaGo usa, entre otras cosas, una red neuronal simulada que permite al programa aprender por sí mismo. Atacar un juego como el go a base de fuerza bruta no hubiera funcionado por la gran cantidad de posibilidad que permite. Se llegó a usar el go como ejemplo de juego en el que un programa informático estaría siempre por debajo de los jugadores humanos.

El juego realizado por la máquina ha sido muy interesante. Los jugadores expertos coinciden en que, en general, la máquina ha jugado como lo haría un humano.

Se ha dicho que la máquina ha exhibido creatividad, de que se dio cuenta de los fallos propios demasiado tarde, etc. Se ha hablado en términos humanos de ella. En China consideran al go como una forma de arte junto a la caligrafía o la música. Por tanto, que una máquina pueda ganar al go y demostrar un juego bello la hace merecedora de cierta creatividad bajo esta forma de verlo.

Pero AlphaGo no es humana ni tiene todas las cualidades de estos. Aunque habrá que aceptar que al menos algunas de las habilidades que los humanos asociamos a la inteligencia emergen de forma espontánea de la complejidad algorítmica.

Allí en donde algunos veían que AlphaGo cometía un error, al final resultaba formar parte de una estrategia ganadora que sólo se veía al avanzar el juego. Las perspectivas parecían negras para el humano cuando la máquina ganó tres juegos consecutivos. Pero en la cuarta partida Sedol derrotó de forma brillante a AlphaGo gracias a un error del programa en el movimiento 79. Sedol vio un resquicio por donde vencer al programa y lo consiguió.

Los técnicos de AlphaGo sostienen que el fallo se debió a un error en el árbol de exploración de tipo Monte Carlo, otra parte del programa. Recordemos que AlphaGo usa un Monte Carlo que es peor que el de otros programas que se basan solamente en este aspecto y que no usan redes neuronales. Así que es de esperar que la máquina sea imbatible pronto cuando mejoren esta parte.

Sin embargo, en la quinta partida Sedol volvió a perder frente a la máquina. Simplemente, la profundidad de juego de AlphaGo era imbatible. AlphaGo consiguió una pequeña ventaja a mitad del juego y la hizo crecer poco a poco hasta ganar la partida.

La lección a aprender es que los algoritmos inspirados por la biología, como las redes neuronales o los algoritmos genéticos, son una muy buena manera de conseguir algo parecido a la inteligencia artificial. El precio a pagar será probablemente que a veces estos programas se equivoquen.

Obviamente no hay que temer a un cercano Skynet, ni nada similar. Un ser humano (o un hipotético androide que lo imite a la perfección) es algo más que un algoritmo que gana al go. Y ni siquiera solamente la inteligencia nos hace humanos, nos hacen humanos muchas más cosas.

AlphaGo no es más que un esclavo condenado a jugar al go, a veces de forma interminable contra sí mismo. No decide entre jugar o no jugar, pues carece de voluntad. Tampoco goza de la satisfacción cuando gana, ni de la belleza que crea su juego y el de otros.

Nada impide que lo que salga del carbono auto-organizado no salga del silicio organizado. Pero una simulación de realidad tampoco es una realidad.

AlphaGo nos recuerda que nosotros también somos esclavos y que tampoco podemos en la mayoría de las ocasiones no elegir ir a un lugar de trabajo en donde quizás nos desprecian o explotan, por ejemplo. La diferencia es que nosotros sufrimos muchas veces en el mismo y AlphaGo no sufre después de jugar un millón de partidas al día. Ni siquiera se aburre, ni lucha por sus derechos, ni se va de vacaciones…

Copyleft: atribuir con enlace a http://neofronteras.com/?p=4898 [1]

Fuentes y referencias:
Artículo original [2]
AlphaGo gana a un campeón de go. [3]