Inicio Actualidad de poker Cómo derrotó Libratus a la Humanidad y qué esperar en el futuro

Cómo derrotó Libratus a la Humanidad y qué esperar en el futuro

El último dí­a del pasado enero, el mundo del poker asistí­a a la humilación de un escogido grupo de especialistas en heads-up a manos de una inteligencia artificial bautizada Libratus por sus creadores.

Libratus era producto de la evolución de un bot de poker programado por los profesores Noam Brown y Tuomas Sandholm de la Carnegie Mellon University, que acaban de publicar en la revista Science un estudio en el que describen cómo diseñaron el sistema de aprendizaje que destruyó a sus rivales.

La falta de información hace que un juego sea bastante más complejo. en vez de buscar simplemente una secuencia óptima de acciones, una inteligencia artificial, en un juego de información imperfecta, debe determinar cómo equilibrar sus acciones de manera apropiada, de manera que su rival nunca pueda descubrir demasiados datos sobre la información privada que tiene la máquina.

Lo primero fue darle a Libratus una base teórica, que consistió en programar un entendimiento básico de la teorí­a del juego que lleva a soluciones óptimas (GTO). Era necesario para las primeras rondas aprovechando que los rivales humanos no tení­an una lectura del juego del bot.

Una vez en juego, Libratus usó un sistema de resolución de subjuegos anidado, explicado gráficamente en Science.

El bot toma la información que recibe de una nueva mano y la compara con la base de GTO inicial para ir aprendiendo a distinguir situaciones especí­ficas y las respuestas más adecuadas a las mismas.

Son tantas las variables en juego en el NLHE que era necesario que Libratus fuera capaz de procesar esta información y mejorar la base de GTO con que arrancó el match. es decir, Libratus también debí­a ir aprendiendo a jugar según avanzaban las partidas.

Esta combinación se demostró demoledora, y Libratus fue ampliando su ventaja contra el equipo de Doug Polk según avanzaban las partidas.

El autoaprendizaje es la base de estas inteligencia artificial que, algo más mejorada, repitió éxito ante un equipo de jugadores chinos meses más tarde.

El futuro es aún más asombroso.

Un equipo distinto de programadores, de los laboratorios Google Deep Mind, han sido capaces de evolucionar este concepto hasta el punto que una IA a la que simplemente se le informó de las reglas básicas del Go, un juego tradicional chino famoso por su complejidad y por el completo dominio que los maestros humanos ejercieron sobre los primerops bots, fue capaz de aprender por sí­ mismo hasta batir a los grandes maestros y alcanzar un ELO estratosférico.

El gran reto de lA en el poker sigue siendo dar el salto del HU al 6-max. La duda no es si lo lograrán, sino cuánto tardarán.

Salir de la versión móvil