Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2022-12-01La inteligencia artificial consigue dominar Stratego, el juego de información imperfecta

SINC |La empresa DeepMind, propiedad Google, ha desarrollado un programa de IA que ha aprendido a jugar a Stratego por primera vez. Este juego plantea grandes desafíos debido a la cantidad de incertidumbre a la que se enfrenta el usuario, comparable al póker. Su dominio plantea nuevas posibilidades en aplicaciones como la gestión del tráfico.

El programa de inteligencia artificial DeepNash, desarrallodo por la empresa británica DeepMind ha aprendido a jugar al Stratego a nivel experto. Se trata de uno de los pocos juegos de mesa que la inteligencia artificial (IA) todavía no había dominado, debido a la gran incertidumbre que lo caracteriza. El logro alcanzado por la empresa británica, comprada por Google en 2014, se publica en el número de esta semana de la revista Science.

A diferencia de otros juegos ya controlados por la inteligencia artificial, como el ajedrez o el Go, en los que los jugadores pueden ver todas las piezas del juego y crear de este modo estrategias, los jugadores de Stratego tienen que aprender a manejar la falta de certeza. Es un juego mucho más parecido al póker, en el que cada jugador conoce sus propias cartas pero no las del oponente.

Para jugar bien a Stratego con IA es necesario encontrar un algoritmo que tenga en cuenta las dudas del jugador. La gran cantidad de resultados posibles tiene como consecuencia que los algoritmos que funcionan bien en juegos de información perfecta, e incluso aquellos que funcionan bien para el póker, no se puedan aplicar a este juego. La complejidad es de muchos órdenes de magnitud mayor: 10^66 en Stratego comparado con 10^6 en Texas Hold´em para dos jugadores.

DeepNash Ganó contra todos los bots y logró un nivel de juego altamente competitivo contra jugadores humanos.

“En Stratego, la planificación es casi imposible, dada la cantidad de incertidumbre sobre la que los jugadores tienen que razonar. En este trabajo, tomamos otro camino y aprendimos directamente una estrategia para cada situación dada del tablero, usando una combinación de teoría de juegos y aprendizaje de refuerzo profundo”, explica a SINC Julien Perolat, coautor principal del estudio e investigador de DeepMind.

Para desarrollar DeepNash, el programa detrás del logro, Perolat y sus colegas combinaron el algoritmo R-NaD, de aprendizaje por refuerzo, con una arquitectura de red neuronal profunda para lograr una estrategia de juego competitiva.

El programa se probó contra varios bots Stratego de última generación y contra jugadores humanos expertos. Ganó contra todos los bots y logró un nivel de juego altamente competitivo contra jugadores humanos con nivel de experto en Gravon, la plataforma en línea más grande de jugadores de Stratego.

Los juegos como campo de experimentación

El propósito de estudiar juegos con IA no siempre es ganar, sino probar nuevos métodos y enfoques que podrían ser útiles para problemas del mundo real. 

“Es poco probable que los sistemas de IA sean imbatibles en juegos que manejan incertidumbre. Para ganar en un juego de información imperfecta, normalmente se necesita una combinación de suerte y habilidad. E incluso si un programa de inteligencia artificial hubiera aprendido una estrategia perfecta  –digamos un equilibrio de Nash– aún podría perder por tener mala suerte”, explica Karl Tuyls, coautor principal del estudio e investigador de DeepMind.

“Los juegos son el entorno perfecto para estudiar los sistemas avanzados de inteligencia artificial. Permiten desarrollar y probar algoritmos de IA más inteligentes y flexibles de manera rápida y eficiente, y también ofrecen comentarios instantáneos sobre cómo lo estamos haciendo a través de las puntuaciones”, explica Perolat.

Todavía quedan juegos que la IA no ha podido dominar. Según los investigadores, un ejemplo podría ser bridge, un juego de cuatro jugadores en el que se compite por parejas. “En este juego se han logrado algunos avances en los últimos años con versiones simplificadas, pero sigue siendo difícil para una IA dominar el juego completo,” añade Perolat.

El programa plantea posibilidades para que los sistemas de IA tengan aplicaciones en el mundo real en entornos caracterizados por la información imperfecta. Esto se debe a que puede manejar grandes cantidades de incertidumbre en forma de información y antes no era posible
Karl Tuyls, coautor del trabajo e investigador de DeepMInd

IA para mejorar el tráfico

Según los autores, este avance podría ayudar a desbloquear nuevas aplicaciones de la IA en dominios que cuentan con una gran cantidad de participantes humanos y donde no se tiene información sobre la intención de los usuarios o lo que está ocurriendo en el entorno. Como por ejemplo, para optimizar la gestión del tráfico a gran escala, reducir los tiempos de viaje de los conductores y las emisiones de los vehículos.

 “Creemos que DeepNash plantea nuevas posibilidades para que los sistemas de IA tengan aplicaciones en el mundo real en entornos caracterizados por la información imperfecta. Esto se debe a que puede manejar grandes cantidades de incertidumbre en forma de información y antes no era posible”, explica Karl Tuyls.


Referencia:

Perolat, Julien; De Vylder, Bart; et al. “Mastering the game of Stratego with model-free multiagent reinforcement learning”. Science (2022)

SINC
Autor
SINC

El Servicio de Información y Noticias Científicas (SINC) es la primera agencia pública de ámbito estatal especializada en información sobre ciencia, tecnología e innovación en español. Fue puesta en marcha por la Fundación Española para la Ciencia y la Tecnología en el año 2008. El equipo de SINC produce noticias, reportajes, entrevistas y materiales audiovisuales (vídeos, fotografías, ilustraciones e infografías).


2024-04-24
Emprendedores universitarios recuperan tuberías dañadas

El problema de las fugas hídricas en el país no es un tema nuevo. Un estudio realizado por la UNAM (Agua Capital, Fondo de Agua de la Ciudad de México y el Centro Regional de Seguridad Hídrica) afirma que “las pérdidas de agua en las redes de distribución del Valle de México se estiman entre el 40 y 50 por ciento, aunque no se cuenta con información precisa sobre los volúmenes que no llegan a su destino”.

2024-04-24
Arc Search llega y reta a Chrome con su mejor experiencia de usuario

Arc Search es un navegador que está dando mucho de qué hablar en el mundo de la tecnología. Enfocado en la experiencia de usuario, es una alternativa que integra inteligencia artificial para mejorar la búsqueda y navegación web.

2024-04-23
Nadie puede trabajar solo en ingeniería civil

Para Mikayla Britsch, senior, la ingeniería civil y ambiental es una vocación que requiere habilidades tanto técnicas como humanas.

2024-04-22
Rompiendo paradigmas para descarbonizar el transporte de carga en América Latina y el Caribe

El transporte de carga terrestre es el más importante para la movilización de bienes en la región de América Latina y el Caribe (ALC), llevando más del 70 % de las cargas nacionales de la región. Se estima que el transporte de carga tiene una participación entre el 3-4 % del PIB nacional de los países de la región (Barbero & Guerrero, 2017).

2024-04-22
Hacia la regulación de las tecnologías a partir de Inteligencia Artificial (IA)

La revolución de la Inteligencia Artificial (IA) se está integrando a nuestras vidas en el día a día. Desde los algoritmos que eligen nuestros videos y series en YouTube y Netflix, pasando por los discursos escritos en el ChatGPT hasta los dispositivos como Alexa o Siri.

2024-04-19
La Inteligencia Artificial (IA) entendiendo el lenguaje humano

Desde 1950, con el artículo de Alan Turing Maquinaria informática e inteligencia y la publicación de la novela Yo, robot de Isaac Asimov, la Inteligencia Artificial viene evolucionando año tras año de forma más rápida.