La sinergia de dobles redes neuronales para la licitación de bridge
Autores: Zhang, Xiaoyu; Lin, Rongheng; Bo, Yuchang; Yang, Fangchun
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Inteligencia artificial
Subasta
Bridge
Aprendizaje profundo por refuerzo
Redes neuronales
Juego.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
La inteligencia artificial (IA) ha logrado muchos avances en el juego de información perfecta. Sin embargo, el Bridge, un juego de información imperfecta multijugador, sigue siendo bastante desafiante. El Bridge consta de dos partes: la subasta y el juego. La subasta representa aproximadamente el 75% del juego y el juego alrededor del 25%. Los equipos de nivel experto son generalmente indistinguibles en el nivel de juego, por lo que la subasta es el factor más decisivo para ganar o perder. Los dos equipos pueden comunicarse utilizando diferentes sistemas durante la fase de subasta. Sin embargo, los modelos de subasta de Bridge existentes se centran en a lo sumo un sistema de subasta, lo que no se ajusta a las reglas reales del juego. Este documento propone un modelo de aprendizaje profundo por refuerzo que admite múltiples sistemas de subasta, lo que puede competir con jugadores que utilizan diferentes sistemas de subasta e intercambiar información de manos normalmente. El modelo consta principalmente de dos redes neuronales profundas: una red de selección de subasta y una red de evaluación de estado. La red de selección de subasta puede predecir las probabilidades de todas las subastas, y la red de evaluación de estado puede evaluar directamente las subastas opcionales y tomar decisiones basadas en los resultados de la evaluación. Los experimentos muestran que el modelo de subasta no está limitado por un solo sistema de subasta y tiene un rendimiento de subasta superior.
Descripción
La inteligencia artificial (IA) ha logrado muchos avances en el juego de información perfecta. Sin embargo, el Bridge, un juego de información imperfecta multijugador, sigue siendo bastante desafiante. El Bridge consta de dos partes: la subasta y el juego. La subasta representa aproximadamente el 75% del juego y el juego alrededor del 25%. Los equipos de nivel experto son generalmente indistinguibles en el nivel de juego, por lo que la subasta es el factor más decisivo para ganar o perder. Los dos equipos pueden comunicarse utilizando diferentes sistemas durante la fase de subasta. Sin embargo, los modelos de subasta de Bridge existentes se centran en a lo sumo un sistema de subasta, lo que no se ajusta a las reglas reales del juego. Este documento propone un modelo de aprendizaje profundo por refuerzo que admite múltiples sistemas de subasta, lo que puede competir con jugadores que utilizan diferentes sistemas de subasta e intercambiar información de manos normalmente. El modelo consta principalmente de dos redes neuronales profundas: una red de selección de subasta y una red de evaluación de estado. La red de selección de subasta puede predecir las probabilidades de todas las subastas, y la red de evaluación de estado puede evaluar directamente las subastas opcionales y tomar decisiones basadas en los resultados de la evaluación. Los experimentos muestran que el modelo de subasta no está limitado por un solo sistema de subasta y tiene un rendimiento de subasta superior.