logo móvil
logo tablet

Cookies y Privacidad

Usamos cookies propias y de terceros para mejorar la experiencia de nuestros usuarios, analizar el tráfico del sitio y personalizar contenido. Si continúas navegando, asumimos que aceptas su uso. Para más información, consulta nuestra Política de Cookies

Aprendizaje mejorado de características: Una red neuronal profunda de máximo promedio para el juego Go

Los programas informáticos de juego basados en el aprendizaje profundo por refuerzo han superado el rendimiento incluso de los mejores jugadores humanos. Sin embargo, el enorme espacio de análisis de estas redes neuronales y sus numerosos parámetros requieren una gran potencia de cálculo. Por ello, en este estudio nos propusimos aumentar la eficiencia de aprendizaje de la red modificando la estructura de la red neuronal, lo que debería reducir el número de iteraciones de aprendizaje y la potencia de cálculo necesaria. Se propone una red neuronal convolucional con una estructura de unidad de máximo promedio (MAO) basada en el pensamiento de función a trozos, a través de la cual se pueden aprender eficazmente las características y mejorar la capacidad de expresión de las características de la capa oculta. Para verificar el rendimiento de la estructura MAO, la comparamos con la red ResNet18 aplicando ambas al marco de AlphaGo Zero, desarrollado para jugar al juego Go. Las dos estructuras de red se entrenaron desde cero utilizando un entorno de servidor de bajo coste. La unidad MAO ganó ocho de cada diez partidas contra la red ResNet18. El rendimiento superior de la unidad MAO en comparación con la red ResNet18 es significativo para el futuro desarrollo de algoritmos de juego que requieran menos potencia de cálculo que los que se utilizan actualmente.

Autores: Xiali, Li; Zhengyu, Lv; Bo, Liu; Licheng, Wu; Zheng, Wang

Idioma: Inglés

Editor: Hindawi

Año: 2020

Disponible con Suscripción Virtualpro

Artículos


Categoría

Matemáticas

Licencia

Atribución – Compartir igual

Consultas: 7

Citaciones: Sin citaciones


Hindawi

Mathematical Problems in Engineering

Volume 2020, Article ID 1397948, 6 pages

https://doi.org/10.1155/2020/1397948

Xiali Li 1, Zhengyu Lv 1, Bo Liu 1, Licheng Wu 1, Zheng Wang 2

1 , China

2 , China

Academic Editor:

Contact: mpe@hindawi.com

Descripción
Los programas informáticos de juego basados en el aprendizaje profundo por refuerzo han superado el rendimiento incluso de los mejores jugadores humanos. Sin embargo, el enorme espacio de análisis de estas redes neuronales y sus numerosos parámetros requieren una gran potencia de cálculo. Por ello, en este estudio nos propusimos aumentar la eficiencia de aprendizaje de la red modificando la estructura de la red neuronal, lo que debería reducir el número de iteraciones de aprendizaje y la potencia de cálculo necesaria. Se propone una red neuronal convolucional con una estructura de unidad de máximo promedio (MAO) basada en el pensamiento de función a trozos, a través de la cual se pueden aprender eficazmente las características y mejorar la capacidad de expresión de las características de la capa oculta. Para verificar el rendimiento de la estructura MAO, la comparamos con la red ResNet18 aplicando ambas al marco de AlphaGo Zero, desarrollado para jugar al juego Go. Las dos estructuras de red se entrenaron desde cero utilizando un entorno de servidor de bajo coste. La unidad MAO ganó ocho de cada diez partidas contra la red ResNet18. El rendimiento superior de la unidad MAO en comparación con la red ResNet18 es significativo para el futuro desarrollo de algoritmos de juego que requieran menos potencia de cálculo que los que se utilizan actualmente.

Documentos Relacionados

Temas Virtualpro