Utilizando una red neuronal profunda basada en aprendizaje por refuerzo Q-Learning para jugar videojuegos
Autores: Lin, Cheng-Jian; Jhang, Jyun-Yu; Lin, Hsueh-Yi; Lee, Chin-Ling; Young, Kuu-Young
Idioma: Inglés
Editor: MDPI
Año: 2019
Disponible con Suscripción Virtualpro
Artículos
Categoría
Ingeniería y Tecnología
Licencia
Atribución – Compartir igual
Consultas: 8
Citaciones: Sin citaciones
Este estudio propuso una red neuronal profunda basada en aprendizaje por refuerzo Q-learning (RQDNN) que combinaba una red de análisis de componentes principales profundos (DPCANet) y Q-learning para determinar una estrategia de juego para videojuegos. Se utilizaron imágenes de videojuegos como entradas. El DPCANet propuesto se utilizó para inicializar los parámetros del núcleo de convolución y capturar automáticamente las características de la imagen. Funciona como una red neuronal profunda y requiere menos complejidad computacional que las redes neuronales convolucionales tradicionales. Se utilizó un método de aprendizaje por refuerzo Q-learning para implementar una estrategia para jugar el videojuego. Tanto los juegos de Flappy Bird como Atari Breakout se implementaron para verificar el método propuesto en este estudio. Los resultados experimentales mostraron que las puntuaciones de nuestro RQDNN propuesto fueron mejores que las de los jugadores humanos y otros métodos. Además, el tiempo de entrenamiento del RQDNN propuesto también fue mucho menor que otros métodos.
Descripción
Este estudio propuso una red neuronal profunda basada en aprendizaje por refuerzo Q-learning (RQDNN) que combinaba una red de análisis de componentes principales profundos (DPCANet) y Q-learning para determinar una estrategia de juego para videojuegos. Se utilizaron imágenes de videojuegos como entradas. El DPCANet propuesto se utilizó para inicializar los parámetros del núcleo de convolución y capturar automáticamente las características de la imagen. Funciona como una red neuronal profunda y requiere menos complejidad computacional que las redes neuronales convolucionales tradicionales. Se utilizó un método de aprendizaje por refuerzo Q-learning para implementar una estrategia para jugar el videojuego. Tanto los juegos de Flappy Bird como Atari Breakout se implementaron para verificar el método propuesto en este estudio. Los resultados experimentales mostraron que las puntuaciones de nuestro RQDNN propuesto fueron mejores que las de los jugadores humanos y otros métodos. Además, el tiempo de entrenamiento del RQDNN propuesto también fue mucho menor que otros métodos.