Biblioteca93.141 documentos en línea

Artículo

Optimal Skipping Rates: Training Agents with Fine-Grained Control Using Deep Reinforcement LearningTasas óptimas de omisión: Entrenamiento de agentes con control detallado mediante aprendizaje profundo por refuerzo

Resumen

En la actualidad, la IA de juegos es una de las reas de investigacin ms activas y centradas en la inteligencia artificial, ya que los juegos de ordenador son los mejores bancos de pruebas para comprobar las ideas tericas sobre IA antes de aplicarlas en la prctica en el mundo real. Del mismo modo, ViZDoom es una plataforma de investigacin de inteligencia artificial de juegos basada en Doom que se utiliza para el aprendizaje visual profundo por refuerzo en entornos de juegos 3D como los shooters en primera persona (FPS). Durante el entrenamiento, la velocidad del agente de aprendizaje depende en gran medida del nmero de fotogramas que se le permite saltarse. En este trabajo se propone cmo influye la velocidad de salto de fotogramas en el aprendizaje y el rendimiento final de los agentes, en particular utilizando el aprendizaje profundo Q-learning, la memoria de repeticin de experiencias y la plataforma de investigacin ViZDoom Game AI. El agente se entrena y se prueba en escenarios bsicos de Doom, donde se comparan los resultados y se encuentra que son un 10% mejores en comparacin con el estado del arte de los trabajos de investigacin existentes sobre agentes basados en Doom. Los experimentos muestran que la tasa de omisin de fotogramas rentable y ptima se sita entre 3 y 11, lo que proporciona el mejor equilibrio entre la velocidad de aprendizaje y el rendimiento final del agente, que muestra un comportamiento similar al humano y supera a un jugador humano medio y a los agentes de juego incorporados.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento