Biblioteca93.141 documentos en línea

Artículo

Dynamic Path Planning of Unknown Environment Based on Deep Reinforcement LearningPlanificación dinámica de rutas en entornos desconocidos basada en aprendizaje profundo por refuerzo

Resumen

La planificacin dinmica de rutas en entornos desconocidos siempre ha sido un reto para los robots mviles. En este artculo, aplicamos el aprendizaje profundo por refuerzo de doble red Q (DDQN) propuesto por DeepMind en 2016 a la planificacin dinmica de rutas en entornos desconocidos. La funcin de recompensa y castigo y el mtodo de entrenamiento estn diseados para la inestabilidad de la etapa de entrenamiento y la escasez del espacio de estado del entorno. En diferentes etapas de entrenamiento, ajustamos dinmicamente la posicin inicial y la posicin objetivo. Con la actualizacin de la red neuronal y el aumento de la probabilidad de la regla codiciosa, el espacio local buscado por el agente se expande. El mdulo Pygame de PYTHON se utiliza para establecer entornos dinmicos. Teniendo en cuenta la seal lidar y la posicin local del objetivo como entradas, se utilizan redes neuronales convolucionales (CNN) para generalizar el estado del entorno. El algoritmo Q-learning mejora la capacidad de evitacin dinmica de obstculos y la planificacin local de los agentes en el entorno. Los resultados muestran que, tras entrenarse en diferentes entornos dinmicos y realizar pruebas en un nuevo entorno, el agente es capaz de alcanzar con xito la posicin del objetivo local en un entorno dinmico desconocido.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento