Ficha técnica

50 | 0

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

An Optimized Path Planning Method for Coastal Ships Based on Improved DDPG and DPUn método optimizado de planificación de rutas para buques costeros basado en DDPG y DP mejorados

Resumen

El aprendizaje profundo por refuerzo (DRL) se utiliza ampliamente en la planificación de rutas gracias a su potente capacidad de ajuste y aprendizaje de redes neuronales. Sin embargo, los métodos existentes basados en DRL utilizan un espacio de acción discreto y no tienen en cuenta el impacto de la información histórica del estado, lo que provoca que el algoritmo no pueda aprender la estrategia óptima para planificar la ruta, y que la ruta planificada tenga arcos o demasiadas esquinas, lo que no cumple los requisitos reales de navegación del barco. En este trabajo se propone un método de planificación optimizada de trayectorias para buques costeros basado en el algoritmo Deep Deterministic Policy Gradient (DDPG) y el algoritmo Douglas-Peucker (DP) mejorados. En primer lugar, se utiliza la Memoria Larga a Corto Plazo (LSTM) para mejorar la estructura de red del DDPG, que utiliza la información de estado histórica para aproximar la información de estado ambiental actual, de modo que la acción predicha es más precisa. Por otro lado, la función de recompensa tradicional de DDPG puede conducir a una baja eficiencia de aprendizaje y velocidad de convergencia del modelo. Por lo tanto, este trabajo mejora el principio de recompensa del DDPG tradicional a través de la función de recompensa principal y la función de recompensa auxiliar, que no sólo ayuda a planificar una mejor ruta para el barco, sino que también mejora la velocidad de convergencia del modelo. En segundo lugar, teniendo en cuenta el problema de que existen demasiados puntos de giro en la ruta planificada, lo que puede aumentar el riesgo de navegación, se propone un algoritmo de DP mejorado para optimizar aún más la ruta planificada y hacer que la ruta final sea más segura y económica. Por último, se realizan experimentos de simulación para verificar el método propuesto desde el punto de vista del efecto de planificación y la tendencia de convergencia. Los resultados muestran que el método propuesto puede planificar trayectorias de navegación seguras y económicas y tiene buena estabilidad y convergencia.

Materias:Infraestructura de transportes Ingeniería del transporte Accidentes de transito Seguridad del transporte Planificación de ruta
Subjects:Transport infrastructure Transport engineering Traffic accidents Transport safety Path planning
Palabras claves:información de estado histórico, trayectoria, ddpg, velocidad de convergencia, gradiente de política determinista profunda, información de estado ambiental actual, aprendizaje por refuerzo profundo, requisitos de navegación reales, función de recompensa auxiliar, espacio de acción discreto
Keywords:historical state information, path, ddpg, convergence speed, deep deterministic policy gradient, current environmental state information, deep reinforcement learning, actual sailing requirements, auxiliary reward function, discrete action space

Autor:Yiquan, Du; Xiuguo, Zhang; Zhiying, Cao; Shaobo, Wang; Jiacheng, Liang; Fengge, Zhang; Jiawei, Tang.
Categoría:Gestión y administración
Subcategoría:Gestión logística
Año de publicación:2021.
Editor:Hindawi

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

An Optimized Path Planning Method for Coastal Ships Based on Improved DDPG and DP

DC.Title.eng

Un método optimizado de planificación de rutas para buques costeros basado en DDPG y DP mejorados

DC.Creator

Yiquan, Du; Xiuguo, Zhang; Zhiying, Cao; Shaobo, Wang; Jiacheng, Liang; Fengge, Zhang; Jiawei, Tang

DC.Subject.snpi.spa

Infraestructura de transportes Ingeniería del transporte Accidentes de transito Seguridad del transporte Planificación de ruta

DC.Subject.snpi.eng

Transport infrastructure Transport engineering Traffic accidents Transport safety Path planning

DC.Subject.spa

información de estado histórico, trayectoria, ddpg, velocidad de convergencia, gradiente de política determinista profunda, información de estado ambiental actual, aprendizaje por refuerzo profundo, requisitos de navegación reales, función de recompensa auxiliar, espacio de acción discreto

DC.Subject.eng

historical state information, path, ddpg, convergence speed, deep deterministic policy gradient, current environmental state information, deep reinforcement learning, actual sailing requirements, auxiliary reward function, discrete action space

DC.Description.spa

DC.Source