La planificacin dinmica de rutas en entornos desconocidos siempre ha sido un reto para los robots mviles. En este artculo, aplicamos el aprendizaje profundo por refuerzo de doble red Q (DDQN) propuesto por DeepMind en 2016 a la planificacin dinmica de rutas en entornos desconocidos. La funcin de recompensa y castigo y el mtodo de entrenamiento estn diseados para la inestabilidad de la etapa de entrenamiento y la escasez del espacio de estado del entorno. En diferentes etapas de entrenamiento, ajustamos dinmicamente la posicin inicial y la posicin objetivo. Con la actualizacin de la red neuronal y el aumento de la probabilidad de la regla codiciosa, el espacio local buscado por el agente se expande. El mdulo Pygame de PYTHON se utiliza para establecer entornos dinmicos. Teniendo en cuenta la seal lidar y la posicin local del objetivo como entradas, se utilizan redes neuronales convolucionales (CNN) para generalizar el estado del entorno. El algoritmo Q-learning mejora la capacidad de evitacin dinmica de obstculos y la planificacin local de los agentes en el entorno. Los resultados muestran que, tras entrenarse en diferentes entornos dinmicos y realizar pruebas en un nuevo entorno, el agente es capaz de alcanzar con xito la posicin del objetivo local en un entorno dinmico desconocido.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Preparación de películas compuestas de ZnO-Zn2TiO4 Sol y sus actividades fotocatalíticas
Artículo:
Método de análisis dinámico de la varianza de Allan con longitud de ventana variable en el tiempo basado en el control difuso
Artículo:
Influencia de las nanopartículas de TiO2 en la mejora de las propiedades optoelectrónicas del diodo emisor de luz basado en PFO
Artículo:
La creciente centralidad de la tecnología robótica en el contexto de los cuidados de enfermería: implicaciones bioéticas analizadas mediante un enfoque de revisión exhaustiva
Artículo:
Desarrollo de una plataforma de monitorización de la calidad del aire interior basada en IoT
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Infografía:
Sistemas de calidad. Six Sigma
Manual:
Química de los taninos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.