Ficha técnica

119 | 0

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

UAV Swarm Confrontation Using Hierarchical Multiagent Reinforcement LearningEnfrentamiento de enjambres de vehículos aéreos no tripulados mediante el aprendizaje por refuerzo jerárquico de múltiples agentes

Resumen

Con el desarrollo de la tecnología de los vehículos aéreos no tripulados (UAV), el enfrentamiento de los enjambres de UAV ha atraído la atención de muchos investigadores. Sin embargo, la situación a la que se enfrenta el enjambre de UAV tiene una incertidumbre sustancial y una variabilidad dinámica. El espacio de estado y el espacio de acción aumentan exponencialmente con el número de UAV, por lo que la toma de decisiones autónoma se convierte en un problema difícil en el entorno de confrontación. En este trabajo se propone un método de aprendizaje por refuerzo multiagente con macroacción y experiencia humana para la toma de decisiones autónoma de los UAV. En el enfoque propuesto, el enjambre de UAVs se modela como un gran sistema multiagente (MAS) con un UAV individual como agente, y el problema de toma de decisiones secuencial en la confrontación del enjambre se modela como un proceso de decisión de Markov. Los agentes del método propuesto se entrenan basándose en las macroacciones, donde se superan eficazmente las recompensas escasas y retrasadas, el gran espacio de estado y el espacio de acción. La clave del éxito de este método es la generación de las macroacciones que permiten a la política de alto nivel encontrar una solución casi óptima. En este trabajo, aprovechamos además la experiencia humana para diseñar un conjunto de buenas macroacciones. Extensos experimentos empíricos en nuestro entorno de confrontación de enjambre construido muestran que nuestro método rinde mejor que los demás algoritmos.

Materias:Automatización Aerodinámica Motores (Mecánica) Cinemática Ingeniería Aeronáutica
Subjects:Automation Aerodynamics Engines Kinematics Aeronautical Engineering
Palabras claves:macroacción, enjambre de uavs, experiencia humana, decisión autónoma, gran sistema multiagente, fabricación de uavs, vehículo aéreo no tripulado, buena macroacción, gran espacio de estados, número de uavs
Keywords:macro action, uav swarm, human expertise, autonomous decision, large multiagent system, making of uavs, unmanned aerial vehicle, good macro action, large state space, number of uavs

Autor:Baolai, Wang; Shengang, Li; Xianzhong, Gao; Tao, Xie.
Categoría:Diseño, modelado, automatización y simulación de procesos
Subcategoría:Automatización y control de procesos
Año de publicación:2021.
Editor:Hindawi

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

UAV Swarm Confrontation Using Hierarchical Multiagent Reinforcement Learning

DC.Title.eng

Enfrentamiento de enjambres de vehículos aéreos no tripulados mediante el aprendizaje por refuerzo jerárquico de múltiples agentes

DC.Creator

Baolai, Wang; Shengang, Li; Xianzhong, Gao; Tao, Xie

DC.Subject.snpi.spa

Automatización Aerodinámica Motores (Mecánica) Cinemática Ingeniería Aeronáutica

DC.Subject.snpi.eng

Automation Aerodynamics Engines Kinematics Aeronautical Engineering

DC.Subject.spa

macroacción, enjambre de uavs, experiencia humana, decisión autónoma, gran sistema multiagente, fabricación de uavs, vehículo aéreo no tripulado, buena macroacción, gran espacio de estados, número de uavs

DC.Subject.eng

macro action, uav swarm, human expertise, autonomous decision, large multiagent system, making of uavs, unmanned aerial vehicle, good macro action, large state space, number of uavs

DC.Description.spa

DC.Source