Con el desarrollo de la tecnología de los vehículos aéreos no tripulados (UAV), el enfrentamiento de los enjambres de UAV ha atraído la atención de muchos investigadores. Sin embargo, la situación a la que se enfrenta el enjambre de UAV tiene una incertidumbre sustancial y una variabilidad dinámica. El espacio de estado y el espacio de acción aumentan exponencialmente con el número de UAV, por lo que la toma de decisiones autónoma se convierte en un problema difícil en el entorno de confrontación. En este trabajo se propone un método de aprendizaje por refuerzo multiagente con macroacción y experiencia humana para la toma de decisiones autónoma de los UAV. En el enfoque propuesto, el enjambre de UAVs se modela como un gran sistema multiagente (MAS) con un UAV individual como agente, y el problema de toma de decisiones secuencial en la confrontación del enjambre se modela como un proceso de decisión de Markov. Los agentes del método propuesto se entrenan basándose en las macroacciones, donde se superan eficazmente las recompensas escasas y retrasadas, el gran espacio de estado y el espacio de acción. La clave del éxito de este método es la generación de las macroacciones que permiten a la política de alto nivel encontrar una solución casi óptima. En este trabajo, aprovechamos además la experiencia humana para diseñar un conjunto de buenas macroacciones. Extensos experimentos empíricos en nuestro entorno de confrontación de enjambre construido muestran que nuestro método rinde mejor que los demás algoritmos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Ley de guiado en medio del curso basada en una alta probabilidad de adquisición del objetivo considerando la restricción angular y el control de la tasa de ángulo de la línea de visión
Artículo:
Simulación numérica del acoplamiento de la influencia térmica y mecánica en la tobera sumergida del motor de cohete sólido
Artículo:
Desarrollo de la tecnología de enfriamiento intermedio y su control para el laminado de chapas en dos niveles
Video:
Simulando control por retroalimentación de sistemas térmicos
Artículo:
Detección de fallos en sistemas lineales de tiempo discreto, periódicos y de datos muestreados
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Infografía:
Sistemas de calidad. Six Sigma
Manual:
Química de los taninos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.