Aprendizaje Profundo por Refuerzo para el Problema Ágil de Programación de Satélites de Observación Terrestre
Autores: Chun, Jie; Yang, Wenyuan; Liu, Xiaolu; Wu, Guohua; He, Lei; Xing, Lining
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
ágil
Satélite de observación terrestre
Problema de programación
Red de atención de gráficos
Red neuronal de decisión
Restricciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El problema de programación de satélites de observación terrestre ágil (AEOSSP) es un problema de optimización combinatoria con restricciones dependientes del tiempo. Recientemente, se han propuesto muchos heurísticos de construcción y metaheurísticos; sin embargo, los métodos existentes no pueden equilibrar los requisitos de eficiencia y puntualidad. En este documento, proponemos una red neuronal de decisión basada en una red de atención gráfica (GDNN) para resolver el AEOSSP. Específicamente, primero representamos la tarea y las restricciones de transición de actitud dependientes del tiempo mediante un gráfico. Luego, describimos el problema como un proceso de decisión de Markov y realizamos ingeniería de características. Sobre esta base, diseñamos un GDNN para guiar la construcción de la secuencia de solución y lo entrenamos con la optimización de política proximal (PPO). Los resultados experimentales muestran que el método propuesto supera a los heurísticos de construcción en la programación de beneficios en al menos un 45%. El método propuesto también puede calcular los beneficios aproximados del método de vanguardia con un error de menos del 7% y reducir notablemente el tiempo de programación. Finalmente, demostramos la escalabilidad del método propuesto.
Descripción
El problema de programación de satélites de observación terrestre ágil (AEOSSP) es un problema de optimización combinatoria con restricciones dependientes del tiempo. Recientemente, se han propuesto muchos heurísticos de construcción y metaheurísticos; sin embargo, los métodos existentes no pueden equilibrar los requisitos de eficiencia y puntualidad. En este documento, proponemos una red neuronal de decisión basada en una red de atención gráfica (GDNN) para resolver el AEOSSP. Específicamente, primero representamos la tarea y las restricciones de transición de actitud dependientes del tiempo mediante un gráfico. Luego, describimos el problema como un proceso de decisión de Markov y realizamos ingeniería de características. Sobre esta base, diseñamos un GDNN para guiar la construcción de la secuencia de solución y lo entrenamos con la optimización de política proximal (PPO). Los resultados experimentales muestran que el método propuesto supera a los heurísticos de construcción en la programación de beneficios en al menos un 45%. El método propuesto también puede calcular los beneficios aproximados del método de vanguardia con un error de menos del 7% y reducir notablemente el tiempo de programación. Finalmente, demostramos la escalabilidad del método propuesto.