logo móvil
Contáctanos

Control ajustable y adaptativo para un robot móvil inestable utilizando aprendizaje por imitación con optimización de trayectorias

Autores: Dengler, Christian; Lohmann, Boris

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Controlador de retroalimentación
Función paramétrica
Péndulo invertido móvil
Aprendizaje por imitación
Controlador robusto
Red neuronal recurrente

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones


Descripción
En esta contribución, desarrollamos un controlador de retroalimentación en forma de una función paramétrica para un péndulo invertido móvil. El control estabiliza el sistema y lo lleva a posiciones objetivo con orientaciones objetivo. Un diseño del controlador basado únicamente en una función de costo es difícil para esta tarea, por lo que elegimos entrenar el controlador utilizando aprendizaje por imitación en trayectorias optimizadas. A diferencia de enfoques populares como los métodos de gradiente de política, este enfoque nos permite moldear el comportamiento del sistema al incluir restricciones de igualdad. Al transferir el controlador paramétrico de la simulación al péndulo invertido móvil real, el rendimiento del control se degrada debido a la brecha de realidad. Un diseño de control robusto puede reducir la degradación. Sin embargo, para el marco del aprendizaje por imitación en trayectorias optimizadas, los métodos que consideran explícitamente la robustez aún no existen según el conocimiento de los autores. Abordamos esta brecha de investigación presentando un método para diseñar un controlador robusto en forma de una red neuronal recurrente, para mejorar la transferibilidad del controlador entrenado al sistema real. Como último paso, hacemos que el comportamiento del controlador paramétrico sea ajustable para permitir el ajuste fino del comportamiento del sistema real. Diseñamos el controlador para nuestro sistema y mostramos en la aplicación que la red neuronal recurrente ha aumentado el rendimiento en comparación con una red neuronal estática sin consideraciones de robustez.

Documentos Relacionados

Temas Virtualpro