Aprendizaje por Refuerzo Profundo para Robots Suaves y Flexibles: Breve Revisión con Desafíos Inminentes
Autores: Bhagat, Sarthak; Banerjee, Hritwick; Ho Tse, Zion Tsz; Ren, Hongliang
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
La creciente tendencia de estudiar la suavidad innata de las estructuras robóticas y amalgamarla con los beneficios de los extensos desarrollos en el campo de la inteligencia incorporada ha llevado al surgimiento de una esfera de tecnología relativamente nueva pero gratificante en la robótica blanda inteligente. La fusión de algoritmos de refuerzo profundo con estructuras blandas inspiradas en la biología dirige positivamente hacia una perspectiva fructífera de diseñar agentes completamente autosuficientes que son capaces de aprender de las observaciones recolectadas de su entorno. Para las estructuras robóticas blandas que poseen innumerables grados de libertad, a veces no es conveniente formular modelos matemáticos necesarios para entrenar a un agente de aprendizaje por refuerzo profundo (DRL). La implementación de los actuales algoritmos de aprendizaje por imitación en sistemas robóticos blandos ha proporcionado resultados competentes. Este artículo de revisión presenta una visión general de varios de estos algoritmos junto con ejemplos de su aplicación en escenarios del mundo real, obteniendo resultados de vanguardia. Breves descripciones destacan las diversas ramas prístinas de la investigación en DRL en robótica blanda.
Descripción
La creciente tendencia de estudiar la suavidad innata de las estructuras robóticas y amalgamarla con los beneficios de los extensos desarrollos en el campo de la inteligencia incorporada ha llevado al surgimiento de una esfera de tecnología relativamente nueva pero gratificante en la robótica blanda inteligente. La fusión de algoritmos de refuerzo profundo con estructuras blandas inspiradas en la biología dirige positivamente hacia una perspectiva fructífera de diseñar agentes completamente autosuficientes que son capaces de aprender de las observaciones recolectadas de su entorno. Para las estructuras robóticas blandas que poseen innumerables grados de libertad, a veces no es conveniente formular modelos matemáticos necesarios para entrenar a un agente de aprendizaje por refuerzo profundo (DRL). La implementación de los actuales algoritmos de aprendizaje por imitación en sistemas robóticos blandos ha proporcionado resultados competentes. Este artículo de revisión presenta una visión general de varios de estos algoritmos junto con ejemplos de su aplicación en escenarios del mundo real, obteniendo resultados de vanguardia. Breves descripciones destacan las diversas ramas prístinas de la investigación en DRL en robótica blanda.