Cookies y Privacidad
Usamos cookies propias y de terceros para mejorar la experiencia de nuestros usuarios, analizar el tráfico del sitio y personalizar contenido. Si continúas navegando, asumimos que aceptas su uso. Para más información, consulta nuestra Política de Cookies

Image courtesy of the MIT-IBM Watson AI Lab.
2021-06-10
Entrenamiento de robots para manipular objetos blandos y deformables
Los robots pueden resolver un cubo de Rubik y navegar por el escarpado terreno de Marte, pero les cuesta tareas sencillas como extender un trozo de masa o manejar un par de palillos. Incluso con montañas de datos, instrucciones claras y una amplia formación, tienen dificultades para realizar tareas que un niño podría realizar fácilmente.
Un nuevo entorno de simulación, PlasticineLab, está diseñado para que el aprendizaje de los robots sea más intuitivo. Al incorporar el conocimiento del mundo físico al simulador, los investigadores esperan facilitar el entrenamiento de los robots para que manipulen objetos y materiales del mundo real que a menudo se doblan y deforman sin volver a su forma original. Desarrollado por investigadores del MIT, el Laboratorio de Inteligencia Artificial MIT-IBM Watson y la Universidad de California en San Diego, el simulador se presentó en la Conferencia Internacional sobre el Aprendizaje de Representaciones en mayo.
En PlasticineLab, el agente robótico aprende a completar una serie de tareas dadas manipulando varios objetos blandos en la simulación. En RollingPin, el objetivo es aplanar un trozo de masa presionándolo o haciéndolo rodar con un alfiler; en Rope, enrollar una cuerda alrededor de un pilar; y en Chopsticks, coger una cuerda y llevarla a un lugar determinado.
Los investigadores entrenaron a su agente para que completara estas y otras tareas más rápidamente que los agentes entrenados con algoritmos de aprendizaje por refuerzo, dicen, al incorporar al simulador conocimientos físicos del mundo, lo que les permitió aprovechar las técnicas de optimización basadas en el descenso de gradiente para encontrar la mejor solución.
"Programar un conocimiento básico de la física en el simulador hace que el proceso de aprendizaje sea más eficiente", afirma el autor principal del estudio, Zhiao Huang, antiguo becario del MIT-IBM Watson AI Lab que ahora es estudiante de doctorado en la Universidad de California en San Diego. "Esto da al robot un sentido más intuitivo del mundo real, que está lleno de seres vivos y objetos deformables".
"Un robot puede tardar miles de iteraciones en dominar una tarea mediante la técnica de ensayo y error del aprendizaje por refuerzo, que se utiliza habitualmente para entrenar robots en simulación", dice el autor principal del trabajo, Chuang Gan, investigador de IBM. "Demostramos que puede hacerse mucho más rápido incorporando algunos conocimientos de física, lo que permite al robot utilizar algoritmos de planificación basados en el gradiente para aprender".
Las ecuaciones físicas básicas se incorporan a PlasticineLab mediante un lenguaje de programación gráfica llamado Taichi. Tanto TaiChi como un simulador anterior en el que se basa PlasticineLab, ChainQueen, fueron desarrollados por el coautor del estudio Yuanming Hu SM ´19, PhD ´21. Mediante el uso de algoritmos de planificación basados en el gradiente, el agente de PlasticineLab es capaz de comparar continuamente su objetivo con los movimientos que ha realizado hasta ese momento, lo que permite corregir el rumbo más rápidamente.
"Podemos encontrar la solución óptima mediante la retropropagación, la misma técnica que se utiliza para entrenar redes neuronales", explica Tao Du, coautor del estudio y estudiante de doctorado en el MIT. "La retropropagación proporciona al agente la información que necesita para actualizar sus acciones y alcanzar su objetivo más rápidamente".
El trabajo forma parte de un esfuerzo continuo por dotar a los robots de más sentido común para que algún día sean capaces de cocinar, limpiar, doblar la ropa y realizar otras tareas mundanas en el mundo real.
Otros autores de PlasticineLab son Siyuan Zhou, de la Universidad de Pekín, Hao Su, de la UCSD, y el profesor del MIT Joshua Tenenbaum.l mundo real.

MIT
Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...