El aprendizaje y la inteligencia humanos funcionan de forma diferente al enfoque de reconocimiento de patrones supervisado adoptado en la mayoría de las arquitecturas de aprendizaje profundo. Los humanos parecen aprender representaciones ricas mediante la exploración y la imitación, construyen modelos causales del mundo y utilizan ambos para resolver de forma flexible nuevas tareas. Proponemos un modelo simple pero eficaz sin supervisión que desarrolla estas características. El agente aprende a representar las propiedades físicas dinámicas de su entorno mediante la exploración intrínsecamente motivada y realiza inferencia sobre esta representación para alcanzar objetivos. Para ello, se combina un conjunto de mapas autoorganizativos que representan pares estado-acción con un modelo causal para la predicción de secuencias. El sistema propuesto se evalúa en el entorno de Cartpole. Tras una fase inicial de exploración lúdica, el agente puede ejecutar simulaciones cinemáticas del futuro del entorno y utilizarlas para la planificación de acciones. Demostramos su rendimiento en un conjunto de varias tareas de imitación relacionadas, pero diferentes, que el agente resuelve con flexibilidad en un estilo de inferencia activa.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Estudio de métodos de compensación de errores de sistemas basados en transductores moleculares-electrónicos de parámetros de movimiento
Artículo:
Propiedades de transporte eléctrico de películas multicapa de nanotubos de carbono de pared simple
Artículo:
BMIVPOT, una versión totalmente automatizada de la pértiga intravenosa: Simulación, diseño y evaluación
Artículo:
Síntesis de polietileno de peso molecular ultraalto desenredado: influencia del medio de reacción en las propiedades del material
Artículo:
Sistema de advertencia de seguridad para camiones grandes basado en un modelo de SSD ligero
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Presentación:
Estudio de movimientos y tiempos
Artículo:
Estudio sobre la evaluación de la sostenibilidad de los productos innovadores
Artículo:
Generadores para ideales asociados a diferencia de tablas de Ferrers y cómputo de los generadores para ideales de Ferrers