Ficha técnica

144 | 0

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Context Transfer in Reinforcement Learning Using Action-Value FunctionsTransferencia de contexto en el aprendizaje por refuerzo mediante funciones acción-valor

Resumen

Este artículo analiza la noción de transferencia de contexto en las tareas de aprendizaje por refuerzo. La transferencia de contexto, tal y como se define en este trabajo, implica la transferencia de conocimiento entre tareas de origen y de destino que comparten la misma dinámica de entorno y la misma función de recompensa, pero que tienen estados o espacios de acción diferentes. En otras palabras, los agentes aprenden la misma tarea mientras utilizan diferentes sensores y actuadores. Esto requiere la existencia de un proceso de decisión de Markov (MDP) común subyacente al que se puedan asignar todos los MDP de los agentes. Esto se formula en términos de la noción de homomorfismo MDP. El marco de aprendizaje es el aprendizaje Q. Para transferir el conocimiento entre estas tareas, el espacio de características se utiliza como traductor y se expresa como un mapeo parcial entre los espacios estado-acción de las diferentes tareas. Los valores Q aprendidos durante el proceso de aprendizaje de las tareas de origen se asignan a los conjuntos de valores Q de la tarea de destino. Estos valores Q transferidos se fusionan y se utilizan para iniciar el proceso de aprendizaje de la tarea de destino. Se utiliza un enfoque basado en intervalos para representar y fusionar el conocimiento de las tareas de origen. Los resultados empíricos muestran que la inicialización transferida puede ser beneficiosa para el proceso de aprendizaje de la tarea objetivo.

Materias:Algoritmos (Matemáticas) Ingeniería del transporte Neurociencias Seguridad del transporte Ingeniería ferroviaria
Subjects:Agorithms (Math) Transport engineering Neurosciences Transport safety Railway engineering
Palabras claves:tarea objetivo, proceso de aprendizaje, espacio de acción, transferencia de contexto, tarea fuente, tarea de aprendizaje por refuerzo, proceso de decisión de markov, decisión de markov común, noción de mdp, noción de contexto
Keywords:target task, learning process, action space, context transfer, source task, reinforcement learning task, markov decision process, common markov decision, notion of mdp, notion of context

Autor:Amin, Mousavi; Babak, Nadjar Araabi; Majid, Nili Ahmadabadi.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Bioingeniería, biotecnología, nanotecnología y afines
Año de publicación:2014.
Editor:Hindawi Publishing Corporation

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Context Transfer in Reinforcement Learning Using Action-Value Functions

DC.Title.eng

Transferencia de contexto en el aprendizaje por refuerzo mediante funciones acción-valor

DC.Creator

Amin, Mousavi; Babak, Nadjar Araabi; Majid, Nili Ahmadabadi

DC.Subject.snpi.spa

Algoritmos (Matemáticas) Ingeniería del transporte Neurociencias Seguridad del transporte Ingeniería ferroviaria

DC.Subject.snpi.eng

Agorithms (Math) Transport engineering Neurosciences Transport safety Railway engineering

DC.Subject.spa

tarea objetivo, proceso de aprendizaje, espacio de acción, transferencia de contexto, tarea fuente, tarea de aprendizaje por refuerzo, proceso de decisión de markov, decisión de markov común, noción de mdp, noción de contexto

DC.Subject.eng

target task, learning process, action space, context transfer, source task, reinforcement learning task, markov decision process, common markov decision, notion of mdp, notion of context

DC.Description.spa

DC.Source

https://www.hindawi.com/journals/cin/2014/428567

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/transferencia-de-contexto-en-el-aprendizaje-por-refuerzo-mediante-funciones-accion-valor

DC.Identifier.issn-isbn

ISSN:1687-5265

DC.Identifier.citacion

Revista Virtual Pro, ,

DC.Language

Inglés

DC.Relation

DC.Publisher

Hindawi Publishing Corporation

DC.Contributor

DC.Rights

Derechos de autor:6

DC.Date

2014

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

https://downloads.hindawi.com/journals/cin/2014/428567.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Biblioteca76.515 documentos en línea

Ficha técnica

Context Transfer in Reinforcement Learning Using Action-Value FunctionsTransferencia de contexto en el aprendizaje por refuerzo mediante funciones acción-valor

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Transporte neumático de sólidos

Tratamiento de residuos (químicos y biológicos)

Biorrefinería a partir de microalgas

Constructor de áreas

Técnicas de caracterización de polímeros

Fracciones: números mixtos

Explorador de igualdades: intro

Videos

Itinerario de camiones de transporte de materiales peligrosos - Audiencia pública MassDOT en Boston - 23 de agosto de 2011

Video Conferencias sobre Ingeniería Bioquímica: Conferencia # 26: Diseño de Bioreactores.

Módulo 05, lección 38. Sensor de presión: conceptos de diseño, procesamiento y empaque. Parte 2

Relacioón de la Ergonomía con la Salud Ocupacional

13. Mecánica estadística clásica. Parte 2

Diálogos Ambientales - Minería ilegal

Identificación y clasificación fundamentales de residuos sólidos (parte 1 de 2)

Documentos más descargados

2022-11-04
Conservación de alimentos por medio de alta presión

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca76.515 documentos en línea

Ficha técnica

Context Transfer in Reinforcement Learning Using Action-Value FunctionsTransferencia de contexto en el aprendizaje por refuerzo mediante funciones acción-valor

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Transporte neumático de sólidos

Tratamiento de residuos (químicos y biológicos)

Biorrefinería a partir de microalgas

Constructor de áreas

Técnicas de caracterización de polímeros

Fracciones: números mixtos

Explorador de igualdades: intro

Videos

Itinerario de camiones de transporte de materiales peligrosos - Audiencia pública MassDOT en Boston - 23 de agosto de 2011

Video Conferencias sobre Ingeniería Bioquímica: Conferencia # 26: Diseño de Bioreactores.

Módulo 05, lección 38. Sensor de presión: conceptos de diseño, procesamiento y empaque. Parte 2

Relacioón de la Ergonomía con la Salud Ocupacional

13. Mecánica estadística clásica. Parte 2

Diálogos Ambientales - Minería ilegal

Identificación y clasificación fundamentales de residuos sólidos (parte 1 de 2)

Documentos más descargados

2022-11-04Conservación de alimentos por medio de alta presión

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-11-04
Conservación de alimentos por medio de alta presión