El dilema del prisionero iterado (DPI) es bien conocido en el ámbito de la teoría de juegos. Aunque es relativamente sencillo, también puede dilucidar importantes problemas relacionados con la cooperación y la confianza. En general, los jugadores pueden predecir las acciones de sus oponentes cuando son capaces de construir un modelo preciso de su comportamiento basado en su experiencia de juego. Sin embargo, es difícil hacer tales predicciones basándose en un número limitado de partidas. La creación de un modelo preciso requiere el uso no sólo de un algoritmo y un marco de aprendizaje adecuados, sino también de un buen conjunto de datos. Los enfoques de aprendizaje activo se han introducido recientemente en las comunidades de aprendizaje automático. Este enfoque suele producir conjuntos de datos informativos con relativamente poco esfuerzo. Por lo tanto, hemos propuesto una técnica de modelado activo para predecir el comportamiento de los jugadores de IPD. El método propuesto puede modelar el comportamiento del jugador adversario aprovechando los entornos de juego interactivos. Este experimento utilizó doce tipos representativos de jugadores como oponentes, y un observador utilizó un algoritmo de modelado activo para modelar estos oponentes. Este observador recogió activamente datos y modeló el comportamiento del oponente en línea. La mayoría de nuestros datos mostraron que el observador fue capaz de construir, a través de acciones directas, un modelo más preciso del comportamiento de un oponente que cuando los datos fueron recogidos a través de acciones aleatorias.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Método de dos pasos para sintetizar nanorods cristalinos de BaSn(OH)6 y su descomposición térmica en estannato de bario
Artículo:
Alambre esmaltado nanocompuesto resistente a sobretensiones utilizando nanopartículas de sílice con composiciones químicas binarias en la superficie
Artículo:
Tomografía de impedancia eléctrica: fundamentos de hardware y aplicaciones médicas
Artículo:
Estrategia de adquisición de señales sEMG para el control de FES de mano
Artículo:
Estudio de la magnetorreología de nanocables de óxido de hierro
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Presentación:
Estudio de movimientos y tiempos
Artículo:
Estudio sobre la evaluación de la sostenibilidad de los productos innovadores
Artículo:
Generadores para ideales asociados a diferencia de tablas de Ferrers y cómputo de los generadores para ideales de Ferrers