Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Participe en la convocatoria de trabajos inéditos de Virtual Pro.

Publicar Ahora

2020-11-23IA aprende más rápido un videojuego con niveles graduales de dificultad

Agencia de Noticias UN |Un jugador controlado con inteligencia artificial (IA) al que se le va incrementando la dificultad en cada videojuego aprende más rápido que cuando se trata de enseñarle con el máximo nivel de dificultad desde el inicio.

Así lo determinó una investigación reciente que muestra cómo el aprendizaje por currículos, o métodos, puede reducir el tiempo de aprendizaje de un agente inteligente –que en esencia es un algoritmo de IA diseñado para ejecutar una tarea específica– en un videojuego.

En el estudio, realizado por Rigoberto Sáenz Imbacuán, magíster en Ingeniería de Sistemas y Computación de la Universidad Nacional de Colombia (UNAL), con la dirección del profesor Jorge Eliécer Camargo Mendoza, doctor en la misma área, se plantea cómo un agente inteligente potencialmente puede aprender más rápido a jugar un videojuego si se usan currículos de aprendizaje durante su entrenamiento. Estos currículos son un conjunto de parámetros que determinan como varía la dificultad del juego en el tiempo.

En los experimentos entrenaron al agente para que aprendiera un videojuego de minifútbol de dos jugadores usando un currículo en particular, durante 100 millones de partidos que fueron simulados usando el motor de videojuegos Unity.

En los currículos de mejor desempeño, el agente aprendió de manera óptima solo con 60 o 70 millones de partidos. En cada uno, el agente inteligente, representado como un cubo azul en el videojuego, competía con un adversario rojo; el campo de fútbol tenía barreras que evitaban que la pelota saliera del campo y facilitaba el entrenamiento.

El agente podía ver su entorno mediante rayos de detección lanzados continuamente en diferentes direcciones y que detectan todos los elementos presentes en el campo, incluyendo los adversarios, el balón, las barreras y los arcos.

El investigador diseñó 24 currículos variando en cada uno parámetros del partido a distintas velocidades, con el fin de determinar cuáles tenían mejor efecto en los tiempos de entrenamiento.

Cada currículo se puede interpretar como distintas formas de darle una ventaja al jugador. “Al inicio de un partido, para guiar el proceso de aprendizaje del jugador, puedo reducir la velocidad de movimiento de los adversarios dándole una ventaja significativa y permitiéndole aprender rápidamente a perseguir la pelota y empujarla al arco contrario. Cuando aprende a marcar goles aumento la velocidad de los adversarios, con el fin de que este aprenda a esquivarlos y siga anotando goles”, detalla el magíster Sáenz.

El escenario de la IA

La inteligencia artificial es cada vez más usada en diferentes ámbitos, incluyendo sistemas robóticos que operan plantas de producción, detección de fraude en operaciones bancarias, y análisis y segmentación de compradores a partir de información de sus compras pasadas.

Usualmente, para que un jugador controlado por IA aprenda a jugar un videojuego, por ejemplo de baloncesto, se ponen todos los adversarios en el campo de juego desde el inicio y se le indica: “muévase, actúe”, y según sus acciones se le da una recompensa o un castigo.

Si hace una cesta se le recompensa, si los adversarios la hacen se le castiga. En este escenario es muy difícil que el jugador aprenda de manera rápida y efectiva, ya que desde el inicio existe una clara desventaja y recibirá muchas cestas en contra. Eventualmente aprenderá a evitar que le hagan puntos, y luego aprenderá a hacerlos, pero será necesario que juegue cientos y miles de millones de partidos para aprenderlo.

“La hipótesis de nuestro trabajo es que este proceso de dificultad incremental es más efectivo, en términos de la velocidad de aprendizaje”, asegura el investigador.

Los currículos que tuvieron el mejor desempeño exhibieron características comunes y redujeron el tiempo de entrenamiento desde un 15 hasta un 40 % en el mejor de los casos.

Si se tiene en cuenta que el tiempo de entrenamiento de un agente inteligente usualmente toma varias semanas, o incluso meses, la reducción resulta significativa.

Este tipo de entrenamientos se suelen ejecutar en servicios de computación en la nube que pueden resultar costosos, por lo que una reducción de tiempos de entrenamiento también se traduce en una disminución de costos.

Si bien la aplicación principal de los resultados de esta investigación es el desarrollo de NPC (Non-player character), que son los jugadores autónomos contra los que un jugador humano debe competir dentro de un videojuego, los resultados también se podrían aplicar a otros ámbitos como la robótica, la ciberseguridad y la conducción autónoma.

Unimedios | Agencia de Noticias UN
Autor
Unimedios | Agencia de Noticias UN

La Unidad de Medios de Comunicación – Unimedios, es la unidad de producción y difusión de la información científica, cultural, investigativa, académica, artística y tecnológica generada por la Universidad Nacional de Colombia y dirigida a la comunidad universitaria y a la sociedad en general. Es una dependencia de nivel nacional, adscrita a la Rectoría que articula los medios de comunicación existentes dentro de la Unidad para velar por el buen nombre e imagen de la Institución, promover y agenciar sus logros e integrarla en su diversidad y con la sociedad a través de sus medios, servicios y productos.


2024-04-17
La NASA refina las prioridades nacionales de desarrollo de tecnología espacial

Mientras la NASA se centra en explorar la Luna, Marte y el sistema solar en beneficio de la humanidad, la Dirección de Misiones de Tecnología Espacial (STMD) de la agencia está cambiando la forma en que prioriza el desarrollo tecnológico. Como parte de este esfuerzo de refinamiento, la NASA está pidiendo a la comunidad aeroespacial estadounidense comentarios sobre casi 190 necesidades (o deficiencias) de tecnología espacial nacional que ha identificado para futuros esfuerzos científicos y de exploración espacial.

2024-04-17
La ciencia de los grandes descubrimientos científicos es cada vez más elitista e interdisciplinaria

Un trabajo del Instituto de Análisis Económico (IAE-CSIC) analiza la edad, género, formación y procedencia de los autores de más de 700 grandes hallazgos científicos desde 1600 hasta la actualidad

2024-04-17
8 principios para la publicación científica según el International Science Council

El International Science Council (ISC), organización no gubernamental creada en 2018, promueve la ciencia como bien público global, respaldando la universalidad del conocimiento científico. A través de una política científica, busca mejorar la publicación académica en la era digital, basándose en 8 principios para la publicación científica, que incluyen acceso abierto, revisión rigurosa y garantía de acceso para futuras generaciones.

2024-04-16
Cristales antibacterianos de cobre y níquel aportarían a la prevención de futuras pandemias

Después de exponerlos a un proceso químico se encontró que el cobre y el níquel inhibieron con éxito el crecimiento de "Bacillus cereus" y "Staphylococcus aureus", bacterias con cepas resistentes a los antibióticos y relacionadas con enfermedades de transmisión alimentaria (toxiinfecciones). El hallazgo permitiría pensar en nuevos tratamientos farmacológicos o en la elaboración de empaques especiales que protejan productos como carnes y verduras.

2024-04-15
El CERN no decepciona. ATLAS nos recuerda a golpe de exitazo por qué es importante invertir en física de partículas

El bosón W es, junto al Z, una de las partículas responsables de la mediación que tiene lugar en la interacción nuclear débil, que es una de las cuatro fuerzas fundamentales de la naturaleza junto a la interacción electromagnética, la gravedad y la interacción nuclear fuerte. Los físicos suelen colocar a este mismo nivel el campo de Higgs, que es otra interacción fundamental que explica cómo las partículas adquieren su masa, pero para facilitar su comprensión los textos suelen recoger como fuerzas fundamentales las cuatro que acabo de mencionar.

2024-04-12
GPT-5: qué es, qué novedades traerá y cuándo estará disponible

No es ningún secreto que GPT-5, la nueva versión de la inteligencia artificial de OpenAI, está en desarrollo y que podría ver la luz en los próximos meses. De hecho, Sam Altman, CEO de la compañía, ha confirmado esto en diferentes ocasiones, y si bien intenta evitar dar detalles sobre qué ventajas tendrá la nueva IA frente a GPT-4, hay muchos rumores procedentes de fuentes fiables, así como declaraciones de otros ejecutivos, que ya han revelado algunas mejoras que tendría el modelo de lenguaje que alimenta a ChatGPT.