Noticias

Ciencias aplicadas e interdisciplinarias

179

2023-03-22GPT-4 saca notazas en los exámenes. Es más demérito de los exámenes que mérito de la IA

Xataca |Si GPT-4 fuera un estudiante, sería uno de los más brillantes. La propia OpenAI evaluó su capacidad con una serie de exámenes que fueron creados para seres humanos y en los sacó notas espectaculares. Conseguiría estar de hecho entre el 10% de los que obtienen mejores calificaciones, pero hay quien dice que en realidad eso no significa demasiado.

Si GPT-4 fuera un estudiante, sería uno de los más brillantes. La propia OpenAI evaluó su capacidad con una serie de exámenes que fueron creados para seres humanos y en los sacó notas espectaculares. Conseguiría estar de hecho entre el 10% de los que obtienen mejores calificaciones, pero hay quien dice que en realidad eso no significa demasiado.

Qué ha pasado. OpenAI sometió a GPT-4 a exámanes académicos de diversos tipos, como el Uniform Bar Exam, el test más popular en EEUU para convertirse en abogado, o el LSAT, la prueba que da la posibilidad de acceder a la Columbia Law School. También se sometió a la prueba GRE Quantitative, que mide la capacidad de razonar y de entender conceptos matemáticos. En casi todas ellas su puntuación fue excepcional, y eso parecía hacer a GPT-4 superior a la mayoría de estudiantes humanos. Un reciente estudio de dos investigadores revela que hay problemas con esa percepción.

Contaminación de datos. Para empezar, los investigadores comprobaron que GPT-4 se sabía respuestas de memoria... cuando su memoria llegaba hasta ahí. Se sabe que los datos con los que se entrenó al modelo son de antes de septiembre de 2021. Cuando se le sometió a pruebas con preguntas de programación antes de esa fecha, respondió bien, pero no pudo responder ninguna con test basados en pruebas posteriores incluso cuando los problemas eran simples.

Se califica a ese problema como de "contaminación de datos", e incluso cambiar pequeños detalles en la forma de enunciar el problema puede confundir a ChatGPT —que era un alumno mediocre— y probablemente a GPT-4, apuntan mientras que no lo haría en el caso de un humano.

Estos exámenes son para humanos, no para máquinas. "La memorización es un espectro", explicaban los autores. Aunque un modelo como GPT-4 no tenga en su entrenamiento un problema exacto al que se le pide, "es inevitable que haya visto ejemplos bastante parecidos, simplemente por el tamaño del corpus de entrenamiento". Eso le permite al modelo "utilizar un nivel de razonamiento mucho menos profundo". Para estos expertos, estos modelos lingüísticos no tienen por tanto la capacidad de razonamiento que necesitan los humanos que se examinan y que luego aplican en el mundo real.

Las comparaciones son odiosas. Exámenes como el de acceso a la abogacía "ponen demasiado énfasis en el conocimiento de la mateira y poco en las habilidades del mundo real, que son mucho más difíciles de medir de forma estandarizada". O lo que es lo mismo: estos exámenes no solo no hacen hincapié en lo incorrecto, sino que precisamente "hacen demasiado hincapié precisamente en lo que hacen bien los modelos lingüísticos". Para los autores del estudio, la elección de estaos exámenes para evaluar GPT-4 es "desafortunada".

Calidad, no cantidad. Para los investigadores se necesitan estudios cualitativos, no cuantitativos. Aunque reconocen que GPT-4 "es realmente apasionante y puede resolver muchos problemas de los profesionales" como automatizar tareas rutinarias, este tipo de evaluaciones con exámenes como los utilizados por OpenAI pueden llevar a confusión.

Autor

Xataka

Publicación de noticias sobre gadgets y tecnología. Últimas tecnologías en electrónica de consumo y novedades tecnológicas en móviles, tablets, informática...

2022-09-12
De la peste negra al SARS-CoV-2: la respuesta de la humanidad ante las crisis sanitarias

Revista Virtual Pro |El virus SARS-CoV-2 revolucionó el comportamiento económico, social y cultural de la humanidad poniendo a prueba la capacidad que poseen los gobier...

Industria y tecnología química

Noticias relacionadas

2024-04-19
La Inteligencia Artificial (IA) entendiendo el lenguaje humano

Desde 1950, con el artículo de Alan Turing Maquinaria informática e inteligencia y la publicación de la novela Yo, robot de Isaac Asimov, la Inteligencia Artificial viene evolucionando año tras año de forma más rápida.

2024-04-17
La NASA refina las prioridades nacionales de desarrollo de tecnología espacial

Mientras la NASA se centra en explorar la Luna, Marte y el sistema solar en beneficio de la humanidad, la Dirección de Misiones de Tecnología Espacial (STMD) de la agencia está cambiando la forma en que prioriza el desarrollo tecnológico. Como parte de este esfuerzo de refinamiento, la NASA está pidiendo a la comunidad aeroespacial estadounidense comentarios sobre casi 190 necesidades (o deficiencias) de tecnología espacial nacional que ha identificado para futuros esfuerzos científicos y de exploración espacial.

2024-04-17
La ciencia de los grandes descubrimientos científicos es cada vez más elitista e interdisciplinaria

Un trabajo del Instituto de Análisis Económico (IAE-CSIC) analiza la edad, género, formación y procedencia de los autores de más de 700 grandes hallazgos científicos desde 1600 hasta la actualidad

2024-04-17
8 principios para la publicación científica según el International Science Council

El International Science Council (ISC), organización no gubernamental creada en 2018, promueve la ciencia como bien público global, respaldando la universalidad del conocimiento científico. A través de una política científica, busca mejorar la publicación académica en la era digital, basándose en 8 principios para la publicación científica, que incluyen acceso abierto, revisión rigurosa y garantía de acceso para futuras generaciones.

2024-04-16
Cristales antibacterianos de cobre y níquel aportarían a la prevención de futuras pandemias

Después de exponerlos a un proceso químico se encontró que el cobre y el níquel inhibieron con éxito el crecimiento de "Bacillus cereus" y "Staphylococcus aureus", bacterias con cepas resistentes a los antibióticos y relacionadas con enfermedades de transmisión alimentaria (toxiinfecciones). El hallazgo permitiría pensar en nuevos tratamientos farmacológicos o en la elaboración de empaques especiales que protejan productos como carnes y verduras.

2024-04-15
El CERN no decepciona. ATLAS nos recuerda a golpe de exitazo por qué es importante invertir en física de partículas

El bosón W es, junto al Z, una de las partículas responsables de la mediación que tiene lugar en la interacción nuclear débil, que es una de las cuatro fuerzas fundamentales de la naturaleza junto a la interacción electromagnética, la gravedad y la interacción nuclear fuerte. Los físicos suelen colocar a este mismo nivel el campo de Higgs, que es otra interacción fundamental que explica cómo las partículas adquieren su masa, pero para facilitar su comprensión los textos suelen recoger como fuerzas fundamentales las cuatro que acabo de mencionar.

Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Noticias

Ciencias aplicadas e interdisciplinarias

2023-03-22GPT-4 saca notazas en los exámenes. Es más demérito de los exámenes que mérito de la IA

2022-09-12
De la peste negra al SARS-CoV-2: la respuesta de la humanidad ante las crisis sanitarias

Noticias relacionadas

2024-04-19
La Inteligencia Artificial (IA) entendiendo el lenguaje humano

2024-04-17
La NASA refina las prioridades nacionales de desarrollo de tecnología espacial

2024-04-17
La ciencia de los grandes descubrimientos científicos es cada vez más elitista e interdisciplinaria

2024-04-17
8 principios para la publicación científica según el International Science Council

2024-04-16
Cristales antibacterianos de cobre y níquel aportarían a la prevención de futuras pandemias

2024-04-15
El CERN no decepciona. ATLAS nos recuerda a golpe de exitazo por qué es importante invertir en física de partículas

Noticias más leidas

2023-03-08
La importancia de la probabilidad y estadística en la vida diaria

2021-08-18
Herramientas para el control estadístico de calidad

2021-10-08
Qué es la planificación de procesos de un sistema operativo

2022-04-25
Precio del pan en Chile: por qué ha subido su valor

2021-08-13
Historia del control estadístico de la calidad

2021-06-11
Ganadería, biotecnología y medio ambiente

2024-02-15
Nanotecnología para la producción de materiales inteligentes en la industria textil

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Noticias Actualidad en procesos industriales

Dele visibilidad a su trayectoria académica

Noticias

Ciencias aplicadas e interdisciplinarias

2023-03-22GPT-4 saca notazas en los exámenes. Es más demérito de los exámenes que mérito de la IA

2022-09-12De la peste negra al SARS-CoV-2: la respuesta de la humanidad ante las crisis sanitarias

Noticias relacionadas

2024-04-19La Inteligencia Artificial (IA) entendiendo el lenguaje humano

2024-04-17La NASA refina las prioridades nacionales de desarrollo de tecnología espacial

2024-04-17La ciencia de los grandes descubrimientos científicos es cada vez más elitista e interdisciplinaria

2024-04-178 principios para la publicación científica según el International Science Council

2024-04-16Cristales antibacterianos de cobre y níquel aportarían a la prevención de futuras pandemias

2024-04-15El CERN no decepciona. ATLAS nos recuerda a golpe de exitazo por qué es importante invertir en física de partículas

Noticias más leidas

2023-03-08La importancia de la probabilidad y estadística en la vida diaria

2021-08-18Herramientas para el control estadístico de calidad

2021-10-08Qué es la planificación de procesos de un sistema operativo

2022-04-25Precio del pan en Chile: por qué ha subido su valor

2021-08-13Historia del control estadístico de la calidad

2021-06-11Ganadería, biotecnología y medio ambiente

2024-02-15Nanotecnología para la producción de materiales inteligentes en la industria textil

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-09-12
De la peste negra al SARS-CoV-2: la respuesta de la humanidad ante las crisis sanitarias

2024-04-19
La Inteligencia Artificial (IA) entendiendo el lenguaje humano

2024-04-17
La NASA refina las prioridades nacionales de desarrollo de tecnología espacial

2024-04-17
La ciencia de los grandes descubrimientos científicos es cada vez más elitista e interdisciplinaria

2024-04-17
8 principios para la publicación científica según el International Science Council

2024-04-16
Cristales antibacterianos de cobre y níquel aportarían a la prevención de futuras pandemias

2024-04-15
El CERN no decepciona. ATLAS nos recuerda a golpe de exitazo por qué es importante invertir en física de partículas

2023-03-08
La importancia de la probabilidad y estadística en la vida diaria

2021-08-18
Herramientas para el control estadístico de calidad

2021-10-08
Qué es la planificación de procesos de un sistema operativo

2022-04-25
Precio del pan en Chile: por qué ha subido su valor

2021-08-13
Historia del control estadístico de la calidad

2021-06-11
Ganadería, biotecnología y medio ambiente

2024-02-15
Nanotecnología para la producción de materiales inteligentes en la industria textil