logo móvil

Un método de construcción de ejemplos de solicitud basado en agrupamiento y similitud semántica

Autores: Chen, Ding; Wang, Jun

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ingeniería y Tecnología

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 11

Citaciones: Sin citaciones


Descripción
Con el lanzamiento de ChatGPT de OpenAI, los modelos de lenguaje grandes han atraído una atención significativa, y las aplicaciones basadas en estos modelos se han proliferado. Ha surgido un desafío crítico: cómo mejorar rápidamente las capacidades de los LLM generales en dominios especializados. En comparación con el ajuste fino y otros métodos, la ingeniería de prompts ha demostrado ser un enfoque rentable para mejorar el rendimiento de los LLM en tareas específicas, obteniendo resultados notables. Sin embargo, los métodos actuales de construcción de ejemplos de prompts son numerosos y carecen de un enfoque universalmente aplicable que abarque diferentes modelos y tareas. Además, la investigación existente se prueba y evalúa predominantemente en un rango limitado de conjuntos de datos específicos, sin explorar el impacto más amplio de estos métodos en una variedad más amplia de tareas. Este artículo propone un método de construcción de ejemplos de prompts basado en agrupamiento y similitud semántica, que combina algoritmos de agrupamiento con técnicas de similitud semántica para mejorar significativamente la calidad de los ejemplos de prompts. En pruebas comparativas realizadas en seis LLM y siete conjuntos de datos, la precisión y estabilidad general del método propuesto supera significativamente a cinco otros métodos comunes, demostrando una amplia aplicabilidad y el potencial para mejorar el rendimiento de salida de todos los LLM. A través de experimentos comparativos, este artículo también identifica que a medida que aumenta la escala de parámetros de los LLM, el efecto de mejora del método de construcción de ejemplos de prompts sobre el rendimiento de salida de los LLM tiende a disminuir. Además, conjuntos de ejemplos de prompts diversificados proporcionan una mejora más pronunciada en el rendimiento de salida de los LLM.

Documentos Relacionados

Temas Virtualpro