Clasificación de preguntas sobre enfermedades y plagas de papa basada en la ingeniería de pistas y convolución con compuertas
Autores: Tang, Wentao; Hu, Zelin
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Ciencias Agrícolas y Biológicas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
Actualmente, no hay un conjunto de datos públicamente disponible para la clasificación de consultas relacionadas con plagas y enfermedades de la papa. Además, los modelos tradicionales de clasificación de consultas generalmente adoptan una estrategia de máxima agrupación única al realizar operaciones de submuestreo. Este mecanismo solo extrae las respuestas de valor extremo dentro del campo receptivo local, lo que conduce a la degradación de la representación de características detalladas y amplifica significativamente el ruido del texto. Para abordar estos problemas, se propone un método de construcción de conjunto de datos basado en la ingeniería de instrucciones, junto con un método de clasificación de preguntas que utiliza una red neuronal convolucional de fusión con compuertas (GF-CNN). Al interactuar con modelos de lenguaje grandes, se utilizan palabras clave para generar plantillas de preguntas sobre enfermedades y plagas de la papa y construir eficientemente el Conjunto de Datos de Clasificación de Preguntas sobre Plagas y Enfermedades de la Papa (PDPQCD) mediante la importación por lotes de entidades nombradas. El GF-CNN combina salidas de núcleos convolucionales de diferentes tamaños, y después de procesar con máxima agrupación y media agrupación, se emplea un mecanismo de compuerta para regular el flujo de información, optimizando así el proceso de extracción de características del texto. Los experimentos utilizando GF-CNN en los conjuntos de datos PDPQCD, Subj y THUCNews muestran puntuaciones del 100.00%, 96.70% y 93.55%, respectivamente, superando a otros modelos. El método basado en ingeniería de instrucciones proporciona un nuevo paradigma para la construcción de conjuntos de datos de clasificación de preguntas, y el GF-CNN también puede ser ampliado para su aplicación en otros dominios.
Descripción
Actualmente, no hay un conjunto de datos públicamente disponible para la clasificación de consultas relacionadas con plagas y enfermedades de la papa. Además, los modelos tradicionales de clasificación de consultas generalmente adoptan una estrategia de máxima agrupación única al realizar operaciones de submuestreo. Este mecanismo solo extrae las respuestas de valor extremo dentro del campo receptivo local, lo que conduce a la degradación de la representación de características detalladas y amplifica significativamente el ruido del texto. Para abordar estos problemas, se propone un método de construcción de conjunto de datos basado en la ingeniería de instrucciones, junto con un método de clasificación de preguntas que utiliza una red neuronal convolucional de fusión con compuertas (GF-CNN). Al interactuar con modelos de lenguaje grandes, se utilizan palabras clave para generar plantillas de preguntas sobre enfermedades y plagas de la papa y construir eficientemente el Conjunto de Datos de Clasificación de Preguntas sobre Plagas y Enfermedades de la Papa (PDPQCD) mediante la importación por lotes de entidades nombradas. El GF-CNN combina salidas de núcleos convolucionales de diferentes tamaños, y después de procesar con máxima agrupación y media agrupación, se emplea un mecanismo de compuerta para regular el flujo de información, optimizando así el proceso de extracción de características del texto. Los experimentos utilizando GF-CNN en los conjuntos de datos PDPQCD, Subj y THUCNews muestran puntuaciones del 100.00%, 96.70% y 93.55%, respectivamente, superando a otros modelos. El método basado en ingeniería de instrucciones proporciona un nuevo paradigma para la construcción de conjuntos de datos de clasificación de preguntas, y el GF-CNN también puede ser ampliado para su aplicación en otros dominios.