Un método eficiente de convolución de grupo y fusión de características para la detección de malezas
Autores: Chen, Chaowen; Zang, Ying; Jiao, Jinkang; Yan, Daoqing; Fan, Zhuorong; Cui, Zijian; Zhang, Minghua
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un método eficiente de convolución de grupo y fusión de características para la detección de malezasCategoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Detección de malezas
YOLOv8-EGC-Fusion
Tecnología de detección de malezas en vegetales
Precisión de detección
Métodos de detección
Modelo YEF
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La detección de malezas es un paso crucial para lograr la desmalezadora inteligente para hortalizas. Actualmente, la investigación sobre la tecnología de detección de malezas en hortalizas es relativamente limitada, y los métodos de detección existentes aún enfrentan desafíos debido a las complejas condiciones naturales, lo que resulta en una baja precisión y eficiencia de detección. Este documento propone el modelo YOLOv8-EGC-Fusion (YEF), una mejora basada en el modelo YOLOv8, para abordar estos desafíos. Este modelo introduce módulos plug-and-play: (1) El módulo Efficient Group Convolution (EGC) aprovecha núcleos de convolución de varios tamaños combinados con técnicas de convolución de grupo para reducir significativamente el costo computacional. Integrar este módulo EGC con el módulo C2f crea el módulo C2f-EGC, fortaleciendo la capacidad del modelo para captar información contextual local. (2) El módulo Group Context Anchor Attention (GCAA) fortalece la capacidad del modelo para capturar información contextual a larga distancia, contribuyendo a una mejor comprensión de las características. (3) El módulo GCAA-Fusion fusiona efectivamente características de múltiples escalas, abordando la pérdida de características superficiales y preservando información crítica. Aprovechando GCAA-Fusion y PAFPN, desarrollamos una estructura piramidal de características de Fusión de Características Adaptativas (AFF) que amplifica las capacidades de extracción de características del modelo. Para garantizar una evaluación efectiva, recopilamos un conjunto de datos diverso de imágenes de malezas de diversos campos de hortalizas. Se realizaron una serie de experimentos comparativos para verificar la efectividad de detección del modelo YEF. Los resultados muestran que el modelo YEF supera al modelo original YOLOv8, Faster R-CNN, RetinaNet, TOOD, RTMDet y YOLOv5 en rendimiento de detección. Las métricas de detección logradas por el modelo YEF son las siguientes: precisión de 0.904, recall de 0.88, puntaje F1 de 0.891 y mAP0.5 de 0.929. En conclusión, el modelo YEF demuestra una alta precisión de detección para la identificación de hortalizas y malezas, cumpliendo con los requisitos para una detección precisa.
Descripción
La detección de malezas es un paso crucial para lograr la desmalezadora inteligente para hortalizas. Actualmente, la investigación sobre la tecnología de detección de malezas en hortalizas es relativamente limitada, y los métodos de detección existentes aún enfrentan desafíos debido a las complejas condiciones naturales, lo que resulta en una baja precisión y eficiencia de detección. Este documento propone el modelo YOLOv8-EGC-Fusion (YEF), una mejora basada en el modelo YOLOv8, para abordar estos desafíos. Este modelo introduce módulos plug-and-play: (1) El módulo Efficient Group Convolution (EGC) aprovecha núcleos de convolución de varios tamaños combinados con técnicas de convolución de grupo para reducir significativamente el costo computacional. Integrar este módulo EGC con el módulo C2f crea el módulo C2f-EGC, fortaleciendo la capacidad del modelo para captar información contextual local. (2) El módulo Group Context Anchor Attention (GCAA) fortalece la capacidad del modelo para capturar información contextual a larga distancia, contribuyendo a una mejor comprensión de las características. (3) El módulo GCAA-Fusion fusiona efectivamente características de múltiples escalas, abordando la pérdida de características superficiales y preservando información crítica. Aprovechando GCAA-Fusion y PAFPN, desarrollamos una estructura piramidal de características de Fusión de Características Adaptativas (AFF) que amplifica las capacidades de extracción de características del modelo. Para garantizar una evaluación efectiva, recopilamos un conjunto de datos diverso de imágenes de malezas de diversos campos de hortalizas. Se realizaron una serie de experimentos comparativos para verificar la efectividad de detección del modelo YEF. Los resultados muestran que el modelo YEF supera al modelo original YOLOv8, Faster R-CNN, RetinaNet, TOOD, RTMDet y YOLOv5 en rendimiento de detección. Las métricas de detección logradas por el modelo YEF son las siguientes: precisión de 0.904, recall de 0.88, puntaje F1 de 0.891 y mAP0.5 de 0.929. En conclusión, el modelo YEF demuestra una alta precisión de detección para la identificación de hortalizas y malezas, cumpliendo con los requisitos para una detección precisa.