DHN-YOLO: Un algoritmo de detección conjunta para fresas en diferentes etapas de madurez y puntos clave de cosecha
Autores: Hao, Hongrui; Xi, Juan; Dai, Jingyuan; Wang, Guozheng; Liu, Dayang; Zhu, Liangkuan
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Fresas
Robots de cosecha automatizada
Detección de puntos clave
Conjunto de datos de imágenes
DHN-YOLO
Extracción de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 14
Citaciones: Sin citaciones
Las fresas son cultivos comerciales importantes. La recolección manual tradicional es costosa e ineficiente, mientras que los robots de cosecha automatizados se ven obstaculizados por desafíos en el campo como la oclusión de tallos y hojas, la superposición de frutas y las variaciones de apariencia/maduración debido a la iluminación y los ángulos de visión. Para abordar la necesidad de una identificación precisa de frutas de diferentes grados de madurez y detección de puntos clave, este estudio construyó un conjunto de datos de imágenes de fresas que abarca múltiples variedades, etapas de maduración y condiciones complejas de cultivo en hileras: MSRBerry. Basado en el marco YOLO11-pose, propusimos DHN-YOLO con tres mejoras clave: reemplazar el C2PSA original con el módulo CDC para mejorar la captura de características sutiles y la adaptabilidad a formas irregulares; sustituir C3K2 por C3H para fortalecer la extracción de características a múltiples escalas y la robustez ante variaciones de madurez/color inducidas por la iluminación; y actualizar el cuello a un Nuevo-Cuello a través de CA y fusión de doble camino para reducir la pérdida de características y mejorar la percepción de regiones críticas. Estas modificaciones mejoraron la calidad de las características mientras redujeron los parámetros y aceleraron la inferencia. Los resultados experimentales mostraron que DHN-YOLO logró un 87.3% de precisión, un 88% de recuperación y un 78.6% de mAP@50:95 para la detección de fresas (0.9%, 1.6%, 5% más que YOLO11-pose), y un 83%, 87.5%, 83.6% para la detección de puntos clave (mejoras del 1.9%, 2.1%, 4.6%). También alcanzó 71.6 FPS con 15 ms de inferencia de imagen única. El rendimiento general de DHN-YOLO también supera a otros modelos principales como YOLO13, YOLO10, DETR, entre otros. Esto demuestra que DHN-YOLO satisface las necesidades prácticas para la detección robusta de fresas y puntos de recolección en entornos agrícolas complejos.
Descripción
Las fresas son cultivos comerciales importantes. La recolección manual tradicional es costosa e ineficiente, mientras que los robots de cosecha automatizados se ven obstaculizados por desafíos en el campo como la oclusión de tallos y hojas, la superposición de frutas y las variaciones de apariencia/maduración debido a la iluminación y los ángulos de visión. Para abordar la necesidad de una identificación precisa de frutas de diferentes grados de madurez y detección de puntos clave, este estudio construyó un conjunto de datos de imágenes de fresas que abarca múltiples variedades, etapas de maduración y condiciones complejas de cultivo en hileras: MSRBerry. Basado en el marco YOLO11-pose, propusimos DHN-YOLO con tres mejoras clave: reemplazar el C2PSA original con el módulo CDC para mejorar la captura de características sutiles y la adaptabilidad a formas irregulares; sustituir C3K2 por C3H para fortalecer la extracción de características a múltiples escalas y la robustez ante variaciones de madurez/color inducidas por la iluminación; y actualizar el cuello a un Nuevo-Cuello a través de CA y fusión de doble camino para reducir la pérdida de características y mejorar la percepción de regiones críticas. Estas modificaciones mejoraron la calidad de las características mientras redujeron los parámetros y aceleraron la inferencia. Los resultados experimentales mostraron que DHN-YOLO logró un 87.3% de precisión, un 88% de recuperación y un 78.6% de mAP@50:95 para la detección de fresas (0.9%, 1.6%, 5% más que YOLO11-pose), y un 83%, 87.5%, 83.6% para la detección de puntos clave (mejoras del 1.9%, 2.1%, 4.6%). También alcanzó 71.6 FPS con 15 ms de inferencia de imagen única. El rendimiento general de DHN-YOLO también supera a otros modelos principales como YOLO13, YOLO10, DETR, entre otros. Esto demuestra que DHN-YOLO satisface las necesidades prácticas para la detección robusta de fresas y puntos de recolección en entornos agrícolas complejos.