Investigación sobre detección y seguimiento de manzanas en escenas complejas basada en el YOLOv7-Tiny-PDE mejorado
Autores: Cao, Dongxuan; Luo, Wei; Tang, Ruiyin; Liu, Yuyan; Zhao, Jiasen; Li, Xuqing; Yuan, Lihua
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Ciencias Agrícolas y Biológicas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
Detectar con precisión la fruta de manzana puede ayudar crucialmente en estimar el rendimiento de fruta en huertos de manzanas en escenarios complejos. En tales entornos, los factores de densidad, la occlusión de hojas y la superposición de frutas pueden afectar la precisión de detección y conteo. Este documento propone un modelo de red YOLOv7-Tiny-PDE mejorado basado en el modelo YOLOv7-Tiny para detectar y contar manzanas a partir de datos recopilados por drones, considerando diversas condiciones de occlusión e iluminación. Primero, dentro de la red base, reemplazamos la red de agregación de capa eficiente simplificada (ELAN) con convolución parcial (PConv), reduciendo los parámetros de red y la redundancia computacional mientras se mantiene la precisión de detección. En segundo lugar, en la red de cuello, utilizamos una cabeza de detección dinámica para reemplazar la cabeza de detección original, suprimiendo efectivamente la interferencia de fondo y capturando la información de fondo de manera más completa, mejorando así la precisión de detección para objetivos ocultos y mejorando la extracción de características de la fruta. Para optimizar aún más el modelo, reemplazamos la función de pérdida de caja límite de CIOU a EIOU. Para contar frutas a lo largo de cuadros de video en escenas de occlusión complejas, integramos el modelo mejorado con el algoritmo de seguimiento DeepSort basado en el filtrado de Kalman y la predicción de trayectoria de movimiento con un algoritmo de coincidencia en cascada. Según los resultados experimentales, en comparación con el modelo base YOLOv7-Tiny, el modelo mejorado redujo los parámetros totales en un 22.2% y la complejidad computacional en un 18.3%. Además, en las pruebas de datos, el valor de - mejoró en un 0.5%; el valor de R aumentó en un 2.7%; el mAP y los puntajes de F1 aumentaron en un 4% y 1.7%, respectivamente; y el valor de MOTA mejoró en un 2%. El modelo mejorado es más ligero y puede mantener una alta precisión de detección, por lo tanto, puede aplicarse a tareas de detección y conteo en huertos complejos y proporciona una nueva solución para la estimación del rendimiento de frutas utilizando dispositivos ligeros.
Descripción
Detectar con precisión la fruta de manzana puede ayudar crucialmente en estimar el rendimiento de fruta en huertos de manzanas en escenarios complejos. En tales entornos, los factores de densidad, la occlusión de hojas y la superposición de frutas pueden afectar la precisión de detección y conteo. Este documento propone un modelo de red YOLOv7-Tiny-PDE mejorado basado en el modelo YOLOv7-Tiny para detectar y contar manzanas a partir de datos recopilados por drones, considerando diversas condiciones de occlusión e iluminación. Primero, dentro de la red base, reemplazamos la red de agregación de capa eficiente simplificada (ELAN) con convolución parcial (PConv), reduciendo los parámetros de red y la redundancia computacional mientras se mantiene la precisión de detección. En segundo lugar, en la red de cuello, utilizamos una cabeza de detección dinámica para reemplazar la cabeza de detección original, suprimiendo efectivamente la interferencia de fondo y capturando la información de fondo de manera más completa, mejorando así la precisión de detección para objetivos ocultos y mejorando la extracción de características de la fruta. Para optimizar aún más el modelo, reemplazamos la función de pérdida de caja límite de CIOU a EIOU. Para contar frutas a lo largo de cuadros de video en escenas de occlusión complejas, integramos el modelo mejorado con el algoritmo de seguimiento DeepSort basado en el filtrado de Kalman y la predicción de trayectoria de movimiento con un algoritmo de coincidencia en cascada. Según los resultados experimentales, en comparación con el modelo base YOLOv7-Tiny, el modelo mejorado redujo los parámetros totales en un 22.2% y la complejidad computacional en un 18.3%. Además, en las pruebas de datos, el valor de - mejoró en un 0.5%; el valor de R aumentó en un 2.7%; el mAP y los puntajes de F1 aumentaron en un 4% y 1.7%, respectivamente; y el valor de MOTA mejoró en un 2%. El modelo mejorado es más ligero y puede mantener una alta precisión de detección, por lo tanto, puede aplicarse a tareas de detección y conteo en huertos complejos y proporciona una nueva solución para la estimación del rendimiento de frutas utilizando dispositivos ligeros.