Mejorando la detección de moscas de la fruta en fondos complejos utilizando la arquitectura Transformer con mecanismo de atención paso a paso
Autores: Zhang, Lexin; Chen, Kuiheng; Zheng, Liping; Liao, Xuwei; Lu, Feiyu; Li, Yilun; Cui, Yuzhuo; Wu, Yaze; Song, Yihong; Yan, Shuo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
Categoría
Ciencias Agrícolas y Biológicas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Este estudio presenta un novedoso modelo de detección de moscas de la fruta de alta precisión basado en la estructura del Transformer, específicamente diseñado para abordar los desafíos únicos en la detección de moscas de la fruta, como la identificación de objetivos pequeños y la localización precisa contra fondos complejos. Al integrar un mecanismo de atención paso a paso y una función de pérdida cruzada, este modelo mejora significativamente el reconocimiento y la localización de moscas de la fruta dentro de fondos complejos, mejorando especialmente la efectividad del modelo para manejar objetivos de tamaño pequeño y su adaptabilidad bajo diferentes condiciones ambientales. Los resultados experimentales demuestran que el modelo logra una precisión del 0.96, una tasa de recuperación del 0.95, una exactitud del 0.95 y un puntaje F1 de 0.95 en la tarea de detección de moscas de la fruta, superando significativamente a los principales modelos de detección de objetos como YOLOv8 y DETR. Específicamente, esta investigación profundiza y optimiza los desafíos enfrentados en la detección de moscas de la fruta, como problemas de reconocimiento bajo variaciones significativas de luz, tamaño de objetivo pequeño y fondos complejos. A través de experimentos de ablación que comparan diferentes técnicas de aumento de datos y configuraciones de modelos, se valida aún más la contribución crítica del mecanismo de atención paso a paso y la función de pérdida cruzada para mejorar el rendimiento del modelo bajo estas condiciones complejas. Estos logros no solo destacan la innovación y efectividad del método propuesto, sino que también brindan un sólido soporte técnico para resolver problemas prácticos de detección de moscas de la fruta en aplicaciones del mundo real, abriendo nuevos caminos para futuras investigaciones en tecnología de detección de objetos.
Descripción
Este estudio presenta un novedoso modelo de detección de moscas de la fruta de alta precisión basado en la estructura del Transformer, específicamente diseñado para abordar los desafíos únicos en la detección de moscas de la fruta, como la identificación de objetivos pequeños y la localización precisa contra fondos complejos. Al integrar un mecanismo de atención paso a paso y una función de pérdida cruzada, este modelo mejora significativamente el reconocimiento y la localización de moscas de la fruta dentro de fondos complejos, mejorando especialmente la efectividad del modelo para manejar objetivos de tamaño pequeño y su adaptabilidad bajo diferentes condiciones ambientales. Los resultados experimentales demuestran que el modelo logra una precisión del 0.96, una tasa de recuperación del 0.95, una exactitud del 0.95 y un puntaje F1 de 0.95 en la tarea de detección de moscas de la fruta, superando significativamente a los principales modelos de detección de objetos como YOLOv8 y DETR. Específicamente, esta investigación profundiza y optimiza los desafíos enfrentados en la detección de moscas de la fruta, como problemas de reconocimiento bajo variaciones significativas de luz, tamaño de objetivo pequeño y fondos complejos. A través de experimentos de ablación que comparan diferentes técnicas de aumento de datos y configuraciones de modelos, se valida aún más la contribución crítica del mecanismo de atención paso a paso y la función de pérdida cruzada para mejorar el rendimiento del modelo bajo estas condiciones complejas. Estos logros no solo destacan la innovación y efectividad del método propuesto, sino que también brindan un sólido soporte técnico para resolver problemas prácticos de detección de moscas de la fruta en aplicaciones del mundo real, abriendo nuevos caminos para futuras investigaciones en tecnología de detección de objetos.