Aplicación de la IA en la detección de dátiles: análisis de rendimiento de los modelos YOLO y Faster R-CNN
Autores: Lipinski, Seweryn; Sadkowski, Szymon; Chwietczuk, Pawe
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
El estudio presentado evalúa y compara dos modelos de aprendizaje profundo, es decir, YOLOv8n y Faster R-CNN, para la detección automatizada de frutas de dátil en entornos naturales de huertos. Ambos modelos fueron entrenados y probados utilizando un conjunto de datos anotados públicamente disponible. YOLO, un detector de una sola etapa, logró un [email protected] de 0.942 con un tiempo de entrenamiento de aproximadamente 2 h. Demostró una fuerte generalización, especialmente en condiciones más simples, y es adecuado para aplicaciones en tiempo real debido a su velocidad y menores requisitos computacionales. Por otro lado, Faster R-CNN, un detector de dos etapas que utiliza una columna vertebral ResNet-50, alcanzó una precisión comparable ([email protected] = 0.94) con una precisión y recuperación ligeramente más altas. Sin embargo, su entrenamiento requirió significativamente más tiempo (aproximadamente 19 h) y recursos. El análisis de métricas de aprendizaje profundo confirmó que ambos modelos funcionaron de manera confiable, con YOLO favoreciendo la velocidad de inferencia y Faster R-CNN ofreciendo una mayor robustez bajo oclusión e iluminación variable. Se proporcionan recomendaciones prácticas para la selección del modelo basadas en las necesidades de la aplicación: YOLO para robótica móvil o de campo y Faster R-CNN para tareas fuera de línea de alta precisión. Las conclusiones adicionales resaltan los beneficios de la aceleración de GPU y las entradas de alta resolución. El estudio contribuye al creciente cuerpo de investigación sobre la implementación de IA en la agricultura de precisión y brinda información sobre el desarrollo de sistemas inteligentes de cosecha y monitoreo de cultivos.
Descripción
El estudio presentado evalúa y compara dos modelos de aprendizaje profundo, es decir, YOLOv8n y Faster R-CNN, para la detección automatizada de frutas de dátil en entornos naturales de huertos. Ambos modelos fueron entrenados y probados utilizando un conjunto de datos anotados públicamente disponible. YOLO, un detector de una sola etapa, logró un [email protected] de 0.942 con un tiempo de entrenamiento de aproximadamente 2 h. Demostró una fuerte generalización, especialmente en condiciones más simples, y es adecuado para aplicaciones en tiempo real debido a su velocidad y menores requisitos computacionales. Por otro lado, Faster R-CNN, un detector de dos etapas que utiliza una columna vertebral ResNet-50, alcanzó una precisión comparable ([email protected] = 0.94) con una precisión y recuperación ligeramente más altas. Sin embargo, su entrenamiento requirió significativamente más tiempo (aproximadamente 19 h) y recursos. El análisis de métricas de aprendizaje profundo confirmó que ambos modelos funcionaron de manera confiable, con YOLO favoreciendo la velocidad de inferencia y Faster R-CNN ofreciendo una mayor robustez bajo oclusión e iluminación variable. Se proporcionan recomendaciones prácticas para la selección del modelo basadas en las necesidades de la aplicación: YOLO para robótica móvil o de campo y Faster R-CNN para tareas fuera de línea de alta precisión. Las conclusiones adicionales resaltan los beneficios de la aceleración de GPU y las entradas de alta resolución. El estudio contribuye al creciente cuerpo de investigación sobre la implementación de IA en la agricultura de precisión y brinda información sobre el desarrollo de sistemas inteligentes de cosecha y monitoreo de cultivos.