Efectividad de las arquitecturas YOLO en la detección de árboles: impacto de la optimización de hiperparámetros y los optimizadores SGD, Adam y AdamW
Autores: Moraes, André Magalhães; Pugliese, Luiz Felipe; Santos, Rafael Francisco dos; Vitor, Giovani Bernardes; Braga, Rodrigo Aparecido da Silva; Silva, Fernanda Rodrigues da
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Procesos industriales
Subcategoría
Gestion y control de procesos
Palabras clave
Optimización
Detección de árboles
YOLOv5
YOLOv8
YOLOv11
Banco de imágenes personalizado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 46
Citaciones: Sin citaciones
Este estudio investiga la optimización de la detección de árboles en imágenes estáticas utilizando los modelos YOLOv5, YOLOv8 y YOLOv11, aprovechando un banco de imágenes no estándar creado exclusivamente para esta investigación. Objetivos: Mejorar la detección de árboles en imágenes estáticas comparando el rendimiento de los modelos YOLOv5, YOLOv8 y YOLOv11. La comparación involucró la sintonización de hiperparámetros y la aplicación de varios optimizadores, con el objetivo de mejorar el rendimiento del modelo en términos de precisión, recuperación, F1 y precisión media promedio (mAP). Diseño/Metodología/Enfoque: Se utilizó un banco de imágenes personalizado para entrenar los modelos YOLOv5, YOLOv8 y YOLOv11. Durante el entrenamiento, se ajustaron la tasa de aprendizaje y el momento de los hiperparámetros en combinación con los optimizadores SGD, Adam y AdamW. Se analizaron métricas de rendimiento, incluyendo precisión, recuperación, F1 y mAP, para cada configuración. Resultados clave: El proceso de optimización logró valores de precisión del 100% con Adam para YOLOv8 y SGD para YOLOv11, y una recuperación del 91.5% con AdamW en YOLOv8. Además, los valores de mAP alcanzaron el 95.6% para AdamW en YOLOv8 y el 95.2% para SGD en YOLOv11. Los tiempos de convergencia para mAP también se redujeron significativamente, demostrando un entrenamiento más rápido y un mejor rendimiento general del modelo. Originalidad/Brecha de investigación: Este estudio aborda una brecha en la detección de árboles utilizando modelos YOLO entrenados en bancos de imágenes no estándar, un tema que se explora menos comúnmente en la literatura. El desarrollo exclusivo de un banco de imágenes personalizado añade aún más novedad a la investigación. Implicaciones prácticas: Los hallazgos subrayan la efectividad de la optimización del modelo en tareas de detección de árboles utilizando conjuntos de datos personalizados. Esta metodología podría extenderse a otras aplicaciones que requieren detección de objetos en bancos de imágenes no estándar. Limitaciones de la investigación: Este estudio se limita a la detección de árboles dentro de un único conjunto de datos personalizado y no evalúa la generalizabilidad de estas optimizaciones a otros conjuntos de datos o tareas de detección de objetos.
Descripción
Este estudio investiga la optimización de la detección de árboles en imágenes estáticas utilizando los modelos YOLOv5, YOLOv8 y YOLOv11, aprovechando un banco de imágenes no estándar creado exclusivamente para esta investigación. Objetivos: Mejorar la detección de árboles en imágenes estáticas comparando el rendimiento de los modelos YOLOv5, YOLOv8 y YOLOv11. La comparación involucró la sintonización de hiperparámetros y la aplicación de varios optimizadores, con el objetivo de mejorar el rendimiento del modelo en términos de precisión, recuperación, F1 y precisión media promedio (mAP). Diseño/Metodología/Enfoque: Se utilizó un banco de imágenes personalizado para entrenar los modelos YOLOv5, YOLOv8 y YOLOv11. Durante el entrenamiento, se ajustaron la tasa de aprendizaje y el momento de los hiperparámetros en combinación con los optimizadores SGD, Adam y AdamW. Se analizaron métricas de rendimiento, incluyendo precisión, recuperación, F1 y mAP, para cada configuración. Resultados clave: El proceso de optimización logró valores de precisión del 100% con Adam para YOLOv8 y SGD para YOLOv11, y una recuperación del 91.5% con AdamW en YOLOv8. Además, los valores de mAP alcanzaron el 95.6% para AdamW en YOLOv8 y el 95.2% para SGD en YOLOv11. Los tiempos de convergencia para mAP también se redujeron significativamente, demostrando un entrenamiento más rápido y un mejor rendimiento general del modelo. Originalidad/Brecha de investigación: Este estudio aborda una brecha en la detección de árboles utilizando modelos YOLO entrenados en bancos de imágenes no estándar, un tema que se explora menos comúnmente en la literatura. El desarrollo exclusivo de un banco de imágenes personalizado añade aún más novedad a la investigación. Implicaciones prácticas: Los hallazgos subrayan la efectividad de la optimización del modelo en tareas de detección de árboles utilizando conjuntos de datos personalizados. Esta metodología podría extenderse a otras aplicaciones que requieren detección de objetos en bancos de imágenes no estándar. Limitaciones de la investigación: Este estudio se limita a la detección de árboles dentro de un único conjunto de datos personalizado y no evalúa la generalizabilidad de estas optimizaciones a otros conjuntos de datos o tareas de detección de objetos.