Un algoritmo mejorado yolo v5s para detección de objetos con un mecanismo de atención
Autores: Jiang, Tingyao; Li, Cheng; Yang, Ming; Wang, Zilong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Para mejorar la precisión del algoritmo You Only Look Once v5s (YOLOv5s) para la detección de objetos, este documento propone un algoritmo mejorado YOLOv5s, CBAM-YOLOv5s, que introduce un mecanismo de atención. Un módulo de atención de bloque convolucional (CBAM) se incorpora en la red principal de YOLOv5s para mejorar su capacidad de extracción de características. Además, se utiliza la pérdida completa de intersección sobre unión (CIoU) como función de pérdida de regresión de cuadro delimitador de objeto para acelerar la velocidad del proceso de regresión. Se realizan experimentos en el conjunto de datos Pascal Visual Object Classes 2007 (VOC2007) y en el conjunto de datos Microsoft Common Objects in Context (COCO2014), que se utilizan ampliamente para evaluaciones de detección de objetos. En el conjunto de datos VOC2007, los resultados experimentales muestran que en comparación con los del algoritmo YOLOv5s original, la precisión, recall y precisión promedio (mAP) del algoritmo CBAM-YOLOv5s mejoran en un 4,52%, 1,18% y 3,09%, respectivamente. En el conjunto de datos COCO2014, en comparación con el algoritmo YOLOv5s original, la precisión, recall y mAP del algoritmo CBAM-YOLOv5s se incrementan en un 2,21%, 0,88% y 1,39%, respectivamente.
Descripción
Para mejorar la precisión del algoritmo You Only Look Once v5s (YOLOv5s) para la detección de objetos, este documento propone un algoritmo mejorado YOLOv5s, CBAM-YOLOv5s, que introduce un mecanismo de atención. Un módulo de atención de bloque convolucional (CBAM) se incorpora en la red principal de YOLOv5s para mejorar su capacidad de extracción de características. Además, se utiliza la pérdida completa de intersección sobre unión (CIoU) como función de pérdida de regresión de cuadro delimitador de objeto para acelerar la velocidad del proceso de regresión. Se realizan experimentos en el conjunto de datos Pascal Visual Object Classes 2007 (VOC2007) y en el conjunto de datos Microsoft Common Objects in Context (COCO2014), que se utilizan ampliamente para evaluaciones de detección de objetos. En el conjunto de datos VOC2007, los resultados experimentales muestran que en comparación con los del algoritmo YOLOv5s original, la precisión, recall y precisión promedio (mAP) del algoritmo CBAM-YOLOv5s mejoran en un 4,52%, 1,18% y 3,09%, respectivamente. En el conjunto de datos COCO2014, en comparación con el algoritmo YOLOv5s original, la precisión, recall y mAP del algoritmo CBAM-YOLOv5s se incrementan en un 2,21%, 0,88% y 1,39%, respectivamente.