Hacia la detección de peatones con Mask R-CNN optimizado.
Autores: Chen, Dong-Hao; Cao, Yu-Dong; Yan, Jia
Idioma: Inglés
Editor: Hindawi
Año: 2020
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Centrándonos en el problema de la baja precisión de detección de peatones, proponemos un algoritmo de detección basado en Mask R-CNN optimizado que utiliza los últimos resultados de investigación en aprendizaje profundo para mejorar la precisión y velocidad de los resultados de detección. Debido a la influencia de la iluminación, postura, fondo y otros factores en el objetivo humano en la imagen de escena natural, la complejidad de la información del objetivo es alta. Se utiliza SKNet para reemplazar parte del módulo de convolución en el modelo de red residual en profundidad con el fin de extraer características de manera más efectiva para que el modelo pueda seleccionar de forma adaptativa el mejor núcleo de convolución durante el entrenamiento. Además, de acuerdo con la ley estadística, se modifica la relación longitud-anchura de la caja de anclaje para que se ajuste más a las características naturales del objetivo peatonal. Finalmente, se establece un conjunto de datos de objetivos peatonales seleccionando imágenes de peatones adecuadas en el conjunto de datos COCO y se amplía
Descripción
Centrándonos en el problema de la baja precisión de detección de peatones, proponemos un algoritmo de detección basado en Mask R-CNN optimizado que utiliza los últimos resultados de investigación en aprendizaje profundo para mejorar la precisión y velocidad de los resultados de detección. Debido a la influencia de la iluminación, postura, fondo y otros factores en el objetivo humano en la imagen de escena natural, la complejidad de la información del objetivo es alta. Se utiliza SKNet para reemplazar parte del módulo de convolución en el modelo de red residual en profundidad con el fin de extraer características de manera más efectiva para que el modelo pueda seleccionar de forma adaptativa el mejor núcleo de convolución durante el entrenamiento. Además, de acuerdo con la ley estadística, se modifica la relación longitud-anchura de la caja de anclaje para que se ajuste más a las características naturales del objetivo peatonal. Finalmente, se establece un conjunto de datos de objetivos peatonales seleccionando imágenes de peatones adecuadas en el conjunto de datos COCO y se amplía