logo móvil

Augmented grad-CAM++: mapas de saliencia de super resolución para interpretación visual de redes neuronales profundas

Autores: Gao, Yongshun; Liu, Jie; Li, Weihan; Hou, Ming; Li, Yang; Zhao, Huimin

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ingeniería y Tecnología

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
En los últimos años, las redes neuronales profundas han mostrado un rendimiento superior en varios campos, pero la interpretabilidad siempre ha sido el talón de Aquiles de las redes neuronales profundas. Los métodos visuales de interpretación existentes para las redes neuronales profundas aún sufren de una localización inexacta e insuficiente del objetivo y de mapas de prominencia de baja resolución. Para abordar los problemas mencionados, este documento presenta un método de generación de mapas de prominencia basado en la ampliación de la geometría de la imagen y la superresolución llamado mapeo de activación de clase de ponderación de gradiente de alto orden aumentado (grad-CAM++ aumentado). A diferencia de enfoques anteriores que dependen de una sola imagen de entrada para generar mapas de prominencia, este método primero introduce la técnica de ampliación de la geometría de la imagen para crear un conjunto de imágenes aumentadas para la imagen de entrada y generar mapas de activación por separado. En segundo lugar, los mapas de activación aumentados se combinan para formar el mapa de prominencia final. Finalmente, se introduce una técnica de superresolución para agregar puntos de píxel para reconstruir los píxeles del mapa de prominencia y mejorar la resolución del mapa de prominencia. El método propuesto se aplica para analizar datos de imagen estándar e imágenes de defectos de superficie industrial. Los resultados indican que, en experimentos realizados en datos de imagen estándar, el método propuesto logró una mejora del 3,1% en la precisión de captura de objetos objetivo en comparación con los métodos tradicionales. Además, la resolución de los mapas de prominencia fue tres veces mayor que la de los métodos tradicionales. En la aplicación de la detección de defectos de superficie industrial, el método propuesto demostró un aumento del 11,6% en la precisión de captura de objetos objetivo, reduciendo simultáneamente la tasa de falsos positivos. El enfoque presentado permite una captura más precisa y completa de objetos objetivo con una mayor resolución, mejorando así la interpretabilidad visual de las redes neuronales profundas. Esta mejora contribuye a una mayor interpretabilidad de los modelos de aprendizaje profundo en aplicaciones industriales, ofreciendo ganancias de rendimiento sustanciales para la implementación práctica de redes de aprendizaje profundo en el ámbito industrial.

Documentos Relacionados

Temas Virtualpro