Red de Interacción de Atención Equilibrada Multiescala para la Detección de Objetos Sobresalientes
Autores: Yang, Haiyan; Chen, Rui; Deng, Dexiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Red de Interacción de Atención Equilibrada Multiescala para la Detección de Objetos SobresalientesCategoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
El propósito de la detección de saliencia es detectar regiones significativas en la imagen. Se ha logrado un gran progreso en la detección de objetos salientes utilizando marcos de aprendizaje profundo. Cómo extraer e integrar de manera efectiva información multiescala con diferentes profundidades es un problema abierto para la detección de objetos salientes. En este documento, proponemos un mecanismo de procesamiento basado en un módulo de atención equilibrada y un módulo residual interactivo. El mecanismo abordó la adquisición de las características multiescala capturando información de contexto superficial y profundo. Para una fusión de información efectiva, se adoptó una estrategia de propagación bidireccional modificada. Finalmente, utilizamos la información multiescala fusionada para predecir características de saliencia, las cuales se combinaron para generar los mapas de saliencia finales. Los resultados experimentales en cinco conjuntos de datos de referencia muestran que el método está a la par con el estado del arte para conjuntos de datos de saliencia de imágenes, especialmente en los conjuntos de datos PASCAL-S, donde el MAE alcanza 0.092, y en los conjuntos de datos DUT-OMROM, donde la medida F alcanza 0.763.
Descripción
El propósito de la detección de saliencia es detectar regiones significativas en la imagen. Se ha logrado un gran progreso en la detección de objetos salientes utilizando marcos de aprendizaje profundo. Cómo extraer e integrar de manera efectiva información multiescala con diferentes profundidades es un problema abierto para la detección de objetos salientes. En este documento, proponemos un mecanismo de procesamiento basado en un módulo de atención equilibrada y un módulo residual interactivo. El mecanismo abordó la adquisición de las características multiescala capturando información de contexto superficial y profundo. Para una fusión de información efectiva, se adoptó una estrategia de propagación bidireccional modificada. Finalmente, utilizamos la información multiescala fusionada para predecir características de saliencia, las cuales se combinaron para generar los mapas de saliencia finales. Los resultados experimentales en cinco conjuntos de datos de referencia muestran que el método está a la par con el estado del arte para conjuntos de datos de saliencia de imágenes, especialmente en los conjuntos de datos PASCAL-S, donde el MAE alcanza 0.092, y en los conjuntos de datos DUT-OMROM, donde la medida F alcanza 0.763.