logo móvil

Lmanet: una red de segmentación semántica asimétrica ligera basada en la extracción de características a múltiples escalas

Autores: Chen, Hui; Xiao, Zhexuan; Ge, Bin; Li, Xuedi

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ingeniería y Tecnología

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 13

Citaciones: Sin citaciones


Descripción
Con el rápido avance del aprendizaje profundo y su amplia aplicación en la segmentación semántica, el efecto de la segmentación semántica ha mejorado significativamente. Sin embargo, lograr un compromiso razonable entre precisión, tamaño del modelo y velocidad de inferencia es crucial. En este documento, proponemos una red codificador-decodificador asimétrica multi-escala ligera (LMANet) que está diseñada sobre la base de una estructura codificador-decodificador. Primero, se utiliza un módulo de cuello de botella optimizado para extraer características de diferentes niveles, y se aplican diferentes campos receptivos para obtener información efectiva en diferentes escalas. Luego, se introducen un módulo de atención de canal y un módulo de extracción de características para constituir la estructura residual, y diferentes mapas de características se conectan mediante un módulo de fusión de características para mejorar efectivamente la precisión de la segmentación. Finalmente, se diseña un decodificador multi-escala ligero para recuperar la imagen, y se agrega un módulo de atención espacial para recuperar los detalles espaciales de manera efectiva. Este documento ha verificado el método propuesto en el conjunto de datos de Cityscapes y en el conjunto de datos de CamVid, logrando una intersección media sobre unión (mIoU) del 73.9% y 71.3% con velocidades de inferencia de 111 FPS y 118 FPS, respectivamente, y el número de parámetros es solo de 0.85 M.

Documentos Relacionados

Temas Virtualpro