Csgn: arquitectura de puerta dinámica combinada de canal y espacio para redes neuronales convolucionales
Autores: Hyun, Sangmin; Ryu, Chang Ho; Kang, Ju Yeon; Lim, Hyun Jo; Han, Tae Hee
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
La explosiva computación y los requisitos de memoria de las redes neuronales convolucionales (CNN) obstaculizan su implementación en dispositivos con recursos limitados. Debido a que las CNN convencionales realizan cálculos paralelos idénticos incluso en píxeles redundantes, la relevancia de diversas características en una imagen debería reflejarse para lograr una mayor eficiencia energética y penetración en el mercado. Este documento propone una nueva red de compuerta espacial y de canal (CSGN) para seleccionar de forma adaptativa canales vitales y generar máscaras de ejecución a nivel espacial. Un CSGN puede caracterizarse como un módulo de compuerta dinámica de canal y espacialmente consciente al utilizar al máximo la dispersión oportunista. Se realizaron experimentos extensos en los conjuntos de datos CIFAR-10 e ImageNet basados en ResNet. Los resultados revelaron que, con la arquitectura propuesta, la cantidad de operaciones de multiplicar-acumular (MAC) se redujo en 1.97-11.78x y 1.37-13.12x en CIFAR-10 e ImageNet, respectivamente, con una degradación de precisión insignificante en la etapa de inferencia en comparación con las arquitecturas de referencia.
Descripción
La explosiva computación y los requisitos de memoria de las redes neuronales convolucionales (CNN) obstaculizan su implementación en dispositivos con recursos limitados. Debido a que las CNN convencionales realizan cálculos paralelos idénticos incluso en píxeles redundantes, la relevancia de diversas características en una imagen debería reflejarse para lograr una mayor eficiencia energética y penetración en el mercado. Este documento propone una nueva red de compuerta espacial y de canal (CSGN) para seleccionar de forma adaptativa canales vitales y generar máscaras de ejecución a nivel espacial. Un CSGN puede caracterizarse como un módulo de compuerta dinámica de canal y espacialmente consciente al utilizar al máximo la dispersión oportunista. Se realizaron experimentos extensos en los conjuntos de datos CIFAR-10 e ImageNet basados en ResNet. Los resultados revelaron que, con la arquitectura propuesta, la cantidad de operaciones de multiplicar-acumular (MAC) se redujo en 1.97-11.78x y 1.37-13.12x en CIFAR-10 e ImageNet, respectivamente, con una degradación de precisión insignificante en la etapa de inferencia en comparación con las arquitecturas de referencia.