ConvFaceNeXt: redes ligeras para reconocimiento facial
Autores: Hoo, Seng Chun; Ibrahim, Haidi; Suandi, Shahrel Azmin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de reconocimiento facial
ConvFaceNeXt
Ligero
ConvNeXt
Bloque ECN
Conteo de FLOP
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Los modelos actuales de reconocimiento facial ligeros necesitan mejorar en términos de operaciones de punto flotante (FLOPs), parámetros y tamaño del modelo. Motivado por ConvNeXt y MobileFaceNet, se introduce una familia de modelos de reconocimiento facial ligeros conocida como ConvFaceNeXt para superar las deficiencias mencionadas anteriormente. ConvFaceNeXt tiene tres partes principales, que son el tallo, el cuello de botella y las particiones de incrustación. A diferencia de ConvNeXt, que aplica el bloque ConvNeXt renovado en un modelo ResNet-50 grande, la familia ConvFaceNeXt está diseñada como modelos ligeros. El bloque mejorado de ConvNeXt (ECN) se propone como el bloque de construcción principal para ConvFaceNeXt. El bloque ECN contribuye significativamente a reducir el conteo de FLOP. Además del enfoque típico de submuestreo utilizando convolución con un tamaño de kernel de tres, se implementa una estrategia de "patchify" que utiliza un tamaño de kernel de dos como alternativa para la familia ConvFaceNeXt. El propósito de adoptar la estrategia de "patchify" es reducir aún más la complejidad computacional. Además, se suman bloques con la misma dimensión de salida en la partición del cuello de botella para una mejor correlación de características. Basado en los resultados experimentales, el modelo propuesto ConvFaceNeXt logra resultados competitivos o incluso mejores en comparación con modelos anteriores de reconocimiento facial ligeros, además de un conteo de FLOP, parámetros y tamaño del modelo significativamente más bajos.
Descripción
Los modelos actuales de reconocimiento facial ligeros necesitan mejorar en términos de operaciones de punto flotante (FLOPs), parámetros y tamaño del modelo. Motivado por ConvNeXt y MobileFaceNet, se introduce una familia de modelos de reconocimiento facial ligeros conocida como ConvFaceNeXt para superar las deficiencias mencionadas anteriormente. ConvFaceNeXt tiene tres partes principales, que son el tallo, el cuello de botella y las particiones de incrustación. A diferencia de ConvNeXt, que aplica el bloque ConvNeXt renovado en un modelo ResNet-50 grande, la familia ConvFaceNeXt está diseñada como modelos ligeros. El bloque mejorado de ConvNeXt (ECN) se propone como el bloque de construcción principal para ConvFaceNeXt. El bloque ECN contribuye significativamente a reducir el conteo de FLOP. Además del enfoque típico de submuestreo utilizando convolución con un tamaño de kernel de tres, se implementa una estrategia de "patchify" que utiliza un tamaño de kernel de dos como alternativa para la familia ConvFaceNeXt. El propósito de adoptar la estrategia de "patchify" es reducir aún más la complejidad computacional. Además, se suman bloques con la misma dimensión de salida en la partición del cuello de botella para una mejor correlación de características. Basado en los resultados experimentales, el modelo propuesto ConvFaceNeXt logra resultados competitivos o incluso mejores en comparación con modelos anteriores de reconocimiento facial ligeros, además de un conteo de FLOP, parámetros y tamaño del modelo significativamente más bajos.