Adaptación de dominio no supervisada para el reconocimiento de expresiones faciales mediante redes generativas adversariales
Autores: Xiaoqing, Wang; Xiangjun, Wang; Yubo, Ni
Idioma: Inglés
Editor: Hindawi
Año: 2018
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 10
Citaciones: Sin citaciones
En la tarea de reconocimiento de expresiones faciales, un modelo de red neuronal convolucional (CNN) de buen rendimiento entrenado en un conjunto de datos (conjunto de datos de origen) suele tener un mal rendimiento en otro conjunto de datos (conjunto de datos de destino). Esto se debe a que la distribución de las características de la misma emoción varía en los diferentes conjuntos de datos. Para mejorar la precisión del modelo CNN en diferentes conjuntos de datos, introducimos un método de adaptación de dominio no supervisado, que es especialmente adecuado para conjuntos de datos de destino pequeños sin etiquetar. Para resolver el problema de la falta de muestras del conjunto de datos de destino, entrenamos una red generativa adversarial (GAN) en el conjunto de datos de destino y utilizamos las muestras generadas por la GAN para afinar el modelo preentrenado en el conjunto de datos de origen. En el proceso de ajuste, damos a las muestras generadas por la GAN sin etiquetar, pseudo-etiquetas distribuidas dinámicamente de acuerdo con las probabilidades de predicción actuales. Nuestro método puede aplicarse fácilmente a cualquier red neuronal convolucional (CNN) existente. Demostramos la eficacia de nuestro método en cuatro conjuntos de datos de reconocimiento de expresiones faciales con dos estructuras de CNN y obtenemos resultados inspiradores.
Descripción
En la tarea de reconocimiento de expresiones faciales, un modelo de red neuronal convolucional (CNN) de buen rendimiento entrenado en un conjunto de datos (conjunto de datos de origen) suele tener un mal rendimiento en otro conjunto de datos (conjunto de datos de destino). Esto se debe a que la distribución de las características de la misma emoción varía en los diferentes conjuntos de datos. Para mejorar la precisión del modelo CNN en diferentes conjuntos de datos, introducimos un método de adaptación de dominio no supervisado, que es especialmente adecuado para conjuntos de datos de destino pequeños sin etiquetar. Para resolver el problema de la falta de muestras del conjunto de datos de destino, entrenamos una red generativa adversarial (GAN) en el conjunto de datos de destino y utilizamos las muestras generadas por la GAN para afinar el modelo preentrenado en el conjunto de datos de origen. En el proceso de ajuste, damos a las muestras generadas por la GAN sin etiquetar, pseudo-etiquetas distribuidas dinámicamente de acuerdo con las probabilidades de predicción actuales. Nuestro método puede aplicarse fácilmente a cualquier red neuronal convolucional (CNN) existente. Demostramos la eficacia de nuestro método en cuatro conjuntos de datos de reconocimiento de expresiones faciales con dos estructuras de CNN y obtenemos resultados inspiradores.