Detección de videos de falsificación de rostros deepfake basada en fusión de múltiples características
Autores: Lai, Zhimao; Wang, Yufei; Feng, Renhai; Hu, Xianglei; Xu, Haifeng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 10
Citaciones: Sin citaciones
Con el rápido desarrollo del aprendizaje profundo, generar videos falsos de rostros realistas se está volviendo más fácil. Es común crear noticias falsas, pornografía en la red, extorsión y otros eventos ilegales relacionados utilizando la falsificación profunda. Para atenuar el daño de los videos falsos de rostros generados por esta técnica, los investigadores han propuesto muchos métodos de detección basados en las huellas de manipulación introducidas por la falsificación profunda. Sin embargo, estos métodos generalmente tienen un rendimiento de detección cruzada entre bases de datos deficiente. Por lo tanto, este artículo propone un método de detección de fusión de múltiples características para mejorar la capacidad de generalización del detector. Este método combina la información de características del video facial en el dominio espacial, dominio de frecuencia, Patrón de Fuerza Gravitacional Local (PLGF) y dominio temporal, y reduce efectivamente la tasa de error promedio de detección de span mientras asegura un buen efecto de detección en la biblioteca.
Descripción
Con el rápido desarrollo del aprendizaje profundo, generar videos falsos de rostros realistas se está volviendo más fácil. Es común crear noticias falsas, pornografía en la red, extorsión y otros eventos ilegales relacionados utilizando la falsificación profunda. Para atenuar el daño de los videos falsos de rostros generados por esta técnica, los investigadores han propuesto muchos métodos de detección basados en las huellas de manipulación introducidas por la falsificación profunda. Sin embargo, estos métodos generalmente tienen un rendimiento de detección cruzada entre bases de datos deficiente. Por lo tanto, este artículo propone un método de detección de fusión de múltiples características para mejorar la capacidad de generalización del detector. Este método combina la información de características del video facial en el dominio espacial, dominio de frecuencia, Patrón de Fuerza Gravitacional Local (PLGF) y dominio temporal, y reduce efectivamente la tasa de error promedio de detección de span mientras asegura un buen efecto de detección en la biblioteca.