Eadn: un modelo eficiente de aprendizaje profundo para la detección de anomalías en videos
Autores: Ul Amin, Sareer; Ullah, Mohib; Sajjad, Muhammad; Cheikh, Faouzi Alaya; Hijji, Mohammad; Hijji, Abdulrahman; Muhammad, Khan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Sistemas de vigilancia
Datos de video
Aprendizaje profundo
Detección de anomalías
Red neuronal convolucional
Células LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Los sistemas de vigilancia crean regularmente enormes datos de video en la era tecnológica moderna, lo que dificulta su análisis para los especialistas en seguridad. Encontrar actividades anómalas manualmente en estas enormes grabaciones de video es una tarea tediosa, ya que ocurren con poca frecuencia en el mundo real. Hemos propuesto un modelo minimalista y complejo basado en aprendizaje profundo llamado EADN para la detección de anomalías que puede operar en un sistema de vigilancia. En la entrada del modelo, el video se segmenta en tomas destacadas utilizando un algoritmo de detección de límites de tomas. A continuación, la secuencia seleccionada de fotogramas se entrega a una Red Neuronal Convolucional (CNN) que consta de capas 2D distribuidas en el tiempo para extraer características espacio-temporales destacadas. Las características extraídas se enriquecen con información valiosa que es muy útil para capturar eventos anormales. Por último, se emplean celdas de Memoria a Corto y Largo Plazo (LSTM) para aprender características espacio-temporales de una secuencia de fotogramas por muestra de cada evento anormal para la detección de anomalías. Se realizan experimentos exhaustivos en conjuntos de datos de referencia. Además, los resultados cuantitativos se comparan con métodos de vanguardia, y se logra una mejora sustancial, demostrando la efectividad de nuestro modelo.
Descripción
Los sistemas de vigilancia crean regularmente enormes datos de video en la era tecnológica moderna, lo que dificulta su análisis para los especialistas en seguridad. Encontrar actividades anómalas manualmente en estas enormes grabaciones de video es una tarea tediosa, ya que ocurren con poca frecuencia en el mundo real. Hemos propuesto un modelo minimalista y complejo basado en aprendizaje profundo llamado EADN para la detección de anomalías que puede operar en un sistema de vigilancia. En la entrada del modelo, el video se segmenta en tomas destacadas utilizando un algoritmo de detección de límites de tomas. A continuación, la secuencia seleccionada de fotogramas se entrega a una Red Neuronal Convolucional (CNN) que consta de capas 2D distribuidas en el tiempo para extraer características espacio-temporales destacadas. Las características extraídas se enriquecen con información valiosa que es muy útil para capturar eventos anormales. Por último, se emplean celdas de Memoria a Corto y Largo Plazo (LSTM) para aprender características espacio-temporales de una secuencia de fotogramas por muestra de cada evento anormal para la detección de anomalías. Se realizan experimentos exhaustivos en conjuntos de datos de referencia. Además, los resultados cuantitativos se comparan con métodos de vanguardia, y se logra una mejora sustancial, demostrando la efectividad de nuestro modelo.