Filter-GAN: clasificación desequilibrada del tráfico malicioso basada en redes generativas adversarias con filtro
Autores: Cao, Xin; Luo, Qin; Wu, Peng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Desarrollo rápido
Seguridad de red
Tráfico malicioso
Aprendizaje automático
Aprendizaje profundo
Filter-GAN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
En los últimos años, con el rápido desarrollo de los servicios de Internet en todos los ámbitos de la vida, una gran cantidad de actos maliciosos como ataques de red, filtración de datos y robo de información se han convertido en grandes desafíos para la seguridad de la red. Debido a la dificultad de recopilación y etiquetado del tráfico malicioso, la distribución de diversas muestras en el conjunto de datos existente está seriamente desequilibrada, lo que resulta en una baja precisión de la clasificación del tráfico malicioso basada en aprendizaje automático y aprendizaje profundo, y una mala capacidad de generalización del modelo. En este documento, se propone un método de representación de imagen de características y una Red Generativa Adversaria con Filtro (Filter-GAN) para resolver estos problemas. Primero, el método de representación de imagen de características divide el tráfico de sesión original en tres partes. Se extrae una matriz de Markov de cada parte para formar una imagen de características de tres canales. Este método puede transformar el formato original del tráfico de sesión en una matriz de longitud uniforme y caracterizar completamente el tráfico de red. Luego, Filter-GAN utiliza las imágenes de características para generar algunas muestras de ataque. En comparación con los métodos generales, Filter-GAN puede generar muestras más eficientes. Se realizaron experimentos en conjuntos de datos públicos. Los resultados muestran que el método de representación de imagen de características puede caracterizar efectivamente el tráfico de sesión original. Cuando el número de muestras es suficiente, la precisión de la clasificación puede alcanzar el 99%. En comparación con conjuntos de datos desequilibrados, Filter-GAN ha mejorado significativamente la precisión de reconocimiento de conjuntos de datos de pequeñas muestras, con una mejora máxima del 6%.
Descripción
En los últimos años, con el rápido desarrollo de los servicios de Internet en todos los ámbitos de la vida, una gran cantidad de actos maliciosos como ataques de red, filtración de datos y robo de información se han convertido en grandes desafíos para la seguridad de la red. Debido a la dificultad de recopilación y etiquetado del tráfico malicioso, la distribución de diversas muestras en el conjunto de datos existente está seriamente desequilibrada, lo que resulta en una baja precisión de la clasificación del tráfico malicioso basada en aprendizaje automático y aprendizaje profundo, y una mala capacidad de generalización del modelo. En este documento, se propone un método de representación de imagen de características y una Red Generativa Adversaria con Filtro (Filter-GAN) para resolver estos problemas. Primero, el método de representación de imagen de características divide el tráfico de sesión original en tres partes. Se extrae una matriz de Markov de cada parte para formar una imagen de características de tres canales. Este método puede transformar el formato original del tráfico de sesión en una matriz de longitud uniforme y caracterizar completamente el tráfico de red. Luego, Filter-GAN utiliza las imágenes de características para generar algunas muestras de ataque. En comparación con los métodos generales, Filter-GAN puede generar muestras más eficientes. Se realizaron experimentos en conjuntos de datos públicos. Los resultados muestran que el método de representación de imagen de características puede caracterizar efectivamente el tráfico de sesión original. Cuando el número de muestras es suficiente, la precisión de la clasificación puede alcanzar el 99%. En comparación con conjuntos de datos desequilibrados, Filter-GAN ha mejorado significativamente la precisión de reconocimiento de conjuntos de datos de pequeñas muestras, con una mejora máxima del 6%.