El desarrollo de Internet y de las aplicaciones de red ha trado consigo el desarrollo de la tecnologa de comunicacin cifrada. Pero sobre esta base, el trfico malicioso tambin utiliza el cifrado para evitar la proteccin y la deteccin de seguridad tradicionales. Los mtodos tradicionales de proteccin y deteccin de la seguridad no pueden detectar con precisin el trfico malicioso cifrado. En los ltimos aos, el auge de la inteligencia artificial nos permite utilizar mtodos de aprendizaje automtico y aprendizaje profundo para detectar el trfico malicioso cifrado sin descifrar, y los resultados de deteccin son muy precisos. En la actualidad, la investigacin sobre la deteccin de trfico cifrado malicioso se centra principalmente en el anlisis de las caractersticas del trfico cifrado y la seleccin de algoritmos de aprendizaje automtico. En este artculo se propone un mtodo que combina el procesamiento del lenguaje natural y el aprendizaje automtico; es decir, se propone un mtodo de deteccin basado en TF-IDF para construir un modelo de deteccin. En el proceso de preprocesamiento de datos, este mtodo introduce el mtodo de procesamiento del lenguaje natural, es decir, el modelo TF-IDF, para extraer la informacin de los datos, obtener la importancia de las palabras clave y, a continuacin, reconstruir las caractersticas de los datos. El mtodo de deteccin basado en el modelo TF-IDF no necesita analizar cada campo del conjunto de datos. En comparacin con el mtodo general de preprocesamiento de datos de aprendizaje automtico, es decir, el procesamiento de codificacin de datos, los resultados experimentales muestran que el uso de la tecnologa de procesamiento del lenguaje natural para preprocesar los datos puede mejorar eficazmente la precisin de la deteccin. El clasificador Gradient Boost, el clasificador Random Forest, el clasificador AdaBoost y el modelo ensemble basado en estos tres clasificadores se utilizan, respectivamente, en la construccin de los modelos posteriores. Al mismo tiempo, la red neuronal CNN en el aprendizaje profundo tambin se utiliza para el entrenamiento, y la CNN puede extraer eficazmente la informacin de los datos. Bajo la condicin de que los datos de entrada del clasificador y la red neuronal sean consistentes, a travs de la comparacin y el anlisis de varios mtodos, la precisin de la red convolucional unidimensional basada en CNN es ligeramente superior a la del clasificador basado en aprendizaje automtico.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Problema de recarga de la batería en un sistema de volante de inercia de dos niveles de potencia
Artículo:
Modo de innovación abierta del sistema de innovación ecológica para la industria manufacturera
Artículo:
Investigación sobre control jerárquico y distribuido para la generación inteligente basada en la estrategia de manada virtual de lobos.
Artículo:
En un Control Óptimo Aplicado en un Oscilador MEMS con Comportamiento Caótico que Incluye Orden Fraccional
Artículo:
Ingeniería de requisitos de seguridad en redes de señalización ferroviaria críticas para la seguridad
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Artículo:
Nuevas necesidades cosméticas : tendencias y productos específicos
Manual:
Química de los taninos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.