Detección de spam en redes sociales basada en ALBERT y la combinación de Bi-LSTM con autoatención
Autores: Xu, Guangxia; Zhou, Daiqi; Liu, Jun
Idioma: Inglés
Editor: Hindawi
Año: 2021
Acceso abierto
Artículo científico
2021
Detección de spam en redes sociales basada en ALBERT y la combinación de Bi-LSTM con autoatenciónCategoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
Las redes sociales están llenas de spam y spammers. Aunque las plataformas de redes sociales han establecido una variedad de estrategias para prevenir la propagación de spam, un mecanismo estricto de revisión de información ha dado lugar a spammers más astutos que disfrazan el spam como texto enviado por usuarios comunes. En respuesta a esto, este artículo propone un método de detección de spam impulsado por el modelo de red neuronal Bi-LSTM de autoatención combinado con ALBERT, un modelo ligero de vectores de palabras de BERT. Aprovechamos ALBERT para transformar el texto de las redes sociales en vectores de palabras y luego los introducimos en la capa Bi-LSTM. Después de la extracción de características y combinado con el enfoque de información de la capa de autoatención, se obtiene el vector de características final. Finalmente, un clasificador SoftMax realiza la clasificación para obtener el resultado. Verificamos la excelencia del modelo con precisión, precisión, puntuación F, etc. Los resultados muestran que el modelo tiene un mejor rendimiento que otros.
Descripción
Las redes sociales están llenas de spam y spammers. Aunque las plataformas de redes sociales han establecido una variedad de estrategias para prevenir la propagación de spam, un mecanismo estricto de revisión de información ha dado lugar a spammers más astutos que disfrazan el spam como texto enviado por usuarios comunes. En respuesta a esto, este artículo propone un método de detección de spam impulsado por el modelo de red neuronal Bi-LSTM de autoatención combinado con ALBERT, un modelo ligero de vectores de palabras de BERT. Aprovechamos ALBERT para transformar el texto de las redes sociales en vectores de palabras y luego los introducimos en la capa Bi-LSTM. Después de la extracción de características y combinado con el enfoque de información de la capa de autoatención, se obtiene el vector de características final. Finalmente, un clasificador SoftMax realiza la clasificación para obtener el resultado. Verificamos la excelencia del modelo con precisión, precisión, puntuación F, etc. Los resultados muestran que el modelo tiene un mejor rendimiento que otros.