logo móvil
Contáctanos

Un método basado en muestreo para detectar ataques de envenenamiento de datos en sistemas de recomendación

Autores: Li, Mohan; Lian, Yuxin; Zhu, Jinpeng; Lin, Jingyi; Wan, Jiawen; Sun, Yanbin

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Algoritmo de recomendación
Filtrado colaborativo
Ataques de envenenamiento de datos
Matriz de calificaciones
Método de muestreo
Datos maliciosos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones


Descripción
El algoritmo de recomendación basado en filtrado colaborativo es vulnerable a ataques de envenenamiento de datos, donde los atacantes pueden manipular la salida del sistema inyectando una gran cantidad de datos de calificación falsos. Para abordar este problema, es esencial investigar métodos para detectar datos de envenenamiento inyectados sistemáticamente dentro de la matriz de calificación. Dado que los atacantes a menudo inyectan una cantidad significativa de datos de envenenamiento en un corto período para lograr su impacto deseado, estos datos pueden exhibir proximidad espacial. En otras palabras, los datos de envenenamiento pueden estar concentrados en filas adyacentes de la matriz de calificación. Este documento aprovecha las características de proximidad de los datos de envenenamiento en la matriz de calificación e introduce un método basado en muestreo para detectar ataques de envenenamiento de datos. Primero, diseñamos un método de muestreo de matriz de calificación específicamente para detectar datos de envenenamiento. Al muestrear las diferencias obtenidas de la matriz de calificación original, es posible inferir la presencia de ataques de envenenamiento y descartar efectivamente los datos envenenados. En segundo lugar, desarrollamos un método para señalar datos maliciosos basados en la distancia de los vectores de calificación. A través de cálculos de distancia, podemos identificar con precisión las posiciones de los datos maliciosos. Después, validamos el método en tres conjuntos de datos del mundo real. Los resultados demuestran la efectividad de nuestro método en identificar datos maliciosos dentro de la matriz de calificación.

Documentos Relacionados

Temas Virtualpro