Robusto multi-etiqueta clasificación con correlación mejorada de etiquetas globales y locales
Autores: Zhao, Tianna; Zhang, Yuanjian; Pedrycz, Witold
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Representación de datos
Robustez del modelo
Características ruidosas
Etiquetas faltantes
Características latentes
Clasificación multietiqueta
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La representación de datos es de gran importancia para minimizar la ambigüedad de múltiples etiquetas. Mientras que la mayoría de los investigadores investigan intensamente la correlación de etiquetas, la investigación sobre cómo mejorar la robustez del modelo es preliminar. Los datos de baja calidad son una de las principales razones por las que la robustez del modelo se degrada. Apuntando a los casos con características ruidosas y etiquetas faltantes, desarrollamos un método novedoso llamado correlación de etiquetas global y local robusta (RGLC). En este modelo, el aprendizaje de subespacios reconstruye características latentes intrínsecas inmunes al ruido de las características. El aprendizaje de la variedad asegura que las salidas obtenidas por la factorización de matrices sean similares en la etiqueta latente de rango bajo si las características latentes son similares. Examinamos la co-ocurrencia de la correlación de etiquetas global y local con las características latentes construidas y las etiquetas latentes. Experimentos extensos demuestran que el rendimiento de clasificación con información integrada es estadísticamente superior a una colección de enfoques de vanguardia en numerosos dominios. Además, el modelo propuesto muestra un rendimiento prometedor en la clasificación multi-etiqueta cuando se presentan características ruidosas y etiquetas faltantes, demostrando la robustez de la clasificación multi-etiqueta.
Descripción
La representación de datos es de gran importancia para minimizar la ambigüedad de múltiples etiquetas. Mientras que la mayoría de los investigadores investigan intensamente la correlación de etiquetas, la investigación sobre cómo mejorar la robustez del modelo es preliminar. Los datos de baja calidad son una de las principales razones por las que la robustez del modelo se degrada. Apuntando a los casos con características ruidosas y etiquetas faltantes, desarrollamos un método novedoso llamado correlación de etiquetas global y local robusta (RGLC). En este modelo, el aprendizaje de subespacios reconstruye características latentes intrínsecas inmunes al ruido de las características. El aprendizaje de la variedad asegura que las salidas obtenidas por la factorización de matrices sean similares en la etiqueta latente de rango bajo si las características latentes son similares. Examinamos la co-ocurrencia de la correlación de etiquetas global y local con las características latentes construidas y las etiquetas latentes. Experimentos extensos demuestran que el rendimiento de clasificación con información integrada es estadísticamente superior a una colección de enfoques de vanguardia en numerosos dominios. Además, el modelo propuesto muestra un rendimiento prometedor en la clasificación multi-etiqueta cuando se presentan características ruidosas y etiquetas faltantes, demostrando la robustez de la clasificación multi-etiqueta.