logo móvil
Contáctanos

Un marco de conjunto de agrupamiento con integración de características de datos e información de estructura: un enfoque de redes neuronales gráficas

Autores: Du, Hang-Yuan; Wang, Wen-Jian

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Matemáticas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 27

Citaciones: Sin citaciones


Descripción
El conjunto de agrupaciones es un tema de investigación de minería de datos que agrega varios resultados de agrupaciones base para generar una única agrupación de salida con una mayor robustez y estabilidad. Sin embargo, la validez del resultado del conjunto suele estar afectada por la falta de fiabilidad en la generación e integración de las agrupaciones base. Para abordar este problema, desarrollamos un marco de agrupación de conjuntos visto desde las redes neuronales gráficas que genera un resultado de conjunto integrando las características de los datos y la información de la estructura. En este marco, extraemos información de la estructura de los resultados de agrupación base del conjunto de datos utilizando una medida de afinidad de acoplamiento. Después, combinamos la información de la estructura con las características de los datos utilizando una red neuronal gráfica (GNN) para aprender sus incrustaciones conjuntas en el espacio latente. Luego, empleamos un modelo de mezcla gaussiana (GMM) para predecir la asignación final de clúster en el espacio latente. Finalmente, construimos la GNN y el GMM como un modelo de optimización unificado para integrar los objetivos de la incrustación gráfica y la agrupación de consenso. Nuestro marco no solo puede combinar de manera elegante la información en el espacio de características y el espacio de estructura, sino que también puede lograr representaciones adecuadas para la partición final del clúster. Por lo tanto, puede producir un resultado sobresaliente. Los resultados experimentales en seis conjuntos de datos de referencia sintéticos y seis conjuntos de datos del mundo real muestran que el marco propuesto ofrece un mejor rendimiento en comparación con 12 algoritmos de referencia que se desarrollan basados en una arquitectura de conjunto de agrupaciones o una estrategia de agrupación profunda.

Documentos Relacionados

Temas Virtualpro