logo móvil
Contáctanos

Evaluación de la correlación del rendimiento de clasificadores asociativos en conjuntos de datos de crédito basada en medidas de complejidad de datos

Autores: Camacho-Urriolagoitia, Francisco J.; Villuendas-Rey, Yenny; López-Yáñez, Itzamá; Camacho-Nieto, Oscar; Yáñez-Márquez, Cornelio

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Matemáticas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 18

Citaciones: Sin citaciones


Descripción
Una de las cuatro tareas básicas de aprendizaje automático es la clasificación de patrones. La selección del algoritmo de aprendizaje adecuado para un problema dado es una tarea desafiante, conocida formalmente como el problema de selección de algoritmo (ASP). En particular, estamos interesados en el comportamiento de los clasificadores asociativos derivados de los modelos Alfa-Beta aplicados al campo financiero. En este artículo, se estudió el comportamiento de cuatro clasificadores asociativos: la versión One-Hot del Clasificador Asociativo Híbrido con Traducción (CHAT-OHM), el Gamma Extendido (EG), el Clasificador Asociativo Ingenuo (NAC) y la Clasificación Asistida para Conjuntos de Datos Desbalanceados (ACID). Para establecer el rendimiento, utilizamos el área bajo la curva (AUC), la puntuación F y medidas de la media geométrica. Los cuatro clasificadores se aplicaron en 11 conjuntos de datos del área financiera. Luego, se analizó el rendimiento de cada uno, considerando su correlación con las medidas de complejidad de los datos, correspondientes a seis categorías basadas en aspectos específicos de los conjuntos de datos: característica, linealidad, vecindario, red, dimensionalidad y desequilibrio de clases. Se establecen las correlaciones que surgen entre las medidas de complejidad de los conjuntos de datos y las medidas de rendimiento de los clasificadores asociativos; estos resultados se expresan con el coeficiente Rho de Spearman. Los resultados experimentales indicaron correctamente correlaciones entre las medidas de complejidad de los datos y el rendimiento de los clasificadores asociativos.

Documentos Relacionados

Temas Virtualpro