Evaluación de la correlación del rendimiento de clasificadores asociativos en conjuntos de datos de crédito basada en medidas de complejidad de datos
Autores: Camacho-Urriolagoitia, Francisco J.; Villuendas-Rey, Yenny; López-Yáñez, Itzamá; Camacho-Nieto, Oscar; Yáñez-Márquez, Cornelio
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Una de las cuatro tareas básicas de aprendizaje automático es la clasificación de patrones. La selección del algoritmo de aprendizaje adecuado para un problema dado es una tarea desafiante, conocida formalmente como el problema de selección de algoritmo (ASP). En particular, estamos interesados en el comportamiento de los clasificadores asociativos derivados de los modelos Alfa-Beta aplicados al campo financiero. En este artículo, se estudió el comportamiento de cuatro clasificadores asociativos: la versión One-Hot del Clasificador Asociativo Híbrido con Traducción (CHAT-OHM), el Gamma Extendido (EG), el Clasificador Asociativo Ingenuo (NAC) y la Clasificación Asistida para Conjuntos de Datos Desbalanceados (ACID). Para establecer el rendimiento, utilizamos el área bajo la curva (AUC), la puntuación F y medidas de la media geométrica. Los cuatro clasificadores se aplicaron en 11 conjuntos de datos del área financiera. Luego, se analizó el rendimiento de cada uno, considerando su correlación con las medidas de complejidad de los datos, correspondientes a seis categorías basadas en aspectos específicos de los conjuntos de datos: característica, linealidad, vecindario, red, dimensionalidad y desequilibrio de clases. Se establecen las correlaciones que surgen entre las medidas de complejidad de los conjuntos de datos y las medidas de rendimiento de los clasificadores asociativos; estos resultados se expresan con el coeficiente Rho de Spearman. Los resultados experimentales indicaron correctamente correlaciones entre las medidas de complejidad de los datos y el rendimiento de los clasificadores asociativos.
Descripción
Una de las cuatro tareas básicas de aprendizaje automático es la clasificación de patrones. La selección del algoritmo de aprendizaje adecuado para un problema dado es una tarea desafiante, conocida formalmente como el problema de selección de algoritmo (ASP). En particular, estamos interesados en el comportamiento de los clasificadores asociativos derivados de los modelos Alfa-Beta aplicados al campo financiero. En este artículo, se estudió el comportamiento de cuatro clasificadores asociativos: la versión One-Hot del Clasificador Asociativo Híbrido con Traducción (CHAT-OHM), el Gamma Extendido (EG), el Clasificador Asociativo Ingenuo (NAC) y la Clasificación Asistida para Conjuntos de Datos Desbalanceados (ACID). Para establecer el rendimiento, utilizamos el área bajo la curva (AUC), la puntuación F y medidas de la media geométrica. Los cuatro clasificadores se aplicaron en 11 conjuntos de datos del área financiera. Luego, se analizó el rendimiento de cada uno, considerando su correlación con las medidas de complejidad de los datos, correspondientes a seis categorías basadas en aspectos específicos de los conjuntos de datos: característica, linealidad, vecindario, red, dimensionalidad y desequilibrio de clases. Se establecen las correlaciones que surgen entre las medidas de complejidad de los conjuntos de datos y las medidas de rendimiento de los clasificadores asociativos; estos resultados se expresan con el coeficiente Rho de Spearman. Los resultados experimentales indicaron correctamente correlaciones entre las medidas de complejidad de los datos y el rendimiento de los clasificadores asociativos.