Selección de Características Basada en Gráficas de Correlación Tridimensionales
Autores: Dudá, Adam; Szoliková, Aneta
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El proceso de selección de características es un componente crítico de cualquier sistema de toma de decisiones que incorpore modelos de aprendizaje automático o profundo aplicados a datos multidimensionales. La selección de características en los datos de entrada se puede realizar utilizando una variedad de técnicas, como métodos basados en correlación, métodos envolventes o métodos integrados. Sin embargo, muchos enfoques utilizados convencionalmente no admiten la interpretabilidad hacia atrás de las características seleccionadas, lo que hace que su aplicación en escenarios del mundo real sea impráctica y difícil de implementar. Este trabajo aborda esa limitación proponiendo una nueva estrategia basada en correlación para la selección de características en tareas de regresión, basada en una visualización tridimensional de los resultados del análisis de correlación, denominada gráficos de correlación tridimensionales. El objetivo principal de este estudio es el diseño, implementación y evaluación experimental de este modelo gráfico a través de un estudio de caso utilizando un conjunto de datos multidimensional con 28 atributos. Los experimentos evalúan la claridad de las visualizaciones y su impacto en el rendimiento del modelo de regresión, demostrando que el enfoque reduce la dimensionalidad mientras mantiene o mejora la precisión predictiva, mejora la interpretabilidad al descubrir relaciones ocultas y logra mejores resultados o resultados comparables a los métodos convencionales de selección de características.
Descripción
El proceso de selección de características es un componente crítico de cualquier sistema de toma de decisiones que incorpore modelos de aprendizaje automático o profundo aplicados a datos multidimensionales. La selección de características en los datos de entrada se puede realizar utilizando una variedad de técnicas, como métodos basados en correlación, métodos envolventes o métodos integrados. Sin embargo, muchos enfoques utilizados convencionalmente no admiten la interpretabilidad hacia atrás de las características seleccionadas, lo que hace que su aplicación en escenarios del mundo real sea impráctica y difícil de implementar. Este trabajo aborda esa limitación proponiendo una nueva estrategia basada en correlación para la selección de características en tareas de regresión, basada en una visualización tridimensional de los resultados del análisis de correlación, denominada gráficos de correlación tridimensionales. El objetivo principal de este estudio es el diseño, implementación y evaluación experimental de este modelo gráfico a través de un estudio de caso utilizando un conjunto de datos multidimensional con 28 atributos. Los experimentos evalúan la claridad de las visualizaciones y su impacto en el rendimiento del modelo de regresión, demostrando que el enfoque reduce la dimensionalidad mientras mantiene o mejora la precisión predictiva, mejora la interpretabilidad al descubrir relaciones ocultas y logra mejores resultados o resultados comparables a los métodos convencionales de selección de características.