Un enfoque de selección de características en dos etapas basado en colonia de abejas artificial y LASSO adaptativo en datos de alta dimensión
Autores: Onakpojeruo, Efe Precious; Sancar, Nuriye
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
Categoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
Los conjuntos de datos de alta dimensión, donde el número de características supera con creces el número de observaciones, presentan desafíos significativos en la selección de características y el rendimiento del modelo. Este estudio propone un novedoso enfoque de selección de características en dos etapas que integra la optimización de Colonia de Abejas Artificiales (ABC) con el Operador de Selección y Reducción Absoluta Adaptativa (AD_LASSO). La etapa inicial reduce la dimensionalidad mientras maneja de manera efectiva espacios de búsqueda complejos y de alta dimensión utilizando ABC para realizar una búsqueda global del subconjunto ideal de características. La segunda etapa aplica AD_LASSO, refinando las características seleccionadas al eliminar características redundantes y mejorar la interpretabilidad del modelo. El método propuesto ABC-ADLASSO se comparó con los métodos AD_LASSO, LASSO, por pasos y LARS bajo diferentes configuraciones de simulación en datos de alta dimensión y varios conjuntos de datos reales. Según los resultados obtenidos de simulaciones y aplicaciones en varios conjuntos de datos reales, ABC-ADLASSO ha mostrado un rendimiento significativamente superior en términos de precisión, exactitud y rendimiento general del modelo, particularmente en escenarios con alta correlación y un gran número de características en comparación con los otros métodos evaluados. Este enfoque en dos etapas ofrece una selección de características robusta y mejora la precisión predictiva, convirtiéndolo en una herramienta efectiva para analizar datos de alta dimensión.
Descripción
Los conjuntos de datos de alta dimensión, donde el número de características supera con creces el número de observaciones, presentan desafíos significativos en la selección de características y el rendimiento del modelo. Este estudio propone un novedoso enfoque de selección de características en dos etapas que integra la optimización de Colonia de Abejas Artificiales (ABC) con el Operador de Selección y Reducción Absoluta Adaptativa (AD_LASSO). La etapa inicial reduce la dimensionalidad mientras maneja de manera efectiva espacios de búsqueda complejos y de alta dimensión utilizando ABC para realizar una búsqueda global del subconjunto ideal de características. La segunda etapa aplica AD_LASSO, refinando las características seleccionadas al eliminar características redundantes y mejorar la interpretabilidad del modelo. El método propuesto ABC-ADLASSO se comparó con los métodos AD_LASSO, LASSO, por pasos y LARS bajo diferentes configuraciones de simulación en datos de alta dimensión y varios conjuntos de datos reales. Según los resultados obtenidos de simulaciones y aplicaciones en varios conjuntos de datos reales, ABC-ADLASSO ha mostrado un rendimiento significativamente superior en términos de precisión, exactitud y rendimiento general del modelo, particularmente en escenarios con alta correlación y un gran número de características en comparación con los otros métodos evaluados. Este enfoque en dos etapas ofrece una selección de características robusta y mejora la precisión predictiva, convirtiéndolo en una herramienta efectiva para analizar datos de alta dimensión.