Mitigando el problema de multicolinealidad y su enfoque de aprendizaje automático: una revisión
Autores: Chan, Jireh Yi-Le; Leow, Steven Mun Hong; Bea, Khean Thye; Cheng, Wai Khuen; Phoong, Seuk Wai; Hong, Zeng-Wei; Chen, Yen-Lin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tecnologías
Grandes datos
Multicolinealidad
Métodos de selección de variables
Métodos de estimación modificados
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Las tecnologías han impulsado la recopilación de grandes datos en muchos campos, como la genómica y la inteligencia empresarial. Esto resulta en un aumento significativo de variables y puntos de datos (observaciones) recopilados y almacenados. Aunque esto presenta oportunidades para modelar mejor la relación entre los predictores y las variables de respuesta, también causa problemas serios durante el análisis de datos, uno de los cuales es el problema de multicolinealidad. Los dos enfoques principales utilizados para mitigar la multicolinealidad son los métodos de selección de variables y los métodos de estimadores modificados. Sin embargo, los métodos de selección de variables pueden anular los esfuerzos para recopilar más datos, ya que nuevos datos pueden ser finalmente excluidos del modelado, mientras que estudios recientes sugieren que los enfoques de optimización a través del aprendizaje automático manejan mejor los datos con multicolinealidad que los estimadores estadísticos. Por lo tanto, este estudio detalla los desarrollos cronológicos para mitigar los efectos de la multicolinealidad y las recomendaciones actualizadas para mitigar mejor la multicolinealidad.
Descripción
Las tecnologías han impulsado la recopilación de grandes datos en muchos campos, como la genómica y la inteligencia empresarial. Esto resulta en un aumento significativo de variables y puntos de datos (observaciones) recopilados y almacenados. Aunque esto presenta oportunidades para modelar mejor la relación entre los predictores y las variables de respuesta, también causa problemas serios durante el análisis de datos, uno de los cuales es el problema de multicolinealidad. Los dos enfoques principales utilizados para mitigar la multicolinealidad son los métodos de selección de variables y los métodos de estimadores modificados. Sin embargo, los métodos de selección de variables pueden anular los esfuerzos para recopilar más datos, ya que nuevos datos pueden ser finalmente excluidos del modelado, mientras que estudios recientes sugieren que los enfoques de optimización a través del aprendizaje automático manejan mejor los datos con multicolinealidad que los estimadores estadísticos. Por lo tanto, este estudio detalla los desarrollos cronológicos para mitigar los efectos de la multicolinealidad y las recomendaciones actualizadas para mitigar mejor la multicolinealidad.