Minería de datos del campus: predicción de la elección de carrera utilizando un método de aprendizaje automático interpretable
Autores: Wang, Yuan; Yang, Liping; Wu, Jun; Song, Zisheng; Shi, Li
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
El problema de la elección de carrera de los estudiantes es una preocupación común de los propios estudiantes, padres y educadores. Sin embargo, los datos conductuales de los estudiantes no han sido estudiados a fondo para comprender su elección de carrera. En este estudio, utilizamos eXtreme Gradient Boosting (XGBoost), una técnica de aprendizaje automático (ML), para predecir la elección de carrera de los estudiantes universitarios utilizando un conjunto de datos del mundo real recopilado en un colegio específico. Específicamente, los datos incluyen información sobre la educación y elección de carrera de 18,000 graduados durante sus años universitarios. Además, se empleó SHAP (Shapley Additive exPlanation) para interpretar los resultados y analizar la importancia de las características individuales. Los resultados muestran que XGBoost puede predecir de manera robusta la elección de carrera de los estudiantes con una precisión, tasa de recuperación y un valor de 1 del 89.1%, 85.4% y 0.872, respectivamente. Además, también se exploró la interacción de características entre cuatro opciones diferentes de los estudiantes (es decir, elegir estudiar en China, elegir trabajar, dificultad para encontrar trabajo y elegir estudiar en el extranjero). Se encontró que varias características educativas, especialmente las diferencias en el promedio de calificaciones (GPA) durante sus estudios universitarios, tienen un impacto relativamente mayor en la elección final de carrera. Estos resultados pueden ser de ayuda en la planificación, diseño e implementación de eventos de instituciones de educación superior (HEIs).
Descripción
El problema de la elección de carrera de los estudiantes es una preocupación común de los propios estudiantes, padres y educadores. Sin embargo, los datos conductuales de los estudiantes no han sido estudiados a fondo para comprender su elección de carrera. En este estudio, utilizamos eXtreme Gradient Boosting (XGBoost), una técnica de aprendizaje automático (ML), para predecir la elección de carrera de los estudiantes universitarios utilizando un conjunto de datos del mundo real recopilado en un colegio específico. Específicamente, los datos incluyen información sobre la educación y elección de carrera de 18,000 graduados durante sus años universitarios. Además, se empleó SHAP (Shapley Additive exPlanation) para interpretar los resultados y analizar la importancia de las características individuales. Los resultados muestran que XGBoost puede predecir de manera robusta la elección de carrera de los estudiantes con una precisión, tasa de recuperación y un valor de 1 del 89.1%, 85.4% y 0.872, respectivamente. Además, también se exploró la interacción de características entre cuatro opciones diferentes de los estudiantes (es decir, elegir estudiar en China, elegir trabajar, dificultad para encontrar trabajo y elegir estudiar en el extranjero). Se encontró que varias características educativas, especialmente las diferencias en el promedio de calificaciones (GPA) durante sus estudios universitarios, tienen un impacto relativamente mayor en la elección final de carrera. Estos resultados pueden ser de ayuda en la planificación, diseño e implementación de eventos de instituciones de educación superior (HEIs).