Modelos de Aprendizaje Automático Explicables para la Calificación Crediticia en Entidades del Sector Solidario Colombiano
Autores: Arias-Serna, María Andrea; Quiza-Montealegre, Jhon Jair; Móntes-Gómez, Luis Fernando; Clavijo, Leandro Uribe; Orozco-Duque, Andrés Felipe
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Gestión y administración
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
Este documento propone una metodología para implementar un modelo de explicabilidad desarrollado a medida para la calificación crediticia utilizando datos de comportamiento registrados durante el ciclo de vida del préstamo que puede replicar la puntuación dada por el modelo regulatorio para la economía solidaria en Colombia. La metodología integra variables de comportamiento y financieras continuas de más de 17,000 historias crediticias reales en modelos predictivos basados en regresión ridge, árboles de decisión, bosques aleatorios, XGBoost y LightGBM. Los modelos fueron entrenados y evaluados utilizando validación cruzada y métricas de RMSE. LightGBM surgió como el modelo más preciso, capturando efectivamente patrones de comportamiento crediticio no lineales. Para garantizar la interpretabilidad, se utilizó SHAP para identificar la contribución de cada característica a las predicciones del modelo. El modelo presentado utilizando LightGBM predijo la evaluación del riesgo crediticio de acuerdo con el modelo regulatorio utilizado por la Superintendencia de la Economía Solidaria de Colombia, con un error cuadrático medio de 0.272 y un puntaje R de 0.99. Proponemos un marco alternativo utilizando modelos de aprendizaje automático explicables alineados con el enfoque basado en calificaciones internas bajo Basilea II. Nuestro modelo integra variables recopiladas a lo largo del ciclo de vida del préstamo, ofreciendo una perspectiva más completa que el modelo regulatorio. Mientras que el marco regulatorio se ajusta genéricamente a las regulaciones nacionales, nuestro enfoque tiene en cuenta explícitamente las dinámicas específicas del prestatario.
Descripción
Este documento propone una metodología para implementar un modelo de explicabilidad desarrollado a medida para la calificación crediticia utilizando datos de comportamiento registrados durante el ciclo de vida del préstamo que puede replicar la puntuación dada por el modelo regulatorio para la economía solidaria en Colombia. La metodología integra variables de comportamiento y financieras continuas de más de 17,000 historias crediticias reales en modelos predictivos basados en regresión ridge, árboles de decisión, bosques aleatorios, XGBoost y LightGBM. Los modelos fueron entrenados y evaluados utilizando validación cruzada y métricas de RMSE. LightGBM surgió como el modelo más preciso, capturando efectivamente patrones de comportamiento crediticio no lineales. Para garantizar la interpretabilidad, se utilizó SHAP para identificar la contribución de cada característica a las predicciones del modelo. El modelo presentado utilizando LightGBM predijo la evaluación del riesgo crediticio de acuerdo con el modelo regulatorio utilizado por la Superintendencia de la Economía Solidaria de Colombia, con un error cuadrático medio de 0.272 y un puntaje R de 0.99. Proponemos un marco alternativo utilizando modelos de aprendizaje automático explicables alineados con el enfoque basado en calificaciones internas bajo Basilea II. Nuestro modelo integra variables recopiladas a lo largo del ciclo de vida del préstamo, ofreciendo una perspectiva más completa que el modelo regulatorio. Mientras que el marco regulatorio se ajusta genéricamente a las regulaciones nacionales, nuestro enfoque tiene en cuenta explícitamente las dinámicas específicas del prestatario.