Regresión de Weibull y Modelos de Supervivencia de Aprendizaje Automático: Metodología, Comparación y Aplicación a Datos Biomédicos Relacionados con la Cirugía Cardíaca
Autores: Cavalcante, Thalytta; Ospina, Raydonal; Leiva, Víctor; Cabezas, Xavier; Martin-Barreiro, Carlos
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 13
Citaciones: Sin citaciones
En este artículo, proponemos un estudio comparativo entre dos modelos que pueden ser utilizados por investigadores para el análisis de datos de supervivencia: (i) el modelo de regresión Weibull y (ii) el modelo de bosque aleatorio de supervivencia (RSF). Los modelos se comparan considerando la tasa de error, el rendimiento del modelo a través del índice C de Harrell y la identificación de las variables relevantes para la predicción de supervivencia. Se ha realizado un análisis estadístico de un conjunto de datos del Instituto del Corazón de la Universidad de São Paulo, Brasil. En el estudio, se utilizó la duración de la estancia de los pacientes sometidos a cirugía cardíaca, dentro del quirófano, como variable de respuesta. Los resultados obtenidos muestran que el modelo RSF tiene una menor tasa de error para los conjuntos de datos de entrenamiento y prueba, con un 23.55% y un 20.31%, respectivamente, en comparación con el modelo Weibull, que tiene una tasa de error del 23.82%. En cuanto al índice C de Harrell, obtenemos los valores 0.76, 0.79 y 0.76, para los modelos RSF y Weibull, respectivamente. Después del procedimiento de selección, el modelo Weibull contiene variables asociadas con el tipo de protocolo y el tipo de paciente que son estadísticamente significativas al 5%. El modelo RSF elige la edad, el tipo de paciente y el tipo de protocolo como variables relevantes para la predicción. Empleamos el paquete del software para realizar nuestro análisis de datos y experimentos computacionales. La propuesta que presentamos tiene muchas aplicaciones en biología y medicina, las cuales se discuten en las conclusiones de este trabajo.
Descripción
En este artículo, proponemos un estudio comparativo entre dos modelos que pueden ser utilizados por investigadores para el análisis de datos de supervivencia: (i) el modelo de regresión Weibull y (ii) el modelo de bosque aleatorio de supervivencia (RSF). Los modelos se comparan considerando la tasa de error, el rendimiento del modelo a través del índice C de Harrell y la identificación de las variables relevantes para la predicción de supervivencia. Se ha realizado un análisis estadístico de un conjunto de datos del Instituto del Corazón de la Universidad de São Paulo, Brasil. En el estudio, se utilizó la duración de la estancia de los pacientes sometidos a cirugía cardíaca, dentro del quirófano, como variable de respuesta. Los resultados obtenidos muestran que el modelo RSF tiene una menor tasa de error para los conjuntos de datos de entrenamiento y prueba, con un 23.55% y un 20.31%, respectivamente, en comparación con el modelo Weibull, que tiene una tasa de error del 23.82%. En cuanto al índice C de Harrell, obtenemos los valores 0.76, 0.79 y 0.76, para los modelos RSF y Weibull, respectivamente. Después del procedimiento de selección, el modelo Weibull contiene variables asociadas con el tipo de protocolo y el tipo de paciente que son estadísticamente significativas al 5%. El modelo RSF elige la edad, el tipo de paciente y el tipo de protocolo como variables relevantes para la predicción. Empleamos el paquete del software para realizar nuestro análisis de datos y experimentos computacionales. La propuesta que presentamos tiene muchas aplicaciones en biología y medicina, las cuales se discuten en las conclusiones de este trabajo.