Evaluación de cuatro métodos de imputación múltiple para el manejo de datos faltantes de resultado binario en presencia de una interacción entre una variable ficticia y una variable continua.
Autores: Javadi, Sara; Bahrampour, Abbas; Saber, Mohammad Mehdi; Garrusi, Behshid; Baneshi, Mohammad Reza
Idioma: Inglés
Editor: Hindawi
Año: 2021
Acceso abierto
Artículo científico
Categoría
Gestión y administración
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
La imputación múltiple por ecuaciones encadenadas (MICE) es el método más común para imputar datos faltantes. En el algoritmo MICE, la imputación se puede realizar utilizando una variedad de métodos paramétricos y no paramétricos. La configuración predeterminada en la implementación de MICE es que los modelos de imputación incluyan variables solo como términos lineales sin interacciones, pero la omisión de términos de interacción puede llevar a resultados sesgados. Se investiga, utilizando conjuntos de datos simulados y reales, si la partición recursiva crea la variabilidad adecuada entre las imputaciones y estimaciones de parámetros no sesgadas con intervalos de confianza apropiados. Comparamos cuatro métodos de imputación múltiple (MI) en un conjunto de datos real y uno simulado. Los métodos de MI incluyeron el uso de coincidencia de medias predictivas con un término de interacción en el modelo de imputación en MICE (MICE-interacción), árbol de clasificación y regresión (C
Descripción
La imputación múltiple por ecuaciones encadenadas (MICE) es el método más común para imputar datos faltantes. En el algoritmo MICE, la imputación se puede realizar utilizando una variedad de métodos paramétricos y no paramétricos. La configuración predeterminada en la implementación de MICE es que los modelos de imputación incluyan variables solo como términos lineales sin interacciones, pero la omisión de términos de interacción puede llevar a resultados sesgados. Se investiga, utilizando conjuntos de datos simulados y reales, si la partición recursiva crea la variabilidad adecuada entre las imputaciones y estimaciones de parámetros no sesgadas con intervalos de confianza apropiados. Comparamos cuatro métodos de imputación múltiple (MI) en un conjunto de datos real y uno simulado. Los métodos de MI incluyeron el uso de coincidencia de medias predictivas con un término de interacción en el modelo de imputación en MICE (MICE-interacción), árbol de clasificación y regresión (C