Inteligencia Artificial Explicable y Aprendizaje Automático para la Evaluación del Riesgo de Contaminación del Aire y Resultados en la Salud Respiratoria: Una Revisión Sistemática
Autores: Agbehadji, Israel Edem; Obagbuwa, Ibidun Christiana
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Contaminación del aire
Modelos de aprendizaje automático
Inteligencia artificial explicable
Relaciones de exposición-respuesta ambiental
Riesgos para la salud
SHAP
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 6
Citaciones: Sin citaciones
La contaminación del aire es un riesgo ambiental importante que causa morbilidad y mortalidad respiratoria. La creciente disponibilidad de datos ambientales de alta resolución y casos de salud relacionados con la contaminación del aire han acelerado el uso de modelos de aprendizaje automático (ML) para estimar las relaciones de exposición-respuesta ambiental, prever riesgos para la salud y solicitar las intervenciones políticas y prácticas necesarias. Desafortunadamente, los modelos de ML son opacos, en el sentido de que no está claro cómo estos modelos combinan varios datos de entrada para tomar una decisión concisa. Por lo tanto, se limita su confianza y uso en asuntos clínicos. Los modelos de inteligencia artificial explicable (xAI) ofrecen las técnicas necesarias para garantizar modelos transparentes e interpretables. Esta revisión sistemática explora repositorios de datos en línea a través de la lente de la guía de Elementos Preferidos para Informes de Revisiones Sistemáticas y Metaanálisis (PRISMA) para sintetizar artículos de 2020 a 2025. Se establecieron varios criterios de inclusión y exclusión para reducir la búsqueda a una selección final de 92 artículos, que fueron revisados minuciosamente por investigadores independientes para reducir el sesgo en la evaluación de los artículos. Igualmente, la estrategia del dominio ROBINS-I (Riesgo de Sesgo en Estudios No Aleatorizados de Intervenciones) fue útil para reducir aún más cualquier posible riesgo en la evaluación de los artículos y su reproducibilidad. Los hallazgos revelan una creciente adopción de técnicas de ML como bosques aleatorios, XGBoost, modelos de diagnóstico livianos paralelos y redes neuronales profundas para la predicción de riesgos para la salud, siendo SHAP (SHapley Additive exPlanations) la técnica dominante para la interpretabilidad de estos modelos. La técnica de árbol extremadamente aleatorio (ERT) demostró un rendimiento óptimo pero carece de explicabilidad. Además, las limitaciones de estos modelos incluyen la generalizabilidad, limitaciones de datos y traducción de políticas. El resultado de esta revisión sugiere una investigación limitada sobre la integración de LIME (Explicaciones Locales Interpretables Independientes del Modelo) en el modelo de ML actual; recomienda que futuras investigaciones podrían centrarse en modelos de causal-xAI-ML. Nuevamente, el uso de tales modelos en problemas de salud respiratoria puede complementarse con la opinión de un profesional médico.
Descripción
La contaminación del aire es un riesgo ambiental importante que causa morbilidad y mortalidad respiratoria. La creciente disponibilidad de datos ambientales de alta resolución y casos de salud relacionados con la contaminación del aire han acelerado el uso de modelos de aprendizaje automático (ML) para estimar las relaciones de exposición-respuesta ambiental, prever riesgos para la salud y solicitar las intervenciones políticas y prácticas necesarias. Desafortunadamente, los modelos de ML son opacos, en el sentido de que no está claro cómo estos modelos combinan varios datos de entrada para tomar una decisión concisa. Por lo tanto, se limita su confianza y uso en asuntos clínicos. Los modelos de inteligencia artificial explicable (xAI) ofrecen las técnicas necesarias para garantizar modelos transparentes e interpretables. Esta revisión sistemática explora repositorios de datos en línea a través de la lente de la guía de Elementos Preferidos para Informes de Revisiones Sistemáticas y Metaanálisis (PRISMA) para sintetizar artículos de 2020 a 2025. Se establecieron varios criterios de inclusión y exclusión para reducir la búsqueda a una selección final de 92 artículos, que fueron revisados minuciosamente por investigadores independientes para reducir el sesgo en la evaluación de los artículos. Igualmente, la estrategia del dominio ROBINS-I (Riesgo de Sesgo en Estudios No Aleatorizados de Intervenciones) fue útil para reducir aún más cualquier posible riesgo en la evaluación de los artículos y su reproducibilidad. Los hallazgos revelan una creciente adopción de técnicas de ML como bosques aleatorios, XGBoost, modelos de diagnóstico livianos paralelos y redes neuronales profundas para la predicción de riesgos para la salud, siendo SHAP (SHapley Additive exPlanations) la técnica dominante para la interpretabilidad de estos modelos. La técnica de árbol extremadamente aleatorio (ERT) demostró un rendimiento óptimo pero carece de explicabilidad. Además, las limitaciones de estos modelos incluyen la generalizabilidad, limitaciones de datos y traducción de políticas. El resultado de esta revisión sugiere una investigación limitada sobre la integración de LIME (Explicaciones Locales Interpretables Independientes del Modelo) en el modelo de ML actual; recomienda que futuras investigaciones podrían centrarse en modelos de causal-xAI-ML. Nuevamente, el uso de tales modelos en problemas de salud respiratoria puede complementarse con la opinión de un profesional médico.