logo móvil
Contáctanos

Un modelo híbrido de aprendizaje profundo y bosque aleatorio para predecir las variaciones históricas de temperatura impulsadas por la contaminación del aire: Perspectivas metodológicas desde Wuhan

Autores: Liu, Yu; Du, Yuanfang

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ciencias Naturales y Subdisciplinas

Subcategoría

Astronomía

Palabras clave

Industrialización
Contaminación del aire
Pronóstico de temperatura
CNNs
Redes LSTM
RFs

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 8

Citaciones: Sin citaciones


Descripción
Con la continua aceleración de la industrialización, la contaminación del aire se ha vuelto cada vez más grave y, hasta cierto punto, ha contribuido a la progresión del cambio climático global. En este contexto, la previsión precisa de la temperatura juega un papel vital en varios campos, incluida la producción agrícola, la programación energética, la gobernanza ambiental y la protección de la salud pública. Para mejorar la precisión y estabilidad de la predicción de la temperatura, este estudio propone un enfoque de modelado híbrido que integra redes neuronales convolucionales (CNN), redes de memoria a largo y corto plazo (LSTM) y bosques aleatorios (RF). Este modelo aprovecha plenamente las fortalezas de las CNN en la extracción de características espaciales locales, las ventajas de LSTM en la modelización de dependencias a largo plazo en series temporales y las capacidades de RF en modelización no lineal y selección de características a través del aprendizaje en conjunto. Basado en datos de temperatura diaria, meteorológicos y de observación de contaminantes del aire de Wuhan durante el período 2015-2023, este estudio realizó modelado multiescalar y evaluaciones de rendimiento estacional. Se utilizó análisis de correlación de Pearson y clasificación de importancia de características basada en bosques aleatorios para identificar dos contaminantes clave (PM y O) y dos variables meteorológicas críticas (presión del aire y visibilidad) que están fuertemente asociadas con la variación de la temperatura. Luego se construyó un modelo CNN-LSTM utilizando las variables meteorológicas como entrada para generar predicciones preliminares. Estas predicciones se combinaron posteriormente con las concentraciones de los contaminantes seleccionados para formar un nuevo conjunto de características, que se introdujo en el modelo RF para una regresión secundaria, mejorando así el rendimiento general del modelo. Los principales hallazgos son los siguientes: (1) Los seis principales contaminantes exhiben patrones de distribución estacional claros, con concentraciones generalmente más altas en invierno y más bajas en verano, mientras que O muestra la tendencia opuesta. Además, la influencia de los contaminantes en la temperatura demuestra una heterogeneidad estacional significativa. (2) El modelo híbrido CNN-LSTM-RF muestra un excelente rendimiento en tareas de predicción de temperatura. Los valores predichos se alinean estrechamente con los datos observados en el conjunto de prueba, con un bajo error de predicción (RMSE = 0.88, MAE = 0.66) y un alto coeficiente de determinación (R = 0.99), confirmando la precisión y robustez del modelo. (3) En la previsión multiescalar, el modelo se desempeña bien tanto en escalas diarias (corto plazo) como mensuales (medio a largo plazo). Si bien las predicciones a escala diaria exhiben mayor precisión, las previsiones a escala mensual capturan efectivamente las tendencias a largo plazo. Una prueba de muestras emparejadas sobre las predicciones de temperatura media anual a través de las dos escalas de tiempo reveló una diferencia estadísticamente significativa al nivel de confianza del 95% (t = -3.5299, p = 0.0242), lo que indica que la granularidad temporal tiene un impacto notable en los resultados de la predicción y debe ser seleccionada y optimizada cuidadosamente según las necesidades de aplicación práctica. (4) Se emplearon ANOVA unidireccional y la prueba no paramétrica de Kruskal-Wallis para evaluar la significancia estadística de las diferencias estacionales en los errores absolutos de predicción diaria. Los resultados mostraron una variación significativa entre las estaciones (ANOVA: F = 2.94, p = 0.032; Kruskal-Wallis: H = 8.82, p = 0.031; ambos < 0.05), sugiriendo que los cambios estacionales afectan considerablemente el rendimiento predictivo del modelo. Específicamente, el modelo exhibió el RMSE y MAE más altos en primavera, indicando un ajuste más pobre, mientras que el rendimiento fue mejor en otoño, con el valor R más alto, sugiriendo una mayor capacidad de ajuste.

Otros recursos que podrían interesarte

    Temas Virtualpro