Métodos de corrección de aprendizaje profundo para la predicción de precipitaciones del modelo de investigación y pronóstico del tiempo (WRF): un estudio de caso sobre Zhengzhou, China
Autores: Zhang, Jianbin; Gao, Zhiqiu; Li, Yubin
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Sesgos sistemáticos
Resoluciones gruesas
Conjuntos de datos de precipitación
Modelo de aprendizaje profundo
Métodos de aprendizaje automático
Precipitación horaria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 7
Citaciones: Sin citaciones
Los sesgos sistemáticos y las resoluciones gruesas son limitaciones importantes de los conjuntos de datos de precipitación actuales. Se han realizado muchos estudios para la corrección de sesgos de precipitación y la reducción de escala. Sin embargo, todavía es un desafío para los enfoques actuales manejar las características complejas de la precipitación horaria, lo que resulta en la incapacidad de reproducir características a pequeña escala, como eventos extremos. En este estudio, propusimos un modelo de aprendizaje profundo llamado PBT (Entrenamiento Basado en Población)-GRU (Unidad Recurrente de Puerta) basado en datos de pronóstico en cuadrícula del modelo numérico NWP y datos de observación, y empleamos métodos de aprendizaje automático (ML), como Bosque Aleatorio (RF), Máquina de Vectores de Soporte (SVM), Vecino Más Cercano (KNN) y Árbol de Decisión Aumentado por Gradiente (GBDT), para corregir los pronósticos de precipitación horaria del WRF. Para seleccionar el método de evaluación, realizamos un experimento de balance de muestra y encontramos que cuando la proporción de muestras positivas y negativas era de 1:1, el Puntaje de Amenaza (TS) y los puntajes de precisión eran los más altos, mientras que el puntaje de Probabilidad de Detección (POD) era ligeramente más bajo. Los resultados mostraron que: (1) los errores generales del modelo PBT-GRU eran relativamente menores, y su error cuadrático medio (RMSE) fue de solo 1.12 mm, lo que se redujo en un 63.04%, 51.72%, 58.36%, 37.43% y 26.32% en comparación con el RMSE de WRF, SVM, KNN, GBDT y RF, respectivamente; y (2) de acuerdo con el diagrama de Taylor, la desviación estándar () y el coeficiente de correlación (r) de PBT-GRU fueron 1.02 y 0.99, respectivamente, mientras que el y r de RF fueron 1.12 y 0.98, respectivamente. Además, el y r de los modelos SVM, GBDT y KNN estaban entre los de los modelos anteriores, con valores de 1.24 y 0.95, 1.15 y 0.97, y 1.26 y 0.93, respectivamente. Basado en un análisis integral del TS, precisión, RMSE, r y , el modelo PBT-GRU tuvo el mejor rendimiento, con un efecto de corrección significativamente mejor que el de los métodos de ML, resultando en un ranking de rendimiento general de PBT-GRU > RF > GBDT > SVM > KNN. Este estudio proporciona una pista de la posibilidad de que el modelo PBT-GRU propuesto pueda superar la corrección de precipitación del modelo basada en una pequeña muestra de datos de una estación. Por lo tanto, debido a su prometedor rendimiento y excelente robustez, recomendamos adoptar el modelo PBT-GRU propuesto para la corrección de precipitación en aplicaciones comerciales.
Descripción
Los sesgos sistemáticos y las resoluciones gruesas son limitaciones importantes de los conjuntos de datos de precipitación actuales. Se han realizado muchos estudios para la corrección de sesgos de precipitación y la reducción de escala. Sin embargo, todavía es un desafío para los enfoques actuales manejar las características complejas de la precipitación horaria, lo que resulta en la incapacidad de reproducir características a pequeña escala, como eventos extremos. En este estudio, propusimos un modelo de aprendizaje profundo llamado PBT (Entrenamiento Basado en Población)-GRU (Unidad Recurrente de Puerta) basado en datos de pronóstico en cuadrícula del modelo numérico NWP y datos de observación, y empleamos métodos de aprendizaje automático (ML), como Bosque Aleatorio (RF), Máquina de Vectores de Soporte (SVM), Vecino Más Cercano (KNN) y Árbol de Decisión Aumentado por Gradiente (GBDT), para corregir los pronósticos de precipitación horaria del WRF. Para seleccionar el método de evaluación, realizamos un experimento de balance de muestra y encontramos que cuando la proporción de muestras positivas y negativas era de 1:1, el Puntaje de Amenaza (TS) y los puntajes de precisión eran los más altos, mientras que el puntaje de Probabilidad de Detección (POD) era ligeramente más bajo. Los resultados mostraron que: (1) los errores generales del modelo PBT-GRU eran relativamente menores, y su error cuadrático medio (RMSE) fue de solo 1.12 mm, lo que se redujo en un 63.04%, 51.72%, 58.36%, 37.43% y 26.32% en comparación con el RMSE de WRF, SVM, KNN, GBDT y RF, respectivamente; y (2) de acuerdo con el diagrama de Taylor, la desviación estándar () y el coeficiente de correlación (r) de PBT-GRU fueron 1.02 y 0.99, respectivamente, mientras que el y r de RF fueron 1.12 y 0.98, respectivamente. Además, el y r de los modelos SVM, GBDT y KNN estaban entre los de los modelos anteriores, con valores de 1.24 y 0.95, 1.15 y 0.97, y 1.26 y 0.93, respectivamente. Basado en un análisis integral del TS, precisión, RMSE, r y , el modelo PBT-GRU tuvo el mejor rendimiento, con un efecto de corrección significativamente mejor que el de los métodos de ML, resultando en un ranking de rendimiento general de PBT-GRU > RF > GBDT > SVM > KNN. Este estudio proporciona una pista de la posibilidad de que el modelo PBT-GRU propuesto pueda superar la corrección de precipitación del modelo basada en una pequeña muestra de datos de una estación. Por lo tanto, debido a su prometedor rendimiento y excelente robustez, recomendamos adoptar el modelo PBT-GRU propuesto para la corrección de precipitación en aplicaciones comerciales.