Estimando la Altura de la Capa Límite Planetaria sobre la Amazonía Central Usando Bosques Aleatorios
Autores: Silva, Paulo Renato P.; Carneiro, Rayonil G.; Moraes, Alison O.; Dias-Junior, Cleo Quaresma; Fisch, Gilberto
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Estimando la Altura de la Capa Límite Planetaria sobre la Amazonía Central Usando Bosques AleatoriosCategoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Bosque aleatorio
Altura de la capa límite planetaria
Amazonía
Observaciones meteorológicas
Rendimiento del modelo
Preprocesamiento de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 6
Citaciones: Sin citaciones
Este estudio investiga el uso de un Bosque Aleatorio (RF), un modelo de inteligencia artificial (IA), para estimar la altura de la capa límite planetaria (PBLH) sobre la Amazonía Central a partir de datos de elementos climáticos recopilados durante el experimento GoAmazon, realizado en 2014 y 2015, ya que es una métrica clave para la calidad del aire, la previsión meteorológica y la modelización climática. La novedad de este estudio radica en estimar la PBLH utilizando únicamente observaciones meteorológicas basadas en superficie. Este enfoque se valida contra mediciones de teledetección (por ejemplo, LIDAR, ceilómetro y perfiles de viento), que rara vez están disponibles en la región amazónica. El conjunto de datos incluye diversas características meteorológicas, aunque la falta sustancial de datos para las mediciones de flujo de calor latente (LE) y radiación neta (Rn) planteó desafíos. Abordamos estas lagunas a través de diferentes estrategias de limpieza de datos, como la exclusión de características, la eliminación de filas y técnicas de imputación, evaluando su impacto en el rendimiento del modelo utilizando el Error Cuadrático Medio (RMSE), el Error Absoluto Medio (MAE) y métricas. La estrategia de mejor rendimiento logró un RMSE de 375.9 m. Además del modelo RF, comparamos su rendimiento con la Regresión Lineal, la Regresión de Vectores de Soporte, LightGBM, XGBoost y una Red Neuronal Profunda. Si bien todos los modelos mostraron una correlación moderada con la PBLH observada, el modelo RF superó a todos los demás con diferencias estadísticamente significativas confirmadas por pruebas pareadas. Se utilizaron valores SHAP (SHapley Additive exPlanations) para mejorar la interpretabilidad del modelo, revelando la hora del día, la temperatura del aire y la humedad relativa como los predictores más influyentes para la PBLH, subrayando su papel crítico en la dinámica atmosférica en la Amazonía Central. A pesar de estas optimizaciones, el modelo subestima los valores de PBLH en un promedio de 197 m, particularmente en la primavera y principios del verano austral, cuando las condiciones atmosféricas son más variables. Estos hallazgos enfatizan la importancia de un preprocesamiento de datos robusto y destacan el potencial de los modelos de ML para mejorar la estimación de PBLH en entornos tropicales con escasez de datos.
Descripción
Este estudio investiga el uso de un Bosque Aleatorio (RF), un modelo de inteligencia artificial (IA), para estimar la altura de la capa límite planetaria (PBLH) sobre la Amazonía Central a partir de datos de elementos climáticos recopilados durante el experimento GoAmazon, realizado en 2014 y 2015, ya que es una métrica clave para la calidad del aire, la previsión meteorológica y la modelización climática. La novedad de este estudio radica en estimar la PBLH utilizando únicamente observaciones meteorológicas basadas en superficie. Este enfoque se valida contra mediciones de teledetección (por ejemplo, LIDAR, ceilómetro y perfiles de viento), que rara vez están disponibles en la región amazónica. El conjunto de datos incluye diversas características meteorológicas, aunque la falta sustancial de datos para las mediciones de flujo de calor latente (LE) y radiación neta (Rn) planteó desafíos. Abordamos estas lagunas a través de diferentes estrategias de limpieza de datos, como la exclusión de características, la eliminación de filas y técnicas de imputación, evaluando su impacto en el rendimiento del modelo utilizando el Error Cuadrático Medio (RMSE), el Error Absoluto Medio (MAE) y métricas. La estrategia de mejor rendimiento logró un RMSE de 375.9 m. Además del modelo RF, comparamos su rendimiento con la Regresión Lineal, la Regresión de Vectores de Soporte, LightGBM, XGBoost y una Red Neuronal Profunda. Si bien todos los modelos mostraron una correlación moderada con la PBLH observada, el modelo RF superó a todos los demás con diferencias estadísticamente significativas confirmadas por pruebas pareadas. Se utilizaron valores SHAP (SHapley Additive exPlanations) para mejorar la interpretabilidad del modelo, revelando la hora del día, la temperatura del aire y la humedad relativa como los predictores más influyentes para la PBLH, subrayando su papel crítico en la dinámica atmosférica en la Amazonía Central. A pesar de estas optimizaciones, el modelo subestima los valores de PBLH en un promedio de 197 m, particularmente en la primavera y principios del verano austral, cuando las condiciones atmosféricas son más variables. Estos hallazgos enfatizan la importancia de un preprocesamiento de datos robusto y destacan el potencial de los modelos de ML para mejorar la estimación de PBLH en entornos tropicales con escasez de datos.