Predicción de la Clase de Calidad del Aire Utilizando Métodos de Aprendizaje Automático Basados en Datos de Monitoreo y Modelado Secundario
Autores: Liu, Qian; Cui, Bingyan; Liu, Zhen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Restricciones
Modelos tradicionales de pronóstico del AQI
Datos meteorológicos
Metodología de predicción de la calidad del aire
Aprendizaje automático
Concentraciones de contaminantes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
Abordando las limitaciones inherentes a los modelos tradicionales de pronóstico del Índice de Calidad del Aire (AQI) y las deficiencias en la explotación de datos meteorológicos, esta investigación introduce una nueva metodología de predicción de la calidad del aire que aprovecha el aprendizaje automático y la mejora del modelado de datos secundarios. El conjunto de datos empleado abarca datos de pronóstico sobre las concentraciones de contaminantes primarios y las condiciones meteorológicas primarias, junto con observaciones meteorológicas reales y mediciones de concentración de contaminantes, que abarcan desde el 23 de julio de 2020 hasta el 13 de julio de 2021, obtenidos de proyecciones de calidad del aire a largo plazo en varias estaciones de monitoreo dentro de Jinan, China. Inicialmente, a través de un riguroso análisis de correlación, se seleccionaron diez factores meteorológicos, que comprenden tanto datos medidos como pronosticados en cinco categorías cada uno. Posteriormente, se evaluó y clasificó la importancia de estos diez factores en función de su impacto en las diferentes concentraciones de contaminantes, utilizando una combinación de análisis de significancia univariados y multivariados junto con un enfoque de bosque aleatorio. El análisis de características estacionales destacó los distintos impactos estacionales de la temperatura, la humedad, la presión atmosférica y las condiciones atmosféricas generales en las concentraciones de seis contaminantes clave del aire. La evaluación del rendimiento de varios modelos de predicción de clasificación basados en aprendizaje automático reveló que el clasificador Light Gradient Boosting Machine (LightGBM) era el más efectivo, logrando una tasa de precisión del 97.5% y un puntaje F del 93.3%. Además, los resultados experimentales para la predicción del AQI indicaron que el modelo de Memoria a Largo y Corto Plazo (LSTM) era superior, demostrando un ajuste del 91.37% para las predicciones de AQI, 90.46% para las predicciones de O, y un ajuste perfecto para el conjunto de prueba de contaminantes primarios. En conjunto, estos hallazgos afirman la fiabilidad y eficacia de los modelos de aprendizaje automático empleados en la previsión de la calidad del aire.
Descripción
Abordando las limitaciones inherentes a los modelos tradicionales de pronóstico del Índice de Calidad del Aire (AQI) y las deficiencias en la explotación de datos meteorológicos, esta investigación introduce una nueva metodología de predicción de la calidad del aire que aprovecha el aprendizaje automático y la mejora del modelado de datos secundarios. El conjunto de datos empleado abarca datos de pronóstico sobre las concentraciones de contaminantes primarios y las condiciones meteorológicas primarias, junto con observaciones meteorológicas reales y mediciones de concentración de contaminantes, que abarcan desde el 23 de julio de 2020 hasta el 13 de julio de 2021, obtenidos de proyecciones de calidad del aire a largo plazo en varias estaciones de monitoreo dentro de Jinan, China. Inicialmente, a través de un riguroso análisis de correlación, se seleccionaron diez factores meteorológicos, que comprenden tanto datos medidos como pronosticados en cinco categorías cada uno. Posteriormente, se evaluó y clasificó la importancia de estos diez factores en función de su impacto en las diferentes concentraciones de contaminantes, utilizando una combinación de análisis de significancia univariados y multivariados junto con un enfoque de bosque aleatorio. El análisis de características estacionales destacó los distintos impactos estacionales de la temperatura, la humedad, la presión atmosférica y las condiciones atmosféricas generales en las concentraciones de seis contaminantes clave del aire. La evaluación del rendimiento de varios modelos de predicción de clasificación basados en aprendizaje automático reveló que el clasificador Light Gradient Boosting Machine (LightGBM) era el más efectivo, logrando una tasa de precisión del 97.5% y un puntaje F del 93.3%. Además, los resultados experimentales para la predicción del AQI indicaron que el modelo de Memoria a Largo y Corto Plazo (LSTM) era superior, demostrando un ajuste del 91.37% para las predicciones de AQI, 90.46% para las predicciones de O, y un ajuste perfecto para el conjunto de prueba de contaminantes primarios. En conjunto, estos hallazgos afirman la fiabilidad y eficacia de los modelos de aprendizaje automático empleados en la previsión de la calidad del aire.