Pronóstico de Concentración de PM Utilizando Bi-LSTM Ponderado y Selección de Características Basada en la Importancia de Características del Bosque Aleatorio
Autores: Kim, Baekcheon; Kim, Eunkyeong; Jung, Seunghwan; Kim, Minseok; Kim, Jinyong; Kim, Sungshin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Astronomía
Palabras clave
Material particulado
Problemas de salud
Enfermedades
Pronóstico
Bi-LSTM
Aprendizaje profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 8
Citaciones: Sin citaciones
Las partículas en el aire (PM) pueden causar diversos problemas de salud y enfermedades en los humanos. En particular, el tamaño más pequeño de las PM les permite penetrar profundamente en los pulmones, causando graves impactos en la salud. La exposición a las PM puede resultar en enfermedades respiratorias, cardiovasculares y alérgicas, y la exposición prolongada también se ha relacionado con un mayor riesgo de cáncer, incluido el cáncer de pulmón. Por lo tanto, pronosticar la concentración de PM en el entorno es crucial para prevenir estos efectos adversos para la salud. Este documento propone un método para pronosticar la concentración de PM después de 1 hora utilizando memoria a largo y corto plazo bidireccional (Bi-LSTM). El método propuesto implica seleccionar variables de entrada basadas en la importancia de las características calculada por un bosque aleatorio, clasificar los datos para asignar variables de peso y reducir el sesgo, y pronosticar la concentración de PM utilizando Bi-LSTM. Para comparar el rendimiento del método propuesto, se realizaron dos estudios de caso. Primero, una comparación del rendimiento de pronóstico según el preprocesamiento. Segundo, el rendimiento de pronóstico entre modelos de aprendizaje profundo (memoria a largo y corto plazo, unidad recurrente con compuerta y Bi-LSTM) y modelos de aprendizaje automático convencionales (perceptrón multicapa, máquina de soporte vectorial, árbol de decisión y bosque aleatorio). En el estudio de caso 1, el método propuesto muestra que los índices de rendimiento (RMSE: 3.98%p, MAE: 5.87%p, RRMSE: 3.96%p y R: 0.72%p) mejoran porque se asignan pesos de acuerdo con las variables de entrada antes de que se realice el pronóstico. En el estudio de caso 2, mostramos que Bi-LSTM, que considera ambas direcciones (hacia adelante y hacia atrás), puede pronosticar de manera efectiva en comparación con los modelos convencionales (RMSE: 2.70, MAE: 0.84, RRMSE: 1.97, R: 0.16). Por lo tanto, se demuestra que el método propuesto puede pronosticar efectivamente las PM incluso si los datos en la sección de alta concentración son insuficientes.
Descripción
Las partículas en el aire (PM) pueden causar diversos problemas de salud y enfermedades en los humanos. En particular, el tamaño más pequeño de las PM les permite penetrar profundamente en los pulmones, causando graves impactos en la salud. La exposición a las PM puede resultar en enfermedades respiratorias, cardiovasculares y alérgicas, y la exposición prolongada también se ha relacionado con un mayor riesgo de cáncer, incluido el cáncer de pulmón. Por lo tanto, pronosticar la concentración de PM en el entorno es crucial para prevenir estos efectos adversos para la salud. Este documento propone un método para pronosticar la concentración de PM después de 1 hora utilizando memoria a largo y corto plazo bidireccional (Bi-LSTM). El método propuesto implica seleccionar variables de entrada basadas en la importancia de las características calculada por un bosque aleatorio, clasificar los datos para asignar variables de peso y reducir el sesgo, y pronosticar la concentración de PM utilizando Bi-LSTM. Para comparar el rendimiento del método propuesto, se realizaron dos estudios de caso. Primero, una comparación del rendimiento de pronóstico según el preprocesamiento. Segundo, el rendimiento de pronóstico entre modelos de aprendizaje profundo (memoria a largo y corto plazo, unidad recurrente con compuerta y Bi-LSTM) y modelos de aprendizaje automático convencionales (perceptrón multicapa, máquina de soporte vectorial, árbol de decisión y bosque aleatorio). En el estudio de caso 1, el método propuesto muestra que los índices de rendimiento (RMSE: 3.98%p, MAE: 5.87%p, RRMSE: 3.96%p y R: 0.72%p) mejoran porque se asignan pesos de acuerdo con las variables de entrada antes de que se realice el pronóstico. En el estudio de caso 2, mostramos que Bi-LSTM, que considera ambas direcciones (hacia adelante y hacia atrás), puede pronosticar de manera efectiva en comparación con los modelos convencionales (RMSE: 2.70, MAE: 0.84, RRMSE: 1.97, R: 0.16). Por lo tanto, se demuestra que el método propuesto puede pronosticar efectivamente las PM incluso si los datos en la sección de alta concentración son insuficientes.