Un algoritmo de corrección jerárquico basado en difusos para el problema de hits de red vecina
Autores: Leiva-Araos, Andrés; Allende-Cid, Héctor
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Teléfonos móviles
Datos de comportamiento
NNH
Análisis de movilidad
Procesamiento de datos
Lógica difusa
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La mayoría de los humanos hoy en día tienen teléfonos móviles. Estos dispositivos están recopilando y almacenando permanentemente datos de comportamiento de la sociedad humana. Sin embargo, el procesamiento de datos tiene varios desafíos por resolver, especialmente si se obtiene de tecnologías obsoletas. Las antiguas tecnologías como GSM y UMTS aún representan casi la mitad de todos los dispositivos a nivel mundial. El principal problema en los datos es conocido como golpe de red vecina (NNH). Un NNH ocurre cuando un dispositivo celular se conecta a un sitio más lejano de lo que corresponde por el diseño de la red, introduciendo un error en el análisis de movilidad espaciotemporal. Los problemas presentados por los datos se mitigan eliminando datos erróneos o diluyéndolos estadísticamente en base a aumentar la cantidad de datos procesados y el tamaño del área de estudio. Ninguna de estas soluciones es efectiva si lo que se busca es estudiar la movilidad en áreas pequeñas (por ejemplo, la pandemia de Covid-19). La eliminación de registros completos o trazas en la serie temporal genera desviaciones en análisis posteriores; esto tiene un impacto especial en estudios con cobertura espacial reducida. El presente trabajo es una evolución del enfoque anterior de corrección de NNH (NFA) e inferencia de viaje (TCA), basado en lógica binaria. NFA y TCA combinados ofrecen buenos resultados de conteo de viajes en comparación con encuestas gubernamentales (2.37 vs. 2.27, respectivamente). Sin embargo, su principal contribución se da por el aumento en la precisión del cálculo de las distancias recorridas (37% mejor que estudios previos). En este documento, presentamos FNFA y FTCA. Ambos algoritmos están basados en lógica difusa y ofrecen resultados aún mejores. Observamos una mejora en el recuento de viajes (2.29, lo que representa un 2.79% mejor que NFA). Con FNFA y FTCA combinados, observamos una diferencia promedio en la distancia recorrida de 9.2 km, que es un 9.8% mejor que el NFA-TCA anterior. En comparación con los métodos ingenuos (sin corregir el ), la mejora aumenta de 28.8 a 19.6 km (46.9%). Utilizamos datos debidamente anonimizados de dispositivos móviles de tres ciudades principales en Chile. Comparamos nuestros resultados con trabajos previos y Encuestas de Origen y Destino del Gobierno para evaluar el rendimiento de nuestra solución. Este nuevo enfoque, al mejorar nuestros resultados anteriores, proporciona las ventajas de un modelo mejor adaptado a la condición difusa de las variables del problema y nos muestra un camino para desarrollar nuevos modelos que representen desafíos abiertos en estudios de movilidad urbana basados en datos celulares (por ejemplo, inferencia de modo de viaje).
Descripción
La mayoría de los humanos hoy en día tienen teléfonos móviles. Estos dispositivos están recopilando y almacenando permanentemente datos de comportamiento de la sociedad humana. Sin embargo, el procesamiento de datos tiene varios desafíos por resolver, especialmente si se obtiene de tecnologías obsoletas. Las antiguas tecnologías como GSM y UMTS aún representan casi la mitad de todos los dispositivos a nivel mundial. El principal problema en los datos es conocido como golpe de red vecina (NNH). Un NNH ocurre cuando un dispositivo celular se conecta a un sitio más lejano de lo que corresponde por el diseño de la red, introduciendo un error en el análisis de movilidad espaciotemporal. Los problemas presentados por los datos se mitigan eliminando datos erróneos o diluyéndolos estadísticamente en base a aumentar la cantidad de datos procesados y el tamaño del área de estudio. Ninguna de estas soluciones es efectiva si lo que se busca es estudiar la movilidad en áreas pequeñas (por ejemplo, la pandemia de Covid-19). La eliminación de registros completos o trazas en la serie temporal genera desviaciones en análisis posteriores; esto tiene un impacto especial en estudios con cobertura espacial reducida. El presente trabajo es una evolución del enfoque anterior de corrección de NNH (NFA) e inferencia de viaje (TCA), basado en lógica binaria. NFA y TCA combinados ofrecen buenos resultados de conteo de viajes en comparación con encuestas gubernamentales (2.37 vs. 2.27, respectivamente). Sin embargo, su principal contribución se da por el aumento en la precisión del cálculo de las distancias recorridas (37% mejor que estudios previos). En este documento, presentamos FNFA y FTCA. Ambos algoritmos están basados en lógica difusa y ofrecen resultados aún mejores. Observamos una mejora en el recuento de viajes (2.29, lo que representa un 2.79% mejor que NFA). Con FNFA y FTCA combinados, observamos una diferencia promedio en la distancia recorrida de 9.2 km, que es un 9.8% mejor que el NFA-TCA anterior. En comparación con los métodos ingenuos (sin corregir el ), la mejora aumenta de 28.8 a 19.6 km (46.9%). Utilizamos datos debidamente anonimizados de dispositivos móviles de tres ciudades principales en Chile. Comparamos nuestros resultados con trabajos previos y Encuestas de Origen y Destino del Gobierno para evaluar el rendimiento de nuestra solución. Este nuevo enfoque, al mejorar nuestros resultados anteriores, proporciona las ventajas de un modelo mejor adaptado a la condición difusa de las variables del problema y nos muestra un camino para desarrollar nuevos modelos que representen desafíos abiertos en estudios de movilidad urbana basados en datos celulares (por ejemplo, inferencia de modo de viaje).