Un algoritmo de clustering paralelo basado en MapReduce eficiente para la división de subáreas de tráfico distribuido.
Autores: Xia, Dawen; Wang, Binfeng; Li, Yantao; Rong, Zhuobo; Zhang, Zili
Idioma: Inglés
Editor: Hindawi Publishing Corporation
Año: 2015
Acceso abierto
Artículo científico
Categoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La división de subáreas de tráfico es vital para la gestión del sistema de tráfico y el análisis de la red de tráfico en sistemas de transporte inteligente (ITSs). Dado que los métodos existentes pueden no ser adecuados para el procesamiento de grandes volúmenes de datos de tráfico, este documento presenta un algoritmo Par3PKM (Paralelo Three-Phase -Means) basado en MapReduce para resolver el problema de división de subáreas de tráfico en una plataforma de cómputo distribuido Hadoop ampliamente adoptada. Específicamente, primero modificamos la métrica de distancia y la estrategia de inicialización de -Means y luego empleamos un paradigma MapReduce para rediseñar el algoritmo optimizado de -Means para el agrupamiento paralelo de trayectorias de taxis a gran escala. Además, proponemos un método para identificar los límites que conectan los bordes de los resultados de agrupamiento para cada cluster. Finalmente, dividimos la subárea de tráfico de Beijing basada en conjuntos de datos de trayectorias del mundo real generados
Descripción
La división de subáreas de tráfico es vital para la gestión del sistema de tráfico y el análisis de la red de tráfico en sistemas de transporte inteligente (ITSs). Dado que los métodos existentes pueden no ser adecuados para el procesamiento de grandes volúmenes de datos de tráfico, este documento presenta un algoritmo Par3PKM (Paralelo Three-Phase -Means) basado en MapReduce para resolver el problema de división de subáreas de tráfico en una plataforma de cómputo distribuido Hadoop ampliamente adoptada. Específicamente, primero modificamos la métrica de distancia y la estrategia de inicialización de -Means y luego empleamos un paradigma MapReduce para rediseñar el algoritmo optimizado de -Means para el agrupamiento paralelo de trayectorias de taxis a gran escala. Además, proponemos un método para identificar los límites que conectan los bordes de los resultados de agrupamiento para cada cluster. Finalmente, dividimos la subárea de tráfico de Beijing basada en conjuntos de datos de trayectorias del mundo real generados