STLIS: un sistema escalable de índices de dos niveles para Big Data en IoT
Autores: Leng, Yonglin; Chen, Zhikui; Hu, Yueming
Idioma: Inglés
Editor: Hindawi Publishing Corporation
Año: 2016
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Desarrollo
Internet de los objetos
Datos
Almacenamiento
RDF
índice
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
El rápido desarrollo del Internet de las Cosas provoca el crecimiento dramático de datos, lo que plantea un importante desafío en el almacenamiento y la rápida recuperación de big data. Como modelo de representación efectivo, el RDF recibe la mayor atención. Cada vez se han desarrollado más esquemas de almacenamiento e indexación para el modelo RDF. Para los datos RDF a gran escala, la mayoría de ellos sufren de un gran número de autojoin, alto costo de almacenamiento y muchos resultados intermedios. En este documento, proponemos un esquema de índice escalable de dos niveles (STLIS) para datos RDF. En el primer nivel, diseñamos un índice de árbol de plantillas de ruta comprimidas (CPTT) basado en S-tree para recuperar los conjuntos de candidatos de ruta completa. En el segundo nivel, creamos un índice jerárquico de bordes (HEI) y un índice de nodo-predicado (NP) para acelerar la coincidencia. Se realizaron experimentos exhaustivos en dos benchmarks RDF representativos y un conjunto de datos RDF real en IoT comparando con tres esquemas de índice representativos, es decir, RDF-3X, Bitmat y TripleBit. Los resultados demuestran que nuestro esquema propuesto puede responder a la consulta compleja en tiempo real y ahorrar mucho espacio de almacenamiento en comparación con RDF-3X y Bitmat.
Descripción
El rápido desarrollo del Internet de las Cosas provoca el crecimiento dramático de datos, lo que plantea un importante desafío en el almacenamiento y la rápida recuperación de big data. Como modelo de representación efectivo, el RDF recibe la mayor atención. Cada vez se han desarrollado más esquemas de almacenamiento e indexación para el modelo RDF. Para los datos RDF a gran escala, la mayoría de ellos sufren de un gran número de autojoin, alto costo de almacenamiento y muchos resultados intermedios. En este documento, proponemos un esquema de índice escalable de dos niveles (STLIS) para datos RDF. En el primer nivel, diseñamos un índice de árbol de plantillas de ruta comprimidas (CPTT) basado en S-tree para recuperar los conjuntos de candidatos de ruta completa. En el segundo nivel, creamos un índice jerárquico de bordes (HEI) y un índice de nodo-predicado (NP) para acelerar la coincidencia. Se realizaron experimentos exhaustivos en dos benchmarks RDF representativos y un conjunto de datos RDF real en IoT comparando con tres esquemas de índice representativos, es decir, RDF-3X, Bitmat y TripleBit. Los resultados demuestran que nuestro esquema propuesto puede responder a la consulta compleja en tiempo real y ahorrar mucho espacio de almacenamiento en comparación con RDF-3X y Bitmat.