Biblioteca93.141 documentos en línea

Artículo

Application of Filters to Multiway Joins in MapReduceAplicación de filtros a uniones multidireccionales en MapReduce

Resumen

La unión de múltiples conjuntos de datos en MapReduce puede aumentar los gastos generales de disco y de red, ya que los resultados intermedios de la unión tienen que escribirse en el sistema de archivos distribuido subyacente, o los registros de salida del mapa tienen que replicarse varias veces. Este artículo propone un método para aplicar filtros basados en el orden de procesamiento de los conjuntos de datos de entrada, que es adecuado para los dos tipos de uniones multidireccionales: uniones de atributos comunes y uniones de atributos distintos. El número de registros redundantes filtrados depende del orden de procesamiento. En las uniones por atributos comunes, no es necesario replicar los registros de entrada, por lo que se crea un conjunto de filtros que se aplican sucesivamente. En las uniones de atributos distintos, los registros de entrada tienen que replicarse, por lo que es necesario crear varios conjuntos de filtros, que dependen del número de atributos de unión. Los resultados experimentales mostraron que nuestro enfoque superaba a una cascada de uniones bidireccionales y a las uniones multidireccionales básicas en los casos en que se unían pequeñas porciones de los conjuntos de datos de entrada.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento