Biblioteca36.130 documentos en línea

Artículo

MapReduce Based Personalized Locality Sensitive Hashing for Similarity Joins on Large Scale DataHashing personalizado basado en MapReduce y sensible a la localidad para uniones similares en datos a gran escala

Resumen

Se ha propuesto el Hashing Sensible a la Localidad (LSH) como una técnica eficiente para la unión de similitudes para datos de alta dimensión. La eficiencia y la tasa de aproximación de LSH dependen del número de instancias falsas positivas y falsas negativas generadas. En muchos dominios, es crucial reducir el número de falsos positivos. Además, en algunos escenarios de aplicación, se favorece el equilibrio entre falsos positivos y falsos negativos. Para abordar estos problemas, en este trabajo proponemos el Hashing Personalizado Sensible a la Localidad (PLSH), en el que se incorpora un nuevo esquema de bandas para adaptar el número de falsos positivos, falsos negativos y la suma de ambos. PLSH se implementa en paralelo utilizando el marco MapReduce para tratar las uniones de similitud en datos a gran escala. Los estudios experimentales sobre datos reales y simulados verifican la eficiencia y eficacia de nuestra técnica PLSH propuesta, en comparación con los métodos del estado de la técnica.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento