Biblioteca76.869 documentos en línea

Artículo

Exploiting Language Models to Classify Events from TwitterExplotación de modelos lingüísticos para clasificar eventos de Twitter

Resumen

Clasificar eventos es un reto en Twitter porque los textos de los tweets tienen una gran cantidad de datos temporales con mucho ruido y varios tipos de temas. En este artículo, proponemos un método para clasificar los eventos de Twitter. En primer lugar, encontramos los términos distintivos entre los tweets de los eventos y medimos sus similitudes con modelos de lenguaje de aprendizaje como ConceptNet y un método de asignación de Dirichlet latente para las preferencias de selección (LDA-SP), que han sido ampliamente estudiados sobre la base de grandes corpus de texto dentro de las relaciones lingüísticas computacionales. La relación de las palabras de los términos en los tweets se descubrirá comprobándolas bajo cada modelo. A continuación, propusimos un método para calcular la similitud entre los tweets basado en las características de los tweets, incluidas las palabras de término comunes y las relaciones entre sus palabras de término distintivas. Será explícito y conveniente para aplicarlo a las técnicas de k-nearest neighbor para la clasificación. Aplicamos cuidadosamente experimentos en el Corpus de Twitter de Edimburgo para demostrar que nuestro método logra resultados competitivos para clasificar eventos.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento