Transfer learning con contenido de redes sociales en el dominio de las aplicaciones de transporte de pasajeros mediante el uso de una arquitectura híbrida de aprendizaje automático
Autores: de Pablo, Álvaro; Araque, Oscar; Iglesias, Carlos A.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
El análisis del contenido de las publicaciones escritas en redes sociales ha establecido una importante línea de investigación en los últimos años. El estudio de estos textos, así como su relación entre sí y su dependencia de la plataforma en la que están escritos, permite el análisis del comportamiento de los usuarios y sus opiniones con respecto a diferentes dominios. En este trabajo, se ha desarrollado un sistema híbrido basado en aprendizaje automático para clasificar textos utilizando técnicas de modelado de temas y diferentes representaciones de vectores de palabras, así como representaciones de texto tradicionales. El sistema ha sido entrenado con publicaciones de servicios de transporte extraídas de Reddit, mostrando un rendimiento prometedor. Luego, los modelos generados han sido probados con datos extraídos de otras fuentes como Twitter y Google Play, clasificando estos textos sin necesidad de volver a entrenar ningún modelo y realizando así Transfer Learning. Los resultados obtenidos muestran que nuestra arquitectura propuesta es efectiva al realizar Transfer Learning desde dominios ricos en datos y aplicarlos a otras fuentes.
Descripción
El análisis del contenido de las publicaciones escritas en redes sociales ha establecido una importante línea de investigación en los últimos años. El estudio de estos textos, así como su relación entre sí y su dependencia de la plataforma en la que están escritos, permite el análisis del comportamiento de los usuarios y sus opiniones con respecto a diferentes dominios. En este trabajo, se ha desarrollado un sistema híbrido basado en aprendizaje automático para clasificar textos utilizando técnicas de modelado de temas y diferentes representaciones de vectores de palabras, así como representaciones de texto tradicionales. El sistema ha sido entrenado con publicaciones de servicios de transporte extraídas de Reddit, mostrando un rendimiento prometedor. Luego, los modelos generados han sido probados con datos extraídos de otras fuentes como Twitter y Google Play, clasificando estos textos sin necesidad de volver a entrenar ningún modelo y realizando así Transfer Learning. Los resultados obtenidos muestran que nuestra arquitectura propuesta es efectiva al realizar Transfer Learning desde dominios ricos en datos y aplicarlos a otras fuentes.