En esta investigación, se evaluaron ensayos sobre la preservación de árboles de estudiantes de cuarto grado (escuela primaria de Colombia) con Latent Dirichlet Allocation (LDA). El objetivo fue extraer los temas fundamentales, para comprender el comportamiento y la conciencia de los estudiantes hacia el medio ambiente a partir de la escritura creativa. Los resultados computacionales sugieren que las reflexiones del estudiante sobre la preservación del medio ambiente se centran en cinco temas principales en: Enseñar-Aprender a cuidar el medio ambiente, Explorar-descubrir el medio ambiente, Bienestar del medio ambiente, Preocupación por el medio ambiente y Restauración y conservación del entorno. Este análisis de texto por LDA puede complementar el análisis manual de los docentes, evitando el sesgo de veracidad y permitiendo potenciar las estrategias de enseñanza.
1. INTRODUCCIÓN
Cuando los investigadores necesitan analizar una gran cantidad de texto, necesitan herramientas con capacidad para procesar, decodificar e interpretar la información significativa, evitando el sesgo de veracidad y la infoxicación (B. Chen, Chen, & Xing, 2015; Seufert, Guggemos, & Sonderegger, 2019 ). El modelado de temas (TM) es un conjunto de herramientas computacionales basadas en el aprendizaje automático para el análisis y la extracción de temas de textos, audios y vídeos (Blei, Ng, & Jordan, 2002; Chuang, Gupta, Manning, & Heer, 2013), incluyendo aquellos que tienen un gran volumen de información (Letsche & Berry, 1997; Z. Liu, 2013; Röder et al., 2015; Stevens et al., 2012).
Mientras se aplica en el análisis de textos, la MT puede encontrar patrones de aparición de palabras o términos con un peso estadístico adecuado para la conformación de temas consistentes con los textos (Anandarajan et al., 2019; Blei et al., 2003; Ezen-Can & Boyer, s.f.; Landauer et al., 2011; Xun et al., 2017). Básicamente, estas técnicas generan una combinación de términos en forma de vectores y relacionan uno de estos vectores con cada uno de los otros considerando la proximidad estadística de los vectores, determinando la frecuencia de cada vector o la frecuencia de cada término (Blei et al., 2003; Jelodar et al., 2019; Prabhakaran, 2018). Después de generar una matriz, TM examina: (a) qué vector tiene el mayor peso estadístico, (b) qué vector está más cerca de los vectores con mayor peso estadístico, y (c) de esta manera se obtiene un grupo de vectores relacionados con su frecuencia de ocurrencia (Prabhakaran, 2018).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Cartilla:
Video y televisión en la escuela
Artículo:
Repercusiones de los cambios estructurales y tecnológicos en determinados aspectos de la siderurgia polaca
Artículo:
Analítica de datos masivos: retos y aplicaciones para datos de texto, audio, video y medios sociales
Artículo:
Marco y analítica de datos masivos en aprendizaje automático para problemas de datos masivos
Página web:
F.A.S.T. Pipe
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Importancia, manejo y control de extraíbles e incrustaciones (pitch) en la fabricación de papel
Libro:
Tratamientos avanzados de aguas residuales industriales
Artículo:
Estudio sobre la evaluación de la sostenibilidad de los productos innovadores