La dimensión de relación en la identificación y clasificación de coocurrencias de palabras léxicamente restringidas en corpora de texto
Autores: Shvets, Alexander; Wanner, Leo
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Discurso
Colocaciones
Léxicamente restringido
Colocaciones
Clasificación semántica
Función léxica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
El habla de los hablantes nativos está llena de idiosincrasias. Especialmente prominentes son las co-ocurrencias de palabras binarias restringidas léxicamente del tipo, etc. En lexicografía, dichas co-ocurrencias se conocen como. Debido a su naturaleza semi-decomposicional, las colocaciones son de gran relevancia para una gran cantidad de aplicaciones de procesamiento del lenguaje natural, así como para el aprendizaje de segundas lenguas. Existe un cuerpo sustancial de trabajo sobre el reconocimiento automático de colocaciones en material textual y, cada vez más, también sobre su clasificación semántica, aunque aún no en la corriente principal de la investigación. Especialmente la clasificación con respecto a la taxonomía de la función léxica (LF), que es la taxonomía semánticamente más detallada de colocaciones disponible hasta la fecha, demostró ser de gran utilidad tanto para hablantes humanos como para máquinas. Los enfoques más recientes en el campo se basan en modelos de transformadores de grafos neuronales multilingües que utilizan dependencias sintácticas explícitas. Nuestro objetivo es explorar si la extensión de dicho modelo por una red de extracción de relaciones semánticas mejora su rendimiento de clasificación o si ya aprende las relaciones semánticas correspondientes a partir de las dependencias y los contextos oracionales, de tal manera que una red adicional de extracción de relaciones no mejorará el rendimiento general. Los experimentos muestran que la capa de extracción de relaciones semánticas efectivamente mejora el rendimiento general de un transformador de grafos. Sin embargo, esta mejora no es muy significativa, por lo que podemos concluir que los transformadores de grafos ya aprenden en cierta medida la semántica de las dependencias entre los elementos de la colocación.
Descripción
El habla de los hablantes nativos está llena de idiosincrasias. Especialmente prominentes son las co-ocurrencias de palabras binarias restringidas léxicamente del tipo, etc. En lexicografía, dichas co-ocurrencias se conocen como. Debido a su naturaleza semi-decomposicional, las colocaciones son de gran relevancia para una gran cantidad de aplicaciones de procesamiento del lenguaje natural, así como para el aprendizaje de segundas lenguas. Existe un cuerpo sustancial de trabajo sobre el reconocimiento automático de colocaciones en material textual y, cada vez más, también sobre su clasificación semántica, aunque aún no en la corriente principal de la investigación. Especialmente la clasificación con respecto a la taxonomía de la función léxica (LF), que es la taxonomía semánticamente más detallada de colocaciones disponible hasta la fecha, demostró ser de gran utilidad tanto para hablantes humanos como para máquinas. Los enfoques más recientes en el campo se basan en modelos de transformadores de grafos neuronales multilingües que utilizan dependencias sintácticas explícitas. Nuestro objetivo es explorar si la extensión de dicho modelo por una red de extracción de relaciones semánticas mejora su rendimiento de clasificación o si ya aprende las relaciones semánticas correspondientes a partir de las dependencias y los contextos oracionales, de tal manera que una red adicional de extracción de relaciones no mejorará el rendimiento general. Los experimentos muestran que la capa de extracción de relaciones semánticas efectivamente mejora el rendimiento general de un transformador de grafos. Sin embargo, esta mejora no es muy significativa, por lo que podemos concluir que los transformadores de grafos ya aprenden en cierta medida la semántica de las dependencias entre los elementos de la colocación.