Un conjunto de reglas para el análisis automático de múltiples oraciones orientado a funciones en patentes
Autores: Spreafico, Christian; Spreafico, Matteo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
Categoría
Gestión y administración
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Este estudio propone algunas reglas para realizar una búsqueda orientada a funciones (proporcionando función y objeto) para extraer sistemas técnicos de patentes, utilizando patrones de sintaxis y dependencia para analizar múltiples oraciones. A diferencia de los métodos de análisis inter-oracional más comunes, el método propuesto no utiliza información contextual o distancia para vincular los elementos de varias oraciones, sino términos genéricos de la ontología de patentes. El contenido proporcionado por las reglas se derivó completamente de un análisis estadístico de muchas patentes de diferentes dominios, con el fin de proporcionar una validez general para las reglas. La aplicación del método en dos estudios de caso, relacionados con el corte de metales y el procesamiento de estiércol, destacó sus principales ventajas. Su grado de automatización es tal que el experto está casi exclusivamente excluido, excepto en la definición de la función sobre la cual construir el conjunto de documentos. La precisión y el recall de los resultados durante las pruebas superaron el 90%. La limitación actual se refiere al control manual de algunos resultados, alrededor del 25%, que derivan de un conjunto adicional de patrones de dependencia que son difíciles de automatizar y merecen una investigación más profunda. Los sistemas técnicos son muchos más en número y están más detallados en cuanto a aspectos estructurales que aquellos obtenibles al analizar solo oraciones individuales y/o sintaxis.
Descripción
Este estudio propone algunas reglas para realizar una búsqueda orientada a funciones (proporcionando función y objeto) para extraer sistemas técnicos de patentes, utilizando patrones de sintaxis y dependencia para analizar múltiples oraciones. A diferencia de los métodos de análisis inter-oracional más comunes, el método propuesto no utiliza información contextual o distancia para vincular los elementos de varias oraciones, sino términos genéricos de la ontología de patentes. El contenido proporcionado por las reglas se derivó completamente de un análisis estadístico de muchas patentes de diferentes dominios, con el fin de proporcionar una validez general para las reglas. La aplicación del método en dos estudios de caso, relacionados con el corte de metales y el procesamiento de estiércol, destacó sus principales ventajas. Su grado de automatización es tal que el experto está casi exclusivamente excluido, excepto en la definición de la función sobre la cual construir el conjunto de documentos. La precisión y el recall de los resultados durante las pruebas superaron el 90%. La limitación actual se refiere al control manual de algunos resultados, alrededor del 25%, que derivan de un conjunto adicional de patrones de dependencia que son difíciles de automatizar y merecen una investigación más profunda. Los sistemas técnicos son muchos más en número y están más detallados en cuanto a aspectos estructurales que aquellos obtenibles al analizar solo oraciones individuales y/o sintaxis.