Ficha técnica

51 | 0

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Implementación de un sistema de reconocimiento de voz en el idioma yuwe de la NASA basado en redes neuronales convolucionalesImplementation of a Voice Recognition System in the Nasa Yuwe Language Based on Convolutional Neural Networks

Resumen

En 2022, la Universidad del Cauca desarrolló un innovador algoritmo de reconocimiento de voz para la lengua nasa yuwe, de gran riqueza fonética, utilizando redes neuronales convolucionales (CNN). Con 32 vocales y 34 consonantes, la lengua planteaba retos en la pronunciación y el reconocimiento de patrones de voz. El objetivo era implantar un sistema de reconocimiento del habla asistido por CNN que incluyera el preprocesamiento de la señal de audio, la extracción del escalograma del coeficiente de Mel y una arquitectura CNN para la clasificación. Los resultados demostraron márgenes de error bajos en la clasificación de palabras, estableciendo el primer sistema de reconocimiento de voz de su clase para Nasa Yuwe. A pesar de sus limitaciones, como la necesidad de más patrones de voz nativos y de herramientas tecnológicas adicionales, el sistema contribuye a la preservación y educación de la lengua.

1. INTRODUCCIÓN

Un Sistema de Reconocimiento de Voz (SRV) representa el conjunto de técnicas y algoritmos utilizados por una herramienta computacional para identificar y transformar un patrón de voz, de tal forma que permita la interacción hombre-máquina, con el fin de resolver una determinada necesidad [1]. Los SRV han cobrado especial relevancia, sobre todo por su versatilidad y funcionalidad en aplicaciones y usos diversos como la medicina, la robótica y las tecnologías domóticas, entre otros, haciendo que los dispositivos que manejan este tipo de interfaz sean cada vez más precisos y fáciles de manejar [2] [3] [4]. Los modelos VRS suelen tener las siguientes etapas: Adquisición de la señal de voz, preprocesamiento de la señal, reconocimiento y clasificación de los patrones de la señal de voz [5]. Para conseguir un SRV con márgenes de error fiables, es necesario utilizar técnicas de extracción de las características de los patrones de voz[6], entre las más utilizadas se encuentran: 1-) los escalogramas obtenidos a partir de los coeficientes Mel, los MFCC (Mel Frequency Cepstral Coefficients), que están asociados a la percepción neurológica del sonido, y en la mayoría de los casos se utilizan para identificar al locutor y no la palabra hablada[7]; 2-) las características proporcionadas por la aplicación de la transformada Wavelet, que permiten un amplio abanico de posibilidades dado el número de familias existentes, aunque las transformadas wavelet suelen ser sensibles a las variaciones de volumen en las muestras de audio [8]; 3-) la transformada de Fourier que proporciona información sobre los patrones del habla en el dominio de la frecuencia, pero no proporciona información sobre sus variaciones temporales [9]. Una ventaja de los SRV es que pueden trabajar con una gran cantidad de vocabulario sin dificultad, y el tiempo de pro-cesamiento es bajo, lo que permite al usuario evaluar satisfactoriamente el rendimiento del SRV [10].

Autor:Muñoz Burbano, Julio Enrique; Jojoa Gomez, Pablo Emilio; Castro Caicedo, Fausto Miguel.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Ingeniería de sistemas
Año de publicación:2023.
Editor:Ediciones Universidad Cooperativa de Colombia

Tipo de documento:Artículo
Formato:pdf
Idioma:Español
Tamaño:6320 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Implementación de un sistema de reconocimiento de voz en el idioma yuwe de la NASA basado en redes neuronales convolucionales

DC.Title.eng

Implementation of a Voice Recognition System in the Nasa Yuwe Language Based on Convolutional Neural Networks

DC.Creator

Muñoz Burbano, Julio Enrique; Jojoa Gomez, Pablo Emilio; Castro Caicedo, Fausto Miguel

DC.Subject.snpi.spa

Red neuronal convolucional Aprendizaje automático Algoritmo de reconocimiento

DC.Subject.snpi.eng

Convolutional neural network Machine learning Recognition algorithm

DC.Subject.spa

Sistema de Reconocimiento de Voz (VRS); Idioma Nasa Yuwe; Coeficientes Mel; Aprendizaje automático; Red Neuronal Convolucional (CNN)

DC.Subject.eng

VRS (Voice Recognition System); Nasa Yuwe Language; Mel coefficients; Machine learning; CNN (Convolutional Neural Network)

DC.Description.spa

1. INTRODUCCIÓN

DC.Source

https://revistas.ucc.edu.co/index.php/in/article/view/4444

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/implementaci-n-de-un-sistema-de-reconocimiento-de-voz-en-el-idioma-yuwe-de-la-nasa-basado-en-redes-neuronales-convolucionales

DC.Identifier.issn-isbn

ISSN:2357-6014

DC.Identifier.citacion

Revista Virtual Pro, ,

DC.Language

Español

DC.Relation

DC.Publisher

Ediciones Universidad Cooperativa de Colombia

DC.Contributor

DC.Rights

Derechos de autor:1

DC.Date

2023

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

85818.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Información del documento

Titulo:Implementación de un sistema de reconocimiento de voz en el idioma yuwe de la NASA basado en redes neuronales convolucionales
Autor:Muñoz Burbano, Julio Enrique; Jojoa Gomez, Pablo Emilio; Castro Caicedo, Fausto Miguel
Tipo:Artículo
Año:2023
Idioma:Español
Editor:Ediciones Universidad Cooperativa de Colombia
Materias:Red neuronal convolucional Aprendizaje automático Algoritmo de reconocimiento
Descarga:0

Biblioteca93.141 documentos en línea

Ficha técnica

Implementación de un sistema de reconocimiento de voz en el idioma yuwe de la NASA basado en redes neuronales convolucionalesImplementation of a Voice Recognition System in the Nasa Yuwe Language Based on Convolutional Neural Networks

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Generalidades de Condensadores - Intro

Centrifugación

La historia del chocolate

Obtención de la carne

IA Aplicaciones industriales

Construye una fracción

Parejas de fracciones

Videos

Seminario web: Impulsar la creación de empleo rural y el crecimiento económico

Parques de ecoinnovación: eficiencia en el uso de recursos, simbiosis industrial y ecoinnovación

La innovación de los procesos de negocio para conseguir la transformación digital de su organización

Ejemplos del método directo de elementos de frontera. Lección 6

Aditec - Webinar PTAR: Degradación de Contaminantes Orgánicos

Valorización energética de residuos en fábricas de cemento

Introducción de la investigación en nanotecnología y electrospinning de nanofibras compuestas de polímero a estudiantes de secundaria

Documentos más descargados

2024-02-15
Nanotecnología para la producción de materiales inteligentes en la industria textil

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca93.141 documentos en línea

Ficha técnica

Implementación de un sistema de reconocimiento de voz en el idioma yuwe de la NASA basado en redes neuronales convolucionalesImplementation of a Voice Recognition System in the Nasa Yuwe Language Based on Convolutional Neural Networks

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Generalidades de Condensadores - Intro

Centrifugación

La historia del chocolate

Obtención de la carne

IA Aplicaciones industriales

Construye una fracción

Parejas de fracciones

Videos

Seminario web: Impulsar la creación de empleo rural y el crecimiento económico

Parques de ecoinnovación: eficiencia en el uso de recursos, simbiosis industrial y ecoinnovación

La innovación de los procesos de negocio para conseguir la transformación digital de su organización

Ejemplos del método directo de elementos de frontera. Lección 6

Aditec - Webinar PTAR: Degradación de Contaminantes Orgánicos

Valorización energética de residuos en fábricas de cemento

Introducción de la investigación en nanotecnología y electrospinning de nanofibras compuestas de polímero a estudiantes de secundaria

Documentos más descargados

2024-02-15Nanotecnología para la producción de materiales inteligentes en la industria textil

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2024-02-15
Nanotecnología para la producción de materiales inteligentes en la industria textil