Ficha técnica

143 | 2

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Sistema audiovisual para reconocimiento de comandosAudiovisual system for recognition of commands

Resumen

Se presenta el desarrollo de un sistema automático de reconocimiento audiovisual del habla enfocadoen el reconocimiento de comandos. La representación del audio se realizó mediante los coeficientescepstrales de Mel y las primeras dos derivadas temporales. Para la caracterización del vídeo se hizoseguimiento automático de características visuales de alto nivel a través de toda la secuencia. Para lainicialización automática del algoritmo se emplearon transformaciones de color y contornos activoscon información de flujo del vector gradiente (“GVF snakes”) sobre la región labial, mientras que parael seguimiento se usaron medidas de similitud entre vecindarios y restricciones morfológicas definidasen el estándar MPEG-4. Inicialmente, se presenta el diseño del sistema de reconocimiento automáticodel habla, empleando únicamente información de audio (ASR), mediante Modelos Ocultos de Markov(HMMs) y un enfoque de palabra aislada; posteriormente, se muestra el diseño de los sistemas empleandoúnicamente características de vídeo (VSR), y empleando características de audio y vídeo combinadas(AVSR). Al final se comparan los resultados de los tres sistemas para una base de datos propia en españoly francés, y se muestra la influencia del ruido acústico, mostrando que el sistema de AVSR es más robustoque ASR y VSR.

INTRODUCCIÓN

El problema de reconocimiento automático del habla en señales de audio se ha tratado regularmente a través del modelado de las señales, utilizando técnicas como Redes Neuronales [14] o modelos ocultos de Markov [19], las cuales reportan buenos resultados en la literatura. Sin embargo, cuando las condiciones acústicas son adversas, su desempeño se ve afectado. Recientemente, el reconocimiento audiovisual del habla se ha convertido en un campo activo de investigación gracias a los avances en áreas como el procesamiento digital de señales, la visión de máquina y el reconocimiento de patrones [16, 22]. Su objetivo final es permitir la comunicación hombre-máquina usando información audiovisual del habla para combatir las dificultades de un ambiente ruidoso o para tratar de reconocer las emociones exhibidas por el locutor.

Se sabe de los sistemas de comunicación que el análisis visual de la región de la boca del hablante suministra información importante. En particular, los humanos visualizamos el contorno de los labios para mejorar la comprensión del habla [7]. En los trabajos de Campbell [3] se muestra que cuando el oyente tiene información visual de la región de la boca del hablante, la relación señal a ruido (SNR) puede incrementarse hasta en 15 dB.

Materias:Diseño experimental Algoritmo de reconocimiento Administración de bases de datos
Subjects:Experimental design Recognition algorithm Data base management
Palabras claves:Reconocimiento audiovisual del habla, modelo oculto de Markov (HMM), coeficientes de Mel, contorno activo, pseudotono, estándar MPEG-4, puntos FAPs, seguimiento de características.
Keywords:Audiovisual speech recognition, hidden Markov models (HMM), Mel’s coefficients, active contours, pseudo tone, MPEG-4 standard, FAP points, tracking features.

Autor:Redarce, Tanneguy Gómez, Juan B. Prieto, Flavio Serna-Morales, Andrés F. Ceballos, Alexander.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Ingeniería de sistemas
Año de publicación:2011.
Editor:Universidad de Tarapacá

Tipo de documento:Artículo
Formato:pdf
Idioma:Español
Tamaño:362 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Sistema audiovisual para reconocimiento de comandos

DC.Title.eng

Audiovisual system for recognition of commands

DC.Creator

Redarce, Tanneguy Gómez, Juan B. Prieto, Flavio Serna-Morales, Andrés F. Ceballos, Alexander

DC.Subject.snpi.spa

Diseño experimental Algoritmo de reconocimiento Administración de bases de datos

DC.Subject.snpi.eng

Experimental design Recognition algorithm Data base management

DC.Subject.spa

Reconocimiento audiovisual del habla, modelo oculto de Markov (HMM), coeficientes de Mel, contorno activo, pseudotono, estándar MPEG-4, puntos FAPs, seguimiento de características.

DC.Subject.eng

Audiovisual speech recognition, hidden Markov models (HMM), Mel’s coefficients, active contours, pseudo tone, MPEG-4 standard, FAP points, tracking features.

DC.Description.spa

INTRODUCCIÓN

DC.Source

https://www.ingeniare.cl/index.php?option=com_ingeniare&view=d&doc=71/art12.pdf&aid=240&vid=71&lang=es

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/sistema-audiovisual-para-reconocimiento-de-comandos

DC.Identifier.issn-isbn

ISSN:0718-3305 (Versión electrónica); 0718-3291 (Versión impresa)

DC.Identifier.citacion

Revista Virtual Pro, Agosto 2011, Ingeniare. Revista chilena de ingeniería Vol. 19 Núm. 2

DC.Language

Español

DC.Relation

DC.Publisher

Universidad de Tarapacá

DC.Contributor

DC.Rights

Derechos de autor:6

DC.Date

2011

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

47565.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Biblioteca93.141 documentos en línea

Ficha técnica

Sistema audiovisual para reconocimiento de comandosAudiovisual system for recognition of commands

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Generalidades de Condensadores - Intro

Centrifugación

La historia del chocolate

Obtención de la carne

IA Aplicaciones industriales

Construye una fracción

Parejas de fracciones

Videos

Seminario web: Impulsar la creación de empleo rural y el crecimiento económico

Parques de ecoinnovación: eficiencia en el uso de recursos, simbiosis industrial y ecoinnovación

La innovación de los procesos de negocio para conseguir la transformación digital de su organización

Ejemplos del método directo de elementos de frontera. Lección 6

Aditec - Webinar PTAR: Degradación de Contaminantes Orgánicos

Valorización energética de residuos en fábricas de cemento

Introducción de la investigación en nanotecnología y electrospinning de nanofibras compuestas de polímero a estudiantes de secundaria

Documentos más descargados

2022-11-08
Modernización tecnológica de los sectores productivos

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

Biblioteca93.141 documentos en línea

Ficha técnica

Sistema audiovisual para reconocimiento de comandosAudiovisual system for recognition of commands

Resumen

Cómo citar el documento

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

Información del documento

Cómo citar el documento

Documentos relacionados

Recursos

Infografías

Generalidades de Condensadores - Intro

Centrifugación

La historia del chocolate

Obtención de la carne

IA Aplicaciones industriales

Construye una fracción

Parejas de fracciones

Videos

Seminario web: Impulsar la creación de empleo rural y el crecimiento económico

Parques de ecoinnovación: eficiencia en el uso de recursos, simbiosis industrial y ecoinnovación

La innovación de los procesos de negocio para conseguir la transformación digital de su organización

Ejemplos del método directo de elementos de frontera. Lección 6

Aditec - Webinar PTAR: Degradación de Contaminantes Orgánicos

Valorización energética de residuos en fábricas de cemento

Introducción de la investigación en nanotecnología y electrospinning de nanofibras compuestas de polímero a estudiantes de secundaria

Documentos más descargados

2022-11-08Modernización tecnológica de los sectores productivos

Virtual Pro

Virtual Plant

Actualidad

Investigación

Suscripción

Publicidad

Virtual Pro | Procesos Industriales

2022-11-08
Modernización tecnológica de los sectores productivos