Este artículo presenta el desarrollo de un sistema de reconocimiento de palabras aisladas independiente del locutor, para comandar una silla de ruedas. Cada palabra se codifica mediante las técnicas de Predicción lineal y Cepstrum real, y la etapa de clasificación se realiza mediante Modelos Ocultos de Markov (HMM). A partir de los resultados se generan órdenes a un sistema móvil (silla de ruedas), el cual es comandado en un ambiente controlado.
1. INTRODUCCIÓN
El reconocimiento de voz ha despertado un inusitado interés, tanto en empresas tecnológicas como en universidades. Basta señalar una gran cantidad de diferentes productos de interacción por voz para entender la creciente necesidad: control de acceso, robots industriales, sistemas de ayuda a discapacitados, acceso y navegación por base de datos, operaciones y transacciones comerciales, etc.
El reconocimiento de voz es básicamente un proceso de clasificación de patrones (Faundez, 2001). El objetivo es adquirir un patrón de entrada, en este caso es la señal de voz, y clasificarla como adelante, atrás, izquierda, etc. Los patrones de entrada, pueden ser tratados como palabras, sílabas o fonemas. La principal dificultad del reconocimiento es que la señal de voz es muy variable, debido a la gran cantidad de locutores, diferentes velocidades a la hora de hablar, condiciones acústicas y ambientales, e incluso el estado anímico del locutor.
Un sistema de reconocimiento puede ser clasificado según sus características así: reconocimiento de palabras aisladas, identificación de palabras clave en un discurso continuo, reconocimiento de palabras conectadas, con dependencia o independencia del locutor, según el tamaño del vocabulario y si el reconocedor está en la capacidad de responder en presencia de ruido o solamente en un ambiente controlado. Los sistemas de reconocimiento dependientes del locutor, deben ser entrenados para responder a las características particulares de la voz de una persona, es decir, para un solo locutor. Algunos trabajos en esta área son (Moralejo, 2010) (Alcubierre, 2005), (Cabas, 2004), (Gold, 2011), (Méndez, 2006), (Burton, 1987), (Rabiner, 1989), (Villamil, 2005), en los cuales le da aplicación al procesamiento de voz.
En este proyecto se da a conocer la experiencia en el desarrollo de un prototipo de reconocimiento de palabras aisladas dependiente del locutor. El prototipo fue desarrollado para ser utilizado en el desarrollo e implementación de una silla de ruedas comandada por voz, este prototipo busca una herramienta de ayuda para personas en situación de discapacidad y de esta forma lograr su independencia.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Compartir el espectro con la comunicación vehicular en redes cognitivas de células pequeñas
Artículo:
Un método eficaz para la obtención de imágenes de sondeos en túneles enterrados
Artículo:
Una antena de parche ranurado de doble banda sobre sustrato de material dieléctrico
Artículo:
Viabilidad de la diversidad del espacio de enlace de los vehículos aéreos no tripulados en zonas boscosas
Artículo:
Monitoreo automático de servicios convergentes en un entorno Telco 2.0 basado en parámetros de QoS
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Artículo:
Nuevas necesidades cosméticas : tendencias y productos específicos
Manual:
Química de los taninos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.