Marco de Mejora de Voz con Supresión de Ruido Usando Análisis de Componentes Principales por Bloques
Autores: Alsheibi, Abdullah Zaini; Valavanis, Kimon P.; Iqbal, Asif; Aman, Muhammad Naveed
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Marco de Mejora de Voz con Supresión de Ruido Usando Análisis de Componentes Principales por BloquesCategoría
Artes
Subcategoría
Música
Palabras clave
Avance
Basado en comunicación por voz
Interfaz humano-máquina
Señal de voz
Supresión de ruido
Dominio de frecuencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Con el avance de la tecnología de interfaz humano-máquina basada en comunicación por voz en dispositivos de hogar inteligente, la capacidad de descomponer la señal de voz recibida en una señal de interés y un componente de interferencia ha surgido como un requisito clave para su operación exitosa. Estos dispositivos realizan sus tareas en tiempo real basándose en los comandos recibidos, y su efectividad se ve limitada cuando hay mucho ruido ambiental en el área en la que operan. La mayoría de los algoritmos de mejora de voz en tiempo real no funcionan adecuadamente en presencia de grandes cantidades de ruido (es decir, una baja relación señal-ruido de entrada). En este manuscrito, proponemos un marco de mejora de voz para ayudar a estos algoritmos en situaciones cuando el nivel de ruido en la señal recibida es alto. El marco propuesto realiza supresión de ruido en el dominio de la frecuencia generando una aproximación de la transformada de Fourier de corto tiempo de las señales ruidosas, que luego es utilizada por los algoritmos de mejora de voz para recuperar la señal limpia subyacente. Esta aproximación se realiza utilizando el algoritmo propuesto de análisis de componentes principales por bloques (Block-PCA). Para ilustrar la eficacia del marco propuesto, presentamos una evaluación de rendimiento detallada bajo diferentes niveles y tipos de ruido, destacando la efectividad del marco propuesto. Además, el método propuesto puede ser utilizado junto con cualquier algoritmo de mejora de voz para mejorar su rendimiento en escenarios de ruido moderado a alto.
Descripción
Con el avance de la tecnología de interfaz humano-máquina basada en comunicación por voz en dispositivos de hogar inteligente, la capacidad de descomponer la señal de voz recibida en una señal de interés y un componente de interferencia ha surgido como un requisito clave para su operación exitosa. Estos dispositivos realizan sus tareas en tiempo real basándose en los comandos recibidos, y su efectividad se ve limitada cuando hay mucho ruido ambiental en el área en la que operan. La mayoría de los algoritmos de mejora de voz en tiempo real no funcionan adecuadamente en presencia de grandes cantidades de ruido (es decir, una baja relación señal-ruido de entrada). En este manuscrito, proponemos un marco de mejora de voz para ayudar a estos algoritmos en situaciones cuando el nivel de ruido en la señal recibida es alto. El marco propuesto realiza supresión de ruido en el dominio de la frecuencia generando una aproximación de la transformada de Fourier de corto tiempo de las señales ruidosas, que luego es utilizada por los algoritmos de mejora de voz para recuperar la señal limpia subyacente. Esta aproximación se realiza utilizando el algoritmo propuesto de análisis de componentes principales por bloques (Block-PCA). Para ilustrar la eficacia del marco propuesto, presentamos una evaluación de rendimiento detallada bajo diferentes niveles y tipos de ruido, destacando la efectividad del marco propuesto. Además, el método propuesto puede ser utilizado junto con cualquier algoritmo de mejora de voz para mejorar su rendimiento en escenarios de ruido moderado a alto.