logo móvil
Contáctanos

Marco de Mejora de Voz con Supresión de Ruido Usando Análisis de Componentes Principales por Bloques

Autores: Alsheibi, Abdullah Zaini; Valavanis, Kimon P.; Iqbal, Asif; Aman, Muhammad Naveed

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Artes

Subcategoría

Música

Palabras clave

Avance
Basado en comunicación por voz
Interfaz humano-máquina
Señal de voz
Supresión de ruido
Dominio de frecuencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
Con el avance de la tecnología de interfaz humano-máquina basada en comunicación por voz en dispositivos de hogar inteligente, la capacidad de descomponer la señal de voz recibida en una señal de interés y un componente de interferencia ha surgido como un requisito clave para su operación exitosa. Estos dispositivos realizan sus tareas en tiempo real basándose en los comandos recibidos, y su efectividad se ve limitada cuando hay mucho ruido ambiental en el área en la que operan. La mayoría de los algoritmos de mejora de voz en tiempo real no funcionan adecuadamente en presencia de grandes cantidades de ruido (es decir, una baja relación señal-ruido de entrada). En este manuscrito, proponemos un marco de mejora de voz para ayudar a estos algoritmos en situaciones cuando el nivel de ruido en la señal recibida es alto. El marco propuesto realiza supresión de ruido en el dominio de la frecuencia generando una aproximación de la transformada de Fourier de corto tiempo de las señales ruidosas, que luego es utilizada por los algoritmos de mejora de voz para recuperar la señal limpia subyacente. Esta aproximación se realiza utilizando el algoritmo propuesto de análisis de componentes principales por bloques (Block-PCA). Para ilustrar la eficacia del marco propuesto, presentamos una evaluación de rendimiento detallada bajo diferentes niveles y tipos de ruido, destacando la efectividad del marco propuesto. Además, el método propuesto puede ser utilizado junto con cualquier algoritmo de mejora de voz para mejorar su rendimiento en escenarios de ruido moderado a alto.

Documentos Relacionados

Temas Virtualpro