En los últimos años, la globalización económica es la tendencia, y la comunicación entre países es cada vez más estrecha; cada vez más personas empiezan a prestar atención al aprendizaje del inglés hablado. El desarrollo del aprendizaje de idiomas asistido por ordenador hace que sea más cómodo para la gente aprender inglés hablado; sin embargo, la detección y corrección de la pronunciación incorrecta del inglés, que es su núcleo, son todavía inadecuadas. En este artículo, proponemos un modelo multimodal de detección y corrección de errores de pronunciación en inglés basado en audio y vídeo, que no requiere la alineación forzada de fonemas de la señal de vídeo de pronunciación en inglés para ser procesada, y utiliza características ricas de audio y vídeo para la detección de errores de pronunciación en inglés, lo que mejora la precisión de la detección de errores en gran medida, especialmente en entornos ruidosos. Para subsanar las deficiencias del algoritmo actual de extracción de características labiales, que es demasiado complicado y no tiene suficiente capacidad de caracterización, se propone un esquema de extracción de características basado en el ángulo de apertura y cierre de los labios. Los fotogramas de las sílabas labiales se obtienen mediante la división de fotogramas de vídeo, las sílabas se desenotizan, la información de los puntos clave de los labios se obtiene mediante un algoritmo de árbol de regresión basado en la mejora del gradiente, los efectos de la inclinación y el movimiento del hablante se eliminan mediante la normalización de la escala y, por último, los ángulos de apertura y cierre de los labios se calculan mediante geometría matemática y los valores de las características labiales se generan combinando los cambios de ángulo.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Desarrollo y validación de un algoritmo de detección y clasificación de picos dirigido a la implementación en dispositivos de hardware
Artículo:
Redes convolucionales gráficas híbridas de bajo y alto orden
Artículo:
Influencia del modelo de acoplamiento del campo eléctrico en las prestaciones simuladas de un nanodispositivo planar basado en GaN
Artículo:
Óxido de manganeso nanocristalino y óxido de níquel-manganeso sintetizados por electrodeposición para condensadores electroquímicos
Artículo:
Indicación de la salud mental a partir de las ondas de pulso dactilar y su aplicación
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Manual:
Química de los taninos
Artículo:
Nuevas necesidades cosméticas : tendencias y productos específicos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.