Resolución de ejecución de fracciones utilizando un esquema de codificación híbrido multi-CPU/GPU
Autores: Papaioannou, Georgios I.; Koziri, Maria; Loukopoulos, Thanasis; Anagnostopoulos, Ioannis
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Resolución de ejecución de fracciones utilizando un esquema de codificación híbrido multi-CPU/GPUCategoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
Los estándares modernos de codificación de video hacen uso de la estimación de movimiento de subpíxeles para mejorar la calidad del video y reducir la tasa de bits. Se sabe que la parte de estimación de movimiento fraccional (FME) sigue a la estimación de movimiento entero (IME) y agrega una sobrecarga computacional adicional debido a la interpolación y las búsquedas de movimiento adicionales. En este documento, proponemos un algoritmo de resolución de ejecución fraccional (FER) que permite al codificador omitir la parte fraccional cuando se cumplen criterios específicos al introducir un punto de decisión de prueba rápida preliminar (pFTDP) para la parte de IME. Si el pFTDP devuelve cero vectores de movimiento (MVs) y el centro del área de búsqueda de desplazamiento también es cero, entonces se omite la parte fraccional. El tomador de decisiones pFTDP se ejecuta solo una vez, cuando se encuentra por primera vez un bloque de 2N x 2N, mientras que todos los bloques subsiguientes siguen esta decisión inicial ya sea recibiendo los MVs necesarios y RD de la función pFTDP o utilizando los valores IME precalculados del kernel de GPU. Para nuestros experimentos, utilizamos un entorno de CPU multinúcleo que también hace uso de GPU solo para la parte entera. Nuestras evaluaciones proporcionan un ahorro de tiempo de codificación superior al 1600% en su punto máximo en comparación con el modo secuencial HEVC predeterminado e idealmente un ahorro de más del 2286% para secuencias de cuadros de video estáticos. La aceleración promedio total para las secuencias de video de Clase A y Clase B es de x13.45. La ganancia del FER en sí misma es de más de x3.9 en comparación con el mismo entorno de configuración multinúcleo. La sobrecarga de PSNR y tasa de bits observada es proporcional al esquema de entrelazado utilizado y está más relacionada con la forma en que funciona internamente CABAC. Los efectos negativos del FER en la eficiencia de codificación se demuestran ser despreciables. Se muestra que un equilibrio entre velocidad y calidad se logra utilizando un patrón de entrelazado más bajo para minimizar los efectos negativos del patrón de esquema de codificación. Los resultados experimentales confirman la validez de nuestra motivación, es decir, que podemos beneficiarnos de un resolvedor de ejecución de fracciones de software sin costos adicionales de hardware. La ganancia se incrementa aún más cuando las secuencias de video tienen más bloques estáticos que otros.
Descripción
Los estándares modernos de codificación de video hacen uso de la estimación de movimiento de subpíxeles para mejorar la calidad del video y reducir la tasa de bits. Se sabe que la parte de estimación de movimiento fraccional (FME) sigue a la estimación de movimiento entero (IME) y agrega una sobrecarga computacional adicional debido a la interpolación y las búsquedas de movimiento adicionales. En este documento, proponemos un algoritmo de resolución de ejecución fraccional (FER) que permite al codificador omitir la parte fraccional cuando se cumplen criterios específicos al introducir un punto de decisión de prueba rápida preliminar (pFTDP) para la parte de IME. Si el pFTDP devuelve cero vectores de movimiento (MVs) y el centro del área de búsqueda de desplazamiento también es cero, entonces se omite la parte fraccional. El tomador de decisiones pFTDP se ejecuta solo una vez, cuando se encuentra por primera vez un bloque de 2N x 2N, mientras que todos los bloques subsiguientes siguen esta decisión inicial ya sea recibiendo los MVs necesarios y RD de la función pFTDP o utilizando los valores IME precalculados del kernel de GPU. Para nuestros experimentos, utilizamos un entorno de CPU multinúcleo que también hace uso de GPU solo para la parte entera. Nuestras evaluaciones proporcionan un ahorro de tiempo de codificación superior al 1600% en su punto máximo en comparación con el modo secuencial HEVC predeterminado e idealmente un ahorro de más del 2286% para secuencias de cuadros de video estáticos. La aceleración promedio total para las secuencias de video de Clase A y Clase B es de x13.45. La ganancia del FER en sí misma es de más de x3.9 en comparación con el mismo entorno de configuración multinúcleo. La sobrecarga de PSNR y tasa de bits observada es proporcional al esquema de entrelazado utilizado y está más relacionada con la forma en que funciona internamente CABAC. Los efectos negativos del FER en la eficiencia de codificación se demuestran ser despreciables. Se muestra que un equilibrio entre velocidad y calidad se logra utilizando un patrón de entrelazado más bajo para minimizar los efectos negativos del patrón de esquema de codificación. Los resultados experimentales confirman la validez de nuestra motivación, es decir, que podemos beneficiarnos de un resolvedor de ejecución de fracciones de software sin costos adicionales de hardware. La ganancia se incrementa aún más cuando las secuencias de video tienen más bloques estáticos que otros.