logo móvil

Resolución de ejecución de fracciones utilizando un esquema de codificación híbrido multi-CPU/GPU

Autores: Papaioannou, Georgios I.; Koziri, Maria; Loukopoulos, Thanasis; Anagnostopoulos, Ioannis

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ingeniería y Tecnología

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 16

Citaciones: Sin citaciones


Descripción
Los estándares modernos de codificación de video hacen uso de la estimación de movimiento de subpíxeles para mejorar la calidad del video y reducir la tasa de bits. Se sabe que la parte de estimación de movimiento fraccional (FME) sigue a la estimación de movimiento entero (IME) y agrega una sobrecarga computacional adicional debido a la interpolación y las búsquedas de movimiento adicionales. En este documento, proponemos un algoritmo de resolución de ejecución fraccional (FER) que permite al codificador omitir la parte fraccional cuando se cumplen criterios específicos al introducir un punto de decisión de prueba rápida preliminar (pFTDP) para la parte de IME. Si el pFTDP devuelve cero vectores de movimiento (MVs) y el centro del área de búsqueda de desplazamiento también es cero, entonces se omite la parte fraccional. El tomador de decisiones pFTDP se ejecuta solo una vez, cuando se encuentra por primera vez un bloque de 2N x 2N, mientras que todos los bloques subsiguientes siguen esta decisión inicial ya sea recibiendo los MVs necesarios y RD de la función pFTDP o utilizando los valores IME precalculados del kernel de GPU. Para nuestros experimentos, utilizamos un entorno de CPU multinúcleo que también hace uso de GPU solo para la parte entera. Nuestras evaluaciones proporcionan un ahorro de tiempo de codificación superior al 1600% en su punto máximo en comparación con el modo secuencial HEVC predeterminado e idealmente un ahorro de más del 2286% para secuencias de cuadros de video estáticos. La aceleración promedio total para las secuencias de video de Clase A y Clase B es de x13.45. La ganancia del FER en sí misma es de más de x3.9 en comparación con el mismo entorno de configuración multinúcleo. La sobrecarga de PSNR y tasa de bits observada es proporcional al esquema de entrelazado utilizado y está más relacionada con la forma en que funciona internamente CABAC. Los efectos negativos del FER en la eficiencia de codificación se demuestran ser despreciables. Se muestra que un equilibrio entre velocidad y calidad se logra utilizando un patrón de entrelazado más bajo para minimizar los efectos negativos del patrón de esquema de codificación. Los resultados experimentales confirman la validez de nuestra motivación, es decir, que podemos beneficiarnos de un resolvedor de ejecución de fracciones de software sin costos adicionales de hardware. La ganancia se incrementa aún más cuando las secuencias de video tienen más bloques estáticos que otros.

Documentos Relacionados

Temas Virtualpro