stringtranslate.com

Оптимизация соотношения скорости и искажения

Оптимизация скорости-искажения ( RDO ) — это метод улучшения качества видео при сжатии видео . Название относится к оптимизации величины искажения (потери качества видео) по отношению к объему данных, необходимых для кодирования видео, скорости . Хотя она в основном используется видеокодерами, оптимизация скорости-искажения может использоваться для улучшения качества в любой ситуации кодирования (изображение, видео, аудио или иное), где необходимо принимать решения, которые одновременно влияют как на размер файла, так и на его качество.

Фон

Классический метод принятия решений о кодировании заключается в том, что видеокодер выбирает результат, который дает выходное изображение наивысшего качества. Однако у этого есть недостаток, заключающийся в том, что выбор, который он делает, может потребовать больше бит, давая при этом сравнительно небольшой выигрыш в качестве. Один из распространенных примеров этой проблемы — оценка движения [1] и, в частности, использование оценки движения с точностью до четверти пикселя . Добавление дополнительной точности к движению блока во время оценки движения может повысить качество, но в некоторых случаях это дополнительное качество не стоит дополнительных бит, необходимых для кодирования вектора движения с более высокой точностью.

Как это работает

Оптимизация скорости-искажения решает вышеупомянутую проблему, выступая в качестве метрики качества видео, измеряя как отклонение от исходного материала, так и стоимость бита для каждого возможного результата решения. Биты математически измеряются путем умножения стоимости бита на лагранжиан , значение, представляющее связь между стоимостью бита и качеством для определенного уровня качества. Отклонение от источника обычно измеряется как среднеквадратическая ошибка , чтобы максимизировать метрику качества видео PSNR .

Расчет стоимости бита усложняется энтропийными кодерами в современных видеокодеках, требующими, чтобы алгоритм оптимизации скорости-искажения передавал каждый блок видео, который должен быть протестирован, энтропийному кодеру для измерения его фактической стоимости бита. В кодеках MPEG полный процесс состоит из дискретного косинусного преобразования , за которым следует квантование и энтропийное кодирование. Из-за этого оптимизация скорости-искажения намного медленнее, чем большинство других метрик сопоставления блоков, таких как простая сумма абсолютных разностей (SAD) и сумма абсолютных преобразованных разностей (SATD). Таким образом, она обычно используется только для последних этапов процесса оценки движения , таких как выбор между различными типами разделов в H.264/AVC .

Список кодеров, поддерживающих RDO

Ссылки

  1. ^ Хоанг, Д.Т.; Лонг, П.М.; Виттер, Джеффри (август 1998 г.). «Оптимизация скорости и искажения для оценки движения при кодировании видео с низкой скоростью передачи данных» (PDF) . Труды IEEE по схемам и системам для видеотехнологий . 8 (4): 488–500. doi :10.1109/76.709413.Более короткая версия представлена ​​в Hoang, DT; Long, PM; Vitter, JS (март 1996 г.). "Оптимизация скорости-искажения для оценки движения при кодировании видео с низкой скоростью передачи данных". Цифровое сжатие видео: алгоритмы и технологии 1996 г. Том 2668. SPIE. стр. 18–27. doi :10.1117/12.235433.
  2. ^ «Ультра Видео Групп».