Оптимизация скорости-искажения ( RDO ) — это метод улучшения качества видео при сжатии видео . Название относится к оптимизации величины искажения (потери качества видео) по отношению к объему данных, необходимых для кодирования видео, скорости . Хотя она в основном используется видеокодерами, оптимизация скорости-искажения может использоваться для улучшения качества в любой ситуации кодирования (изображение, видео, аудио или иное), где необходимо принимать решения, которые одновременно влияют как на размер файла, так и на его качество.
Классический метод принятия решений о кодировании заключается в том, что видеокодер выбирает результат, который дает выходное изображение наивысшего качества. Однако у этого есть недостаток, заключающийся в том, что выбор, который он делает, может потребовать больше бит, давая при этом сравнительно небольшой выигрыш в качестве. Один из распространенных примеров этой проблемы — оценка движения [1] и, в частности, использование оценки движения с точностью до четверти пикселя . Добавление дополнительной точности к движению блока во время оценки движения может повысить качество, но в некоторых случаях это дополнительное качество не стоит дополнительных бит, необходимых для кодирования вектора движения с более высокой точностью.
Оптимизация скорости-искажения решает вышеупомянутую проблему, выступая в качестве метрики качества видео, измеряя как отклонение от исходного материала, так и стоимость бита для каждого возможного результата решения. Биты математически измеряются путем умножения стоимости бита на лагранжиан , значение, представляющее связь между стоимостью бита и качеством для определенного уровня качества. Отклонение от источника обычно измеряется как среднеквадратическая ошибка , чтобы максимизировать метрику качества видео PSNR .
Расчет стоимости бита усложняется энтропийными кодерами в современных видеокодеках, требующими, чтобы алгоритм оптимизации скорости-искажения передавал каждый блок видео, который должен быть протестирован, энтропийному кодеру для измерения его фактической стоимости бита. В кодеках MPEG полный процесс состоит из дискретного косинусного преобразования , за которым следует квантование и энтропийное кодирование. Из-за этого оптимизация скорости-искажения намного медленнее, чем большинство других метрик сопоставления блоков, таких как простая сумма абсолютных разностей (SAD) и сумма абсолютных преобразованных разностей (SATD). Таким образом, она обычно используется только для последних этапов процесса оценки движения , таких как выбор между различными типами разделов в H.264/AVC .