Подвыборка цветности

Подвыборка цветности — это практика кодирования изображений путем реализации меньшего разрешения для информации о цветности , чем для информации о яркости , с использованием преимущества более низкой остроты зрительной системы человека для определения цветовых различий, чем для яркости. ^[1]

Он используется во многих схемах кодирования видео и неподвижных изображений – как аналоговых, так и цифровых – в том числе в кодировании JPEG .

Обоснование

На этом изображении в полном размере показана разница между четырьмя схемами подвыборки. Обратите внимание, насколько похожи цветные изображения. Нижний ряд показывает разрешение цветовой информации.

Цифровые сигналы часто сжимаются, чтобы уменьшить размер файла и сэкономить время передачи. Поскольку зрительная система человека гораздо более чувствительна к изменениям яркости, чем к цвету, видеосистему можно оптимизировать, выделяя большую полосу пропускания компоненту яркости (обычно обозначаемому Y'), чем компонентам цветового различия Cb и Cr . Например, в сжатых изображениях схема 4:2:2 Y’CbCr требует две трети полосы пропускания без субдискретизации «4:4:4» R’G’B’ . ^[a] Такое уменьшение практически не приводит к визуальному различию, воспринимаемому зрителем.

Как работает субдискретизация

Система человеческого зрения (HVS) обрабатывает информацию о цвете, то есть оттенок и красочность , примерно на трети разрешения яркости , то есть информацию о светлости/темноте изображения. Таким образом, можно получить информацию о цвете с более низким разрешением, сохраняя при этом хорошее качество изображения.

Это достигается путем кодирования данных изображения RGB в составное черно-белое изображение с разделенными данными цветового различия ( цветностью ). Например , компоненты с гамма-кодированием взвешиваются, а затем суммируются для создания компонента яркости . Компоненты цветового различия создаются путем вычитания двух взвешенных компонентов из третьего. Для ограничения разрешения можно использовать различные методы фильтрации . $Y'C_{b}C_{r}$ $R'G'B'$ $Y'$ $R'G'B'$

Что касается гаммы и передаточных функций

Яркость с гамма-кодированием не следует путать с линейной яркостью . Наличие гамма-кодирования обозначается штрихом . В очень ранних видеосистемах гамма-коррекция была необходима из-за нелинейного отклика электронно-лучевой трубки (ЭЛТ). $Y'$ $Y$ $'$

Хотя ЭЛТ больше не используются широко, гамма-кривые или электрооптические кривые передачи (EOTF) по-прежнему очень полезны из-за нелинейной реакции человеческого зрения. Использование гаммы улучшает воспринимаемое соотношение сигнал-шум в аналоговых системах и позволяет более эффективно кодировать данные в цифровых системах. В этом кодировании используется больше уровней для более темных цветов, чем для более светлых, что соответствует чувствительности человеческого зрения. ^[2]

Системы отбора проб и коэффициенты

Схема подвыборки обычно выражается соотношением трех частей J : a : b (например, 4:2:2) или четырьмя частями, если присутствует альфа-канал (например, 4:2:2:4), которые описывают количество образцы яркости и цветности в концептуальной области шириной J пикселей и высотой 2 пикселя. Части (в соответствующем порядке):

J : эталон горизонтальной выборки (ширина концептуальной области). Обычно 4.
a : количество выборок цветности ( Cr , Cb ) в первой строке J пикселей.
b : количество изменений выборок цветности ( Cr , Cb ) между первой и второй строкой J пикселей. b должно быть либо нулевым, либо равным a (за исключением редких нерегулярных случаев, таких как 4:4:1 и 4:2:1, которые не соответствуют этому соглашению).
Альфа : горизонтальный коэффициент (относительно первой цифры). Может быть опущен, если альфа-компонент отсутствует, и равен J , если он присутствует.

Это обозначение допустимо не для всех комбинаций и имеет исключения, например 4:1:0 (где высота области составляет не 2 пикселя, а 4 пикселя, поэтому, если используется 8 бит на компонент, медиа-файл будет иметь 9 бит на каждый компонент). пиксель) и 4:2:1.

Приведенные примеры картирования являются лишь теоретическими и иллюстративными. Также на диаграмме не указана какая-либо фильтрация цветности, которую следует применять во избежание псевдонимов . Чтобы рассчитать требуемый коэффициент пропускной способности относительно 4:4:4 (или 4:4:4:4), необходимо просуммировать все коэффициенты и разделить результат на 12 (или 16, если присутствует альфа).

Виды выборки и подвыборки

4:4:4

Каждый из трех компонентов Y'CbCr имеет одинаковую частоту дискретизации, поэтому субдискретизация цветности отсутствует. Эта схема иногда используется в высококачественных пленочных сканерах и при постобработке кинематографических изображений.

Вместо этого «4:4:4» может ошибочно относиться к цветовому пространству R'G'B' , которое неявно также не имеет какой-либо субдискретизации цветности (за исключением JPEG, R'G'B' может быть субдискретизированной). Такие форматы, как HDCAM SR, могут записывать 4:4:4 R’G’B’ через двухканальный HD-SDI .

4:2:2

Два компонента цветности дискретизируются с половиной частоты горизонтальной выборки яркости: разрешение цветности по горизонтали уменьшается вдвое. Это уменьшает полосу пропускания несжатого видеосигнала на треть, а значит для 8 бит на компонент без альфы (24 бита на пиксель) достаточно всего 16 бит, как в NV16.

Многие форматы и интерфейсы цифрового видео высокого класса используют эту схему:

4:1:1

При субдискретизации цветности 4:1:1 горизонтальное цветовое разрешение уменьшается вчетверо, а полоса пропускания уменьшается вдвое по сравнению с отсутствием субдискретизации цветности. Первоначально субдискретизация цветности 4:1:1 формата DV не считалась вещательным качеством и была приемлема только для недорогих и потребительских приложений. ^[3]^[4] Однако форматы на основе DV (некоторые из которых используют субдискретизацию цветности 4:1:1) профессионально используются при сборе электронных новостей и на серверах воспроизведения. DV также время от времени используется в художественных фильмах и в цифровой кинематографии .

В системе 480i «NTSC», если яркость дискретизируется на частоте 13,5 МГц, это означает, что каждый из сигналов Cr и Cb будет дискретизироваться на частоте 3,375 МГц, что соответствует максимальной полосе пропускания Найквиста 1,6875 МГц, тогда как традиционные «высокочастотные» сигналы аналоговый кодер конечного вещания NTSC » будет иметь полосу Найквиста 1,5 МГц и 0,5 МГц для каналов I/Q . Однако в большинстве устройств, особенно в дешевых телевизорах и видеомагнитофонах VHS / Betamax , каналы цветности имеют полосу пропускания только 0,5 МГц как для Cr , так и для Cb (или, что эквивалентно, для I/Q). Таким образом, система DV фактически обеспечивает превосходную цветовую полосу пропускания по сравнению с лучшими композитными аналоговыми спецификациями для NTSC, несмотря на то, что она составляет лишь 1/4 полосы пропускания цветности «полного» цифрового сигнала.

Форматы, в которых используется субдискретизация цветности 4:1:1, включают:

DVCPRO /D-7 ( NTSC и PAL )
480i «NTSC» DV и DVCAM

4:2:0

В 4:2:0 горизонтальная дискретизация удваивается по сравнению с 4:1:1, но поскольку в этой схеме каналы Cb и Cr дискретизируются только на каждой чередующейся строке, вертикальное разрешение уменьшается вдвое. Таким образом, скорость передачи данных одинакова. Это достаточно хорошо согласуется с системой кодирования цвета PAL , поскольку ее разрешение цветности по вертикали составляет лишь половину от NTSC . Он также очень хорошо сочетается с системой кодирования цвета SECAM , поскольку, как и в этом формате, 4:2:0 сохраняет и передает только один цветовой канал в каждой строке (другой канал восстанавливается из предыдущей строки). Однако на самом деле было произведено мало оборудования, которое выводит аналоговый видеосигнал SECAM. Как правило, на территориях SECAM необходимо использовать либо дисплей с поддержкой PAL, либо транскодер для преобразования сигнала PAL в SECAM для отображения.

Различные варианты конфигураций цветности 4:2:0 можно найти в:

Все стандарты видеокодирования ISO / IEC MPEG и ITU-T VCEG H.26x, включая реализации H.262/MPEG-2 Part 2 (хотя некоторые профили MPEG-4 Part 2 и H.264/MPEG-4 AVC допускают более высокое качество схемы выборки, такие как 4:4:4)
Диски DVD-Video и Blu-ray . ^[5]^[6]
576i «ПАЛ» DV и DVCAM
HDV
AVCHD и AVC-Интра 50
Промежуточный кодек Apple
Наиболее распространенные реализации JPEG/JFIF и MJPEG.
ВК-1
ВебП
YJK , ^[7]^[8]^[9] собственное цветовое пространство , реализованное графическим чипом Yamaha V9958 ^[10]^[11]^[12] на компьютерах MSX2+ . ^[13]^[14]

Cb и Cr подвергаются субвыборке с коэффициентом 2 как по горизонтали, так и по вертикали. Большинство цифровых видеоформатов, соответствующих 576i «PAL», используют субдискретизацию цветности 4:2:0.

Выборочные позиции

Существует четыре основных варианта схем 4:2:0, имеющих разное расположение выборки по горизонтали и вертикали относительно «квадрата» 2×2 исходного входного размера. ^[15]

В MPEG-2, MPEG-4 и AVC Cb и Cr берутся в средней точке левого края квадрата 2×2. Другими словами, они имеют то же горизонтальное расположение, что и верхний левый пиксель, но смещены на половину пикселя вниз по вертикали. Также называется «левым». ^[16]
В форматах JPEG/JFIF, H.261 и MPEG-1 Cb и Cr располагаются в центре квадрата 2×2. Другими словами, они смещены на полпикселя вправо и на полпикселя вниз по сравнению с верхним левым пикселем. Также называется «центр». ^[16]
В HEVC для контента BT.2020 и BT.2100 (в частности, на Blu-ray), Cb и Cr выбираются в том же месте, что и верхний левый пиксель Y группы («совместно размещенный», «совмещенный»). . Также называется «верхним левым». Аналогичная совмещенная выборка используется в MPEG-2 4:2:2. ^[16]
В формате 4:2:0 PAL-DV (IEC 61834-2) Cb отбирается в том же месте, что и верхний левый пиксель Y группы, а Cr отбирается на один пиксель ниже. ^[17] В ffmpeg его также называют «верхним левым». ^[16]

Чересстрочный и прогрессивный

Для чересстрочного материала субдискретизация цветности 4:2:0 может привести к артефактам движения, если она реализована так же, как и для прогрессивного материала. Выборки яркости получаются из отдельных временных интервалов, тогда как выборки цветности будут получены из обоих временных интервалов. Именно эта разница может привести к артефактам движения. Стандарт MPEG-2 допускает альтернативную схему чересстрочной выборки, где 4:2:0 применяется к каждому полю (а не к обоим полям одновременно). Это решает проблему артефактов движения, уменьшает разрешение цветности по вертикали вдвое и может привести к появлению в изображении гребнеобразных артефактов.

Оригинал. На этом изображении показано одно поле. К движущемуся тексту применено размытие в движении.

Прогрессивная выборка 4:2:0 применяется к движущемуся чересстрочному материалу. Цветность ведет и следует за движущимся текстом. На этом изображении показано одно поле.

Чересстрочная выборка 4:2:0 применяется к движущемуся чересстрочному материалу. На этом изображении показано одно поле.

Однако в чересстрочной схеме 4:2:0 вертикальное разрешение цветности уменьшается примерно вдвое, поскольку образцы цветности эффективно описывают область шириной 2 образца и высотой 4 образца вместо 2×2. Кроме того, пространственное смещение между обоими полями может привести к появлению гребенчатых артефактов цветности.

Исходное неподвижное изображение.

Прогрессивная дискретизация 4:2:0 применяется к неподвижному изображению. Оба поля показаны.

Чересстрочная выборка 4:2:0 применяется к неподвижному изображению. Оба поля показаны.

Если чересстрочный материал необходимо деинтерлейсить, гребенчатые артефакты цветности (из чересстрочной выборки 4:2:0) можно удалить путем размытия цветности по вертикали. ^[18]

4:1:0

Такое соотношение возможно, и некоторые кодеки его поддерживают, но оно не получило широкого распространения. В этом соотношении используется половина разрешения цвета по вертикали и одна четверть разрешения цвета по горизонтали, при этом используется лишь одна восьмая полосы пропускания от максимального используемого разрешения цвета. Несжатое видео в этом формате с 8-битным квантованием использует 10 байт на каждый макропиксель (что составляет 4×2 пикселя) или 10 бит на каждый пиксель. Он имеет полосу цветности, эквивалентную сигналу PAL-I или PAL-M, декодированному с помощью декодера линии задержки, и при этом значительно превосходит NTSC.

3:1:1

Используется Sony в рекордерах HDCAM High Definition (не HDCAM SR). В горизонтальном измерении яркость дискретизируется по горизонтали с частотой три четверти частоты дискретизации Full HD — 1440 выборок на строку вместо 1920. Цветность дискретизируется с частотой 480 выборок на строку, что составляет треть частоты дискретизации яркости. В вертикальном измерении яркость и цветность дискретизируются с частотой дискретизации Full HD (1080 выборок по вертикали).

Различные ставки Cb и Cr

Ряд устаревших схем допускают разные коэффициенты субдискретизации в Cb и Cr, аналогично тому, как разная полоса пропускания выделяется для двух значений цветности в системах вещания, таких как CCIR System M. Эти схемы не выражаются в обозначениях J:a:b . Вместо этого они используют обозначение Y:Cb:Cr , где каждая часть описывает степень разрешения соответствующего компонента. Неизвестно, происходит ли уменьшение разрешения в горизонтальном или вертикальном направлении.

В JPEG разрешение 4:4:2 и 4:2:1 по вертикали вдвое меньше, чем у Cb по сравнению с 4:4:4 и 4:4:0. ^[19]
В другой версии4:2:1 , горизонтальное разрешение Cb вдвое меньше, чем у Cr (и четверть горизонтального разрешения Y ).
4:1:0,5 или 4:1:0,25 — это варианты 4:1:0 с уменьшенным разрешением по горизонтали на Cb, аналогично качеству VHS.

Артефакты

Обратите внимание на просветление возле границ.

Подвыборка цветности страдает от двух основных типов артефактов, приводящих к более заметному ухудшению, чем предполагалось, при резком изменении цветов.

Ошибка гамма-яркости

Сигналы с гамма-коррекцией, такие как Y'CbCr, имеют проблему, заключающуюся в том, что ошибки цветности «просачиваются» в яркость. В этих сигналах низкая цветность фактически делает цвет менее ярким, чем цвет с эквивалентной яркостью. В результате, когда насыщенный цвет смешивается с ненасыщенным или дополнительным цветом, на границе происходит потеря яркости. Это можно увидеть на примере пурпурного и зеленого. ^[20] Эта проблема сохраняется в HDR-видео, где гамма обобщается в передаточную функцию « EOTF ». Более крутая EOTF показывает более сильную потерю яркости. ^[21]

Некоторые предлагаемые исправления этой проблемы:

Средневзвешенное по яркости (Корнельский, эксперимент для mozjpeg) ^[22]
Итеративный метод точного YUV , используемый WebP и, опционально, AVIF . Sharp YUV предполагает билинейное масштабирование цветности. ^[23]
Подвыборка RGB в линейном пространстве перед субдискретизацией цветности (HDRTools) ^[21]
Итеративная или закрытая коррекция яркости для минимизации ошибки яркости (HDRTools) ^[24]

Рек. 2020 определяет «постоянную яркость» Yc'CbcCrc, которая рассчитывается на основе линейных компонентов RGB, а затем кодируется гамма-излучением. Эта версия не страдает от потери яркости по своей конструкции. ^[25]

Отсечение гаммы

Еще один артефакт, который может возникнуть при субдискретизации цветности, заключается в том, что при восстановлении цветности могут возникать цвета, выходящие за пределы гаммы . Предположим, что изображение состоит из чередующихся красных и черных линий размером 1 пиксель, а при субдискретизации не учитывается цветность черных пикселей. Цветность красных пикселей будет реконструирована в черных пикселях, в результате чего новые пиксели будут иметь положительные значения красного и отрицательные значения зеленого и синего. Поскольку дисплеи не могут выводить отрицательный свет (отрицательного света не существует), эти отрицательные значения будут фактически обрезаны, и результирующее значение яркости будет слишком высоким. Другие фильтры субдискретизации (особенно «ящик» усреднения) имеют аналогичную проблему, из которой сложнее сделать простой пример. Подобные артефакты возникают в менее искусственном примере градации вблизи довольно резкой границы красного/черного. ^[20]

Декодер может иметь дело с цветами, выходящими за пределы гаммы, учитывая, сколько цветности может содержать данное значение яркости, и соответственно распределять его в промежуточное значение 4: 4: 4, что Гленн Чен назвал «реконструкцией цветности в диапазоне». . Метод «пропорции» по духу подобен средневзвешенному по яркости Корнельскому, тогда как метод «разлива» напоминает диффузию ошибок . ^[20] Улучшение реконструкции цветности остается активной областью исследований. ^[26]

Терминология

Термин Y'UV относится к схеме аналогового ТВ-кодирования (Рекомендация МСЭ-R BT.470), а Y'CbCr относится к схеме цифрового кодирования. ^[2] Единственное различие между ними заключается в том, что масштабные коэффициенты компонентов цветности (U, V, Cb и Cr) различны. Однако термин YUV часто ошибочно используется для обозначения кодировки Y'CbCr. Следовательно, выражения типа «4:2:2 YUV» всегда относятся к 4:2:2 Y'CbCr, поскольку в аналоговом кодировании (например, YUV) просто не существует такой вещи, как 4:x:x. Форматы пикселей, используемые в Y'CbCr, также могут называться YUV, например yuv420p, yuvj420p и многие другие.

Аналогичным образом, термин «яркость» и символ Y часто ошибочно используются для обозначения яркости, которая обозначается символом Y'. Яркость (Y') видеотехники отличается от яркости (Y) науки о цвете (согласно определению CIE ). Яркость формируется как взвешенная сумма гамма-скорректированных (трехцветных) компонентов RGB. Яркость формируется как взвешенная сумма линейных (трехцветных) компонент RGB. На практике символ CIE Y часто неправильно используется для обозначения яркости. В 1993 году SMPTE приняла Техническое руководство EG 28, разъясняющее эти два термина. Символ штриха ' используется для обозначения гамма-коррекции. ^[27]

Точно так же цветность в видеотехнике отличается от цветности в науке о цвете. Цветность видеотехники формируется из взвешенных трехцветных компонентов (с гамма-коррекцией, OETF), а не из линейных компонентов. В практике видеоинженерии термины «цветность» , «цветность » и «насыщенность» часто используются как взаимозаменяемые для обозначения цветности, но, как сказано в Рекомендации ITU-T Rec H.273, это не является хорошей практикой. ^[28]

История

Поддискретизация цветности была разработана в 1950-х годах Альдой Бедфорд для разработки цветного телевидения компанией RCA , которое превратилось в стандарт NTSC ; Разделение яркости и цветности было разработано ранее, в 1938 году Жоржем Валенси . Благодаря исследованиям ^{[ каким? ]} он показал, что человеческий глаз имеет высокое разрешение только для черного и белого цветов, несколько меньшее для цветов «среднего диапазона», таких как желтый и зеленый, и гораздо меньшее для цветов на конце спектра, красного и синего. ^{[ необходимы разъяснения ]} знания позволили RCA разработать систему, в которой они отбрасывают большую часть синего сигнала после того, как он поступает от камеры, сохраняя большую часть зеленого и только часть красного; это субдискретизация цветности в цветовом пространстве YIQ , которая примерно аналогична субдискретизации 4:2:1, поскольку она имеет уменьшающееся разрешение для яркости, желтого/зеленого и красного/синего.

Смотрите также

Цвет
Цветовое пространство
Цветовое зрение
- Стержневая клетка
- Конусная ячейка
Цифровое видео
Телевидение высокой четкости
Множественное кодирование выборки суб-Найквиста
Рек. 601 4:2:2 СДТВ
SMPTE – Общество инженеров кино и телевидения
YCbCr
ЮЖК
ЮПбПр
ЮВ

Внешние ссылки

Выборка цветности: исследование