Rec. 709 , также известный как Rec.709 , BT.709 и ITU 709 , — стандарт, разработанный ITU-R для кодирования изображений и характеристик сигнала телевидения высокой четкости .
Самая последняя версия — BT.709-6, выпущенная в 2015 году. BT.709-6 определяет характеристики изображения как имеющие ( широкоэкранное ) соотношение сторон 16:9, 1080 активных строк на изображение, 1920 выборок на строку и квадратное соотношение сторон пикселя.
Первая версия стандарта была одобрена CCIR как Rec.709 в 1990 году (был также CCIR Rec. XA/11 MOD F [4] в 1989 году) с заявленной целью создания всемирного стандарта HDTV. ITU заменил CCIR в 1992 году и впоследствии выпустил BT.709-1 в ноябре 1993 года. [2] Эти ранние версии все еще оставляли много вопросов без ответа, и отсутствие консенсуса относительно всемирного стандарта HDTV было очевидным. Настолько, что некоторые ранние системы HDTV, такие как 1035i30 и 1152i25, все еще были частью стандарта вплоть до 2002 года в BT.709-5. [5]
Стандарт находится в свободном доступе на веб-сайте МСЭ, и этот документ следует использовать в качестве авторитетной ссылки. Основные положения изложены ниже.
Рекомендация ITU-R BT.709-6 определяет общий формат изображения (CIF), где характеристики изображения не зависят от частоты кадров. Изображение имеет размер 1920x1080 пикселей, общее количество пикселей составляет 2 073 600. [6]
Предыдущие версии BT.709 включали устаревшие системы, такие как системы HDTV 1035i30 и 1152i25. Теперь они устарели и заменены системой, определенной в 2015 ITU BT.709-6.
BT.709 предлагает более разнообразных частот кадров и схем сканирования, что наряду с разделением размера изображения и частоты кадров обеспечило гибкость BT.709, чтобы стать мировым стандартом для HDTV. Это позволяет производителям создавать единый телевизор или дисплей для всех рынков по всему миру.
BT.709-6 определяет следующие частоты кадров, где P обозначает прогрессивно-сканированный кадр , PsF обозначает прогрессивно-сегментированные кадры , а I обозначает чересстрочную развертку :
Согласно BT.709, камеры могут снимать как в прогрессивной, так и в чересстрочной форме. Видео, снятое в прогрессивном режиме, может быть записано, транслировано или передано в потоковом режиме как прогрессивное или как прогрессивный сегментированный кадр (PsF). Видео, снятое в чересстрочном режиме, должно распространяться как чересстрочное, если только процесс деинтерлейсинга не применяется в постобработке.
В случаях, когда прогрессивное захваченное изображение распространяется в режиме сегментированного кадра, частота сегмента/поля должна быть в два раза больше частоты кадров. Таким образом, 30/PsF имеет ту же частоту поля, что и 60/I.
Обратите внимание, что красный, синий и y G совпадают с основными цветами EBU Tech 3213 (PAL), в то время как x G находится на полпути между x G EBU Tech 3213 и x G SMPTE C (PAL и NTSC являются двумя типами BT.601-6 ). В охвате цветового пространства CIE 1931 цветовое пространство Rec. 709 (и производное цветовое пространство sRGB ) почти идентично Rec. 601 и охватывает 35,9%. [8] Оно также охватывает 33,24% CIE 1976 u'v' [9] [10] и 33,5% CIE 1931 xy. [10] Белая точка - это D 65 , как указано в 2° стандартном наблюдателе .
Rec. 709 определяет нелинейную OETF ( оптико-электрическую передаточную функцию ), которая известна как « гамма камеры » и которая описывает, как камера HDTV кодирует линейный свет сцены в нелинейное значение электрического сигнала. Rec. 709 не определяет EOTF ( электрооптическую передаточную функцию ) дисплея, которая описывает, как дисплеи HDTV должны преобразовывать нелинейный электрический сигнал в линейный отображаемый свет, что было сделано в ITU-R BT.1886 . Подробное описание параметров преобразования цвета из Rec. 709 в Rec. 2020 см . в ITU-R BT.2087.
Rec. 709 OETF выглядит следующим образом, близко к 1/1,9 – 1/2,0 чистой гамме: [11]
где
Rec. 709 OETF линейна в нижней части, а затем представляет собой степенную функцию с гаммой 0,45 для остальной части диапазона. Общая OETF приближается к чистой степенной функции с гаммой 0,50 – 0,53 (около 1/1,9 – 1/2,0). Использование любой чистой гаммы в качестве OETF невозможно, поскольку сжатие в нелинейные значения удалит множество непосредственно близких к черному теней, а бесконечное усиление (наклон) вблизи нуля сильно подчеркивает шум камеры. [14] Таким образом, был изобретен линейный сегмент, и гамма 0,45 использовалась для степенного сегмента. Старые ЭЛТ имели EOTF около 2,35 чистой гаммы [15] и, таким образом, соответствующая коррекция 709 OETF для получения линейного изображения EOTF (если предполагается сквозная гамма 1,2) была чистой гаммой 1,2 / 2,35 = 0,51 = 1/1,9608. Таким образом, компания Apple использовала его до появления устройств Display P3. [ необходима цитата ]
В типичной производственной практике функция кодирования источников изображения (OETF) настраивается таким образом, чтобы конечное изображение имело желаемый эстетический вид, как при просмотре на эталонном мониторе с гаммой 2,4 (согласно ITU-R BT.1886 ) в затемненной эталонной среде просмотра (согласно ITU-R Rec. BT.2035 это 10 люкс D 65 или D 93 в Японии). [16] [17] [18]
Rec. 709 inverse OETF описывает преобразование нелинейного значения электрического сигнала в линейную яркость сцены. Это выглядит следующим образом:
Дисплей EOTF HDTV (иногда называемый «гаммой дисплея»), не является обратной величиной OETF камеры. [19] EOTF не указан в Rec. 709. Он обсуждается в EBU Tech 3320 и указан в ITU-R BT.1886 как эквивалентная гамма 2,4, которая отклоняется от нее в черной области в зависимости от того, насколько глубок черный цвет. [20] [21] Это более высокая гамма, чем приблизительно гамма 2,0 Rec. 709 OETF. Результирующая сквозная системная гамма ( OOTF ) системы телевидения HD составляет около 1,2, и она была намеренно разработана для компенсации эффекта затемнения . [19]
Rec. 709 и sRGB имеют одинаковые основные цветности и цветность белой точки; однако sRGB явно выводится (отображается) с эквивалентной гаммой 2,2 ( фактическая функция также является кусочной, чтобы избежать проблем с почти черным). [22] Дисплей P3 использует sRGB EOTF с его линейным сегментом, необходимо изменить этот сегмент с 709 либо с помощью параметрического кодирования кривой ICC v4, либо с помощью ограничения наклона.
Rec. 709 определяет кодировку R'G'B' и кодировку Y'C B C R , каждая с 8 битами или 10 битами на выборку в каждом цветовом канале. В 8-битной кодировке каналы R' , B' , G' и Y' имеют номинальный диапазон [16..235], а каналы C B и C R имеют номинальный диапазон [16..240] с нейтральным значением 128. Таким образом, в ограниченном диапазоне R'G'B' эталонный черный цвет равен (16, 16, 16), а эталонный белый цвет равен (235, 235, 235), а в Y'C B C R эталонный черный цвет равен (16, 128, 128), а эталонный белый цвет равен (235, 128, 128). Значения за пределами номинальных диапазонов допускаются, но обычно они будут ограничены для вещания или отображения (за исключением Superwhite и xvYCC ). Значения 0 и 255 зарезервированы как опорные значения синхронизации (SAV и EAV) и могут не содержать данные о цвете (для 8 бит, для 10 бит зарезервировано больше значений , а для 12 бит еще больше, значения не зарезервированы в файлах или режиме RGB или цифровых режимах полного диапазона YCbCr, таких как sYCC или opYCC ). 10-битное кодирование Rec. 709 использует номинальные значения в четыре раза больше, чем 8-битное кодирование, для упрощения преобразования используется простое заполнение для опорных значений, например, 240 просто дополняется двумя конечными нулями и дает 960 для 10-битной максимальной цветности. [23] Номинальные диапазоны Rec. 709 такие же, как определенные в ITU Rec. 601 . [24]
Преобразование между различными стандартами частоты кадров видео и кодирования цвета всегда было проблемой для производителей контента, распространяющих его через регионы с разными стандартами и требованиями. Хотя BT.709 облегчил проблему совместимости с точки зрения потребителя и производителя телевизора, вещательные компании по-прежнему используют определенную частоту кадров в зависимости от региона, например 29,97 в Северной Америке или 25 в Европе, что означает, что для вещательного контента по-прежнему требуется как минимум преобразование частоты кадров.
Обширная устаревшая библиотека программ и контента стандартной четкости представляет дополнительные проблемы. NTSC , PAL и SECAM — все это чересстрочные форматы с соотношением сторон 4:3 и относительно низким разрешением. Масштабирование их до разрешения HD с соотношением сторон 16:9 представляет ряд проблем.
Во-первых, это потенциальные отвлекающие артефакты движения из-за чересстрочного видеоконтента. Решение состоит в том, чтобы либо преобразовать только в чересстрочный формат BT.709 с той же частотой полей и масштабировать поля независимо, либо использовать обработку движения для удаления межполевого движения и деинтерлейсинга , создавая прогрессивные кадры. В последнем случае обработка движения может вносить артефакты и может быть медленной в обработке.
Во-вторых, это проблема размещения соотношения сторон SD 4:3 в кадре HD 16:9. Обрезка верхней и/или нижней части кадра стандартной четкости может работать или не работать, в зависимости от того, позволяет ли это композиция и есть ли графика или титры, которые будут обрезаны. С другой стороны, столбчатый блок может показать все изображение 4:3, оставив черные границы слева и справа. Иногда этот черный цвет заполняется растянутой и размытой формой изображения.
Кроме того, основные цвета SMPTE C RGB, используемые в североамериканском стандартном разрешении, отличаются от основных цветов BT.709 (SMPTE C обычно называют NTSC, однако это другой набор основных цветов и другая белая точка, чем NTSC 1953 года [25] ). Основные цвета красного и синего для PAL и SECAM такие же, как в BT.709, с изменением основного цвета зеленого. Для точного преобразования изображения требуется LUT (таблица поиска) или рабочий процесс управления цветом для преобразования цветов в новое цветовое пространство. [26] Однако на практике это часто игнорируется, за исключением mpv, потому что даже если проигрыватель имеет управление цветом (большинство из них не имеют такого управления, включая VLC), он может видеть только основные цвета BT.709 или BT.2020.
При кодировании видео Y'C B C R , BT.709 создает гамма-кодированную яркость ( Y' ), используя матричные коэффициенты 0,2126, 0,7152 и 0,0722 (вместе они добавляются к 1). BT.709-1 использовал немного другие 0,2125, 0,7154, 0,0721 (измененные на стандартные в BT.709-2). Хотя всемирное соглашение о единой системе R'G'B' было достигнуто с помощью Rec. 709, принятие различных коэффициентов яркости (поскольку они выводятся из основных цветов и точки белого [27] ) для Y'C B C R требует использования различного декодирования яркости-цветности для стандартной четкости и высокой четкости. [28]
Эти проблемы можно решить с помощью программного обеспечения для обработки видео, которое может быть медленным, или аппаратных решений [29] , которые позволяют выполнять преобразование в реальном времени, часто с улучшением качества.
Более идеальным решением является возврат к оригинальным элементам фильма для проектов, которые изначально были сделаны на пленке. Из-за проблем с международным распространением многие телевизионные программы, снятые на пленку, использовали традиционный процесс негативного монтажа, а затем имели один мастер-пленку, который можно было телесинировать для разных форматов. Эти проекты могут повторно телесинировать свои вырезанные негативные мастера в мастер BT.709 по разумной цене и получить преимущество полного разрешения пленки.
С другой стороны, для проектов, которые изначально были на пленке, но завершили свой онлайн-мастер с использованием методов видео-онлайн, потребуется повторно телесинить отдельные необходимые дубли фильма и затем снова собрать, в этом случае требуется значительно большее количество труда и машинного времени, чем телесин для согласованного негатива. В этом случае, чтобы воспользоваться преимуществами оригинала пленки, повлекут за собой гораздо более высокие затраты на согласование оригиналов пленки с новым HD-мастером.
sRGB был создан после ранней разработки Rec.709. Создатели sRGB решили использовать те же основные цвета и белую точку, что и Rec.709, но изменили кривую тоновой характеристики (иногда называемую гаммой ), чтобы лучше соответствовать предполагаемому использованию в офисах и более ярким условиям, чем просмотр телевизора в темной гостиной. [ необходима цитата ]
-6
текущая версия; предыдущие версии были -1
до -5
.