stringtranslate.com

Долби Диджитал Плюс

Dolby Digital Plus , также известный как Enhanced AC-3 (и обычно сокращенно DDP , DD+ , E-AC-3 или EC-3 ), представляет собой схему сжатия цифрового звука , разработанную Dolby Labs для транспортировки и хранения многоканального цифрового звука. Он является преемником Dolby Digital (AC-3) и имеет ряд улучшений по сравнению с этим кодеком, включая поддержку более широкого диапазона скоростей передачи данных (от 32 кбит/с до 6144 кбит/с), увеличенное количество каналов и поддержку нескольких программ (через подпотоки), а также дополнительные инструменты (алгоритмы) для представления сжатых данных и противодействия артефактам. В то время как Dolby Digital (AC-3) поддерживает до пяти аудиоканалов с полной полосой пропускания при максимальном битрейте 640 кбит/с, E-AC-3 поддерживает до 15 аудиоканалов с полной полосой пропускания при максимальном битрейте 6,144  Мбит/с .

Полный набор технических спецификаций для E-AC-3 (и AC-3) стандартизирован и опубликован в Приложении E ATSC A/52:2012, [1] , а также в Приложении E ETSI TS 102 366. [2]

Технические подробности

Технические характеристики

Dolby Digital Plus способен на следующее:

Структура

Услуга Dolby Digital Plus состоит из одного или нескольких подпотоков . Существует три типа подпотоков:

Все потоки DD+ должны содержать по крайней мере один независимый подпоток или устаревший подпоток, который содержит первые (или единственные) каналы 5.1 основной аудиопрограммы. Дополнительные независимые подпотоки могут использоваться для вторичных аудиопрограмм, таких как звуковые дорожки на иностранных языках, комментарии или описания/закадровые озвучки для людей с нарушениями зрения. Зависимые подпотоки могут быть предоставлены для программ, которые имеют дополнительные каналы звуковой сцены за пределами 5.1.

В каждом подпотоке предусмотрено кодирование пяти каналов полной полосы пропускания, одного низкочастотного канала и одного канала сопряжения. Канал сопряжения используется для средне-высокочастотной информации, которая является общей для нескольких каналов полной полосы пропускания. Его содержимое смешивается с другими каналами способом, предписанным метаданными, он не воспроизводится как дискретный канал декодером.

Dolby Digital Plus включает в себя комплексные метаданные битового потока для управления декодером выходной громкостью (через dialnorm), понижающим микшированием и обратимым управлением динамическим диапазоном (через DRC).

Синтаксис

Dolby Digital Plus номинально является 16-битным выровненным протоколом, хотя очень немногие поля в синтаксисе соблюдают границы байтов или слов. Поскольку многие элементы синтаксиса являются необязательными или имеют переменную длину, включая некоторые, наличие или длина которых зависят от сложных предшествующих вычислений, и в синтаксисе мало избыточности, DD+ может быть чрезвычайно трудно правильно разобрать, синтаксически верными, но неверными разборами, которые легко производятся дефектными кодерами.

Поток DD+ представляет собой набор пакетов синхрокадров фиксированной длины , каждый из которых соответствует 256, 512, 768 или 1536 последовательным аудиосэмплам во временной области. (Случай с 1536 сэмплами является наиболее распространенным случаем и соответствует Dolby Digital; более короткие длины подкадров предназначены для использования в интерактивных приложениях, таких как видеоигры, где сокращение задержки кодировщика является важной проблемой). Каждый синхрокадр декодируется независимо и принадлежит определенному подпотоку в рамках сервиса. Синхрокадр состоит из следующих элементов синтаксиса (некоторые из которых могут быть опущены, когда сервис Dolby Digital Plus инкапсулируется в другой формат или транспорт):

Хранение коэффициентов преобразования

В основе Dolby Digital и DD+ лежит модифицированное дискретное косинусное преобразование (MDCT), которое используется для преобразования аудиосигнала в частотную область; в каждом блоке может передаваться до 256 частотных коэффициентов. Коэффициенты передаются в двоичном формате с плавающей точкой, причем показатели передаются отдельно от мантисс. Это обеспечивает высокоэффективное кодирование.

Экспоненты для каждого канала кодируются в высокоупакованном дифференциальном формате, при этом дельты между последовательными частотными бинами (кроме первого) задаются в потоке. Используются три формата или стратегии экспоненты ; они известны как «D15», «D25» и «D45». В D15 каждый бин имеет уникальную экспоненту, тогда как в D25 и D45 значения дельты соответствуют либо парам, либо четверкам частотных бинов. Аудиоблоки, кроме первого в синхрокадре, могут дополнительно повторно использовать набор экспонент предыдущего блока (это требуется для каналов, которые используют адаптивное гибридное преобразование).

Декодированные экспоненты вместе с набором параметров метаданных используются для получения указателей распределения битов (BAP), которые определяют количество битов, выделенных для каждой мантиссы. Бины, которые соответствуют частотам, на которых человеческий слух более точен, выделяются больше бит; бины, которые соответствуют частотам, к которым люди менее чувствительны, выделяются меньше. Для каждой мантиссы может быть выделено любое значение от нуля до 16 бит; если передаются нулевые биты, функция дизеринга может быть опционально применена для генерации частотного коэффициента.

Алгоритм

Dolby Digital Plus, как и многие аудиокодеки с потерями, использует сильно квантованное представление сигнала в частотной области для достижения усиления кодирования ; в этом разделе описывается работа базового преобразования, а также различные дополнительные «инструменты», указанные стандартом, которые используются для достижения либо большего сжатия, либо уменьшения слышимых артефактов кодирования. [3]

Модифицированное дискретное косинусное преобразование

Оба кодера Dolby Digital и DD+ преобразуют многоканальный аудиосигнал в частотную область с помощью модифицированного дискретного косинусного преобразования (MDCT) с переключаемой длиной блока 256 или 512 выборок (последнее используется со стационарными сигналами, первое — с переходными сигналами). Затем представление частотной области квантуется в соответствии с психоакустической моделью и передается. Используется формат с плавающей точкой для частотных коэффициентов, а мантиссы и экспоненты хранятся и передаются отдельно, причем оба сильно сжимаются.

Адаптивное гибридное преобразование (AHT)

Для высокостационарных сигналов, таких как длинные ноты в музыкальном исполнении, используется адаптивное гибридное преобразование (AHT). Этот инструмент уникален для Dolby Digital Plus (и не поддерживается в Dolby Digital) и использует дополнительное дискретное косинусное преобразование типа II (DCT) для объединения шести смежных блоков преобразования (расположенных в синхрокадре) в эффективно более длинный блок. В дополнение к двухступенчатому преобразованию используется другая структура распределения битов и два способа представления кодированных мантисс: использование векторного квантования , которое дает наивысший коэффициент кодирования, и использование адаптивного к усилению квантования (GAQ), когда требуется большая точность сигнала. Адаптивное к усилению квантование может быть независимо включено для каждого частотного бина в канале и допускает кодирование мантиссы переменной длины.

Муфта

Поскольку многие многоканальные аудиопрограммы имеют высокую степень корреляции между отдельными каналами, обычно используется соединительный канал. Высокочастотная информация, которая является общей для двух или более каналов, передается в отдельном канале (который не воспроизводится декодером, а только смешивается обратно с исходными каналами), известном как соединительный канал; вместе с коэффициентами, известными как «координаты сцепления», которые направляют декодер, как реконструировать исходные каналы.

Dolby Digital Plus поддерживает более сложную версию инструмента сопряжения, известную как Enhanced Coupling (ECPL). Этот алгоритм, обработка которого значительно более затратна (как для кодеров, так и для декодеров), позволяет включать фазовую информацию в координаты сопряжения, что позволяет сохранять фазовые соотношения между связанными каналами.

Спектральное расширение

Dolby Digital Plus предоставляет еще один инструмент для высоких частот. Поскольку высокочастотные компоненты часто являются гармониками низкочастотных звуков, Spectral Extension (SPX) позволяет алгоритмически синтезировать высокочастотные компоненты из низкочастотных компонентов. Этот инструмент также уникален для Dolby Digital Plus и не поддерживается в Dolby Digital.

Рематрицирование

Стереопрограммы обычно ре-матрицируются и кодируются как каналы L+R и LR. Это делается как для повышения коэффициента кодирования (канал LR обычно может быть сильно сжат, и последующее де-матрицирование приведет к отмене многих артефактов сжатия), так и для сохранения фазовых соотношений, необходимых для правильного воспроизведения материала, кодированного Dolby Surround .

Обработка переходных процессов до появления шума

Transient pre-noise processing (TPNP) — это специфичный для Dolby Digital Plus инструмент для уменьшения возникающих артефактов квантования сигнала и других методов сжатия. В отличие от других инструментов, описанных выше, которые работают в частотной области и предшествуют обратному преобразованию в образцы PCM, TPNP — это инструмент, который по сути выполняет оконную операцию вырезания и вставки на сигнале временной области для стирания определенных предсказуемых артефактов квантования.

Связь с Dolby Digital и Dolby Atmos

Битовые потоки Dolby Digital Plus не имеют прямой обратной совместимости с устаревшими декодерами Dolby Digital . Однако Dolby Digital Plus является функциональным надмножеством Dolby Digital, и декодеры включают обязательный компонент, который напрямую преобразует (без декодирования и повторного кодирования) битовый поток Dolby Digital Plus в битовый поток Dolby Digital (работающий на скорости 640 кбит/с) для передачи через устаревшие соединения S/PDIF (включая S/PDIF через HDMI) на внешние декодеры (например, AVR и т. д.). Все декодеры Dolby Digital Plus могут декодировать битовые потоки Dolby Digital.

Однако битовые потоки Dolby Atmos кодируются для обратной совместимости с декодерами Dolby Digital Plus, и, таким образом, Dolby Atmos может быть декодирован совместимыми с Dolby Digital Plus устройствами. Это было представлено Dolby как вариант сжатия с потерями Dolby Atmos под названием "Dolby Digital Plus Atmos", чтобы отличать его от оригинала без потерь на основе DolbyHD. Большинство битовых потоков Dolby Digital Plus теперь кодируются в кодировке Atmos.


Сжатие динамического диапазона

Одной из целей разработки DD+ является качественное воспроизведение в различных средах: от домашних кинотеатров и других акустически контролируемых сред, где возможно воспроизведение с высоким динамическим диапазоном, до портативных и автомобильных сред, где присутствует много фонового шума, и может потребоваться сжатие динамического диапазона, чтобы сделать слышимыми все части аудиопрограммы.

DD+ предоставляет следующие режимы работы для различных сред слушателя/зрителя.

Режимы работы декодера Dolby Digital Plus:

Примечание: Все режимы работы декодера (перечисленные выше) доступны в каждом декодере Dolby Digital Plus. Режим работы по умолчанию регулируется категорией устройства и приложением. В некоторых устройствах пользователи также могут иметь возможность (через меню) выбрать альтернативный режим, который соответствует их вкусу и/или приложению.

Кроме того, Dolby Digital и DD+ содержат дополнительные метаданные, позволяющие осуществлять безошибочный перевод в ограниченные по диапазону нисходящие каналы, такие как радиочастотная модуляция, где чрезмерная амплитуда выходного сигнала может привести к значительным искажениям или ошибкам модуляции.

Инкапсуляция, использование и хранение потоков Dolby Digital

Физический транспорт для потребительских устройств

IEC 61937-3: определяет, как передавать потоки битов Dolby Digital (AC-3) и Dolby Digital Plus (E-AC-3) через интерфейс IEC 60958/61937 (S/PDIF). Однако интерфейс S/PDIF имеет недостаточную полосу пропускания для передачи потоков битов Dolby Digital Plus (E-AC-3) со скоростью передачи данных 3,0 Мбит/с, указанной HD DVD; возможны более низкие скорости передачи данных.

Многие потребительские устройства, и даже некоторые профессиональные устройства, не распознают Dolby Digital Plus как закодированный формат и будут обрабатывать сигналы DD+ через S/PDIF или аналогичный интерфейс, или хранить в файле .WAV или аналогичном формате контейнера, как если бы они были линейными данными PCM. Это не проблема, если данные передаются без изменений, но любое масштабирование усиления или преобразование частоты дискретизации, операции, которые на слух безвредны для данных PCM, испортят и уничтожат поток Dolby Digital Plus. (Старые кодеки, такие как DTS или AC-3, с большей вероятностью будут распознаны как сжатые форматы и защищены от такой обработки).

Dolby Digital Plus может передаваться через HDMI 1.3 или более поздней версии в соответствии со стандартом IEC 61937-3.

Физический транспорт для профессиональных устройств и приложений

Поскольку интерфейс AES-3 является профессиональным аналогом S/PDIF, потоки Dolby Digital Plus могут передаваться по соединениям AES-3 с достаточной пропускной способностью и/или по другим интерфейсам, которые инкапсулируют AES-3 (например, встроенный звук SMPTE 259M и SMPTE 299M). Дополнительные стандарты, принятые SMPTE, определяют кодирование транспортов Dolby, включая Dolby Digital, Dolby Digital Plus и Dolby E (профессиональный кодек, используемый только в аудио/видеоприложениях) на интерфейсе AES. Стандарт SMPTE 337 определяет сигнализацию и передачу сигналов, которые не являются аудио PCM, по интерфейсу AES-3, а стандарт SMPTE 340-2008 определяет, как Dolby Digital Plus и Dolby Digital должны передаваться по этому интерфейсу. Сочетание стандартов SMPTE 340-2008 и 337M позволяет хранить и передавать поток битов Dolby Digital Plus в рамках профессиональных рабочих процессов производства, передачи и распространения до передачи потребителям.

Потребительское вещание в системах цифрового телевидения

Комитет по передовым телевизионным системам определяет DD+ или Dolby Digital в качестве основного аудиокодека для цифровой телевизионной системы ATSC и обычно использует его для других приложений DTV (таких как кабельное и спутниковое вещание) в странах, где для цифрового телевидения используется ATSC.

Для трансляции (передачи) потребителям поток битов Dolby Digital Plus пакетируется в элементарный поток MPEG и мультиплексируется (с видео) в транспортный поток MPEG. В системах ATSC спецификация для переноса Dolby Digital Plus описана в ATSC A/53 Часть 3 и Часть 6. В системах DVB спецификация для переноса Dolby Digital Plus описана в ETSI TS 101 154 и ETSI EN 300 468.

Dolby Digital Plus все чаще используется в системах цифрового телевидения, особенно в кабельных и спутниковых системах, в качестве замены Dolby Digital. Многие такие приложения не используют его большее количество каналов или способность поддерживать несколько независимых программ; вместо этого он используется как более эффективный кодек, чем AC-3.

HD DVD и Blu-ray диски

Оба ныне несуществующих стандарта HD DVD и Blu-ray Disc включают Dolby Digital Plus. Это обязательный компонент HD DVD и необязательный компонент Blu-ray. Максимальное количество дискретных кодированных каналов одинаково для обоих форматов: 7.1. Однако HD DVD и Blu-ray накладывают разные технические ограничения на поддерживаемые аудиокодеки. Следовательно, использование DD+ существенно различается между HD DVD и Blu-ray Disc.

На HD DVD DD+ обозначен как обязательный аудиокодек. Фильм HD DVD может использовать DD+ в качестве основной (или единственной) звуковой дорожки. Проигрыватель HD DVD должен поддерживать звук DD+ путем декодирования и вывода его на выходные гнезда проигрывателя. Сохраненный на диске битовый поток DD+ может нести любое количество аудиоканалов вплоть до максимально допустимого, с любым битрейтом до 3,0 Мбит/с.

На Blu-ray Disc DD+ является дополнительным кодеком и используется как расширение для «базовой» звуковой дорожки AC-3 5.1. Ядро AC-3 кодируется на скорости 640 кбит/с, содержит 5 основных каналов (и 1 LFE) и может независимо воспроизводиться как звуковая дорожка фильма любым проигрывателем Blu-ray Disc. Расширенный битовый поток DD+ используется на проигрывателях, которые его поддерживают, заменяя задние каналы в настройке 5.1 на версии с более высокой точностью, а также обеспечивая возможное расширение каналов до 6.1 или 7.1. Полная звуковая дорожка имеет комбинированный битрейт 1,7 Мбит/с: 640 кбит/с для ядра AC-3 5.1 и 1 Мбит/с для расширения DD+. Во время воспроизведения как основной, так и дополнительный битовые потоки вносят вклад в конечный аудиовыход в соответствии с правилами, встроенными в метаданные битового потока. [4] [ требуется лучший источник ]

Медиаплееры и микширование

Обычно поток битов Dolby Digital Plus может передаваться только по каналу HDMI 1.3 или выше. Более старые ресиверы поддерживают более ранние версии HDMI или поддерживают только систему S/PDIF для цифрового звука или аналоговых входов.

Для соединений, отличных от HDMI 1.3, проигрыватель может декодировать звук, а затем передавать его различными способами.

Большинство приемников и плееров поддерживают S/PDIF. Это цифровое соединение с меньшей пропускной способностью не способно передавать звук PCM без потерь с более чем двумя каналами, но плеер может передавать совместимый с S/PDIF аудиопоток на приемник одним из следующих способов:

Если проигрывателю нужно декодировать аудио для приемника, отличного от HDMI 1.3, результаты должны быть предсказуемыми. Спецификация DD+ явно определяет режимы и механику микширования , поэтому любое исходное звуковое поле (до 14.1) может быть воспроизведено предсказуемо для любой среды прослушивания (вплоть до одного канала).

Смотрите также

Ссылки

  1. ^ Advanced Television Systems Committee (17 декабря 2012 г.), Стандарт ATSC: Цифровое сжатие звука (AC-3, E-AC-3) (PDF) , Вашингтон, округ Колумбия: Автор, ATSC A/52:2012
  2. ^ Стандарт цифрового аудиосжатия (AC-3, Enhanced AC-3) (PDF) , Европейский институт телекоммуникационных стандартов, 20 сентября 2017 г., ETSI TS 102 366 V1.4.1 (2017-09 , получено 21 сентября 2023 г.)
  3. ^ Андерсен, Роберт Лоринг; Крокетт, Б.; Дэвидсон, Г.; Дэвис, Марк; Филдер, Л.; Тернер, Стивен К.; Винтон, М.; Уильямс, П. (1 октября 2004 г.). «Введение в Dolby Digital Plus, усовершенствование системы кодирования Dolby Digital» (PDF) . Журнал Audio Engineering Society . Архивировано из оригинала (PDF) 2016-11-19.
  4. ^ "avcodec/eac3: добавить поддержку для зависимого потока · FFmpeg/FFmpeg@ae92970". GitHub . Получено 2019-06-10 .