stringtranslate.com

Долби Диджитал Плюс

Dolby Digital Plus , также известный как Enhanced AC-3 (и обычно сокращенно DDP , DD+ , E-AC-3 или EC-3 ), представляет собой схему сжатия цифрового звука , разработанную Dolby Labs для транспортировки и хранения многоканальных цифровой звук. Он является преемником Dolby Digital (AC-3) и имеет ряд улучшений по сравнению с этим кодеком, включая поддержку более широкого диапазона скоростей передачи данных (от 32 до 6144 кбит/с), увеличенное количество каналов и многопрограммная поддержка (через подпотоки), а также дополнительные инструменты (алгоритмы) представления сжатых данных и противодействия артефактам. В то время как Dolby Digital (AC-3) поддерживает до пяти полнополосных аудиоканалов с максимальной скоростью передачи данных 640 кбит/с, E-AC-3 поддерживает до 15 полнополосных аудиоканалов с максимальной скоростью передачи данных 6,144  Мбит/с. .

Полный набор технических спецификаций для E-AC-3 (и AC-3) стандартизирован и опубликован в Приложении E к ATSC A/52:2012, [1] , а также в Приложении E к ETSI TS 102 366. [2]

Технические детали

Технические характеристики

Dolby Digital Plus способен на следующее:

Состав

Услуга Dolby Digital Plus состоит из одного или нескольких подпотоков . Существует три типа подпотоков:

Все потоки DD+ должны содержать хотя бы один независимый подпоток или устаревший подпоток, который содержит первые (или только) каналы 5.1 основной аудиопрограммы. Дополнительные независимые субпотоки могут использоваться для вторичных аудиопрограмм, таких как саундтреки на иностранных языках, комментарии или описания/закадровый голос для людей с нарушениями зрения. Зависимые подпотоки могут быть предоставлены для программ, которые имеют дополнительные каналы звуковой сцены помимо 5.1.

В каждом подпотоке предусмотрено кодирование пяти полнополосных каналов, одного низкочастотного канала и одного канала связи. Канал связи используется для передачи средне- и высокочастотной информации, которая является общей для нескольких полнополосных каналов. Его контент смешивается с другими каналами способом, предписанным метаданными, и не воспроизводится декодером как дискретный канал.

Dolby Digital Plus включает в себя комплексные метаданные битового потока для управления декодером выходной громкостью (через Dialnorm), понижающего микширования и обратимого управления динамическим диапазоном (через DRC).

Синтаксис

Dolby Digital Plus номинально представляет собой 16-битный протокол, хотя очень немногие поля в синтаксисе учитывают границы байтов или слов. Поскольку многие элементы синтаксиса являются необязательными или имеют переменную длину, в том числе те, чье присутствие или длина зависят от сложных предшествующих вычислений, а в синтаксисе имеется небольшая избыточность, DD+ может быть чрезвычайно сложно правильно проанализировать, при этом легко получить синтаксически допустимый, но неправильный анализ. из-за неисправных энкодеров.

Поток DD+ представляет собой набор пакетов синхрокад фиксированной длины , каждый из которых соответствует 256, 512, 768 или 1536 последовательным аудиосэмплам во временной области. (Случай с 1536 выборками является наиболее распространенным и соответствует Dolby Digital; более короткие длины субкадров предназначены для использования в интерактивных приложениях, таких как видеоигры, где уменьшение задержки кодера является важной проблемой). Каждый синхрофрейм декодируется независимо и принадлежит определенному подпотоку в рамках службы. Синхронный кадр состоит из следующих синтаксических элементов (некоторые из которых могут быть опущены, когда услуга Dolby Digital Plus инкапсулирована в другой формат или транспорт):

Хранение коэффициентов преобразования

В основе Dolby Digital и DD+ лежит модифицированное дискретное косинусное преобразование (MDCT), которое используется для преобразования аудиосигнала в частотную область; внутри каждого блока может передаваться до 256 частотных коэффициентов. Коэффициенты передаются в двоичном формате с плавающей запятой, причем показатели степени передаются отдельно от мантисс. Это обеспечивает высокоэффективное кодирование.

Экспоненты для каждого канала кодируются в сильно упакованном дифференциальном формате, при этом в потоке задаются дельты между последовательными элементами разрешения частоты (кроме первого). Используются три формата или стратегии экспоненты ; они известны как «D15», «D25» и «D45». В D15 каждый элемент имеет уникальный показатель степени, а в D25 и D45 значения дельты соответствуют либо парам, либо четверкам элементов разрешения по частоте. Аудиоблоки, отличные от первого в синхрокадре, могут дополнительно повторно использовать набор экспонент предыдущего блока (это необходимо для каналов, использующих адаптивное гибридное преобразование).

Декодированные показатели степени вместе с набором параметров метаданных используются для получения указателей распределения битов (BAP), которые определяют количество битов, выделенных для каждой мантиссы. Бинам, соответствующим частотам, на которых человеческий слух более точен, выделяется больше битов; бины, соответствующие частотам, к которым люди менее чувствительны, выделяются меньше. Для каждой мантиссы может быть отведено от нуля до 16 бит; если передаются нулевые биты, для генерации частотного коэффициента может дополнительно применяться функция дизеринга.

Алгоритм

Dolby Digital Plus, как и многие аудиокодеки с потерями, использует сильно квантованное представление сигнала в частотной области для достижения усиления кодирования ; в этом разделе описывается работа базового преобразования, а также различные дополнительные «инструменты», определенные стандартом, которые используются либо для достижения большего сжатия, либо для уменьшения слышимых артефактов кодирования. [3]

Модифицированное дискретное косинусное преобразование

Кодер Dolby Digital и DD+ преобразует многоканальный аудиосигнал в частотную область с использованием модифицированного дискретного косинусного преобразования (MDCT) с переключаемой длиной блока 256 или 512 выборок (последнее используется со стационарными сигналами, первое - с переходными сигналами). ). Затем представление частотной области квантуется в соответствии с психоакустической моделью и передается. Для частотных коэффициентов используется формат с плавающей запятой, а мантисса и показатель степени сохраняются и передаются отдельно, причем оба они сильно сжимаются.

Адаптивное гибридное преобразование (AHT)

Для очень стационарных сигналов, таких как длинные ноты в музыкальном исполнении, используется адаптивное гибридное преобразование (AHT). Этот инструмент уникален для Dolby Digital Plus (и не поддерживается в Dolby Digital) и использует дополнительное дискретное косинусное преобразование (DCT) типа II для объединения шести соседних блоков преобразования (расположенных в кадре синхронизации) в эффективно более длинный блок. В дополнение к двухэтапному преобразованию используется другая структура распределения битов, а также используются два способа представления закодированных мантисс: использование векторного квантования , которое дает наивысший выигрыш от кодирования, и использование квантования с адаптацией к усилению (GAQ). когда требуется более высокая точность сигнала. Квантование с адаптацией к усилению может быть независимо включено для каждого элемента разрешения частоты в канале и позволяет кодировать мантиссу переменной длины.

Связь

Поскольку многие многоканальные аудиопрограммы имеют высокую степень корреляции между отдельными каналами, обычно используется соединительный канал. Высокочастотная информация, которая является общей для двух или более каналов, передается в отдельном канале (который не воспроизводится декодером, а только смешивается с исходными каналами), известном как канал связи; наряду с коэффициентами, известными как «координаты связи», которые помогают декодеру восстановить исходные каналы.

Dolby Digital Plus поддерживает более сложную версию инструмента сопряжения, известную как Enhanced Coupling (ECPL). Этот алгоритм, обработка которого значительно дороже (как для кодеров, так и для декодеров), позволяет включать информацию о фазе в координаты связи, обеспечивая сохранение фазовых соотношений между связанными каналами.

Спектральное расширение

Dolby Digital Plus предоставляет еще один инструмент для высоких частот. Поскольку высокочастотные компоненты часто являются гармониками низкочастотных звуков, Spectral Extension (SPX) позволяет алгоритмически синтезировать высокочастотные компоненты из низкочастотных компонентов. Этот инструмент также уникален для Dolby Digital Plus и не поддерживается в Dolby Digital.

Рематрица

Стереопрограммы обычно преобразуются в матрицу и кодируются как каналы L+R и LR. Это делается как для увеличения усиления кодирования (канал LR обычно может быть сильно сжат, и последующее разматрирование приведет к отмене многих артефактов сжатия), так и для сохранения фазовых соотношений, необходимых для правильного воспроизведения материала, закодированного в формате Dolby Surround .

Переходная предшумовая обработка

Обработка перед шумом переходных процессов (TPNP) — это специальный инструмент Dolby Digital Plus, позволяющий уменьшить результирующие артефакты квантования сигнала и других методов сжатия. В отличие от других инструментов, описанных выше, которые работают в частотной области и предшествуют обратному преобразованию в выборки PCM, TPNP представляет собой инструмент, который по существу выполняет оконную операцию вырезания и вставки сигнала во временной области для стирания определенных предсказуемых артефактов квантования.

Связь с Dolby Digital и Dolby Atmos

Битовые потоки Dolby Digital Plus не имеют прямой обратной совместимости с устаревшими декодерами Dolby Digital . Однако Dolby Digital Plus является функциональной расширенной версией Dolby Digital, а декодеры включают в себя обязательный компонент, который напрямую преобразует (без декодирования и повторного кодирования) битовый поток Dolby Digital Plus в битовый поток Dolby Digital (работающий со скоростью 640 кбит/с) для передачи через устаревшие соединения S/PDIF (включая S/PDIF через HDMI) к внешним декодерам (например, AVR и т. д.). Все декодеры Dolby Digital Plus могут декодировать потоки битов Dolby Digital.

Однако битовые потоки Dolby Atmos кодируются для обеспечения обратной совместимости с декодерами Dolby Digital Plus, и поэтому Dolby Atmos может декодироваться устройствами, совместимыми с Dolby Digital Plus. Он продается компанией Dolby как вариант сжатия Dolby Atmos с потерями под лейблом «Dolby Digital Plus Atmos», чтобы отличить его от оригинала без потерь на основе DolbyHD. Большинство битовых потоков Dolby Digital Plus теперь кодируются в кодировке Atmos.


Сжатие динамического диапазона

Одной из целей разработки DD+ является качественное воспроизведение в различных средах: от домашних кинотеатров и других акустически контролируемых сред, где возможно воспроизведение с широким динамическим диапазоном, до портативных и автомобильных сред, где присутствует много фонового шума и может потребоваться сжатие динамического диапазона. сделать все части аудиопрограммы слышимыми.

DD+ предоставляет следующие режимы работы для различных сред слушателя/зрителя.

Режимы работы декодера Dolby Digital Plus:

Примечание. Все режимы работы декодера (перечисленные выше) доступны в каждом декодере Dolby Digital Plus. Режим работы по умолчанию определяется категорией устройства и применением. В некоторых устройствах у пользователей также может быть возможность выбора (через меню) альтернативного режима, который соответствует их конкретному вкусу и/или применению.

Кроме того, Dolby Digital и DD+ содержат дополнительные метаданные, позволяющие безошибочную трансляцию в нисходящие каналы с ограниченным диапазоном, например радиочастотную модуляцию, где чрезмерная амплитуда выходного сигнала может привести к значительным искажениям или ошибкам модуляции.

Инкапсуляция, использование и хранение потоков Dolby Digital

Физический транспорт для потребительских устройств

IEC 61937-3: определяет, как передавать потоки битов Dolby Digital (AC-3) и Dolby Digital Plus (E-AC-3) через интерфейс IEC 60958/61937 (S/PDIF). Однако интерфейс S/PDIF имеет недостаточную пропускную способность для передачи битовых потоков Dolby Digital Plus (E-AC-3) со скоростью передачи данных 3,0 Мбит/с, заданной HD DVD; возможны более низкие скорости передачи данных.

Большая часть потребительского и даже некоторого профессионального оборудования не распознает Dolby Digital Plus как закодированный формат и будет обрабатывать сигналы DD+ через S/PDIF или аналогичный интерфейс или храниться в файле .WAV или аналогичном контейнерном формате, как если бы они представляли собой линейные данные PCM. Это не проблема, если данные передаются без изменений, но любое масштабирование усиления или преобразование частоты дискретизации, операции, которые безвредны для слуха для данных PCM, повредят и уничтожат поток Dolby Digital Plus. (Старые кодеки, такие как DTS или AC-3, с большей вероятностью будут распознаваться как сжатые форматы и защищены от такой обработки).

Dolby Digital Plus может передаваться через HDMI 1.3 или новее в соответствии со стандартом IEC 61937-3.

Физический транспорт для профессиональных устройств и приложений

Поскольку интерфейс AES-3 является профессиональным аналогом S/PDIF, потоки Dolby Digital Plus могут передаваться через соединения AES-3 с достаточной пропускной способностью и/или через другие интерфейсы, инкапсулирующие AES-3 (например, SMPTE 259M и SMPTE 299M). встроенный звук). Дополнительные стандарты, опубликованные SMPTE, определяют кодирование транспортных потоков Dolby, включая Dolby Digital, Dolby Digital Plus и Dolby E (кодек, предназначенный только для профессиональных пользователей, используемый в аудио/видео приложениях) на интерфейсе AES. Стандарт SMPTE 337 определяет передачу сигналов и передачу сигналов, не являющихся звуком PCM, через интерфейс AES-3, а стандарт SMPTE 340-2008 определяет, как Dolby Digital Plus и Dolby Digital должны передаваться через этот интерфейс. Комбинация SMPTE 340-2008 и 337M позволяет хранить и транспортировать битовый поток Dolby Digital Plus в рамках профессиональных рабочих процессов производства, внесения и распространения перед передачей потребителям.

Потребительское вещание в системах цифрового телевидения

Либо DD+, либо Dolby Digital определены Комитетом по передовым телевизионным системам в качестве основного аудиокодека для системы цифрового телевидения ATSC и обычно используются для других приложений DTV (таких как кабельное и спутниковое вещание) в странах, которые используют ATSC для цифрового телевидения.

Для вещания (передачи) потребителям битовый поток Dolby Digital Plus пакетируется в элементарный поток MPEG и мультиплексируется (с видео) в транспортный поток MPEG. В системах ATSC спецификация передачи Dolby Digital Plus описана в ATSC A/53, часть 3 и часть 6. В системах DVB спецификация передачи Dolby Digital Plus описана в ETSI TS 101 154 и ETSI EN 300 468.

Dolby Digital Plus все чаще используется в системах цифрового телевидения, особенно в кабельных и спутниковых системах, в качестве замены Dolby Digital. Многие такие приложения не используют преимуществ большего количества каналов или способности поддерживать несколько независимых программ; вместо этого он используется как более эффективный кодек, чем AC-3.

HD DVD и Blu-ray диск

И ныне несуществующий стандарт HD DVD , и Blu-ray Disc включают Dolby Digital Plus. Это обязательный компонент HD DVD и дополнительный компонент Blu-ray. Максимальное количество дискретно-кодированных каналов одинаково для обоих форматов: 7.1. Однако HD DVD и Blu-ray накладывают разные технические ограничения на поддерживаемые аудиокодеки. Следовательно, использование DD+ существенно различается между HD DVD и Blu-ray Disc.

На HD DVD DD+ обозначается как обязательный аудиокодек. Фильм HD DVD может использовать DD+ в качестве основной (или единственной) звуковой дорожки. Проигрыватель HD DVD должен поддерживать звук DD+ путем декодирования и вывода его на выходные разъемы проигрывателя. Сохраненный на диске битовый поток DD+ может передавать любое количество аудиоканалов вплоть до максимально допустимого, с любой скоростью передачи данных до 3,0 Мбит/с.

На дисках Blu-ray DD+ является дополнительным кодеком и используется как расширение «основной» аудиодорожки AC-3 5.1. Ядро AC-3 закодировано со скоростью 640 кбит/с, содержит 5 основных каналов (и 1 LFE) и может независимо воспроизводиться как звуковая дорожка фильма на любом проигрывателе дисков Blu-ray. Битовый поток расширения DD+ используется в плеерах, которые его поддерживают, путем замены задних каналов в настройке 5.1 версиями с более высокой точностью, а также обеспечения возможного расширения канала до 6.1 или 7.1. Для всей звуковой дорожки разрешен общий битрейт 1,7 Мбит/с: 640 Кбит/с для ядра AC-3 5.1 и 1 Мбит/с для расширения DD+. Во время воспроизведения как основной, так и дополнительный битовые потоки вносят вклад в окончательный аудиовыход в соответствии с правилами, встроенными в метаданные битового потока. [4] [ нужен лучший источник ]

Медиаплееры и микширование

Как правило, битовый поток Dolby Digital Plus может передаваться только по каналу HDMI 1.3 или более поздней версии. Старые ресиверы поддерживают более ранние версии HDMI или поддерживают только систему S/PDIF для цифрового аудио или аналоговых входов.

Для каналов, отличных от HDMI 1.3, плеер может декодировать звук, а затем передавать его различными способами.

Большинство ресиверов и плееров поддерживают S/PDIF. Это цифровое соединение с меньшей полосой пропускания не способно передавать звук PCM без потерь по более чем двум каналам, но проигрыватель может передавать аудиопоток, совместимый с S / PDIF, на ресивер одним из следующих способов:

Если проигрывателю потребуется декодировать звук для приемника, не поддерживающего HDMI 1.3, результаты должны быть предсказуемы. Спецификация DD+ явно определяет режимы и механику сведения , поэтому любое исходное звуковое поле (до 14.1) может быть предсказуемо воспроизведено для любой среды прослушивания (вплоть до одного канала).

Смотрите также

Рекомендации

  1. ^ Комитет по передовым телевизионным системам (17 декабря 2012 г.), Стандарт ATSC: сжатие цифрового звука (AC-3, E-AC-3) (PDF) , Вашингтон, округ Колумбия: Автор, ATSC A/52:2012.
  2. ^ Стандарт сжатия цифрового звука (AC-3, Enhanced AC-3) (PDF) , Европейский институт телекоммуникационных стандартов, 20 сентября 2017 г., ETSI TS 102 366 V1.4.1 (2017-09 , дата обращения 21 сентября 2023 г. ).
  3. ^ Андерсен, Роберт Лоринг; Крокетт, Б.; Дэвидсон, Г.; Дэвис, Марк; Филдер, Л.; Тернер, Стивен С.; Винтон, М.; Уильямс, П. (1 октября 2004 г.). «Введение в Dolby Digital Plus, усовершенствование системы кодирования Dolby Digital» (PDF) . Журнал Общества аудиоинженеров . Архивировано из оригинала (PDF) 19 ноября 2016 г.
  4. ^ «avcodec/eac3: добавить поддержку зависимого потока · FFmpeg/FFmpeg@ae92970». Гитхаб . Проверено 10 июня 2019 г.