AES3 — это стандарт обмена цифровыми аудиосигналами между профессиональными аудиоустройствами . Сигнал AES3 может переносить два канала импульсно-кодово-модулированного цифрового звука по нескольким средам передачи, включая сбалансированные линии , несбалансированные линии и оптоволокно . [1]
AES3 был совместно разработан Audio Engineering Society (AES) и Европейским вещательным союзом (EBU) и поэтому также известен как AES/EBU . Стандарт был впервые опубликован в 1985 году и был пересмотрен в 1992 и 2003 годах. AES3 был включен в стандарт IEC 60958 Международной электротехнической комиссии и доступен в потребительском варианте, известном как S/PDIF .
Разработка стандартов для цифрового аудиосоединения как для профессионального, так и для домашнего аудиооборудования началась в конце 1970-х годов [2] совместными усилиями Audio Engineering Society и Европейского вещательного союза и завершилась публикацией AES3 в 1985 году. Стандарт AES3 был пересмотрен в 1992 и 2003 годах и опубликован в версиях AES и EBU. [1] Вначале стандарт часто назывался AES/EBU.
Варианты, использующие различные физические соединения, указаны в IEC 60958. По сути, это потребительские версии AES3 для использования в домашней среде высокой точности с использованием разъемов, которые чаще встречаются на потребительском рынке. Эти варианты обычно известны как S/PDIF.
IEC 60958 (ранее IEC 958) — стандарт Международной электротехнической комиссии по цифровым аудиоинтерфейсам . Он воспроизводит профессиональный стандарт цифрового аудиосоединения AES3 и его потребительскую версию S/PDIF .
Стандарт состоит из нескольких частей:
AES-2id — это информационный документ AES, опубликованный Audio Engineering Society [3] для цифровой аудиотехники — Руководство по использованию интерфейса AES3. В этом документе содержатся рекомендации по использованию AES3, AES Recommended Practice для цифровой аудиотехники, Формат последовательной передачи для двухканальных линейно представленных цифровых аудиоданных. В этом документе также содержится описание связанных стандартов, используемых совместно с AES3, таких как AES11 . Полные сведения об AES-2id можно изучить в разделе стандартов веб-сайта Audio Engineering Society [4], загрузив копии документа AES-2id в виде файла PDF.
Стандарт AES3 соответствует части 4 международного стандарта IEC 60958. Из типов физических соединений, определенных IEC 60958, широко используются два.
Соединения типа I используют сбалансированную трехпроводную витую пару с сопротивлением 110 Ом и разъемами XLR . Соединения типа I чаще всего используются в профессиональных установках и считаются стандартным разъемом для AES3. Аппаратный интерфейс обычно реализуется с использованием линейных драйверов и приемников RS-422 .
IEC 60958 Type II определяет несбалансированный электрический или оптический интерфейс для приложений бытовой электроники . Предшественником спецификации IEC 60958 Type II был Sony/Philips Digital Interface, или S/PDIF . Оба были основаны на оригинальной работе AES/EBU. S/PDIF и AES3 взаимозаменяемы на уровне протокола, но на физическом уровне они определяют разные уровни электрических сигналов и импедансы , которые могут быть существенными в некоторых приложениях.
Сигналы AES/EBU также могут передаваться с использованием несимметричных разъемов BNC с 75-омным коаксиальным кабелем. Несимметричная версия имеет очень большое расстояние передачи в отличие от 150 метров максимум для сбалансированной версии. [5] Стандарт AES-3id определяет 75-омный BNC электрический вариант AES3. Он использует те же кабели, коммутацию и инфраструктуру, что и аналоговое или цифровое видео, и поэтому распространен в вещательной отрасли.
AES3 был разработан в первую очередь для поддержки стерео PCM- кодированного звука в формате DAT на частоте 48 кГц или CD на частоте 44,1 кГц. Не было предпринято никаких попыток использовать носитель, способный поддерживать обе скорости; вместо этого AES3 позволяет данным работать на любой скорости и кодировать тактовую частоту и данные вместе с помощью двухфазного кода метки (BMC).
Каждый бит занимает один временной слот . Каждый аудиосэмпл (до 24 бит) объединяется с четырьмя битами флага и преамбулой синхронизации, которая имеет длину в четыре временных слота, чтобы создать подфрейм из 32 временных слотов. 32 временных слота каждого подфрейма назначаются следующим образом:
Два подкадра (A и B, обычно используемые для левого и правого аудиоканалов) составляют кадр . Кадры содержат 64-битные периоды и производятся один раз за период аудиосэмпла. На самом высоком уровне каждые 192 последовательных кадра группируются в аудиоблок . В то время как сэмплы повторяются каждый раз кадра, метаданные передаются только один раз на аудиоблок. При частоте дискретизации 48 кГц имеется 250 аудиоблоков в секунду и 3 072 000 временных интервалов в секунду, поддерживаемых двухфазным тактовым генератором 6,144 МГц. [6]
Преамбула синхронизации — это специально закодированная преамбула , которая идентифицирует подкадр и его положение в аудиоблоке. Преамбулы — это не обычные биты данных, закодированные BMC, хотя они все еще имеют нулевое смещение постоянного тока .
Возможны три преамбулы:
Три преамбулы называются X, Y, Z в стандарте AES3 и M, W, B в IEC 958 (расширение AES).
8-битные преамбулы передаются во времени, выделенном для первых четырех временных интервалов каждого подкадра (временные интервалы от 0 до 3). Любой из трех обозначает начало подкадра. X или Z обозначает начало кадра, а Z обозначает начало аудиоблока.
| 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Временные интервалы _____ _ _____ _ / \_____/ \_/ \_____/ \_/ \ Преамбула X _____ _ ___ ___ / \___/ \___/ \_____/ \_/ \ Преамбула Y _____ _ _ _____ / \_/ \_____/ \_____/ \_/ \ Преамбула Z ___ ___ ___ ___ / \___/ \___/ \___/ \___/ \ Все 0 бит BMC закодированы _ _ _ _ _ _ _ _ / \_/ \_/ \_/ \_/ \_/ \_/ \_/ \_/ \ Все 1 бит BMC закодированы | 0 | 1 | 2 | 3 | | 0 | 1 | 2 | 3 | Временные интервалы
В двухканальном AES3 преамбулы образуют шаблон ZYXYXYXY..., но эту структуру легко расширить на дополнительные каналы (больше подкадров на кадр), каждый с преамбулой Y, как это делается в протоколе MADI .
В каждом подкадре есть один бит статуса канала, всего 192 бита или 24 байта для каждого канала в каждом блоке. Между стандартами AES3 и S/PDIF содержимое 192-битного слова статуса канала существенно различается, хотя они согласны в том, что первый бит статуса канала различает их. В случае AES3 стандарт подробно описывает функцию каждого бита. [1]
Данные таймкода SMPTE могут быть встроены в сигналы AES3. Их можно использовать для синхронизации , а также для регистрации и идентификации аудиоконтента. Они встроены как 32-битное двоичное слово в байтах 18–21 данных о состоянии канала. [8]
Стандарт AES11 предоставляет информацию о синхронизации цифровых аудиоструктур. [9]
Стандарт AES52 описывает, как вставлять уникальные идентификаторы в поток битов AES3. [10]
SMPTE 2110 -31 определяет, как инкапсулировать поток данных AES3 в пакеты протокола реального времени для передачи по сети IP с использованием многоадресной структуры SMPTE 2110 IP. [11]
SMPTE 302M-2007 определяет, как инкапсулировать поток данных AES3 в транспортный поток MPEG для телевизионных приложений. [12]
Формат цифрового аудио AES3 также может передаваться по сети с асинхронным режимом передачи . Стандартом для упаковки кадров AES3 в ячейки ATM является AES47 .
В 1977 году, в связи с растущей потребностью в стандартах цифрового звука, был сформирован Комитет по стандартам цифрового звука AES.
Байты 18–21, биты 0–7: адресный код времени суток. Значение (каждый байт): 32-битное двоичное значение, представляющее первый образец текущего блока. Сначала передаются младшие биты. Значение по умолчанию должно быть логическим "0". Примечание: это время суток, установленное во время кодирования источника сигнала, и должно оставаться неизменным во время последующих операций. Значение из всех нулей для адресного кода двоичного образца должно, для целей транскодирования в реальное время или во временные коды в частности, приниматься за полночь (т. е. 00 ч., 00 мин., 00 с., 00 кадр). Транскодирование двоичного числа в любой обычный временной код требует точной информации о частоте дискретизации для предоставления точного времени образца.