Объемный звук

Объемный звук — это метод обогащения точности и глубины воспроизведения звука с помощью нескольких аудиоканалов от динамиков , которые окружают слушателя ( каналы объемного звучания ). Его первое применение было в кинотеатрах . До объемного звука театральные звуковые системы обычно имели три экранных канала звука, которые воспроизводились из трех громкоговорителей (левого, центрального и правого), расположенных перед аудиторией. Объемный звук добавляет один или несколько каналов от громкоговорителей сбоку или позади слушателя, которые способны создавать ощущение звука, исходящего из любого горизонтального направления (на уровне земли) вокруг слушателя.

Методика улучшает восприятие пространственного расположения звука, используя локализацию звука : способность слушателя определять местоположение или источник обнаруженного звука по направлению и расстоянию. Это достигается с помощью использования нескольких дискретных аудиоканалов, направленных на массив громкоговорителей . ^[1] Объемный звук обычно имеет местоположение слушателя ( точку наилучшего восприятия ), где аудиоэффекты работают лучше всего, и представляет фиксированную или переднюю перспективу звукового поля для слушателя в этом месте.

Форматы объемного звука различаются по методам воспроизведения и записи, а также по количеству и расположению дополнительных каналов. Наиболее распространенная спецификация объемного звука, стандарт 5.1 ITU , требует 6 динамиков: центральный (C), перед слушателем; левый (L) и правый (R), под углом 60°; левый объемный (LS) и правый объемный (RS) под углом 100–120°; и сабвуфер , положение которого не критично. ^[2]

Области применения

Хотя кино и саундтреки представляют собой основные области применения технологий объемного звучания, сфера его применения шире, поскольку объемный звук позволяет создавать аудиосреду для самых разных целей. Многоканальные аудиотехнологии могут использоваться для воспроизведения разнообразного контента, такого как музыка, речь, естественные или синтетические звуки для кино, телевидения , вещания или компьютеров. С точки зрения музыкального контента, например, живое выступление может использовать многоканальные технологии в контексте концерта на открытом воздухе, музыкального театрального представления или для вещания ; ^[3] для фильма определенные технологии адаптированы для кинотеатра или дома (например, системы домашнего кинотеатра ). ^[4] Повествовательное пространство также является контентом, который может быть улучшен с помощью многоканальных технологий. Это относится в основном к повествованиям в кино, например, к речи персонажей фильма, ^[5]^[6]^[7], но также может применяться к пьесам, исполняемым в театре, на конференции или для интеграции голосовых комментариев в археологические раскопки или памятники. Например, выставка может быть улучшена тематическим фоновым звуком воды, птиц, поезда или шума машин. Актуальные естественные звуки также могут использоваться в образовательных приложениях. ^[8] Другие области применения включают игровые приставки, персональные компьютеры и другие платформы. ^[9]^[10]^[11]^[12] В таких приложениях контент обычно представляет собой синтетический шум, создаваемый компьютерным устройством при взаимодействии с его пользователем. Значительная работа также была проделана с использованием объемного звука для повышения осведомленности о ситуации в военных и общественных приложениях безопасности. ^[13]

Типы медиа и технологий

Коммерческие носители объемного звука включают видеокассеты , DVD и вещание SDTV, закодированное как аналоговый матричный Dolby Surround, сжатый Dolby Digital и DTS , и звук без потерь, такой как DTS HD Master Audio и Dolby TrueHD на HDTV Blu-ray Disc и HD DVD , которые идентичны студийному мастеру. Другие коммерческие форматы включают конкурирующие форматы DVD-Audio (DVD-A) и Super Audio CD (SACD), а также MP3 Surround . Форматы объемного звука Cinema 5.1 включают Dolby Digital и DTS . Sony Dynamic Digital Sound (SDDS) — это 8-канальная конфигурация кинотеатра, которая имеет 5 независимых аудиоканалов по всей передней панели с двумя независимыми каналами объемного звука и каналом низкочастотных эффектов . Традиционная конфигурация объемного звука 7.1 представляет собой два дополнительных задних динамика к обычной компоновке 5.1, что в общей сложности дает четыре канала объемного звука и три фронтальных канала, чтобы создать более 360° звуковое поле.

Большинство записей объемного звука создаются кинокомпаниями или производителями видеоигр; однако некоторые потребительские камкордеры имеют такую возможность либо встроенной, либо доступной отдельно. Технологии объемного звука также могут использоваться в музыке для обеспечения новых методов художественного выражения. После провала квадрофонического звука в 1970-х годах многоканальная музыка медленно возрождается с 1999 года с помощью форматов SACD и DVD-Audio. Некоторые AV-ресиверы , стереофонические системы и компьютерные звуковые карты содержат встроенные цифровые сигнальные процессоры или цифровые аудиопроцессоры для имитации объемного звука из стереофонического источника (см. поддельное стерео ).

В 1967 году рок-группа Pink Floyd дала первый в истории концерт с объемным звуком на «Games for May», роскошном мероприятии в лондонском Queen Elizabeth Hall , где группа впервые представила свою изготовленную на заказ квадрофоническую акустическую систему. ^[14] Устройство управления, которое они создали, Azimuth Co-ordinator , сейчас выставлено в лондонском Музее Виктории и Альберта как часть их галереи Theatre Collections. ^[15]

История

Первое задокументированное использование объемного звука было в 1940 году для анимационного фильма студии Диснея « Фантазия» . Уолт Дисней был вдохновлен оперной пьесой Николая Римского-Корсакова «Полет шмеля» , чтобы в его мюзикле «Фантазия» был показан шмель , а также звучал так, как будто он летал во всех частях театра. Первоначальное многоканальное аудиоприложение называлось « Fantasound », оно включало в себя три аудиоканала и динамики. Звук распространялся по всему кинотеатру, управляемый инженером с помощью примерно 54 громкоговорителей. Объемный звук достигался с помощью суммы и разности фаз звука. Однако это экспериментальное использование объемного звука было исключено из фильма в более поздних показах. В 1952 году «объемный звук» успешно появился снова с фильмом «Это Синерама», используя дискретный семиканальный звук, и гонка за разработкой других методов объемного звука началась. ^[16]^[17]

В 1950-х годах немецкий композитор Карлхайнц Штокхаузен экспериментировал и создавал новаторские электронные композиции, такие как Gesang der Jünglinge и Kontakte , последняя из которых использовала полностью дискретные и вращающиеся квадрофонические звуки , созданные с помощью промышленного электронного оборудования в студии Герберта Эймерта на Westdeutscher Rundfunk (WDR). Poème électronique Эдгара Вареза , созданная для павильона Philips , спроектированного Яннисом Ксенакисом на Всемирной выставке в Брюсселе в 1958 году , также использовала пространственный звук с 425 громкоговорителями, которые использовались для перемещения звука по всему павильону.

В 1957 году, работая с художником Джорданом Белсоном , Генри Джейкобс выпустил Vortex: Experiments in Sound and Light — серию концертов с новой музыкой, включая некоторые из собственных произведений Джейкобса, а также Карлхайнца Штокхаузена и многих других, — проходивших в планетарии Моррисона в парке Золотые Ворота в Сан-Франциско. Звукорежиссеры обычно считают это источником (теперь стандартной) концепции «объемного звука». Программа была популярна, и Джейкобс и Белсон были приглашены воспроизвести ее на Всемирной выставке 1958 года в Брюсселе. ^[18] Есть также много других композиторов, которые создали новаторские произведения объемного звука в тот же период времени.

В 1978 году концепция, разработанная Максом Беллом для Dolby Laboratories под названием «раздельное объемное звучание», была опробована с фильмом «Супермен» . Это привело к выпуску 70-миллиметрового стереообъемного звучания фильма «Апокалипсис сегодня» , который стал одним из первых официальных релизов в кинотеатрах с тремя каналами спереди и двумя сзади. ^[19] Обычно за экранами кинотеатров с поддержкой 70-миллиметровой пленки располагалось пять динамиков, но только левый, центральный и правый использовались на полной частоте, в то время как центрально-левый и центрально-правый использовались только для басовых частот (как это принято в настоящее время). Кодер/декодер фильма «Апокалипсис сегодня» был разработан Майклом Карагосяном, также для Dolby Laboratories . Объемный микс был создан командой, удостоенной премии «Оскар», во главе с Уолтером Марчем для American Zoetrope . Формат также был развернут в 1982 году с выпуском стереообъемного звучания фильма « Бегущий по лезвию» .

Версия объемного звука 5.1 появилась в 1987 году в знаменитом французском кабаре « Мулен Руж» . Французский инженер Доминик Бертран использовал микшерный пульт, специально разработанный в сотрудничестве с Solid State Logic , на основе серии 5000 и включающий шесть каналов. Соответственно: A левый, B правый, C центральный, D левый задний, E правый задний, F бас. Этот же инженер уже добился создания системы 3.1 в 1974 году для Международного саммита франкоязычных государств в Дакаре , Сенегал.

Создание объемного звука

Объемный звук создается несколькими способами. Первый и самый простой метод — это использование техники записи объемного звука — захват двух отдельных стереоизображений, одного для передней и одного для задней части, или использование специальной установки, например, дополненного дерева Decca ^[20] — или смешивание объемного звука для воспроизведения на аудиосистеме с использованием динамиков, окружающих слушателя, для воспроизведения звука с разных направлений. Второй подход — обработка звука с помощью психоакустических методов локализации звука для имитации двумерного (2-D) звукового поля с наушниками. Третий подход, основанный на принципе Гюйгенса , пытается реконструировать записанные волновые фронты звукового поля в пространстве прослушивания; форма «аудиоголограммы». Одна форма, синтез волнового поля (WFS), создает звуковое поле с ровным полем ошибок по всей области. Коммерческие системы WFS, в настоящее время продаваемые компаниями Sonic Emotion и Iosono , требуют большого количества громкоговорителей и значительной вычислительной мощности. Четвертый подход заключается в использовании трех микрофонов: одного спереди, одного сбоку и одного сзади, что также называется записью Double MS .

Форма Ambisonics , также основанная на принципе Гюйгенса , дает точную реконструкцию звука в центральной точке; однако она менее точна вдали от центральной точки. Существует множество бесплатных и коммерческих программных обеспечений для Ambisonics, которые доминируют на большинстве потребительского рынка, особенно среди музыкантов, использующих электронную и компьютерную музыку. Более того, продукты Ambisonics являются стандартом в аппаратном обеспечении объемного звука, продаваемом Meridian Audio . В своей простейшей форме Ambisonics потребляет мало ресурсов, однако это не относится к последним разработкам, таким как Near Field Compensated Higher Order Ambisonics. ^[21] Несколько лет назад было показано, что в пределе WFS и Ambisonics сходятся. ^[22]

Наконец, объемный звук также может быть достигнут путем мастеринга уровня, из стереофонических источников, как в Penteo, который использует анализ цифровой обработки сигнала стереозаписи для разбора отдельных звуков на компонентные панорамные позиции, а затем размещает их, соответственно, в пятиканальном поле. Однако есть и другие способы создания объемного звука из стерео, например, с помощью процедур на основе QS и SQ для кодирования звука Quad , где инструменты были разделены на 4 динамика в студии. Этот способ создания объемного звука с помощью программных процедур обычно называется «upmixing», ^[23], что было особенно успешно на декодерах серии Sansui QSD, которые имели режим, в котором он отображал стерео L ↔ R на дугу ∩. ^{[ необходима цитата ]}

Стандартные конфигурации

Существует множество альтернативных установок для создания объемного звука, при этом конфигурация 3-2 (3 фронтальных, 2 тыловых динамика и канал низкочастотных эффектов) (чаще называемая 5.1-канальным объемным звучанием) является стандартной для большинства приложений объемного звука, включая кино, телевидение и бытовые приложения. ^[2]^[24] Это компромисс между идеальным созданием образа комнаты и практичностью и совместимостью с двухканальным стерео. ^[25] Поскольку большинство миксов объемного звука производятся для 5.1-канального объемного звучания (6 каналов), для более крупных установок требуются матрицы или процессоры для питания дополнительных динамиков. ^[25]

Стандартная установка объемного звучания состоит из трех фронтальных динамиков LCR (левый, центральный и правый), двух динамиков объемного звучания LS и RS (левый и правый объемного звучания соответственно) и сабвуфера для канала низкочастотных эффектов (LFE), который фильтруется фильтром нижних частот на частоте 120 Гц. Углы между динамиками были стандартизированы рекомендацией 775 ITU (Международного союза электросвязи) и AES (Общества инженеров-аудиотехников) следующим образом: 60 градусов между каналами L и R (обеспечивает двухканальную стереосовместимость) с центральным динамиком прямо перед слушателем. Каналы объемного звучания размещаются на 100–120 градусов от центрального канала, при этом расположение сабвуфера не является критическим из-за низкого направленного фактора частот ниже 120 Гц. ^[26] Стандарт ITU также допускает дополнительные динамики объемного звучания, которые должны быть равномерно распределены между 60 и 150 градусами. ^[24]^[26]

Приемлемы миксы объемного звучания большего или меньшего количества каналов, если они совместимы, как описано в ITU-R BS. 775-1, ^[2] с 5.1 объемным звучанием. Настройка каналов 3-1 (состоящая из одного монофонического объемного канала) является таким случаем, где и LS, и RS питаются монофоническим сигналом с ослабленным уровнем -3 дБ. ^[25]

Функция центрального канала заключается в том, чтобы закрепить сигнал так, чтобы никакие центральные панорамированные изображения не смещались, когда слушатель движется или сидит вдали от зоны наилучшего восприятия. ^[27] Центральный канал также предотвращает возникновение любых тембральных изменений, что типично для 2-канального стерео, из-за разницы фаз в двух ушах слушателя. ^[24] Центральный канал особенно используется в фильмах и на телевидении, при этом диалог в первую очередь подается на центральный канал. ^[25] Функция центрального канала может быть либо монофонической по своей природе (как в случае с диалогом), либо может использоваться в сочетании с левым и правым каналами для настоящего трехканального стерео. В кинофильмах, как правило, центральный канал используется для монофонических целей, а стерео зарезервировано исключительно для левого и правого каналов. Однако были разработаны методы объемного микрофона, которые в полной мере используют потенциал трехканального стерео.

В 5.1 Surround фантомные изображения между передними динамиками довольно точны, а изображения сзади и особенно по бокам нестабильны. ^[24]^[25] Локализация виртуального источника, основанная на разнице уровней между двумя динамиками по бокам от слушателя, показывает большую непоследовательность в стандартизированной настройке 5.1, также в значительной степени подверженная влиянию перемещения от исходного положения. Поэтому 5.1 Surround ограничен в своей способности передавать трехмерный звук, что делает каналы объемного звучания более подходящими для создания атмосферы или эффектов. ^[24] )

7.1-канальный объемный звук — это еще одна настройка, наиболее часто используемая в больших кинотеатрах, которая совместима с 5.1-канальным объемным звуком, хотя это не указано в стандартах ITU. 7.1-канальный объемный звук добавляет два дополнительных канала, центрально-левый (CL) и центрально-правый (CR) к настройке 5.1-канального объемного звука, при этом динамики располагаются на 15 градусов от центра слушателя. ^[24] Эта конвенция используется для покрытия увеличенного угла между передними динамиками как продукта большего экрана.

Методы использования объемного микрофона

Большинство 2-канальных стереофонических микрофонных техник совместимы с 3-канальной настройкой (LCR), так как многие из этих техник уже содержат центральный микрофон или пару микрофонов. Однако микрофонные техники для LCR должны пытаться получить большее разделение каналов, чтобы предотвратить конфликтующие фантомные изображения между L/C и L/R, например. ^[25]^[27]^[28] Поэтому были разработаны специализированные техники для 3-канального стерео. Методы объемного микрофона во многом зависят от используемой настройки, поэтому они смещены в сторону настройки объемного звука 5.1, так как это стандарт. ^[24]

Методы записи окружающего звука можно разделить на те, которые используют отдельные массивы микрофонов, размещенных в непосредственной близости, и те, которые обрабатывают передние и задние каналы отдельными массивами. ^[24]^[26] Близкие массивы представляют более точные фантомные изображения, тогда как раздельная обработка задних каналов обычно используется для окружения. ^[26] Для точного изображения акустической среды, такой как залы, боковые отражения необходимы. Поэтому следует использовать соответствующие микрофонные методы, если важно впечатление от помещения. Хотя воспроизведение боковых изображений очень нестабильно в настройке объемного звучания 5.1, впечатления от помещения все равно могут быть точно представлены. ^[25]

Некоторые микрофонные методы, используемые для покрытия трех фронтальных каналов, включают двойные стереометоды, INA-3 (идеальная кардиоидная компоновка), установку Decca Tree и OCT (оптимальный кардиоидный треугольник). ^[25]^[28] Методы объемного звучания в значительной степени основаны на 3-канальных методах с дополнительными микрофонами, используемыми для каналов объемного звучания. Отличительным фактором для захвата фронтальных каналов в объемном звучании является то, что должно быть захвачено меньше реверберации, поскольку микрофоны объемного звучания будут отвечать за захват реверберации. ^[24] Поэтому кардиоидные, гиперкардиоидные или суперкардиоидные диаграммы направленности часто заменяют всенаправленные диаграммы направленности для записей объемного звучания. Чтобы компенсировать потерянные низкие частоты направленных микрофонов (градиент давления), можно добавить дополнительные всенаправленные (микрофоны давления), демонстрирующие расширенную низкочастотную характеристику. Выход микрофона обычно фильтруется низкими частотами. ^[25]^[28] Простая конфигурация объемного микрофона включает использование переднего массива в сочетании с двумя направленными назад всенаправленными комнатными микрофонами, размещенными на расстоянии около 10–15 метров от переднего массива. Если эхо заметно, передний массив может быть задержан соответствующим образом. В качестве альтернативы, направленные назад кардиоидные микрофоны могут быть размещены ближе к переднему массиву для аналогичного приема реверберации. ^[26]

INA-5 (идеальная кардиоидная направленность) — это массив объемных микрофонов, в котором используются пять кардиоидных микрофонов, напоминающих углы стандартной конфигурации объемных громкоговорителей, определенной в Рекомендации ITU 775. ^[26] Размеры между тремя передними микрофонами, а также диаграммы направленности микрофонов можно изменять для получения различных углов захвата и отклика окружающей среды. ^[24] Таким образом, эта технология обеспечивает большую гибкость.

Хорошо зарекомендовавшая себя микрофонная решетка — это Fukada Tree, которая является модифицированным вариантом стереотехники Decca Tree. Решетка состоит из пяти разнесенных кардиоидных микрофонов, трех фронтальных микрофонов, напоминающих Decca Tree, и двух объемных микрофонов. Можно добавить два дополнительных всенаправленных аутригера, чтобы увеличить воспринимаемый размер оркестра или лучше интегрировать фронтальные и объемные каналы. ^[24]^[25] Микрофоны L, R, LS и RS должны быть размещены в квадратной формации, причем L/R и LS/RS должны быть расположены под углом 45 градусов и 135 градусов от центрального микрофона соответственно. Расстояние между этими микрофонами должно составлять около 1,8 метра. Эта квадратная формация отвечает за впечатление от помещения. Центральный канал размещается на метр перед каналами L и R, создавая сильный центральный образ. Объемные микрофоны обычно размещаются на критическом расстоянии (где прямое и реверберирующее поле равны), при этом полный массив обычно располагается на несколько метров выше и позади дирижера. ^[24]^[25]

NHK (японская вещательная компания) разработала альтернативную технику, также включающую пять кардиоидных микрофонов. Здесь для разделения передних левого и правого каналов, которые находятся на расстоянии 30 см друг от друга, используется перегородка. ^[24] Выносные всенаправленные микрофоны, фильтруемые на низких частотах на частоте 250 Гц, расположены на расстоянии 3 метров друг от друга на одной линии с левым и правым кардиоидами. Они компенсируют спад басов кардиоидных микрофонов, а также добавляют экспансивности. ^[27] Для каналов объемного звучания используется пара микрофонов, разнесенных на 3 метра и расположенных на расстоянии 2–3 метров позади переднего массива. ^[24] Центральный канал снова расположен немного впереди, при этом левый/правый и левый/правый снова расположены под углом 45 и 135 градусов соответственно.

Микрофонная решетка OCT-Surround (Optimum Cardioid Triangle-Surround) представляет собой расширенную методику стереофонической OCT, использующую ту же переднюю решетку с добавленными объемными микрофонами. Передняя решетка разработана для минимизации перекрестных помех, при этом передние левый и правый микрофоны имеют суперкардиоидные диаграммы направленности и расположены под углом 90 градусов относительно центрального микрофона. ^[24]^[25] Важно, чтобы для каналов L и R использовались высококачественные микрофоны с малой диафрагмой, чтобы уменьшить внеосевое окрашивание. ^[26] Эквалайзер также может использоваться для выравнивания отклика суперкардиоидных микрофонов на сигналы, поступающие под углом до 30 градусов от передней части решетки. ^[24] Центральный канал расположен немного впереди. Объемные микрофоны представляют собой кардиоидные микрофоны, обращенные назад, которые расположены на расстоянии 40 см от микрофонов L и R. Микрофоны L, R, LS и RS улавливают ранние отражения как с боков, так и с задней стороны акустического помещения, поэтому создают значительные впечатления от помещения. ^[25] Расстояние между левым и правым микрофонами можно изменять для получения необходимой ширины стерео. ^[25]

Специализированные микрофонные массивы были разработаны для записи исключительно атмосферы пространства. Эти массивы используются в сочетании с подходящими фронтальными массивами или могут быть добавлены к вышеупомянутым методам объемного звучания. ^[26] Квадрат Хамасаки (также предложенный NHK) — это хорошо зарекомендовавший себя микрофонный массив, используемый для захвата атмосферы зала. Четыре микрофона в форме восьмерки располагаются в квадрате, идеально расположенном далеко и высоко в зале. Расстояние между микрофонами должно составлять от 1 до 3 метров. ^[25] Нулевые точки микрофонов (нулевая точка захвата) устанавливаются так, чтобы они были обращены к основному источнику звука с положительной полярностью наружу, поэтому очень эффективно минимизируют прямой захват звука, а также эхо из задней части зала ^[26] Два задних микрофона микшируются с каналами объемного звучания, а два передних канала микшируются в сочетании с фронтальным массивом в L и R.

Другой эмбиентный метод — это крест IRT (Institut für Rundfunktechnik). Здесь четыре кардиоидных микрофона, расположенных под углом 90 градусов друг к другу, размещаются в квадратной формации на расстоянии 21–25 см. ^[26]^[28] Передние два микрофона должны быть расположены под углом 45 градусов от оси источника звука. Таким образом, этот метод напоминает почти совпадающие стереопары, расположенные спина к спине. Выходы микрофонов подаются на каналы L, R и LS, RS. Недостатком этого подхода является то, что прямой захват звука довольно значителен.

Многие записи не требуют захвата боковых отражений. Для концертов живой поп-музыки более подходящим массивом для захвата окружения является кардиоидная трапеция. ^[25] Все четыре кардиоидных микрофона направлены назад и расположены под углом 60 градусов друг к другу, поэтому похожи на полукруг. Это эффективно для захвата аудитории и окружения.

Все вышеупомянутые микрофонные решетки занимают значительное пространство, что делает их совершенно неэффективными для полевых записей. В этом отношении техника двойного MS (Mid Side) весьма выгодна. Эта решетка использует кардиоидные микрофоны, расположенные спина к спине, один направлен вперед, другой назад, в сочетании с одним или двумя микрофонами восьмерки. Различные каналы получаются путем суммы и разности диаграмм направленности восьмерки и кардиоиды. ^[25]^[26] При использовании только одного микрофона восьмерки техника двойного MS чрезвычайно компактна и, следовательно, также идеально совместима с монофоническим воспроизведением. Эта техника также позволяет изменять угол захвата на этапе постобработки.

Управление басами

Системы объемного воспроизведения могут использовать управление басами , основополагающий принцип которого заключается в том, что басовая составляющая входящего сигнала, независимо от канала, должна направляться только на громкоговорители, способные его обработать, независимо от того, являются ли последние основными громкоговорителями системы или одним или несколькими специальными низкочастотными громкоговорителями, называемыми сабвуферами .

Существует разница в обозначениях до и после системы управления басами. Перед системой управления басами находится канал низкочастотных эффектов (LFE). После системы управления басами находится сигнал сабвуфера. Распространенным заблуждением является мнение, что канал LFE является «каналом сабвуфера». Система управления басами может направлять басы на один или несколько сабвуферов (если они есть) с любого канала, а не только с канала LFE. Кроме того, если нет динамика сабвуфера, то система управления басами может направлять канал LFE на один или несколько основных динамиков.

Канал низкочастотных эффектов

Поскольку канал низкочастотных эффектов (LFE) требует лишь часть полосы пропускания других аудиоканалов, его называют каналом .1 ; например, 5.1 или 7.1 . ^{[ необходима цитата ]}

Канал LFE является источником некоторой путаницы в объемном звуке. Первоначально он был разработан для передачи крайне низких суббасовых кинематографических звуковых эффектов (например, громких раскатов грома или взрывов) на собственном канале. Это позволяло кинотеатрам контролировать громкость этих эффектов в соответствии с акустической средой и системой воспроизведения звука конкретного кинотеатра. Независимое управление суббасовыми эффектами также уменьшало проблему интермодуляционных искажений в аналоговом воспроизведении звука в кино.

В оригинальной реализации кинотеатра LFE был отдельным каналом, подаваемым на один или несколько сабвуферов. Однако домашние системы воспроизведения могут не иметь отдельного сабвуфера, поэтому современные домашние декодеры и системы объемного звучания часто включают в себя систему управления басами, которая позволяет подавать басы на любом канале (основном или LFE) только на громкоговорители, которые могут обрабатывать низкочастотные сигналы. Важным моментом здесь является то, что канал LFE не является каналом сабвуфера ; сабвуфера может не быть, а если он есть, он может обрабатывать гораздо больше, чем просто эффекты. ^[29]

Некоторые звукозаписывающие компании, такие как Telarc и Chesky, утверждают, что каналы LFE не нужны в современной цифровой многоканальной развлекательной системе. ^{[ необходима цитата ]} Они утверждают, что, учитывая громкоговорители с низкочастотной характеристикой до 30 Гц, все доступные каналы имеют полный частотный диапазон и, таким образом, нет необходимости в LFE при создании объемной музыки, поскольку все частоты доступны во всех основных каналах. Эти компании иногда используют канал LFE для переноса канала высоты. ^{[ необходима цитата ]} Лейбл BIS Records обычно использует 5.0-канальный микс.

Обозначение канала

Обозначение канала указывает количество дискретных каналов, закодированных в аудиосигнале, не обязательно количество каналов, воспроизводимых для воспроизведения. Количество каналов воспроизведения может быть увеличено с помощью матричного декодирования . Количество каналов воспроизведения также может отличаться от количества динамиков, используемых для их воспроизведения, если один или несколько каналов управляют группой динамиков. Обозначение представляет количество каналов, а не количество динамиков.

Первая цифра в "5.1" - это количество каналов полного диапазона. ".1" отражает ограниченный частотный диапазон канала LFE.

Например, два стереодинамика без канала LFE = 2.0
5 полнодиапазонных каналов + 1 канал LFE = 5.1

Альтернативная нотация показывает количество полнодиапазонных каналов перед слушателем, отделенных косой чертой от количества полнодиапазонных каналов рядом или позади слушателя, с десятичной точкой, обозначающей количество каналов LFE с ограниченным диапазоном.

Например, 3 фронтальных канала + 2 боковых канала + канал LFE = 3/2.1

Обозначение может быть расширено для включения матричных декодеров . Например, Dolby Digital EX имеет шестой полнодиапазонный канал, включенный в два задних канала с матрицей . Это выражается:

3 фронтальных канала + 2 тыловых канала + 3 канала, воспроизводимых сзади в общей сложности + 1 канал LFE = 3/2:3.1

Термин стерео , хотя и популяризированный в отношении двухканального звука, исторически также относился к объемному звуку, поскольку он строго означает «сплошной» (трехмерный) звук. Однако это больше не является общепринятым употреблением, и «стереозвук» почти исключительно означает два канала, левый и правый.

Идентификация канала

В соответствии с ANSI/CEA-863-A ^[30]

Звуковой звук сверху

В 2002 году Dolby представила премьеру мастер-версии We Were Soldiers , включавшую звуковую дорожку Sonic Whole Overhead Sound. Этот микс включал новый канал высоты , смонтированный на потолке .

Амбисоника

Ambisonics — это метод записи и воспроизведения с использованием многоканального микширования, который может использоваться вживую или в студии и который воссоздает звуковое поле таким, каким оно существовало в пространстве, в отличие от традиционных систем объемного звучания, которые могут создать иллюзию звукового поля только в том случае, если слушатель находится в очень узкой зоне наилучшего восприятия между динамиками. Для воссоздания звукового поля можно использовать любое количество динамиков в любом физическом расположении. При размещении 6 или более динамиков вокруг слушателя можно представить трехмерное («перифоническое» или полносферное) звуковое поле. Ambisonics был изобретен Майклом Герзоном .

Бинауральная запись

Бинауральная запись — это метод записи звука, который использует два микрофона, расположенных с целью создания 3-D стереоэффекта присутствия в комнате с исполнителями или инструментами. Идея трехмерной или «внутренней» формы звука развилась в технологию для стетоскопов, создающих акустику «в голове», и фильмов IMAX, создающих трехмерный акустический опыт.

Panor-Ambiophonic (ПанАмбио) 4.0/4.1

PanAmbio объединяет стереодиполь и подавление перекрестных помех спереди и второй комплект позади слушателя (всего четыре динамика) для воспроизведения объемного звука 360° 2D. Четырехканальные записи, особенно те, которые содержат бинауральные сигналы, создают объемный звук динамика-бинауральный. Записи каналов 5.1, включая фильмы DVD, совместимы путем микширования контента C-канала на переднюю пару динамиков. 6.1 можно воспроизводить путем микширования SC на заднюю пару.

Стандартные каналы динамиков

Несколько конфигураций динамиков обычно используются для потребительского оборудования. Порядок и идентификаторы указаны для маски канала в стандартном несжатом формате файла WAV (который содержит необработанный многоканальный поток PCM ) и используются в соответствии с той же спецификацией для большинства подключаемых к ПК цифровых звуковых аппаратных средств и операционных систем ПК, способных обрабатывать несколько каналов. ^[38]^[39] Хотя возможно построить любую конфигурацию динамиков, существует мало коммерческого кино или музыкального контента для альтернативных конфигураций динамиков. Однако исходные каналы можно ремикшировать для каналов динамиков с помощью матричной таблицы, указывающей, какая часть каждого канала контента воспроизводится через каждый канал динамика.

Большинство конфигураций каналов могут включать канал низкочастотных эффектов (LFE) (канал, воспроизводимый через сабвуфер .) Это делает конфигурацию ".1" вместо ".0". Большинство современных многоканальных миксов содержат один LFE, некоторые используют два.

7.1 объемный звук

Объемный звук 7.1 — популярный формат в кинотеатрах и домашних кинотеатрах, включая Blu-ray, где основными игроками являются Dolby и DTS. ^[43]

7.1.2/7.1.4 объемный звук

7.1.2 и 7.1.4 иммерсивный звук вместе с форматом 5.1.2 и 5.1.4 добавляет либо 2, либо 4 верхних динамика, чтобы звуковые объекты и звуки спецэффектов панорамировались сверху для слушателя. Представлено для театральных релизов фильмов в 2012 году компанией Dolby Laboratories под торговой маркой Dolby Atmos . ^[44]

Dolby Atmos (и другие движки Microsoft Spatial Sound; см. AudioObjectTypeв SpatialAudioClient.h) дополнительно поддерживают виртуальную конфигурацию «8.1.4.4», которая будет отображаться с помощью HRTF . ^[45] Конфигурация дополняет 7.1.4 центральным динамиком позади слушателя и 4 динамиками ниже. ^[46]

10.2 объемный звук

10.2 — это формат объемного звука, разработанный создателем THX Томлинсоном Холманом из TMH Labs и Университета Южной Калифорнии (факультеты кино/телевидения и инженерии). Разработанный совместно с Крисом Кириакакисом из Инженерной школы Витерби Университета Южной Калифорнии , 10.2 ссылается на рекламный слоган формата: «Вдвое лучше, чем 5.1». Сторонники 10.2 утверждают, что это аудиоэквивалент IMAX . ^{[ слова-ласка ]}

11.1 объемный звук

Звук 11.1 поддерживается BARCO с установками в кинотеатрах по всему миру. ^[47]

22.2 объемный звук

22.2 — это компонент объемного звука Ultra High Definition Television , разработанный NHK Science & Technical Research Laboratories. Как следует из названия, он использует 24 динамика. Они расположены в три слоя: средний слой из десяти динамиков, верхний слой из девяти динамиков и нижний слой из трех динамиков и двух сабвуферов. Система была продемонстрирована на Expo 2005 , Aichi , Япония , NAB Shows 2006 и 2009, Лас-Вегас , и IBC Trade Shows 2006 и 2008, Амстердам , Нидерланды .

Смотрите также

Примечания

^ По историческим причинам при использовании (1.0) моно звука часто в технических реализациях используется первый (левый) канал вместо канала центрального динамика, во многих других случаях при воспроизведении многоканального контента на устройстве с конфигурацией моно динамика все каналы микшируются в один канал. То, как спроектированы стандартные моно и стерео разъемы, используемые для обычных аудиоустройств, также обеспечивает это.
^ Стерео (2.0) по-прежнему является наиболее распространенным форматом для музыки, поскольку большинство компьютеров, телевизоров и портативных аудиоплееров оснащены только двумя динамиками, а стандарт аудио-CD Red Book, используемый для розничной продажи музыки, допускает только два канала. Комплект динамиков 2.1 обычно не имеет отдельного физического канала для низкочастотных эффектов, поскольку комплект динамиков микширует низкочастотные компоненты двух стереоканалов в один канал для сабвуфера.

Ссылки

^ "Глоссарий терминов и терминологии домашнего кинотеатра". Audiogurus . Получено 28 октября 2015 г.
^ abc РЕКОМЕНДАЦИЯ МСЭ-Р BS.775-1 - Многоканальная стереофоническая звуковая система с сопровождающим изображением и без него (PDF) . МСЭ-Р. 1992.
^ Савагучи, Мик М.; Фукада, Акира (1999). «Практика многоканального микширования звука для вещания» (PDF) . Конференция IBC, 1999. Архивировано из оригинала (PDF) 2009-12-19.
^ Хили, Грэм; Смитон, Алан Ф. (2009-05-18). «Пространственно дополненная доставка звука: применение пространственной звуковой осведомленности в оборудованных датчиками помещениях» (PDF) . Десятая международная конференция по управлению мобильными данными 2009 года: системы, сервисы и промежуточное программное обеспечение . Тайбэй, Тайвань: Институт инженеров по электротехнике и электронике. стр. 704–708. doi :10.1109/MDM.2009.120. ISBN 978-1-4244-4153-2. S2CID 1627248.
^ Манолас, Христос; Паулетто, Сандра (01.08.2009). «Расширение диегетического пространства: использование многоканальной звуковой дорожки в кинематографическом повествовании». Звуковая дорожка, . 2 (1): 39–55. doi :10.1386/st.2.1.39_1. ISSN 1751-4193.
^ Anstey, Josephine; Pape, Dave; Sandin, Daniel J. (2000-05-03). «Создание повествования в виртуальной реальности». В Merritt, John O.; Benton, Stephen A.; Woods, Andrew J.; Bolas, Mark T. (ред.). Стереоскопические дисплеи и системы виртуальной реальности VII . Том 3957. стр. 370–379. doi :10.1117/12.384463. S2CID 110825093.
^ Керинс, Марк (2006). «Повествование в кинематографе цифрового звука». The Velvet Light Trap . 58 (1): 41–54. doi :10.1353/vlt.2006.0030. ISSN 1542-4251. S2CID 190599052.
^ Данцкер, Марк С. (2004), Акустика в среде обитания китообразных: мультимедийный образовательный пакет (PDF)
^ Гарденфорс, Дэн (2003). «Разработка компьютерных игр на основе звука». Цифровое творчество . 14 (2): 111–114. doi :10.1076/digc.14.2.111.27863. S2CID 1554199.
^ Роден, Тимоти; Парберри, Ян (2005-06-15). «Проектирование игрового движка 3D, основанного только на повествовании». Труды Международной конференции ACM SIGCHI 2005 года по достижениям в области компьютерных развлекательных технологий . ACE '05. Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 274–277. CiteSeerX 10.1.1.552.5977 . doi :10.1145/1178477.1178525. ISBN 978-1-59593-110-8. S2CID 11069976.
^ Шютце, Стефан (август 2003 г.). «Создание аудиосреды как части мира компьютерной игры: дизайн для Jurassic Park – Operation Genesis на XBOX™ как широкая концепция создания объемной инсталляции». Organised Sound . 8 (2): 171–180. doi :10.1017/S1355771803000074. ISSN 1469-8153. S2CID 62690122.
^ M Jones, Mike (2000), Composition Space: Cinema and Computer Gaming. Макро-мизансцена и пространственная композиция (PDF) , архивировано из оригинала (PDF) 2013-05-12
^ Беголт, Дюран и др. (2005). «Система мониторинга аудиовизуальной коммуникации для повышения ситуационной осведомленности» (PDF) .
↑ Калор, Майкл (12 мая 1967 г.). «Pink Floyd поражает „звуком в раунде“». WIRED .
^ "pink floyd" . Получено 2009-08-14 .
^ Томлинсон, Холман (2007). Объемный звук: запущен и работает. Focal Press. стр. 3,4. ISBN 978-0-240-80829-1. Получено 2010-04-03 .
^ Торик, Эмиль (1998-02-01). «Основные моменты в истории многоканального звука». Журнал Audio Engineering Society . 46 (1/2): 27–31.
^ Генри Джейкобс
^ Динстфри, Эрик (2016). «Миф о динамиках: критический пересмотр истории Dolby». История кино . 28 (1). История кино: международный журнал: 167–193. doi : 10.2979/filmhistory.28.1.06. JSTOR 10.2979/filmhistory.28.1.06. S2CID 192940527.
^ "Рон Штайхер (2003): Дерево DECCA — теперь оно не только для стерео" (PDF) . Архивировано из оригинала (PDF) 19 июля 2011 г.
^ «Пространственное кодирование звука, включая эффект ближнего поля: введение в фильтры кодирования расстояния и новый жизнеспособный формат объемного звука» (PDF) .
^ "Дальнейшие исследования амбисоники высокого порядка и синтеза волнового поля для холофонического звукового образа". Архивировано из оригинала 14 декабря 2001 г. Получено 24 октября 2016 г.
^ "DTSAC3". Архивировано из оригинала 2010-02-27.
^ abcdefghijklmnop Рамси, Фрэнсис; Маккормик, Тим (2009). Звук и запись (шестое изд.). Оксфорд: Focal Press.
^ abcdefghijklmnopq Вёр, Мартин; Дикрейтер, Майкл; Диттель, Волкер; и др., ред. (2008). Handbuch der Tonstudiotechnik Band 1 (Седьмое изд.). Мюнхен: КГ Саур.
^ abcdefghijk Холман, Томлинсон (2008). Surround Sound: Up and Running (Второе изд.). Оксфорд: Focal Press.
^ abc Бартлетт, Брюс; Бартлетт, Дженни (1999). Методы записи на месте . Focal Press.
^ abcd Эргл, Джон (2005). The Microphone Book (Второе издание). Оксфорд: Focal Press.
^ Многоканальное музыкальное микширование (PDF) , Dolby Laboratories, Inc., архивировано из оригинала (PDF) 2007-02-26
^ "Стандарты Ассоциации потребительской электроники: настройка и подключение" (PDF) . Архивировано из оригинала (PDF) 2009-09-30.
^ "Обновлено: теперь доступен плеер 6.3.1 с поддержкой mp3 Surround!". Архивировано из оригинала 2011-07-10.
^ "Windows Media". windows.microsoft.com . Microsoft . Получено 28 октября 2015 г. .
^ «Многоканальные аудиоданные и файлы WAVE». Microsoft. Июнь 2017 г.
^ Джош Коулсон. "FLAC - формат".
^ [ "Hydrogenaudio, 5.1 Channel Mappings". Архивировано из оригинала 2015-06-18.
^ "Спецификация Vorbis I". Фонд Xiph.Org . 2015-02-27.
^ Терриберри, Т.; Ли, Р.; Джайлз, Р. (2016). «Семейство сопоставления каналов 1». Инкапсуляция Ogg для аудиокодека Opus. стр. 18. раздел 5.1.1.2. doi : 10.17487/RFC7845 . RFC 7845.
^ "Структура KSAUDIO_CHANNEL_CONFIG". Microsoft. 13 марта 2023 г.
^ «Заголовочный файл для OpenSL, содержащий различные определения идентификаторов».
^ ab "Настройка акустической системы объемного звучания THX 5.1". Архивировано из оригинала 28.05.2010.. Это правильное расположение динамиков для воспроизведения звука 5.0/6.0/7.0 каналов для систем Dolby и Digital Theater Systems .
^ abc "Руководства по настройке акустических систем Dolby Atmos". www.dolby.com .
^ "Sony Print Master Guidelines" (PDF) . Архивировано из оригинала (PDF) 2012-03-07Это плюс LFE - правильное расположение динамиков для 8-дорожечного Sony Dynamic Digital Sound .{{cite web}}: CS1 maint: постскриптум ( ссылка )
^ "Следующие большие вещи в домашнем кинотеатре: Dolby Atmos и DTS:X объяснены". 2015-10-30 . Получено 24 октября 2016 .
^ "Dolby Atmos для дома". www.dolby.com .
^ «Пространственный звук для разработчиков приложений для Windows, Xbox и Hololens 2 — приложения Win32». learn.microsoft.com . 27 апреля 2023 г.
^ «Глубоко захватывающий игровой звук с пространственным звуком». games.dolby.com .
^ «Как работает эффект погружения от Barco?». Архивировано из оригинала 2015-11-18 . Получено 2015-11-01 .

Внешние ссылки

В Wikibooks есть больше информации по теме: Объемный звук