Бинауральная запись — это метод записи звука , который использует два микрофона , расположенных с целью создания у слушателя ощущения 3D -стереозвука, как будто он действительно находится в комнате с исполнителями или инструментами. Этот эффект часто создается с помощью техники, известной как запись с помощью головы манекена, при которой голова манекена оснащена микрофоном в каждом ухе. Бинауральная запись предназначена для воспроизведения с использованием наушников и не будет правильно передаваться через стереодинамики. Эта идея трехмерной или «внутренней» формы звука также транслировалась в полезное развитие технологий во многих вещах, таких как стетоскопы, создающие акустику «в голове», и фильмы IMAX, способные создавать трехмерный акустический опыт.
Термин «бинауральный» часто путают с синонимом слова « стерео », отчасти из-за систематического неправильного использования в середине 1950-х годов звукозаписывающей индустрией в качестве модного маркетингового словечка . Обычные стереозаписи не учитывают естественное расстояние между ушами или « головную тень » головы и ушей, поскольку эти вещи происходят естественным образом, когда человек слушает, создавая интерауральные временные различия (ITD) и интерауральные различия уровней (ILD), характерные для его положения прослушивания. Поскольку перекрестные помехи громкоговорителей с обычным стерео мешают бинауральному воспроизведению (то есть потому, что звук из динамика каждого канала слышен обоими ушами, а не только ухом с соответствующей стороны, как это было бы в случае с наушниками), требуются либо наушники, либо требуется подавление перекрестных помех сигналов, предназначенных для громкоговорителей, таких как Ambiophonics . Для прослушивания с использованием обычных динамиков-стерео или MP3-плееров , голова-манекен без ушной раковины может быть предпочтительнее для квазибинауральных записей, таких как сферический микрофон или Ambiophone. Как правило, для настоящих бинауральных результатов, цепь системы аудиозаписи и воспроизведения, от микрофона до мозга слушателя, должна содержать один и только один набор ушных раковин (предпочтительно собственный слушателя) и одну тень головы.
История бинауральной записи восходит к 1881 году. [1] Первое бинауральное устройство, театрафон , было изобретено Клеманом Адером . [1] Оно состояло из ряда угольных телефонных микрофонов, установленных вдоль переднего края Оперы Гарнье . Сигнал отправлялся абонентам через телефонную систему, и требовалось, чтобы они носили специальную гарнитуру, которая имела крошечный динамик для каждого уха.
Запись головы манекена связана с использованием физической синтетической головы, называемой Kunstkopf . Kunstkopf размещался в концертных залах во время записи живого оркестра или в киноиндустрии, актеры могли стоять вокруг головы во время записи своего диалога. Голову манекена также можно было использовать для запечатления позиционной информации на предварительно записанных звуковых эффектах путем воспроизведения звуков через громкоговоритель в подходящей ориентации по отношению к голове. Например, звуки грома и пения птиц можно было воспроизводить над головой манекена.
В киноиндустрии «Demolition» (1973) стала первой радиопостановкой, записанной с использованием манекена. [2]
В 1974 году Virgin Records выпустила первый сольный альбом лидера Tangerine Dream Эдгара Фрёзе под названием Aqua . В краткой аннотации на обложке сообщается, что вторая сторона диска (т. е. треки NGC 891 и Upland ) была записана с использованием системы искусственной головы, разработанной Гюнтером Бруншеном. Слушателям рекомендовалось оптимизировать прослушивание, используя стереонаушники для этой стороны альбома.
Хотя Эдгар стремился продолжать использовать и продвигать эту систему для последующих записей, от нее отказались, поскольку, хотя она хорошо работала через наушники, улучшенное качество звука не передавалось адекватно через Hi-Fi акустическую систему.
В 1978 году Лу Рид выпустил первую коммерчески выпущенную бинауральную поп-запись Street Hassle , которая представляла собой комбинацию живых и студийных записей. [3]
Бинауральный звук оставался на заднем плане из-за дорогого специализированного оборудования, необходимого для качественной записи, и необходимости использования наушников для надлежащего воспроизведения. Особенно в до- Walkman -дни большинство потребителей считали наушники неудобством и интересовались только записями, которые можно было слушать на домашней стереосистеме или в автомобиле. Наконец, типы вещей, которые можно записывать, не имеют типично высокой рыночной стоимости. Студийные записи мало выиграли бы от использования бинауральной установки, за исключением естественной перекрестной подачи, поскольку пространственное качество студии не было бы очень динамичным и интересным. Интерес представляют записи живых оркестровых выступлений и окружающие «экологические» записи городских звуков, природы и других подобных тем.
В 1990-х годах электронные устройства, которые использовали цифровую обработку сигнала (DSP) для воспроизведения HRTF, стали коммерчески доступными. Эти устройства позволяли звукорежиссеру использовать набираемые параметры для регулировки видимого направления звуков в реальном времени. Они были необычными и дорогими, но позволяли звукорежиссеру быстро и удобно изменять специальные эффекты предварительно записанных звуков. С помощью манипуляций параметрами звукорежиссеры могли взять монофоническую запись проезжающего автомобиля и заставить ее звучать так, как будто она проезжает позади них в реальном времени. Запись с реальной головой манекена для того же результата потребовала бы звукозаписывающей кабины и движущегося динамика или массива динамиков, а также нескольких панорамирующих или коммутационных устройств.
В современную эпоху наблюдается всплеск интереса к бинауральным технологиям, отчасти обусловленный широкой доступностью наушников, более дешевыми методами записи и общим возросшим коммерческим интересом к технологии 360°-аудио.
Онлайн- сообщество ASMR — еще одно движение, широко использующее бинауральные записи.
Рост популярности Dolby Atmos и других технологий 360° аудиофильмов в коммерческих развлечениях привел к росту популярности использования бинауральной симуляции. Это делается с целью полной адаптации 360° саундтрека для наушников и вкладышей. Пользователи могут якобы смотреть 360° фильмы и музыку с сохранением эффекта погружения в объемный звук , несмотря на использование только двух динамиков гарнитуры. Примечательно, что любой полный 360° многоканальный саундтрек автоматически преобразуется в симулированный бинауральный звук при прослушивании в наушниках.
В 2005 году альбом Aqua был ремикширован для переиздания ограниченным тиражом в Германии и Японии, а в конце компакт-диска был добавлен дополнительный трек Upland Dawn .
В 2015 году сингапурский певец и автор песен JJ Lin выпустил свой дебютный экспериментальный альбом From ME to Myself , используя запись с использованием головы манекена. Это также первый альбом в индустрии поп-музыки, использующий эту технологию. [4]
При простом методе записи два микрофона размещаются на расстоянии 18 см (7 дюймов) друг от друга. Этот метод не создаст настоящую бинауральную запись. Расстояние и размещение примерно соответствуют положению ушных каналов среднестатистического человека , но это не все, что нужно. Существуют более сложные методы.
Для создания бинаурального эффекта используются два основных метода:
Типичное устройство бинауральной записи имеет два высококачественных микрофона, установленных в голове манекена, вставленных в формы в форме уха , чтобы полностью захватить все регулировки звуковой частоты (известные как функции передачи, связанные с головой (HRTF) в сообществе психоакустических исследований), которые происходят естественным образом, когда звук окутывает человеческую голову и «формируется» формой внешнего и внутреннего уха . Голова манекена (также известная как искусственная голова , Kunstkopf [7] или имитатор головы и туловища ) используется для создания бинауральных записей. Затем треки прослушиваются через наушники, что позволяет слушателю слышать с точки зрения манекена. Голова манекена предназначена для записи нескольких звуков одновременно, что позволяет ей быть исключительной при записи музыки, а также в других отраслях, где задействовано несколько источников звука.
Голова манекена разработана для имитации человеческой головы среднего размера и в зависимости от производителя может иметь нос и рот. Каждая голова манекена оснащена ушными раковинами и ушными каналами, в которых размещены небольшие микрофоны, по одному в каждом ухе. [8] Ведущие производители в области дизайна голов манекенов: Brüel & Kjær, Head Acoustics GmBH, Knowles Electronics и GRAS Sound & Vibration. [8]
Производители голов манекенов проектируют свою продукцию по-разному, учитывая конкретные ситуации. Манекены GRAS гибкие: они включают в себя голову или туловище со сменными ушными раковинами разных размеров и материалов, набор различных типов имитаторов ушного канала, имитаторов барабанной перепонки. Головы могут включать или не включать имитатор рта. Конструкция Brüel & Kjær включает в себя мягкие формованные ушные раковины, нос, рот и туловище. Любая голова манекена или ШЛЯПЫ могут использоваться для записи звука одинаковой природы, но разные их типы специально разработаны для выполнения разных задач. Новым производителем на рынке бинауральной записи является 3Dio с целью записи в меньшем масштабе. Микрофоны 3Dio расположены в ушах на среднем расстоянии головы друг от друга, однако модель не включает в себя всю голову или туловище.
Основная цель записи с помощью головы манекена — добиться идеального бинаурального воспроизведения, подходящего всем слушателям. Проблема возникает из-за того, что у каждой человеческой головы разные формы и размеры. Из-за разнообразия HRTF невозможно создать бинауральный эффект, совместимый с ушами каждого. Поэтому алгоритм записи с имитацией головы манекена использует средние HRTF для создания умеренного бинаурального эффекта для всех. [6]
Человеческое восприятие направления сложное:
Традиционная запись музыки производится для стереовоспроизведения, которое использует только левое и правое воспроизведение для динамиков и наушников. Реализация Dummy Head позволяет записывающемуся исполнителю использовать трехмерное воспроизведение звука. Это происходит потому, что при воспроизведении через наушники слушатель воспринимает звук так, как если бы он находился в положении манекена. Запись воспринимается через ушные раковины манекена.
Техника бинауральной перезаписи проста, но не была хорошо разработана. Она следует тем же принципам Worldizing, [10] техники, используемой звукорежиссерами фильмов, в которой звук воспроизводится через громкоговоритель в реальном месте, а затем перезаписывается, принимая с собой все аспекты и характеристики реального мира. [11]
Использование пространства для управления звуком и его последующая перезапись осуществлялись с помощью эхо-камер в студиях звукозаписи в течение многих лет. В 1959 году эхо-камера была знаменита тем, что использовалась Ирвингом Таунсендом во время пост-продакшн-процесса альбома Майлза Дэвиса Kind of Blue 1959 года . "[эффект эхо-камеры на Kind of Blue] просто немного подслащивает. На 30-й улице линия была проложена от микшерного пульта вниз в бетонную подвальную комнату с низким потолком — размером примерно 12 на 15 футов — в любом месте, где мы устанавливали динамик и хороший всенаправленный микрофон". [12]
При бинауральной перезаписи бинауральный микрофон используется для записи контента, воспроизводимого через многоканальную акустическую систему. Таким образом, бинауральная головка, или микрофон, теоретически делает запись того, как люди будут слышать многоканальный контент. Например, звуковая дорожка к фильму будет записана бинауральным микрофоном со всеми экологическими сигналами данного места, а также реверберациями, включая те, которые обычно создаются человеческим торсом (предполагая, что используется модель HATS [13] ). Этот метод, как и некоторые бинауральные записи, сделанные с помощью Neumann KU 100. [14]
Используя сканер МРТ, Brüel & Kjær и DTU собрали геометрию большой популяции человеческих ушей. Захватив полную геометрию ушного канала, включая костную часть, прилегающую к барабанной перепонке, эти данные были подвергнуты последующей обработке для определения средней геометрии ушного канала человека. На основе этого высокочастотный симулятор головы и туловища (HATS) типа 5128 создает очень реалистичное воспроизведение акустических свойств, охватывая весь диапазон слышимых частот (до 20 кГц). [15]
Существуют некоторые сложности с воспроизведением бинауральных записей через наушники. Звук, который улавливается микрофоном, помещенным в или на входе в ушной канал, имеет частотный спектр, который сильно отличается от того, который улавливался бы отдельно стоящим микрофоном. Функция передачи звука в диффузном поле (HRTF), то есть частотная характеристика на барабанной перепонке, усредненная для звуков, поступающих со всех возможных направлений, довольно гротескна, с пиками и провалами, превышающими 10 дБ . Частоты от около 2 до 5 кГц, в частности, сильно усиливаются по сравнению с представлением в свободном поле. [17]
В январе 2012 года BBC R&D совместно с BBC Radio 4 работали над бинауральной постановкой Private Peaceful , книги Майкла Морпурго . [18] 88-минутная инсценировка включала воспроизведение акустической системы 5.1 и имела 4 вариации. В начале каждой вариации слушатель слышал серию тестовых сигналов, позволяющих выбрать, какая версия дает слушателю наилучший пространственный опыт. Сделав это, BBC R&D согласились с тем, что будут вариации в успешности бинаурального воспроизведения, и поэтому предоставили различные миксы на основе различных наборов данных HRTF. Выпуск Private Peaceful сопровождался опросом, который попросили заполнить все слушатели. В нем задавались вопросы об успехе бинаурального воспроизведения у слушателей и о том, какая версия (1-4) слушатель считает наиболее успешной.
Во время интервью с Крисом Пайком из BBC R&D в сентябре 2012 года Пайк заявил, что «вы можете получить хорошее пространственное впечатление, но тембральная окраска часто является проблемой». [19] Проблема тембральной окраски упоминается в большом количестве исследований по пространственному улучшению и иногда рассматривается как результат неправильного использования или недостаточного количества данных HRTF при воспроизведении бинаурального звука, например, или того факта, что конечный пользователь просто не будет хорошо реагировать на собранные данные HRTF. Фрэнсис Рамси утверждает в статье 2011 года «Чья это голова, в конце концов?» [20] , что «плохо реализованные HRTF могут привести к плохому качеству тембра, плохой экстернализации и множеству других нежелательных результатов». [20] Получение правильных данных HRTF является ключевым моментом в создании успешного конечного продукта, и, возможно, сделав данные HRTF как можно более обширными, будет меньше места для ошибок, таких как тембральные проблемы. HRTF, используемые для Private Peaceful [18], были разработаны путем измерения импульсных характеристик в реверберирующей комнате, что было сделано для того, чтобы уловить ощущение пространства, но не слишком внешнего, и, как указал Пайк, существуют очевидные тембральные проблемы. [19]
Юха Меримаа из Sennheiser Research Laboratories обнаружил, что использование фильтров HRTF для уменьшения тембральных проблем не повлияло на пространственную локализацию, ранее достигнутую с использованием данных при тестировании на группе слушателей. [21] Это объясняет, что существуют способы уменьшения влияния тембральных проблем на аудио, которые были обработаны с помощью данных HRTF, но это означает дальнейшую манипуляцию эквалайзером аудио. Если этот путь будет изучаться дальше, исследователям придется довольствоваться тем фактом, что аудио подвергается большой обработке для достижения большего ощущения пространственной осведомленности, и что эта дальнейшая манипуляция вызовет необратимые изменения аудио, что может не понравиться создателям контента. Необходимо будет рассмотреть, насколько уместна манипуляция и в какой степени, если таковая имеется, это повлияет на восприятие конечных пользователей.
Идеальные условия прослушивания, скорее всего, будут созданы с наушниками, разработанными и откалиброванными для обеспечения максимально плоской частотной характеристики, чтобы уменьшить окрашивание звука, который слушает пользователь. В большинстве случаев это не казалось достаточной проблемой для конечных пользователей, чтобы вложить средства в наушники, которые позволят им слышать звук именно так, как задумал создатель контента, и вместо этого они продолжали использовать комплектные наушники или, в некоторых случаях, вкладывать средства в наушники, одобренные и брендированные определенными артистами. Как обсуждалось ранее, существуют проблемы тембральных эффектов, присутствующих при использовании данных BRIR и HRTF для создания пространственно улучшенного звука, методов, используемых Крисом Пайком и BBC R&D. [19] Результаты выявили тембральные проблемы, и поэтому этот метод пока не может быть успешным способом создания пространственно улучшенного звука для наушников, но эти тембральные проблемы также возникают при выборе наушников. «[Являются ли проблемы с тембром, вызванные использованием данных BRIR и HRFT], чем-то хуже разницы между дешевыми наушниками, которые вы получаете с mp3-плеером, и хорошими Sennheisers». [19]
Разработан для использования в электроакустических испытаниях на месте, например, телефонных трубок, гарнитур, устройств аудиоконференций, микрофонов, наушников, слуховых аппаратов и средств защиты органов слуха. [22]
Neumann KU 100 — это микрофон-муляж, используемый для записи в бинауральном стерео. «Он напоминает человеческую голову и имеет два микрофонных капсюля, встроенных в уши» . [14] Neumann — это широко используемый бинауральный микрофон, который используется группами исследований и разработок BBC. [23]
KEMAR изначально был изобретен в сотрудничестве с аудиологической промышленностью для использования в разработке слуховых аппаратов и до сих пор является фактическим стандартом для этой отрасли, однако с тех пор использование KEMAR распространилось на множество других отраслей, таких как: телекоммуникации, тестирование средств защиты органов слуха, разработка автомобилей и т. д. KEMAR разработан с использованием обширных статистических исследований, чтобы максимально приблизиться к средним измерениям человека. Модель KEMAR также является единственным микрофоном в этом списке, в котором используется модель торса. Отражения торса, как было замечено, вносят значительный вклад в создание успешной бинауральной записи. [24]
Линейка бинауральных микрофонов 3Dio оснащена двумя силиконовыми ушными (ушными) формами, разделенными расстоянием 19 сантиметров (7,5 дюйма) — близко к среднему расстоянию между человеческими ушами. Микрофоны размещаются внутри ушей, начиная с Primo EM172 в моделях Free Space и Free Space XLR и заканчивая DPA 4060s в модели Pro II. Линейка 3Dio значительно дешевле, чем, например, Neumann KU 100, и поэтому больше используется на потребительском и полупрофессиональном уровне. Главное отличие моделей 3Dio от KEMAR или KU 100 заключается в отсутствии модели головы. 3Dio полностью полагается на использование ушных форм для достижения бинаурального эффекта от стереозаписи.
Внутриушной носимый стереомикрофон, используемый как наушники, помещаемый внутрь ушной раковины человека. Этот микрофон использует ушную раковину пользователя для создания бинаурального эффекта. [25]
Hooke Verse — сравнительно новое бинауральное устройство, представляющее собой набор микрофонов, которые можно носить в ухе и которые подключаются к записывающим устройствам с помощью Bluetooth с записью без потерь. Разработанный кодек позволяет пользователю записывать аудио вместе с видео. Кроме того, устройство использует ветрозащиту микрофона для снижения шума ветра, распространенной проблемы носимых устройств и смартфонов. [ необходима цитата ]