stringtranslate.com

Локализация звука

Локализация звука — это способность слушателя определять местоположение или источник обнаруженного звука по направлению и расстоянию.

Механизмы локализации звука слуховой системы млекопитающих были тщательно изучены. Слуховая система использует несколько сигналов для локализации источника звука, включая разницу во времени и разницу в уровне (или разность интенсивности) между ушами, а также спектральную информацию. Другие животные, такие как птицы и рептилии, также используют их, но они могут использовать их по-другому, а некоторые также имеют сигналы локализации, которые отсутствуют в слуховой системе человека, такие как эффекты движений ушей. Животные, способные локализовать звук, имеют явное эволюционное преимущество.

Как звук достигает мозга

Звук — это воспринимаемый результат механических колебаний, проходящих через среду, например, воздух или воду. Благодаря механизмам сжатия и разрежения звуковые волны распространяются по воздуху, отражаются от ушной раковины и раковины наружного уха и попадают в слуховой проход. У млекопитающих звуковые волны вызывают вибрацию барабанной перепонки ( барабанной перепонки ), заставляя вибрировать три косточки среднего уха , которые затем посылают энергию через овальное окно в улитку , где она преобразуется в химический сигнал волосковыми клетками в органе Корти , которые синапсируют на спиральных ганглиозных волокнах, проходящих через кохлеарный нерв в мозг.

Нейронные взаимодействия

Известно, что у позвоночных межушные временные различия рассчитываются в верхнем оливном ядре ствола мозга . По словам Джеффресса , [1] этот расчет основан на линиях задержки : нейронах в верхней оливе, которые принимают иннервацию от каждого уха с разной длиной соединительного аксона . Некоторые клетки более непосредственно связаны с одним ухом, чем с другим, поэтому они специфичны для конкретной межушной временной разницы. Эта теория эквивалентна математической процедуре кросс-корреляции . Однако, поскольку теория Джеффресса не может учесть эффект предшествования , при котором только первый из нескольких идентичных звуков используется для определения местоположения звуков (таким образом избегая путаницы, вызванной эхом), ее нельзя полностью использовать для объяснения ответа. Кроме того, ряд недавних физиологических наблюдений, проведенных в среднем мозге и стволе мозга мелких млекопитающих, вызвали значительные сомнения в обоснованности первоначальных идей Джеффресса. [2]

Нейроны, чувствительные к межушным различиям уровней (ILD), возбуждаются при стимуляции одного уха и подавляются при стимуляции другого уха, так что величина реакции клетки зависит от относительной силы двух входов, которая, в свою очередь, зависит от интенсивности звука в ушах.

В слуховом ядре среднего мозга, нижнем холмике (IC), многие чувствительные к ILD нейроны имеют функции ответа, которые резко снижаются от максимальных до нулевых спайков в зависимости от ILD. Однако есть также много нейронов с гораздо более поверхностными функциями ответа, которые не снижаются до нулевых спайков.

Слуховая система человека

Локализация звука — это процесс определения местоположения источника звука . Мозг использует тонкие различия в интенсивности, спектральных и временных сигналах для локализации источников звука. [3] [4] [5]

Локализацию можно описать в терминах трехмерного положения: азимут или горизонтальный угол, угол возвышения или вертикальный угол, а также расстояние (для статических звуков) или скорость (для движущихся звуков). [6]

Азимут звука определяется разницей во времени прибытия звука между ушами , относительной амплитудой высокочастотных звуков (эффект тени) и асимметричными спектральными отражениями от различных частей нашего тела, включая туловище, плечи и ушные раковины . [6]

Признаками расстояния являются потеря амплитуды, потеря высоких частот и отношение прямого сигнала к отраженному сигналу. [6]

В зависимости от того, где находится источник, наша голова действует как барьер для изменения тембра , интенсивности и спектральных качеств звука, помогая мозгу сориентироваться, откуда исходит звук. [5] Эти мельчайшие различия между двумя ушами известны как интерауральные сигналы. [5]

Более низкие частоты с более длинными волнами рассеивают звук вокруг головы, заставляя мозг фокусироваться только на фазовых сигналах от источника. [5]

Хельмут Хаас обнаружил, что мы можем различить источник звука, несмотря на дополнительные отражения на 10 децибел громче, чем исходный волновой фронт, используя самый ранний прибывший волновой фронт. [5] Этот принцип известен как эффект Хааса , особая версия эффекта предшествования . [5] Хаас измерил даже разницу в 1 миллисекунду во времени между исходным звуком и отраженным звуком, увеличив объемность, что позволило мозгу различить истинное местоположение исходного звука. Нервная система объединяет все ранние отражения в единое воспринимаемое целое, позволяя мозгу обрабатывать несколько разных звуков одновременно. [7] Нервная система будет объединять отражения, которые находятся в пределах примерно 35 миллисекунд друг от друга и имеют схожую интенсивность. [7]

Теория дуплекса

Чтобы определить боковое направление входного сигнала (влево, вперед, вправо), слуховая система анализирует следующую информацию о ушном сигнале:

В 1907 году лорд Рэлей использовал камертоны для генерации монофонического возбуждения и изучал теорию боковой локализации звука на модели человеческой головы без ушной раковины. Он впервые представил теорию локализации звука на основе интерауральной разницы подсказок, которая известна как дуплексная теория. [8] Человеческие уши находятся по разные стороны головы и, таким образом, имеют разные координаты в пространстве. Как показано на рисунке дуплексной теории, поскольку расстояния между акустическим источником и ушами различны, существует разница во времени и разница в интенсивности между звуковыми сигналами двух ушей. Мы называем эти виды различий интерауральной разницей во времени (ITD) и интерауральной разницей в интенсивности (IID) соответственно.

Теория дуплекса

Из рисунка теории дуплекса мы можем видеть, что для источника B1 или источника B2 будет задержка распространения между двумя ушами, которая будет генерировать ITD. Одновременно голова и уши человека могут иметь эффект затенения высокочастотных сигналов, что будет генерировать IID.

Для частот ниже 800 Гц размеры головы (расстояние до уха 21,5 см, что соответствует интерауральной временной задержке 626 мкс) меньше половины длины волны звуковых волн. Таким образом, слуховая система может определять фазовые задержки между обоими ушами без путаницы. Интерауральные различия уровня очень малы в этом диапазоне частот, особенно ниже примерно 200 Гц, поэтому точная оценка направления ввода на основе только разниц уровня практически невозможна. Когда частота падает ниже 80 Гц, становится трудно или невозможно использовать либо разницу во времени, либо разницу в уровне для определения бокового источника звука, потому что разность фаз между ушами становится слишком малой для направленной оценки. [12]

Для частот выше 1600 Гц размеры головы больше длины звуковых волн. Однозначное определение направления ввода на основе только интерауральной фазы на этих частотах невозможно. Однако интерауральные различия уровня становятся больше, и эти различия уровня оцениваются слуховой системой. Кроме того, задержки между ушами все еще могут быть обнаружены с помощью некоторой комбинации фазовых различий и групповых задержек , которые более выражены на более высоких частотах; то есть, если есть начало звука, задержка этого начала между ушами может быть использована для определения направления ввода соответствующего источника звука. Этот механизм становится особенно важным в реверберирующих средах. После начала звука есть короткий временной интервал, когда прямой звук достигает ушей, но еще не отраженный звук. Слуховая система использует этот короткий временной интервал для оценки направления источника звука и сохраняет это обнаруженное направление до тех пор, пока отражения и реверберация не мешают однозначной оценке направления. [13] Описанные выше механизмы не могут использоваться для различения источника звука, находящегося впереди или позади слушателя; поэтому необходимо оценивать дополнительные сигналы. [14]

Эффект фильтрации ушной раковины

HRTF

Теория дуплекса показывает, что ITD и IID играют важную роль в локализации звука, но они могут иметь дело только с проблемами боковой локализации. Например, если два акустических источника симметрично размещены спереди и сзади правой стороны головы человека, они будут генерировать равные ITD и IID, в том, что называется эффектом модели конуса. Однако человеческие уши все еще могут различать эти источники. Кроме того, при естественном слухе одно ухо, без ITD или IID, может различать их с высокой точностью. Из-за недостатков теории дуплекса исследователи предложили теорию эффекта фильтрации ушной раковины. [15] [16] Форма ушной раковины человека вогнутая со сложными складками и асимметрична как по горизонтали, так и по вертикали. Отраженные и прямые волны генерируют частотный спектр на барабанной перепонке, относящийся к акустическим источникам. Затем слуховые нервы локализуют источники, используя этот частотный спектр. [17]

ХРИР

Эти спектральные подсказки, генерируемые эффектом фильтрации ушной раковины, можно представить в виде функции передачи, связанной с головой (HRTF). Соответствующие выражения временной области называются импульсной реакцией, связанной с головой (HRIR). HRTF также описывается как функция передачи от свободного поля к определенной точке в ушном канале. Обычно мы распознаем HRTF как системы LTI: [9]

где L и R представляют левое и правое ухо соответственно, и представляют амплитуду звукового давления на входах в левый и правый слуховые проходы, а - амплитуда звукового давления в центре координат головы, когда слушатель отсутствует. В общем случае HRTF и являются функциями углового положения источника , угла возвышения , расстояния между источником и центром головы , угловой скорости и эквивалентного размера головы .

В настоящее время основными институтами, работающими над базой данных измерений HRTF, являются CIPIC [18] International Lab, MIT Media Lab, Graduate School in Psychoacoustics at the University of Oldenburg, The Neurophysiology Lab at the University of Wisconsin–Madison и Ames Lab of NASA. Базы данных HRIR от людей с нормальным и нарушенным слухом, а также от животных находятся в открытом доступе.

Другие сигналы

Человеческое наружное ухо , то есть структуры ушной раковины и наружного слухового прохода , образуют фильтры, селективные по направлению. В зависимости от направления входного звука активизируются различные резонансы фильтров. Эти резонансы внедряют шаблоны, специфичные для направления, в частотные характеристики ушей, которые могут быть оценены слуховой системой для локализации звука. Вместе с другими селективными по направлению отражениями на голове, плечах и туловище они формируют передаточные функции наружного уха. Эти шаблоны в частотных характеристиках уха являются весьма индивидуальными и зависят от формы и размера наружного уха. Если звук подается через наушники и был записан через другую голову с наружными поверхностями уха другой формы, шаблоны направленности отличаются от собственных у слушателя, и при попытке оценить направления в срединной плоскости с помощью этих чужих ушей возникнут проблемы. Как следствие, при прослушивании записей с фиктивной головы , или иначе называемых бинауральными записями, могут возникнуть перестановки спереди назад или локализация внутри головы. Было показано, что люди могут моноаурально локализовать звук высокой частоты, но не звук низкой частоты. Бинауральная локализация, однако, была возможна с более низкими частотами. Это, вероятно, из-за того, что ушная раковина достаточно мала, чтобы взаимодействовать только со звуковыми волнами высокой частоты. [19] Похоже, что люди могут точно локализовать возвышение только тех звуков, которые являются сложными и включают частоты выше 7000 Гц, и ушная раковина должна присутствовать. [20]

Когда голова неподвижна, бинауральные сигналы для боковой локализации звука (межушная разница во времени и межушная разница в уровне) не дают информации о местоположении звука в срединной плоскости. Идентичные ITD и ILD могут быть получены звуками на уровне глаз или на любой высоте, пока боковое направление постоянно. Однако, если голова вращается, ITD и ILD динамически изменяются, и эти изменения различны для звуков на разной высоте. Например, если источник звука на уровне глаз находится прямо перед вами, а голова поворачивается влево, звук становится громче (и достигает раньше) правого уха, чем левого. Но если источник звука находится прямо над головой, не будет никаких изменений в ITD и ILD при повороте головы. Промежуточные высоты будут производить промежуточные степени изменения, и если подача бинауральных сигналов на два уха во время движения головы будет обратной, звук будет слышен позади слушателя. [14] [21] Ганс Уоллах [22] искусственно изменил бинауральные сигналы звука во время движений головы. Хотя звук объективно располагался на уровне глаз, динамические изменения ITD и ILD при повороте головы были такими, которые были бы произведены, если бы источник звука был поднят. В этой ситуации звук был слышен на синтезированной высоте. Тот факт, что источники звука объективно оставались на уровне глаз, не позволял моноауральным сигналам указывать высоту, показывая, что именно динамическое изменение бинауральных сигналов во время движения головы позволяло правильно локализовать звук в вертикальном измерении. Движения головы не обязательно должны быть активно произведены; точная вертикальная локализация происходила в аналогичной установке, когда вращение головы производилось пассивно, путем усаживания субъекта с завязанными глазами во вращающееся кресло. Пока динамические изменения бинауральных сигналов сопровождали воспринимаемое вращение головы, воспринималась синтезированная высота. [14]

В 1960-х годах Батто показал, что ушная раковина также усиливает горизонтальную локализацию. [23] [24]

Расстояние до источника звука

[ необходима ссылка ]

Человеческая слуховая система имеет лишь ограниченные возможности для определения расстояния до источника звука. В ближнем диапазоне есть некоторые указания для определения расстояния, такие как экстремальные различия в уровне (например, при шепоте в одно ухо) или специфические резонансы ушной раковины (видимой части уха) в ближнем диапазоне.

Слуховая система использует эти подсказки для оценки расстояния до источника звука:

Обработка сигнала

Обработка звука слуховой системой человека осуществляется в так называемых критических полосах . Диапазон слышимости сегментирован на 24 критических полосы, каждая шириной 1 Барк или 100 Мел . Для направленного анализа сигналы внутри критической полосы анализируются вместе.

Слуховая система может извлекать звук нужного источника звука из мешающего шума. Это позволяет слушателю сосредоточиться только на одном говорящем, если другие говорящие также говорят ( эффект коктейльной вечеринки ). С помощью эффекта коктейльной вечеринки звук с мешающих направлений воспринимается ослабленным по сравнению со звуком с нужного направления. Слуховая система может увеличить отношение сигнал/шум до 15  дБ , что означает, что мешающий звук воспринимается ослабленным до половины (или меньше) его фактической громкости . [ требуется цитата ]

В закрытых помещениях в уши слушателя поступает не только прямой звук от источника звука, но и звук, отраженный от стен. Слуховая система анализирует только прямой звук, [13] который поступает первым, для локализации звука, но не отраженный звук, который поступает позже ( закон первого волнового фронта ). Таким образом, локализация звука остается возможной даже в эхогенной среде. Это подавление эха происходит в дорсальном ядре латеральной петли (DNLL). [25]

Чтобы определить временные периоды, в которых преобладает прямой звук и которые можно использовать для направленной оценки, слуховая система анализирует изменения громкости в различных критических полосах, а также стабильность воспринимаемого направления. Если есть сильная атака громкости в нескольких критических полосах и если воспринимаемое направление стабильно, эта атака, по всей вероятности, вызвана прямым звуком источника звука, который поступает вновь или который меняет свои сигнальные характеристики. Этот короткий временной период используется слуховой системой для направленного и громкостного анализа этого звука. Когда отражения приходят немного позже, они не усиливают громкость внутри критических полос таким сильным образом, но направленные сигналы становятся нестабильными, потому что есть смесь звука нескольких направлений отражения. В результате слуховая система не запускает новый направленный анализ.

Это первое обнаруженное направление от прямого звука принимается за найденное направление источника звука до тех пор, пока другие сильные атаки громкости в сочетании со стабильной направленной информацией не покажут, что возможен новый направленный анализ. (см. эффект Франсена )

Конкретные методы с приложениями

Аудиальная система передачи стереосигнала

Этот вид техники локализации звука предоставляет нам настоящую виртуальную стереосистему . [26] Он использует «умные» манекены, такие как KEMAR, для сбора сигналов или использует методы DSP для имитации процесса передачи от источников к ушам. После усиления, записи и передачи два канала полученных сигналов будут воспроизводиться через наушники или динамики. Этот подход локализации использует электроакустические методы для получения пространственной информации исходного звукового поля путем переноса слухового аппарата слушателя в исходное звуковое поле. Наиболее значительными его преимуществами являются то, что его акустические образы являются живыми и естественными. Кроме того, для воспроизведения акустического образа трехмерной системы требуются только два независимых переданных сигнала.

Локализация звука с помощью манекена

3D паравиртуализационная стереосистема

Представителями такого рода систем являются SRS Audio Sandbox, Spatializer Audio Lab и Qsound Qxpander. [26] Они используют HRTF для имитации принимаемых акустических сигналов в ушах с разных направлений с помощью обычного стереовоспроизведения с двоичным каналом. Поэтому они могут имитировать отраженные звуковые волны и улучшать субъективное ощущение пространства и охвата. Поскольку они являются паравиртуализированными стереосистемами, их основной целью является имитация стереозвуковой информации. Традиционные стереосистемы используют датчики, которые сильно отличаются от человеческих ушей. Хотя эти датчики могут получать акустическую информацию с разных направлений, они не имеют той же частотной характеристики, что и слуховая система человека. Поэтому при применении режима двоичного канала слуховые системы человека по-прежнему не могут ощущать поле трехмерного звукового эффекта. Однако стереосистема трехмерной паравиртуализации преодолевает такие недостатки. Она использует принципы HRTF для извлечения акустической информации из исходного звукового поля, а затем создает живое трехмерное звуковое поле через обычные наушники или динамики.

Многоканальное стерео виртуальное воспроизведение

Поскольку многоканальные стереосистемы требуют много каналов воспроизведения, некоторые исследователи приняли технологии моделирования HRTF, чтобы уменьшить количество каналов воспроизведения. [26] Они используют только два динамика для моделирования нескольких динамиков в многоканальной системе. Этот процесс называется виртуальным воспроизведением. По сути, такой подход использует как принцип интерауральной разницы, так и теорию эффекта фильтрации ушной раковины. К сожалению, такой подход не может полностью заменить традиционную многоканальную стереосистему, такую ​​как система объемного звучания 5.1 / 7.1 . Это связано с тем, что когда зона прослушивания относительно больше, имитационное воспроизведение через HRTF может вызывать инвертированные акустические образы в симметричных положениях.

Животные

Поскольку у большинства животных два уха, многие эффекты слуховой системы человека можно обнаружить и у других животных. Поэтому интерауральные временные различия (интерауральные фазовые различия) и интерауральные различия уровня играют роль для слуха многих животных. Но влияние на локализацию этих эффектов зависит от размеров головы, расстояния до ушей, положения ушей и ориентации ушей. Более мелкие животные, такие как насекомые, используют другие методы, поскольку разделение ушей слишком мало. [27] О процессе испускания животными звука для улучшения локализации, биологической форме активного сонара , см. эхолокация животных .

Боковая информация (слева, впереди, справа)

Если уши расположены по бокам головы, можно использовать аналогичные сигналы боковой локализации, как и для слуховой системы человека. Это означает: оценку интерауральных временных различий (интерауральных фазовых различий) для более низких частот и оценку интерауральных различий уровня для более высоких частот. Оценка интерауральных фазовых различий полезна, пока она дает однозначные результаты. Это так, пока расстояние до уха меньше половины длины (максимальной длины волны) звуковых волн. Для животных с большей головой, чем у человека, диапазон оценки интерауральных фазовых различий смещен в сторону более низких частот, для животных с меньшей головой этот диапазон смещен в сторону более высоких частот.

Самая низкая частота, которую можно локализовать, зависит от расстояния до уха. Животные с большим расстоянием до уха могут локализовать более низкие частоты, чем люди. Для животных с меньшим расстоянием до уха самая низкая локализуемая частота выше, чем для людей.

Если уши расположены по бокам головы, то интерауральные различия уровня проявляются для более высоких частот и могут быть оценены для задач локализации. Для животных с ушами на макушке головы не будет появляться затенение головой, и поэтому будет гораздо меньше интерауральных различий уровня, которые можно оценить. Многие из этих животных могут двигать ушами, и эти движения ушей могут использоваться в качестве латерального сигнала локализации.

В срединной плоскости (спереди, сверху, сзади, снизу)

У многих млекопитающих также имеются выраженные структуры в ушной раковине около входа в слуховой проход. В результате могут возникать резонансы, зависящие от направления, которые можно использовать в качестве дополнительного сигнала локализации, аналогичного локализации в срединной плоскости в слуховой системе человека. Существуют дополнительные сигналы локализации, которые также используются животными.

Наклон головы

Для локализации звука в срединной плоскости (возвышение звука) также можно использовать два детектора, которые располагаются на разной высоте. Однако у животных грубая информация о высоте получается просто путем наклона головы, при условии, что звук длится достаточно долго, чтобы завершить движение. Это объясняет врожденное поведение [ неопределенного ] наклона головы в сторону при попытке точно локализовать звук. Чтобы получить мгновенную локализацию в более чем двух измерениях из сигналов разницы во времени или разницы в амплитуде, требуется более двух детекторов.

Локализация с помощью парных ушей (мухи)

Крошечная паразитическая муха Ormia ochracea стала модельным организмом в экспериментах по локализации звука из-за своего уникального уха . Животное слишком мало для того, чтобы обычным способом рассчитать разницу во времени поступления звука в два уха, однако оно может определять направление источников звука с исключительной точностью. Барабанные перепонки противоположных ушей напрямую соединены механически, что позволяет разрешать разницу во времени в субмикросекунды [28] [29] и требует новой стратегии нейронного кодирования . [30] Хо [31] показал, что система сопряженных барабанных перепонок у лягушек может вызывать повышенные различия в межушных вибрациях, когда голове животного доступны только небольшие различия во времени прибытия и уровне звука. В настоящее время ведутся работы по созданию направленных микрофонов на основе структуры сопряженных барабанных перепонок.

Бикоординатная локализация звука (совы)

Большинство сов — ночные или сумеречные хищные птицы . Поскольку они охотятся ночью, им приходится полагаться на невизуальные чувства. Эксперименты Роджера Пейна [32] показали, что совы чувствительны к звукам, издаваемым их добычей, а не к теплу или запаху. Фактически, звуковые сигналы необходимы и достаточны для локализации мышей с удаленного места, где они сидят. Чтобы это работало, совы должны уметь точно локализовать как азимут, так и высоту источника звука.

Дельфины

Дельфины (и другие зубатые киты ) полагаются на эхолокацию , чтобы помочь в обнаружении, идентификации, локализации и захвате добычи. Сигналы сонара дельфина хорошо подходят для локализации нескольких небольших целей в трехмерной водной среде, используя высоконаправленные (ширина луча 3 дБ около 10 градусов), широкополосные (ширина полосы пропускания 3 дБ обычно около 40 кГц; пиковые частоты между 40 кГц и 120 кГц), короткие щелчки (около 40 мкс). Дельфины могут локализовать звуки как пассивно, так и активно (эхолокация) с разрешением около 1 градуса. Кросс-модальное соответствие (между зрением и эхолокацией) предполагает, что дельфины воспринимают пространственную структуру сложных объектов, опрашиваемых с помощью эхолокации, подвиг, который, вероятно, требует пространственного разрешения отдельных особенностей объекта и интеграции в целостное представление формы объекта. Хотя дельфины чувствительны к небольшой бинауральной интенсивности и временным различиям, все больше доказательств свидетельствуют о том, что дельфины используют зависящие от положения спектральные сигналы, полученные из хорошо развитых функций передачи, связанных с головой, для локализации звука как в горизонтальной, так и в вертикальной плоскостях. Очень малое время временной интеграции (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптации локализации включают выраженную асимметрию черепа, носовых мешков и специализированные липидные структуры во лбу и челюстях, а также акустически изолированные среднее и внутреннее ухо.

Роль Престина в локализации звука:

В области локализации звука млекопитающих ген Prestin стал ключевым игроком, особенно в увлекательной области эхолокации , используемой летучими мышами и дельфинами. Обнаруженный чуть более десяти лет назад, Prestin кодирует белок, расположенный в волосковых клетках внутреннего уха, что обеспечивает быстрые сокращения и расширения. Этот сложный механизм работает подобно старинному рупору фонографа, усиливая звуковые волны в улитке и повышая общую чувствительность слуха.

В 2014 году Лю и другие углубились в эволюционные адаптации Престина , раскрыв его важную роль в ультразвуковом диапазоне слуха, необходимом для сонара животных, особенно в контексте эхолокации . Эта адаптация оказывается полезной для дельфинов, перемещающихся по мутной воде, и летучих мышей, ищущих пропитание в ночной темноте. [33]

Примечательно, что зубатые киты и эхолокационные летучие мыши издают высокочастотные эхолокационные сигналы, демонстрируя разнообразие по форме, длительности и амплитуде. Однако именно их высокочастотный слух становится первостепенным, поскольку он позволяет принимать и анализировать эхо, отражающееся от объектов в их среде. Тщательное исследование функции белка Prestin у летучих мышей, управляемых сонаром, и дельфинов-афалин в сравнении с млекопитающими, не обладающими сонаром, проливает свет на тонкости этого процесса.

Эволюционный анализ последовательностей белка Prestin выявил убедительное наблюдение – единичный аминокислотный сдвиг с треонина (Thr или T) у млекопитающих-сонарников на аспарагин (Asn или N) у млекопитающих, не обладающих сонарной функцией. Это специфическое изменение, подверженное параллельной эволюции, выступает в качестве стержня в повествовании об эхолокации млекопитающих. [33]

Последующие эксперименты подтвердили эту гипотезу, определив четыре ключевых аминокислотных различия у млекопитающих-сонаристов, которые, вероятно, способствуют их отличительным особенностям эхолокации. Слияние эволюционного анализа и эмпирических результатов дает надежные доказательства, отмечая важный момент в понимании роли гена Престина в эволюционной траектории систем эхолокации млекопитающих. Это исследование подчеркивает адаптивность и эволюционное значение Престина, предлагая ценную информацию о генетических основах локализации звука у летучих мышей и дельфинов, особенно в сложной области эхолокации. [33]

История

Термин «бинауральный» буквально означает «слышать двумя ушами» и был введен в 1859 году для обозначения практики прослушивания одного и того же звука обоими ушами или двух отдельных звуков, по одному через каждое ухо. Только в 1916 году Карл Штумпф (1848–1936), немецкий философ и психолог , провел различие между дихотическим слушанием, которое относится к стимуляции каждого уха разным стимулом , и диотическим слушанием, одновременной стимуляцией обоих ушей одним и тем же стимулом. [34]

Позже стало очевидно, что бинауральный слух, будь то дихотический или диотический, является средством, с помощью которого происходит локализация звука. [34] [35] [ нужна страница ]

Научное рассмотрение бинаурального слуха началось до того, как явление получило такое название, с предположений, опубликованных в 1792 году Уильямом Чарльзом Уэллсом (1757–1817), основанных на его исследованиях бинокулярного зрения . [36] Джованни Баттиста Вентури (1746–1822) проводил и описывал эксперименты, в которых люди пытались локализовать звук, используя оба уха или одно ухо, заткнутое пальцем. Эта работа не получила продолжения и была восстановлена ​​только после того, как другие выяснили, как работает локализация звука у человека. [34] [36] Лорд Рэлей (1842–1919) проведет эти же эксперименты и придет к результатам, не зная, что Вентури впервые провел их, почти семьдесят пять лет спустя. [36]

Чарльз Уитстон (1802–1875) работал над оптикой и смешиванием цветов, а также исследовал слух. Он изобрел устройство, которое он назвал «микрофоном», которое включало металлическую пластину над каждым ухом, каждое из которых было соединено с металлическими стержнями; он использовал это устройство для усиления звука. Он также проводил эксперименты, держа камертоны у обоих ушей одновременно или по отдельности, пытаясь выяснить, как работает чувство слуха, что он опубликовал в 1827 году. [36] Эрнст Генрих Вебер (1795–1878) и Август Зеебек (1805–1849) и Уильям Чарльз Уэллс также пытались сравнить и сопоставить то, что станет известно как бинауральный слух, с принципами бинокулярной интеграции в целом. [36]

Понимание того, как различия в звуковых сигналах между двумя ушами способствуют слуховой обработке таким образом, чтобы обеспечить локализацию и направление звука, значительно продвинулось вперед после изобретения стетофона Сомервиллем Скоттом Элисоном в 1859 году, который ввел термин «бинауральный». Элисон создал стетофон на основе стетоскопа , который был изобретен Рене Теофилем Гиацинтом Лаэннеком (1781–1826); стетофон имел два отдельных «датчика», что позволяло пользователю слышать и сравнивать звуки, полученные из двух отдельных мест. [36]

Смотрите также

Ссылки

  1. ^ Джеффресс LA (1948). «Теория места локализации звука». Журнал сравнительной и физиологической психологии . 41 (1): 35–39. doi :10.1037/h0061495. PMID  18904764.
  2. ^ Шнупп Дж., Нелькен И и Кинг А.Дж., 2011. Слуховая нейронаука, MIT Press, глава 5.
  3. ^ Карлини, Алессандро; Бордо, Камиль; Амбар, Максим (2024-07-10). «Слуховая локализация: всеобъемлющий практический обзор». Frontiers in Psychology . 15. doi : 10.3389/fpsyg.2024.1408073 . ISSN  1664-1078. PMC 11267622. PMID 39049946  . 
  4. ^ Блауэрт, Дж.: Пространственный слух: психофизика локализации звука человеком; MIT Press; Кембридж, Массачусетс (1983)
  5. ^ abcdef Томпсон, Дэниел М. Понимание звука: извлечение максимальной пользы из вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.
  6. ^ abc Roads, Curtis. Учебник компьютерной музыки. Кембридж, Массачусетс: MIT, 2007. Печать.
  7. ^ ab Benade, Arthur H. Fundamentals of Musical Acoustics. Нью-Йорк: Oxford UP, 1976. Печать.
  8. Рэлей Л. XII. О нашем восприятии направления звука [J]. Лондонский, Эдинбургский и Дублинский философский журнал и научный журнал, 1907, 13(74): 214-232.
  9. ^ abc Чжоу X. Техника виртуальной реальности [J]. Телекоммуникационная наука, 1996, 12(7): 46-–.
  10. ^ Ян Питт. "Слуховое восприятие". Архивировано из оригинала 2010-04-10.
  11. ^ ДеЛян Ванг; Гай Дж. Браун (2006). Вычислительный анализ слуховой сцены: принципы, алгоритмы и приложения . Wiley interscience. ISBN 9780471741091. Для синусоидальных сигналов, представленных в горизонтальной плоскости, пространственное разрешение наиболее высоко для звуков, исходящих из средней плоскости (прямо перед слушателем) с MAA около 1 градуса, и оно заметно ухудшается, когда стимулы перемещаются в сторону — например, MAA составляет около 7 градусов для звуков, исходящих под углом 75 градусов в сторону.
  12. ^ Аудиальная локализация - Введение Колумбийский колледж, Чикаго - Аудиоискусство и акустика acousticslab.org/psychoacoustics , дата обращения 16 мая 2021 г.
  13. ^ ab Wallach, H; Newman, EB; Rosenzweig, MR (июль 1949). «Эффект предшествования в локализации звука». American Journal of Psychology . 62 (3): 315–336. doi :10.2307/1418275. JSTOR  1418275. PMID  18134356.
  14. ^ abc Wallach, Hans (октябрь 1940 г.). «Роль движений головы, вестибулярных и зрительных сигналов в локализации звука». Журнал экспериментальной психологии . 27 (4): 339–368. doi :10.1037/h0054629.
  15. ^ "Акустика: Уши имеют это". Newsweek . 1961-12-04. стр. 80.
  16. ^ Батто Д. В. Роль ушной раковины в локализации человека [J]. Труды Лондонского королевского общества B: Биологические науки, 1967, 168(1011): 158-180.
  17. ^ Музыкант AD, Батлер R A. Влияние спектральных сигналов, основанных на ушных раковинах, на локализацию звука [J]. Журнал акустического общества Америки, 1984, 75(4): 1195–1200.
  18. ^ "База данных CIPIC HRTF". Архивировано из оригинала 2013-09-13.
  19. ^ Роберт А. Батлер; Ричард А. Хумански (1992). «Локализация звука в вертикальной плоскости с высокочастотными спектральными сигналами и без них». Восприятие и психофизика . 51 (2): 182–186. doi : 10.3758/bf03212242 . PMID  1549436.
  20. ^ Роффлер Сюзанна К.; Батлер Роберт А. (1968). «Факторы, влияющие на локализацию звука в вертикальной плоскости». Журнал акустического общества Америки . 43 (6): 1255–1259. Bibcode : 1968ASAJ...43.1255R. doi : 10.1121/1.1910976. PMID  5659493.
  21. ^ Терлоу, В. Р. «Прослушивание» в Клинг, Дж. В. и Риггс, Л. А., Экспериментальная психология , 3-е издание, Холт Райнхарт и Уинстон, 1971, стр. 267–268.
  22. ^ Уоллах, Х. (1939). «О локализации звука». Журнал Акустического общества Америки . 10 (4): 270–274. Bibcode : 1939ASAJ...10..270W. doi : 10.1121/1.1915985.
  23. ^ "Уши имеют это", Newsweek 1961-12-04, стр.80-81
  24. ^ Батто, Дуайт Уэйн (январь 1964 г.). «Роль ушной раковины в локализации человека» (PDF) . Труды Лондонского королевского общества, B Biological Sciences . Получено 2023-11-30 .
  25. ^ Кидд, Шон А.; Келли, Джек Б. (1996-11-15). «Вклад дорсального ядра латерального лемниска в бинауральные ответы в нижнем холмике крысы: интерауральные задержки времени». Журнал нейронауки . 16 (22): 7390–7397. doi :10.1523/JNEUROSCI.16-22-07390.1996. ISSN  0270-6474. PMC 6578946. PMID 8929445  . 
  26. ^ abc Чжао Р. Исследование слуховой трансмиссионной системы локализации звука[D], Университет науки и технологий Китая, 2006.
  27. ^ Диас-Гарсия, Лара; Рид, Эндрю; Джексон-Камарго, Джозеф; Виндмилл, Джеймс ФК (2022). «На пути к биоинспирированному акустическому датчику: ухо Achroia grisella». Журнал датчиков IEEE . 22 (18): 17746–17753. Bibcode : 2022ISenJ..2217746D. doi : 10.1109/JSEN.2022.3197841. ISSN  1558-1748. S2CID  252223827. Получено 12 сентября 2022 г.
  28. ^ Miles RN, Robert D, Hoy RR (декабрь 1995 г.). «Механически связанные уши для направленного слуха у паразитоидной мухи Ormia ochracea». Журнал акустического общества Америки . 98 (6): 3059–70. Bibcode : 1995ASAJ...98.3059M. doi : 10.1121/1.413830. PMID  8550933.
  29. ^ Роберт Д., Майлз Р. Н., Хой Р. Р. (1996). «Направленный слух с помощью механической связи у паразитоидной мухи Ormia ochracea». Журнал сравнительной физиологии A. 179 ( 1): 29–44. doi :10.1007/BF00193432. PMID  8965258. S2CID  21452506.
  30. ^ Мейсон AC, Ошинский ML, Хой RR (апрель 2001 г.). «Сверхострый направленный слух в микромасштабной слуховой системе». Nature . 410 (6829): 686–90. doi :10.1038/35070564. PMID  11287954. S2CID  4370356.
  31. ^ Ho CC, Narins PM (апрель 2006 г.). «Направленность ушей приемника перепада давления у северной леопардовой лягушки Rana pipiens pipiens». Журнал сравнительной физиологии A. 192 ( 4): 417–29. doi :10.1007/s00359-005-0080-7. PMID  16380842. S2CID  5881898.
  32. ^ Пэйн, Роджер С., 1962. Как сипуха находит добычу с помощью слуха. Живая птица, Первый ежегодник Корнеллской лаборатории орнитологии , 151-159
  33. ^ abc Liu, Z., Qi, FY, Zhou, X., Ren, HQ, & Shi, P. (2014). Параллельные сайты подразумевают функциональную конвергенцию слухового гена prestin среди эхолокирующих млекопитающих. Молекулярная биология и эволюция , 31 (9), 2415–2424. doi :10.1093/molbev/msu194
  34. ^ abc Wade, NJ; Ono, H (2005). «От дихоптического к дихотическому: исторические контрасты между бинокулярным зрением и бинауральным слухом». Восприятие . 34 (6): 645–68. doi :10.1068/p5327. PMID  16042189. S2CID  43674057.
  35. ^ Бейер, Роберт Т. (1999). Звуки нашего времени: двести лет акустики . Нью-Йорк: Springer. ISBN 978-0-387-98435-3.
  36. ^ abcdef Уэйд, Николас Дж.; Дойч, Диана (июль 2008 г.). «Бинауральный слух — до и после стетофона» (PDF) . Акустика сегодня . 4 (3): 16–27. doi :10.1121/1.2994724.

Внешние ссылки