stringtranslate.com

Звуковая локализация

Локализация звука — это способность слушателя определять местоположение или источник обнаруженного звука по направлению и расстоянию.

Механизмы локализации звука в слуховой системе млекопитающих широко изучены. Слуховая система использует несколько сигналов для локализации источника звука, включая разницу во времени и разницу уровней (или разницу интенсивности) между ушами, а также спектральную информацию. Другие животные, такие как птицы и рептилии, также используют их, но они могут использовать их по-другому, а у некоторых также есть сигналы локализации, которые отсутствуют в слуховой системе человека, например, эффекты движений ушей. Животные, обладающие способностью локализовать звук, имеют явное эволюционное преимущество.

Как звук достигает мозга

Звук — это воспринимаемый результат механических вибраций, распространяющихся через такую ​​среду, как воздух или вода. Благодаря механизмам сжатия и разрежения звуковые волны распространяются по воздуху, отражаются от ушной раковины и раковины наружного уха и попадают в слуховой проход. У млекопитающих звуковые волны вызывают вибрацию барабанной перепонки ( барабанной перепонки ), вызывая вибрацию трех костей среднего уха , что затем передает энергию через овальное окно в улитку , где она преобразуется в химический сигнал волосковыми клетками. в кортиевом органе , который образует синапсы на спиральных ганглиозных волокнах, которые проходят через улитковый нерв в мозг.

Нейронные взаимодействия

Известно, что у позвоночных межушные временные различия рассчитываются в верхнем оливковом ядре ствола мозга . По словам Джеффресса , [1] этот расчет основан на линиях задержки : нейронах верхней оливы, которые получают иннервацию от каждого уха с разными длинами соединительных аксонов . Некоторые клетки более непосредственно связаны с одним ухом, чем с другим, поэтому они специфичны для определенной межушной разницы во времени. Эта теория эквивалентна математической процедуре взаимной корреляции . Однако, поскольку теория Джеффресса не может объяснить эффект предшествования , при котором для определения местоположения звука используется только первый из нескольких идентичных звуков (что позволяет избежать путаницы, вызванной эхом), ее нельзя полностью использовать для объяснения реакции. Более того, ряд недавних физиологических наблюдений, сделанных в среднем мозге и стволе мозга мелких млекопитающих, поставили под сомнение обоснованность оригинальных идей Джеффресса. [2]

Нейроны, чувствительные к межушным различиям уровней (ILD), возбуждаются при стимуляции одного уха и тормозятся при стимуляции другого уха, так что величина ответа клетки зависит от относительной силы двух входных сигналов, которая, в свою очередь, зависит от интенсивность звука в ушах.

В слуховом ядре среднего мозга, нижнем холмике (IC), многие чувствительные к ILD нейроны имеют функции ответа, которые резко снижаются от максимальных до нулевых спайков в зависимости от ILD. Однако есть также много нейронов с гораздо более поверхностными функциями ответа, которые не снижаются до нуля.

Конус замешательства

Большинство млекопитающих умеют определять местоположение источника звука, используя межушные различия во времени и межушные различия в уровне. Однако таких различий во времени или уровне не существует для звуков, исходящих по окружности круглых конических срезов, где ось конуса проходит вдоль линии между двумя ушами.

Следовательно, звуковые волны, возникающие в любой точке вдоль заданной наклонной высоты окружности , будут иметь неоднозначные координаты восприятия. То есть слушатель не сможет определить, исходил ли звук сзади, спереди, сверху, снизу или где-либо еще по окружности у основания конуса на любом заданном расстоянии от уха. Конечно, важность этих неоднозначностей исчезающе мала для источников звука, находящихся очень близко или очень далеко от объекта, но именно эти промежуточные расстояния наиболее важны с точки зрения приспособленности.

Эту неясность можно устранить, наклонив голову, что может привести к сдвигу как амплитуды , так и фазы звуковых волн, поступающих в каждое ухо. Это переводит вертикальную ориентацию межушной оси в горизонтальную, тем самым задействуя механизм локализации в горизонтальной плоскости. Более того, даже без изменения угла межушной оси (т.е. без наклона головы) слуховая система может использовать интерференционные картины, генерируемые ушной раковиной, туловищем и даже временным переназначением руки как продолжение ушной раковины. (например, обхватывая ухо ладонью).

Как и в случае с другими сенсорными стимулами, устранение неоднозначности восприятия также достигается за счет интеграции множества сенсорных входов, особенно визуальных сигналов. Локализовав звук внутри окружности на некотором воспринимаемом расстоянии, визуальные подсказки служат для фиксации местоположения звука. Более того, предварительное знание местоположения агента, генерирующего звук, поможет определить его текущее местоположение.

Слуховая система человека

Локализация звука – это процесс определения местоположения источника звука . Мозг использует тонкие различия в интенсивности, спектральных и временных сигналах, чтобы позволить нам локализовать источники звука. [3] [4] В этом разделе, чтобы более глубоко понять механизм слуха человека, мы кратко обсудим теорию локализации человеческого уха.

Локализация может быть описана с точки зрения трехмерного положения: азимута или горизонтального угла, угла места или вертикального угла, а также расстояния (для статических звуков) или скорости (для движущихся звуков). [5]

Об азимуте звука сигнализирует разница во времени прибытия между ушами , относительная амплитуда высокочастотных звуков (эффект тени), а также асимметричные спектральные отражения от различных частей нашего тела, включая туловище, плечи, и пинне . [5]

Признаками расстояния являются потеря амплитуды, потеря высоких частот и соотношение прямого сигнала к реверберированному сигналу. [5]

В зависимости от того, где находится источник, наша голова действует как барьер для изменения тембра , интенсивности и спектральных качеств звука, помогая мозгу сориентироваться, откуда исходит звук. [4] Эти мельчайшие различия между двумя ушами известны как межушные сигналы. [4]

Более низкие частоты и более длинные волны преломляют звук вокруг головы, заставляя мозг сосредоточиться только на фазовых сигналах источника. [4]

Хельмут Хаас обнаружил, что мы можем различить источник звука, несмотря на дополнительные отражения на 10 децибел громче исходного волнового фронта, используя самый ранний пришедший волновой фронт. [4] Этот принцип известен как эффект Хааса , особая версия эффекта предшествования . [4] Хаас измерил разницу во времени между исходным звуком и отраженным звуком даже в 1 миллисекунду, что увеличило объемность, позволив мозгу распознать истинное местоположение исходного звука. Нервная система объединяет все ранние отражения в единое воспринимаемое целое, позволяя мозгу обрабатывать несколько разных звуков одновременно. [6] Нервная система будет комбинировать отражения, которые находятся в пределах 35 миллисекунд друг от друга и имеют одинаковую интенсивность. [6]

Теория дуплекса

Чтобы определить боковое направление ввода (слева, спереди, справа), слуховая система анализирует следующую информацию о ушных сигналах:

В 1907 году лорд Рэлей использовал камертоны для генерации монофонического возбуждения и изучил теорию боковой локализации звука на модели головы человека без ушной раковины. Он первым представил теорию локализации звука, основанную на межушных различиях, известную как теория дуплекса. [7] Человеческие уши расположены по разные стороны головы и, следовательно, имеют разные координаты в пространстве. Как показано на рисунке теории дуплекса, поскольку расстояния между источником звука и ушами различны, между звуковыми сигналами двух ушей существует разница во времени и разница в интенсивности. Мы называем эти виды различий межушной разницей во времени (ITD) и межушной разницей в интенсивности (IID) соответственно.

Теория дуплекса

На рисунке теории дуплекса мы видим, что для источника B1 или источника B2 будет задержка распространения между двумя ушами, которая будет генерировать ITD. Одновременно голова и уши человека могут оказывать затеняющее воздействие на высокочастотные сигналы, которые будут генерировать IID.

Для частот ниже 800 Гц размеры головы (расстояние до уха 21,5 см, что соответствует межушной временной задержке 626 мкс) меньше половины длины волны звуковых волн. Таким образом, слуховая система может без путаницы определить фазовые задержки между обоими ушами. Межушные различия уровней в этом диапазоне частот очень малы, особенно ниже примерно 200 Гц, поэтому точная оценка направления входного сигнала практически невозможна только на основе различий уровней. Когда частота падает ниже 80 Гц, становится трудно или невозможно использовать разницу во времени или разницу уровней для определения бокового источника звука, поскольку разница фаз между ушами становится слишком маленькой для оценки направления. [11]

Для частот выше 1600 Гц размеры головы больше длины звуковых волн. На этих частотах невозможно однозначное определение направления входного сигнала только на основе межушной фазы. Однако различия между ушными уровнями становятся больше, и эти различия уровней оцениваются слуховой системой. Кроме того, задержки между ушами все еще можно обнаружить с помощью некоторой комбинации разностей фаз и групповых задержек , которые более выражены на более высоких частотах; то есть, если есть начало звука, задержку этого начала между ушами можно использовать для определения направления входа соответствующего источника звука. Этот механизм становится особенно важным в реверберирующей среде. После появления звука проходит небольшой промежуток времени, когда прямой звук достигает ушей, но еще не отраженный звук. Слуховая система использует этот короткий промежуток времени для оценки направления источника звука и сохраняет это обнаруженное направление до тех пор, пока отражения и реверберация не позволяют однозначно оценить направление. [12] Описанные выше механизмы нельзя использовать для различения источника звука перед слушателем или позади него; поэтому необходимо оценить дополнительные сигналы. [13]

Эффект фильтрации Пинны

HRTF

Теория дуплекса показывает, что ITD и IID играют важную роль в локализации звука, но они могут решать только проблемы боковой локализации. Например, если два акустических источника расположены симметрично в передней и задней части правой стороны головы человека, они будут генерировать равные ITD и IID, что называется эффектом модели конуса. Однако человеческие уши все еще могут различать эти источники. Кроме того, при естественном слухе одно ухо, без каких-либо ITD или IID, может различать их с высокой точностью. Из-за недостатков теории дуплекса исследователи предложили теорию эффекта фильтрации ушной раковины. [14] [15] Форма ушной раковины человека вогнутая со сложными складками и асимметрична как по горизонтали, так и по вертикали. Отраженные и прямые волны генерируют на барабанной перепонке частотный спектр, соответствующий источникам звука. Затем слуховые нервы локализуют источники, используя этот частотный спектр. [16]

HRIR

Эти подсказки спектра, генерируемые эффектом фильтрации ушной раковины, могут быть представлены как передаточная функция, связанная с головой (HRTF). Соответствующие выражения во временной области называются импульсной реакцией, связанной с головой (HRIR). HRTF также описывается как передаточная функция от свободного поля к определенной точке ушного прохода. Обычно мы признаем HRTF системами LTI: [8]

где L и R представляют собой левое и правое ухо соответственно и представляют собой амплитуду звукового давления на входах в левый и правый слуховые проходы, а — амплитуда звукового давления в центре координаты головы, когда слушатель не слышит существовать. В общем, HRTF и являются функциями углового положения источника , угла места , расстояния между источником и центром головы , угловой скорости и эквивалентного размера головы .

В настоящее время к основным институтам, которые работают над измерением базы данных HRTF, относятся Международная лаборатория CIPIC [17] , Медиа-лаборатория Массачусетского технологического института, Высшая школа психоакустики в Университете Ольденбурга, Лаборатория нейрофизиологии в Университете Висконсин-Мэдисон и Лаборатория Эймса НАСА. . Базы данных HRIR людей с нормальным и нарушенным слухом и животных общедоступны.

Другие сигналы

Наружное ухо человека , то есть структуры ушной раковины и наружного слухового прохода , образуют направленно-селективные фильтры. В зависимости от направления ввода звука активируются различные резонансы фильтра. Эти резонансы внедряют в частотные характеристики ушей паттерны, специфичные для направления , которые могут быть оценены слуховой системой на предмет локализации звука. Вместе с другими направленно-селективными отражениями в голове, плечах и туловище они образуют передаточные функции наружного уха. Эти закономерности частотных характеристик уха очень индивидуальны и зависят от формы и размера наружного уха. Если звук воспроизводится через наушники и был записан через другую голову с внешней поверхностью уха другой формы, диаграммы направленности будут отличаться от собственных, и возникнут проблемы при попытке оценить направления в срединной плоскости этими чужими ушами. Как следствие, при прослушивании записей с имитацией головы , или иначе называемых бинауральными записями, могут возникать перестановки спереди и сзади или локализация внутри головы . Было показано, что люди могут моноурально локализовать высокочастотный звук, но не низкочастотный звук. Однако бинауральная локализация была возможна и на более низких частотах. Вероятно, это связано с тем, что ушная раковина достаточно мала, чтобы взаимодействовать только со звуковыми волнами высокой частоты. [18] Кажется, что люди могут точно локализовать высоту только сложных звуков, включающих частоты выше 7000 Гц, и при этом должна присутствовать ушная раковина. [19]

Когда голова неподвижна, бинауральные сигналы боковой локализации звука (интерауральная разница во времени и интерауральная разница в уровнях) не дают информации о расположении звука в срединной плоскости. Идентичные ITD и ILD могут производиться звуками на уровне глаз или на любой высоте, при условии, что боковое направление постоянно. Однако если голову повернуть, ITD и ILD изменяются динамически, и эти изменения различны для звуков на разной высоте. Например, если источник звука на уровне глаз находится прямо перед вами, а голова повернута влево, звук становится громче (и доходит раньше) до правого уха, чем до левого. Но если источник звука находится непосредственно над головой, при повороте головы изменений в ITD и ILD не будет. Промежуточные высоты будут вызывать промежуточные степени изменения, и если подача бинауральных сигналов двум ушам во время движения головы будет изменена на противоположную, звук будет слышен позади слушателя. [13] [20] Ганс Валлах [21] искусственно изменял бинауральные сигналы звука во время движений головы. Хотя звук объективно располагался на уровне глаз, динамические изменения ITD и ILD при вращении головы были такими же, как если бы источник звука был поднят. В этой ситуации звук был слышен на синтезированной высоте. Тот факт, что источники звука объективно оставались на уровне глаз, не позволял моноуральным сигналам определять высоту, показывая, что именно динамическое изменение бинауральных сигналов во время движения головы позволяло звуку правильно локализоваться в вертикальном измерении. Движения головы не обязательно должны быть активными; точная вертикальная локализация наблюдалась в аналогичной установке, когда вращение головы осуществлялось пассивно путем усаживания испытуемого с завязанными глазами на вращающееся кресло. Пока динамические изменения бинауральных сигналов сопровождали воспринимаемое вращение головы, воспринимался синтезированный подъем. [13]

В 1960-х годах Батто показал, что ушная раковина также усиливает горизонтальную локализацию. [22] [23]

Расстояние до источника звука

[ нужна цитата ]

Слуховая система человека имеет лишь ограниченные возможности определения расстояния до источника звука. На близком расстоянии есть некоторые показания для определения расстояния, такие как крайние различия в уровнях (например, при шепоте в одно ухо) или специфические резонансы ушной раковины (видимой части уха) на близком расстоянии.

Слуховая система использует эти подсказки для оценки расстояния до источника звука:

Обработка сигнала

Звуковая обработка слуховой системы человека осуществляется в так называемых критических полосах . Диапазон слуха разделен на 24 критические полосы, каждая шириной 1 Барк или 100 Мел . Для направленного анализа сигналы внутри критической полосы анализируются вместе.

Слуховая система может извлечь звук желаемого источника звука из мешающего шума. Это позволяет слушателю сосредоточиться только на одном говорящем, если другие говорящие тоже говорят ( эффект коктейльной вечеринки ). С помощью эффекта коктейльной вечеринки звук с мешающих направлений воспринимается приглушенным по сравнению со звуком с нужного направления. Слуховая система может увеличить соотношение сигнал/шум до 15  дБ , что означает, что мешающий звук воспринимается как приглушенный до половины (или меньше) его фактической громкости . [ нужна цитата ]

В закрытых помещениях к ушам слушателя поступает не только прямой звук от источника звука, но и звук, отраженный от стен. Слуховая система анализирует для локализации звука только прямой звук, [12] приходящий первым, но не отраженный звук, приходящий позже ( закон первого волнового фронта ). Таким образом, локализация звука остается возможной даже в эхогенной среде. Это эхоподавление происходит в дорсальном ядре латерального лемниска (DNLL). [24]

Чтобы определить периоды времени, в которых преобладает прямой звук и которые можно использовать для оценки направленности, слуховая система анализирует изменения громкости в разных критических диапазонах, а также стабильность воспринимаемого направления. Если имеется сильный приступ громкости в нескольких критических полосах и если воспринимаемое направление стабильно, то этот приступ, по всей вероятности, вызван прямым звуком источника звука, поступающего вновь или меняющего свои характеристики сигнала. Этот короткий период времени используется слуховой системой для анализа направления и громкости этого звука. Когда отражения приходят чуть позже, они не так сильно усиливают громкость внутри критических полос, но сигналы направления становятся нестабильными, поскольку происходит смешение звука нескольких направлений отражения. В результате слуховая система не запускает новый направленный анализ.

Это первое обнаруженное направление прямого звука принимается за найденное направление источника звука до тех пор, пока другие сильные атаки громкости в сочетании со стабильной информацией о направлении не укажут на то, что возможен новый анализ направления. (см. эффект Франссена )

Конкретные методы с приложениями

Стереосистема звуковой передачи

Такая техника локализации звука дает нам настоящую виртуальную стереосистему . [25] Он использует «умные» манекены, такие как KEMAR, для сбора сигналов или методы цифровой обработки сигналов для моделирования процесса передачи от источников к ушам. После усиления, записи и передачи два канала принятых сигналов будут воспроизводиться через наушники или динамики. Этот подход локализации использует электроакустические методы для получения пространственной информации об исходном звуковом поле путем переноса слухового аппарата слушателя в исходное звуковое поле. Самым значительным его преимуществом является то, что его акустические изображения живы и естественны. Кроме того, для воспроизведения акустического изображения 3D-системы требуется всего два независимых передаваемых сигнала.

Локализация звука с помощью манекена

3D-стереосистема с паравиртуализацией

Представителями такого рода систем являются SRS Audio Sandbox, Spatializer Audio Lab и Qsound Qxpander. [25] Они используют HRTF для имитации полученных акустических сигналов в ушах с разных направлений с общим бинарным стереовоспроизведением. Таким образом, они могут имитировать отраженные звуковые волны и улучшать субъективное ощущение пространства и окружения. Поскольку они представляют собой стереосистемы паравиртуализации, их основной целью является имитация стереозвуковой информации. Традиционные стереосистемы используют датчики, которые сильно отличаются от человеческих ушей. Хотя эти датчики могут получать акустическую информацию с разных направлений, они не имеют такой же частотной характеристики, как слуховая система человека. Таким образом, при применении бинарного режима слуховые системы человека по-прежнему не могут чувствовать поле трехмерного звукового эффекта. Однако 3D-стереосистема с паравиртуализацией преодолевает такие недостатки. Он использует принципы HRTF для сбора акустической информации из исходного звукового поля, а затем создания живого трехмерного звукового поля через обычные наушники или динамики.

Многоканальное виртуальное стереовоспроизведение

Поскольку многоканальные стереосистемы требуют большого количества каналов воспроизведения, некоторые исследователи применили технологии моделирования HRTF, чтобы уменьшить количество каналов воспроизведения. [25] Они используют только два динамика для имитации нескольких динамиков в многоканальной системе. Этот процесс называется виртуальным воспроизведением. По сути, такой подход использует как принцип межушных различий, так и теорию эффекта фильтрации ушной раковины. К сожалению, такой подход не может полностью заменить традиционную многоканальную стереосистему, такую ​​как система объемного звучания 5.1 / 7.1 . Это связано с тем, что когда зона прослушивания относительно больше, воспроизведение моделирования через HRTF может привести к инвертированию акустических изображений в симметричных положениях.

Животные

Поскольку у большинства животных два уха, многие эффекты слуховой системы человека можно обнаружить и у других животных. Следовательно, межушные различия во времени (интерауральные фазовые различия) и межушные различия уровней играют роль для слуха многих животных. Но влияние на локализацию этих эффектов зависит от размера головы, расстояния до ушей, положения ушей и ориентации ушей. Более мелкие животные, такие как насекомые, используют другие методы, поскольку расстояние между ушами слишком мало. [26] О процессе, когда животные издают звук для улучшения локализации, биологической форме активного сонара , см. Эхолокацию животных .

Боковая информация (слева, впереди, справа)

Если уши расположены сбоку от головы, можно использовать те же сигналы боковой локализации, что и для слуховой системы человека. Это означает: оценку межушных различий во времени (межушных разностей фаз) для более низких частот и оценку межушных различий уровней для более высоких частот. Оценка межушных фазовых различий полезна, поскольку дает однозначные результаты. Это так, если расстояние до уха меньше половины длины (максимальная длина волны) звуковых волн. Для животных с головой большего размера, чем у человека, диапазон оценки интерауральных фазовых разностей сдвинут в сторону более низких частот, для животных с головой меньшего размера этот диапазон сдвинут в сторону более высоких частот.

Самая низкая частота, которую можно локализовать, зависит от расстояния до уха. Животные с большим расстоянием до ушей могут локализовать более низкие частоты, чем люди. У животных с меньшим расстоянием до уха самая низкая локализуемая частота выше, чем у человека.

Если уши расположены сбоку от головы, межушные различия уровней появляются для более высоких частот и могут быть оценены для задач локализации. У животных с ушами на макушке затенение головы не появится и, следовательно, будет гораздо меньше межушных различий на уровне, которые можно было бы оценить. Многие из этих животных могут двигать ушами, и эти движения ушей можно использовать как сигнал боковой локализации.

В срединной плоскости (спереди, сверху, сзади, снизу)

У многих млекопитающих имеются также выраженные структуры в ушной раковине вблизи входа в слуховой проход. Как следствие, могут возникать резонансы, зависящие от направления, которые можно использовать в качестве дополнительного сигнала локализации, аналогично локализации в срединной плоскости в слуховой системе человека. Существуют дополнительные сигналы локализации, которые также используют животные.

Наклон головы

Для локализации звука в срединной плоскости (подъем звука) также можно использовать два детектора, расположенные на разной высоте. Однако у животных приблизительную информацию о высоте можно получить, просто наклонив голову, при условии, что звук длится достаточно долго, чтобы завершить движение. Это объясняет врожденное поведение [ неопределенно ] наклонять голову в сторону при попытке точно локализовать звук. Чтобы получить мгновенную локализацию в более чем двух измерениях по сигналам разности времени или разности амплитуд, требуется более двух детекторов.

Локализация при спаренных ушах (мухи)

Крошечная паразитическая муха Ormia ochracea стала модельным организмом в экспериментах по локализации звука из-за своего уникального уха . Животное слишком мало, чтобы можно было рассчитать разницу во времени, когда звук достигает двух ушей, обычным способом, однако оно может с исключительной точностью определять направление источников звука. Барабанные перепонки противоположных ушей напрямую связаны механически, что позволяет разрешить субмикросекундные различия во времени [27] [28] и требует новой стратегии нейронного кодирования . [29] Хо [30] показал, что система соединенных барабанных перепонок у лягушек может вызывать повышенные различия в межушных вибрациях, когда голове животного доступны лишь небольшие различия во времени прихода и уровне звука. В настоящее время предпринимаются усилия по созданию направленных микрофонов на основе конструкции связанной барабанной перепонки.

Двухкоординатная локализация звука (совы)

Большинство сов — ночные или сумеречные хищные птицы . Поскольку они охотятся ночью, им приходится полагаться на незрительные органы чувств. Эксперименты Роджера Пейна [31] показали, что совы чувствительны к звукам, издаваемым их добычей, а не к теплу или запаху. Фактически, звуковые сигналы необходимы и достаточны для локализации мышей из удаленного места, где они сидят. Чтобы это сработало, совы должны уметь точно определять азимут и высоту источника звука.

Дельфины

Дельфины (и другие зубатые киты ) полагаются на эхолокацию , чтобы помочь обнаружить, идентифицировать, локализовать и поймать добычу. Сигналы гидролокатора дельфинов хорошо подходят для локализации нескольких небольших целей в трехмерной водной среде за счет использования узконаправленного (ширина луча по 3 дБ около 10 градусов) и широкополосного (полоса пропускания по 3 дБ обычно составляет около 40 кГц; пиковые частоты от 40 кГц до 120 кГц), кратковременные щелчки (около 40 мкс). Дельфины способны локализовать звуки как пассивно, так и активно (эхолокация) с разрешением около 1 град. Кросс-модальное соответствие (между зрением и эхолокацией) предполагает, что дельфины воспринимают пространственную структуру сложных объектов, опрашиваемых с помощью эхолокации, - подвиг, который, вероятно, требует пространственного разрешения отдельных особенностей объекта и интеграции в целостное представление формы объекта. Хотя дельфины чувствительны к небольшой бинауральной интенсивности и разнице во времени, все больше данных свидетельствуют о том, что дельфины используют зависящие от положения спектральные сигналы, полученные из хорошо развитых передаточных функций, связанных с головой, для локализации звука как в горизонтальной, так и в вертикальной плоскостях. Очень малое время временной интеграции (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптации по локализации включают выраженную асимметрию черепа, носовых мешков и специализированных липидных структур лба и челюстей, а также акустически изолированное среднее и внутреннее ухо.

Роль Престина в локализации звука:

В области локализации звука у млекопитающих ген Prestin стал ключевым игроком, особенно в увлекательной области эхолокации , используемой летучими мышами и дельфинами. Обнаруженный чуть более десяти лет назад, Престин кодирует белок, расположенный в волосковых клетках внутреннего уха, способствуя быстрым сокращениям и расширениям. Этот сложный механизм действует подобно старинному рупору фонографа, усиливая звуковые волны в улитке и повышая общую чувствительность слуха.

В 2014 году Лю и другие углубились в эволюционную адаптацию Престина , раскрыв его решающую роль в ультразвуковом диапазоне слуха, необходимом для сонара животных, особенно в контексте эхолокации . Эта адаптация оказывается полезной для дельфинов, перемещающихся по мутной воде, и для летучих мышей, ищущих пропитание в ночной темноте. [32]

Примечательно, что зубатые киты и летучие мыши-эхолокаторы излучают высокочастотные эхолокационные сигналы, демонстрирующие разнообразие формы, продолжительности и амплитуды. Однако именно их высокочастотный слух становится первостепенным, поскольку он позволяет принимать и анализировать эхо, отражающееся от объектов в их окружении. Тщательное изучение функции белка престина у летучих мышей, управляемых гидролокатором, и дельфинов-афалин в сравнении с млекопитающими, не обладающими гидролокатором, проливает свет на тонкости этого процесса.

Эволюционный анализ последовательностей белков престина привел к убедительному наблюдению — уникальному сдвигу аминокислот от треонина (Thr или T) у сонарных млекопитающих к аспарагину (Asn или N) у несонарных млекопитающих. Это специфическое изменение, подверженное параллельной эволюции, становится стержнем в повествовании об эхолокации млекопитающих. [32]

Последующие эксперименты подтвердили эту гипотезу, определив четыре ключевых различия в аминокислотах у гидроакустических млекопитающих, которые, вероятно, способствуют их отличительным особенностям эхолокации. Слияние эволюционного анализа и эмпирических результатов дает убедительные доказательства, отмечая важный момент в понимании роли гена Prestin в эволюционной траектории эхолокационных систем млекопитающих. Это исследование подчеркивает адаптивность и эволюционное значение Престина, предлагая ценную информацию о генетических основах локализации звука у летучих мышей и дельфинов, особенно в сложной сфере эхолокации. [32]

История

Термин «бинауральный» буквально означает «слышать двумя ушами» и был введен в 1859 году для обозначения практики прослушивания одного и того же звука обоими ушами или двух отдельных звуков, по одному через каждое ухо. Лишь в 1916 году Карл Штумпф (1848–1936), немецкий философ и психолог , провел различие между дихотическим слушанием, подразумевающим стимуляцию каждого уха разными стимулами , и диотическим слушанием, одновременной стимуляцией обоих ушей разными стимулами. тот же стимул. [33]

Позже стало очевидно, что бинауральный слух, дихотический или диотический, является средством локализации звука. [33] [34] [ нужна страница ]

Научное рассмотрение бинаурального слуха началось еще до того, как это явление было названо так, с предположений, опубликованных в 1792 году Уильямом Чарльзом Уэллсом (1757–1817), основанных на его исследованиях бинокулярного зрения . [35] Джованни Баттиста Вентури (1746–1822) проводил и описывал эксперименты, в которых люди пытались локализовать звук, используя оба уха или закрывая пальцем одно ухо. Эта работа не получила дальнейшего развития и была возобновлена ​​​​только после того, как другие выяснили, как работает локализация человеческого звука. [33] [35] Лорд Рэлей (1842–1919) проделал те же эксперименты и пришел к результатам, не зная, что Вентури впервые проделал их почти семьдесят пять лет спустя. [35]

Чарльз Уитстон (1802–1875) работал над оптикой и смешением цветов, а также исследовал слух. Он изобрел устройство, которое назвал «микрофоном», в котором над каждым ухом располагалась металлическая пластина, соединенная с металлическими стержнями; он использовал это устройство для усиления звука. Он также проводил эксперименты, поднося камертоны к обоим ушам одновременно или по отдельности, пытаясь выяснить, как работает слух, и опубликовал их в 1827 году. [35] Эрнст Генрих Вебер (1795–1878) и Август Зеебек (1805). –1849) и Уильям Чарльз Уэллс также попытались сравнить и противопоставить то, что впоследствии стало известно как бинауральный слух, с принципами бинокулярной интеграции в целом. [35]

Понимание того, как различия в звуковых сигналах между двумя ушами способствуют слуховой обработке таким образом, чтобы обеспечить локализацию и направление звука, значительно продвинулось после изобретения стетофона Сомервиллем Скоттом Элисоном в 1859 году, который ввел термин «бинауральный». Элисон создала стетофон на основе стетоскопа , изобретенного Рене Теофилем Гиацинтом Лаэннеком (1781–1826); у стетофона было два отдельных «звукоснимателя», позволяющих пользователю слышать и сравнивать звуки, исходящие из двух отдельных мест. [35]

Смотрите также

Рекомендации

  1. ^ Джеффресс Лос-Анджелес (1948). «Местотеория локализации звука». Журнал сравнительной и физиологической психологии . 41 (1): 35–39. дои : 10.1037/h0061495. ПМИД  18904764.
  2. ^ Шнупп Дж., Нелькен И и Кинг А.Дж., 2011. Слуховая нейронаука, MIT Press, глава 5.
  3. ^ Блауэрт, Дж.: Пространственный слух: психофизика локализации звука человека; Массачусетский технологический институт Пресс; Кембридж, Массачусетс (1983)
  4. ^ abcdef Томпсон, Дэниел М. Понимание звука: получение максимальной отдачи от вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.
  5. ^ abc Дороги, Кертис. Учебник по компьютерной музыке. Кембридж, Массачусетс: Массачусетский технологический институт, 2007. Печать.
  6. ^ аб Бенаде, Артур Х. Основы музыкальной акустики. Нью-Йорк: Оксфордский университет, 1976. Печать.
  7. ^ Рэлей Л. XII. О нашем восприятии направления звука[J]. Философский журнал и научный журнал Лондона, Эдинбурга и Дублина, 1907, 13 (74): 214–232.
  8. ^ abc Чжоу X. Техника виртуальной реальности [J]. Телекоммуникационная наука, 1996, 12(7): 46-–.
  9. ^ Ян Питт. «Слуховое восприятие». Архивировано из оригинала 10 апреля 2010 г.
  10. ^ ДеЛян Ван; Гай Дж. Браун (2006). Вычислительный анализ слуховой сцены: принципы, алгоритмы и приложения . Вайли межнаучный. ISBN 9780471741091. Для синусоидальных сигналов, представленных в горизонтальной плоскости, пространственное разрешение является самым высоким для звуков, исходящих из срединной плоскости (непосредственно перед слушателем) при МАА примерно 1 градус, и оно заметно ухудшается, когда стимулы перемещаются в сторону - например, МАА. составляет около 7 градусов для звуков, исходящих под углом 75 градусов в сторону.
  11. ^ Слуховая локализация - Введение Колумбийский колледж, Чикаго - Аудиоискусство и акустика Acousticslab.org/psychoacoustics , по состоянию на 16 мая 2021 г.
  12. ^ аб Уоллах, Х; Ньюман, Э.Б.; Розенцвейг, MR (июль 1949 г.). «Эффект приоритета в локализации звука». Американский журнал психологии . 62 (3): 315–336. дои : 10.2307/1418275. JSTOR  1418275. PMID  18134356.
  13. ^ abc Wallach, Ганс (октябрь 1940 г.). «Роль движений головы, вестибулярных и зрительных сигналов в локализации звука». Журнал экспериментальной психологии . 27 (4): 339–368. дои : 10.1037/h0054629.
  14. ^ «Акустика: она есть в ушах» . Newsweek . 04.12.1961. п. 80.
  15. ^ Батто Д. В. Роль ушной раковины в локализации человека [J]. Труды Лондонского королевского общества B: Биологические науки, 1967, 168(1011): 158-180.
  16. ^ Музыкант А.Д., Батлер Р.А. Влияние спектральных сигналов на основе ушных раковин на локализацию звука [J]. Журнал Акустического общества Америки, 1984, 75 (4): 1195–1200.
  17. ^ "База данных CIPIC HRTF" . Архивировано из оригинала 13 сентября 2013 г.
  18. ^ Роберт А. БАТЛЕР; Ричард А. ГУМАНСКИ (1992). «Локализация звука в вертикальной плоскости с высокочастотными спектральными признаками и без них». Восприятие и психофизика . 51 (2): 182–186. дои : 10.3758/bf03212242 . ПМИД  1549436.
  19. ^ Роффлер Сюзанна К.; Батлер Роберт А. (1968). «Факторы, влияющие на локализацию звука в вертикальной плоскости». Дж. Акуст. Соц. Являюсь . 43 (6): 1255–1259. Бибкод : 1968ASAJ...43.1255R. дои : 10.1121/1.1910976. ПМИД  5659493.
  20. ^ Терлоу, В. Р. «Прослушивание» в Клинге, Дж. В. и Риггсе, Луизиана, Экспериментальная психология , 3-е издание, Холт Райнхарт и Уинстон, 1971, стр. 267–268.
  21. ^ Уоллах, Х (1939). «О локализации звука». Журнал Акустического общества Америки . 10 (4): 270–274. Бибкод : 1939ASAJ...10..270W. дои : 10.1121/1.1915985.
  22. ^ "Уши есть", Newsweek 1961-12-04, стр.80-81.
  23. ^ Батто, Дуайт Уэйн (январь 1964 г.). «Роль ушной раковины в локализации человека» (PDF) . Труды Лондонского королевского общества, B биологических наук . Проверено 30 ноября 2023 г.
  24. ^ Кидд, Шон А.; Келли, Джек Б. (15 ноября 1996 г.). «Вклад дорсального ядра латерального лемниска в бинауральные реакции в нижнем холмике крысы: межушные временные задержки». Журнал неврологии . 16 (22): 7390–7397. doi : 10.1523/JNEUROSCI.16-22-07390.1996. ISSN  0270-6474. ПМК 6578946 . ПМИД  8929445. 
  25. ^ abc Чжао Р. Исследование системы локализации звуковой передачи [D], Университет науки и технологий Китая, 2006.
  26. ^ Диас-Гарсия, Лара; Рид, Эндрю; Джексон-Камарго, Джозеф; Ветряная мельница, Джеймс ФК (2022). «На пути к биоакустическому датчику: ухо Achroia grisella». Журнал датчиков IEEE . 22 (18): 17746–17753. Бибкод : 2022ISenJ..2217746D. дои : 10.1109/JSEN.2022.3197841. ISSN  1558-1748. S2CID  252223827 . Проверено 12 сентября 2022 г.
  27. ^ Майлз Р.Н., Роберт Д., Хой Р.Р. (декабрь 1995 г.). «Механически соединенные уши для направленного слуха у паразитоидной мухи Ormia ochracea». J Acoust Soc Am . 98 (6): 3059–70. Бибкод : 1995ASAJ...98.3059M. дои : 10.1121/1.413830. ПМИД  8550933.
  28. ^ Роберт Д., Майлз Р.Н., Хой Р.Р. (1996). «Направленный слух посредством механической связи у паразитоидной мухи Ormia ochracea». J Comp Physiol A. 179 (1): 29–44. дои : 10.1007/BF00193432. PMID  8965258. S2CID  21452506.
  29. ^ Мейсон AC, Ошинский М.Л., Хой Р.Р. (апрель 2001 г.). «Сверхострый направленный слух в микромасштабной слуховой системе». Природа . 410 (6829): 686–90. дои : 10.1038/35070564. PMID  11287954. S2CID  4370356.
  30. ^ Ho CC, премьер-министр Наринс (апрель 2006 г.). «Направленность ушей, принимающих разницу давлений, у северной леопардовой лягушки Rana pipiens pipiens». J Comp Physiol A. 192 (4): 417–29. дои : 10.1007/s00359-005-0080-7. PMID  16380842. S2CID  5881898.
  31. ^ Пейн, Роджер С., 1962. Как сипуха находит добычу на слух. Живая птица, первый ежегодник Корнельской лаборатории орнитологии , 151–159.
  32. ^ abc Лю, З., Ци, Ф.Ю., Чжоу, X., Рен, штаб-квартира, и Ши, П. (2014). Параллельные сайты указывают на функциональную конвергенцию слухового гена prestin у эхолокирующих млекопитающих. Молекулярная биология и эволюция , 31 (9), 2415–2424. https://doi.org/10.1093/molbev/msu194
  33. ^ abc Уэйд, Нью-Джерси; Оно, Х (2005). «От дихоптики к дихотике: исторические контрасты между бинокулярным зрением и бинауральным слухом». Восприятие . 34 (6): 645–68. дои : 10.1068/p5327. PMID  16042189. S2CID  43674057.
  34. ^ Бейер, Роберт Т. (1999). Звуки нашего времени: двести лет акустики . Нью-Йорк: Спрингер. ISBN 978-0-387-98435-3.
  35. ^ abcdef Уэйд, Николас Дж.; Дойч, Диана (июль 2008 г.). «Бинауральный слух — до и после стетофона» (PDF) . Акустика сегодня . 4 (3): 16–27. дои : 10.1121/1.2994724.

Внешние ссылки