В аудиологии и психоакустике понятие критических полос , введенное Харви Флетчером в 1933 году [1] и уточненное в 1940 году [2] , описывает полосу частот «слухового фильтра», созданного улиткой , органом слуха во внутреннем ухе . Грубо говоря, критическая полоса — это полоса звуковых частот , в пределах которой второй тон будет мешать восприятию первого тона посредством слуховой маскировки .
Психофизиологически ощущения биения и слуховой шероховатости могут быть связаны с неспособностью механизма анализа слуховой частоты разрешать входные сигналы, разность частот которых меньше критической полосы пропускания, и с возникающим в результате нерегулярным «щекотанием» [3] механической системы ( базилярной мембраны ), которая резонирует в ответ на такие входные сигналы. Критические полосы также тесно связаны с явлениями слуховой маскировки — снижением слышимости звукового сигнала при наличии второго сигнала более высокой интенсивности в пределах той же критической полосы. Явления маскировки имеют широкие последствия, начиная от сложных отношений между громкостью (перцептивной системой отсчета) и интенсивностью (физической системой отсчета) до алгоритмов сжатия звука .
Фильтры используются во многих аспектах аудиологии и психоакустики , включая периферическую слуховую систему. Фильтр — это устройство, которое усиливает определенные частоты и ослабляет другие. В частности, полосовой фильтр пропускает диапазон частот в пределах полосы пропускания, задерживая те, что находятся за пределами частот среза. [4]
Форма и организация базилярной мембраны означают, что различные частоты резонируют особенно сильно в разных точках вдоль мембраны. Это приводит к тонотопической организации чувствительности к частотным диапазонам вдоль мембраны, которую можно смоделировать как массив перекрывающихся полосовых фильтров, известных как «слуховые фильтры». [5] Слуховые фильтры связаны с точками вдоль базилярной мембраны и определяют частотную селективность улитки и, следовательно, различение слушателем различных звуков. [4] [6] Они нелинейны, зависят от уровня, а полоса пропускания уменьшается от основания к вершине улитки по мере того, как настройка базилярной мембраны меняется с высокой на низкую частоту. [4] [6] [7] Полоса пропускания слухового фильтра называется критической полосой пропускания, как впервые предположил Флетчер (1940). Если сигнал и маскировщик предъявляются одновременно, то только частоты маскировщика, попадающие в критическую полосу пропускания, способствуют маскировке сигнала. Чем больше критическая полоса пропускания, тем ниже отношение сигнал/шум (SNR) и тем сильнее маскируется сигнал.
Еще одно понятие, связанное со слуховым фильтром, — эквивалентная прямоугольная полоса пропускания (ERB). ERB показывает связь между слуховым фильтром, частотой и критической полосой пропускания. ERB пропускает то же количество энергии, что и слуховой фильтр, которому он соответствует, и показывает, как она изменяется с частотой входного сигнала. [4] [6] При низких уровнях звука ERB аппроксимируется следующим уравнением согласно Гласбергу и Муру: [6]
где ERB измеряется в Гц, а f — центральная частота в Гц.
Считается, что каждый ERB эквивалентен примерно 0,9 мм на базилярной мембране. [6] [7] ERB можно преобразовать в шкалу, которая относится к частоте и показывает положение слухового фильтра вдоль базилярной мембраны. Например, число ERB 3,36 соответствует частоте на апикальном конце базилярной мембраны, тогда как число ERB 38,9 соответствует основанию, а значение 19,5 находится посередине между ними. [6]
Одним из типов фильтров, используемых для моделирования слуховых фильтров, является фильтр гамматона . Он обеспечивает простой линейный фильтр , который поэтому легко реализовать, но сам по себе не может учитывать нелинейные аспекты слуховой системы; тем не менее, он используется в различных моделях слуховой системы . Вариации и усовершенствования модели гамматона слуховой фильтрации включают фильтр гамма-чирпа, фильтры гамматона all-pole и one-zero, двухсторонний фильтр гамматона и модели каскада фильтров, а также различные зависящие от уровня и динамически нелинейные версии этих фильтров. [8]
Формы слуховых фильтров определяются путем анализа психоакустической настройки, которая представляет собой графики, показывающие порог восприятия субъектом тона в зависимости от параметров маскировщика. [9]
Психоакустические кривые настройки можно измерить с помощью метода зазубренного шума. Эта форма измерения может занять значительное время и может занять около 30 минут, чтобы найти каждый замаскированный порог. [10] В методе зазубренного шума субъекту предъявляется зазубренный шум в качестве маскировщика и синусоида (чистый тон) в качестве сигнала. Зазубренный шум используется в качестве маскировщика, чтобы субъект не слышал биения, которые возникают при использовании синусоидального маскировщика. [7] Зазубренный шум — это шум с зазубриной вокруг частоты сигнала, который субъект пытается обнаружить, и содержит шум в пределах определенной полосы пропускания. Полоса пропускания шума изменяется, и измеряются замаскированные пороги для синусоиды. Замаскированные пороги вычисляются посредством одновременной маскировки, когда сигнал воспроизводится субъекту одновременно с маскировщиком, а не после.
Чтобы получить истинное представление слуховых фильтров у одного субъекта, необходимо рассчитать множество психоакустических кривых настройки с сигналом на разных частотах. Для каждой измеряемой психоакустической кривой настройки необходимо рассчитать не менее пяти, но предпочтительно от тринадцати до пятнадцати порогов с различной шириной выреза. [10] Также необходимо рассчитать большое количество порогов, поскольку слуховые фильтры асимметричны, поэтому пороги также следует измерять с вырезом, асимметричным к частоте сигнала. [9] Из-за большого количества необходимых измерений время, необходимое для нахождения формы слуховых фильтров человека, очень велико. Чтобы сократить необходимое время, можно использовать восходящий метод при нахождении маскированных порогов. Если для расчета порога используется восходящий метод, время, необходимое для расчета формы фильтра, резко сокращается, так как для расчета порога требуется около двух минут. [10] Это происходит потому, что порог регистрируется, когда субъект впервые слышит тон, а не когда он реагирует на определенный уровень стимула в определенном проценте случаев.
Человеческое ухо состоит из трех частей: внешнего, среднего и внутреннего уха. Внутри внутреннего уха находится улитка . Улитка представляет собой улиткообразное образование, которое обеспечивает передачу звука через сенсоневральный путь, а не через проводящий путь. [11] Улитка представляет собой сложную структуру, состоящую из трех слоев жидкости. Лестница вестибулярная и лестница средняя разделены мембраной Рейсснера, тогда как лестница средняя и лестница барабанная разделены базилярной мембраной. [11] На схеме ниже показана сложная компоновка отсеков и их подразделений: [4]
Базилярная мембрана расширяется по мере продвижения от основания к вершине. Поэтому основание (самая тонкая часть) имеет большую жесткость, чем вершина. [4] Это означает, что амплитуда звуковой волны, проходящей через базилярную мембрану, изменяется по мере ее прохождения через улитку. [11] Когда вибрация передается через улитку, жидкость внутри трех отсеков заставляет базилярную мембрану реагировать волнообразным образом. Эта волна называется «бегущей волной»; этот термин означает, что базилярная мембрана не просто вибрирует как единое целое от основания к вершине.
Когда звук поступает в человеческое ухо, время, необходимое волне для прохождения через улитку, составляет всего 5 миллисекунд. [11]
Когда низкочастотные бегущие волны проходят через улитку, волна постепенно увеличивается в амплитуде, а затем почти сразу затухает. Расположение вибрации на улитке зависит от частоты предъявляемых стимулов. Например, более низкие частоты в основном стимулируют верхушку, по сравнению с более высокими частотами, которые стимулируют основание улитки. Этот атрибут физиологии базилярной мембраны можно проиллюстрировать в виде карты место-частота: [12]
Базилярная мембрана поддерживает кортиев орган , который находится в средней лестнице. [4] Кортиев орган состоит из внешних и внутренних волосковых клеток. В одном ухе находится приблизительно от 15 000 до 16 000 таких волосковых клеток. [11] Внешние волосковые клетки имеют стереоцилии , выступающие в сторону текториальной мембраны, которая находится над кортиевым органом. Стереоцилии реагируют на движение текториальной мембраны, когда звук вызывает вибрацию через улитку. Когда это происходит, стереоцилии разделяются и образуется канал, который позволяет происходить химическим процессам. В конечном итоге сигнал достигает восьмого нерва, после чего происходит обработка в мозге. [11]
Слуховые фильтры тесно связаны с маскировкой в способе их измерения, а также в способе их работы в слуховой системе. Как было описано ранее, критическая полоса пропускания фильтра увеличивается с ростом частоты, вместе с этим фильтр становится более асимметричным с ростом уровня.
Эти два свойства слухового фильтра, как полагают, способствуют распространению маскировки вверх, то есть низкие частоты маскируют высокие частоты лучше, чем наоборот. Поскольку увеличение уровня делает наклон низких частот более пологим, увеличивая его амплитуду, низкие частоты маскируют высокие частоты больше, чем при более низком входном уровне.
Слуховой фильтр может уменьшить эффекты маскировки при прослушивании сигнала в фоновом шуме с использованием внечастотного прослушивания. Это возможно, когда центральная частота маскировки отличается от частоты сигнала. В большинстве ситуаций слушатель выбирает прослушивание «через» слуховой фильтр, который центрирован на сигнале, однако, если присутствует маскировка, это может быть нецелесообразно. Слуховой фильтр, центрированный на сигнале, может также содержать большое количество маскировки, что приводит к низкому SNR фильтра и снижению способности слушателя обнаруживать сигнал. Однако, если слушатель прослушивал через немного другой фильтр, который все еще содержал существенное количество сигнала, но меньше маскировки, SNR увеличивается, что позволяет слушателю обнаружить сигнал. [4]
Первая диаграмма выше показывает слуховой фильтр, центрированный на сигнале, и как часть маскирующего вещества попадает в этот фильтр. Это приводит к низкому SNR. Вторая диаграмма показывает следующий фильтр вдоль базилярной мембраны, который не центрирован на сигнале, но содержит значительное количество этого сигнала и меньше маскирующего вещества. Это снижает эффект маскирующего вещества за счет увеличения SNR.
Вышеизложенное относится к модели маскировки на основе спектра мощности. В целом эта модель опирается на слуховую систему, содержащую массив слуховых фильтров, и на выбор фильтра с сигналом в центре или с наилучшим SNR. Только маскировщик, попадающий в слуховой фильтр, вносит вклад в маскировку, и порог слышимости сигнала человеком определяется этим маскировщиком. [6]
В «нормальном» ухе слуховой фильтр имеет форму, похожую на ту, что показана ниже. Этот график отражает частотную избирательность и настройку базилярной мембраны.
Настройка базилярной мембраны обусловлена ее механической структурой. У основания базилярная мембрана узкая и жесткая и наиболее чувствительна к высоким частотам. Однако на вершине мембрана широкая и гибкая и наиболее чувствительна к низким частотам. Поэтому различные участки базилярной мембраны вибрируют в зависимости от частоты звука и дают максимальный отклик на этой конкретной частоте.
Однако в ухе с нарушением слуха слуховой фильтр имеет иную форму по сравнению с «нормальным» ухом. [14]
Слуховой фильтр поврежденного уха более плоский и широкий по сравнению с нормальным ухом. Это происходит из-за того, что частотная селективность и настройка базилярной мембраны снижаются по мере повреждения наружных волосковых клеток. Когда повреждены только наружные волосковые клетки, фильтр шире на стороне низких частот. Когда повреждены как наружные, так и внутренние волосковые клетки, фильтр шире с обеих сторон. Это встречается реже. Расширение слухового фильтра происходит в основном на стороне низких частот фильтра. Это увеличивает восприимчивость к маскировке низких частот, т.е. распространение маскировки вверх, как описано выше. [6]