stringtranslate.com

Слуховая маскировка

При обработке аудиосигнала слуховая маскировка возникает , когда на восприятие одного звука влияет присутствие другого звука. [1]

Слуховая маскировка в частотной области известна как одновременная маскировка , частотная маскировка или спектральная маскировка . Слуховая маскировка во временной области известна как временная маскировка или неодновременная маскировка .

Маскированный порог

Немаскированный порог — это самый тихий уровень сигнала, который можно воспринимать без присутствия маскирующего сигнала. Маскированный порог — это самый тихий уровень воспринимаемого сигнала в сочетании с определенным маскирующим шумом. Величина маскировки — это разница между маскированными и немаскированными порогами.

Рисунок A – адаптировано из Гельфанда (2004) [1]

Гельфанд приводит простой пример. [1] Предположим, что для данного человека звук кошки, царапающей столб в спокойной обстановке, сначала слышен на уровне 10 дБ SPL . Однако при наличии маскирующего шума (например, одновременно работающего пылесоса) тот же человек не может обнаружить звук царапанья кошки, если уровень царапанья не превышает 26 дБ SPL. Мы бы сказали, что немаскированный порог для этого человека для целевого звука (например, кошачьего царапанья) составляет 10 дБ УЗД, тогда как маскированный порог составляет 26 дБ УЗД. Величина маскировки — это просто разница между этими двумя порогами: 16 дБ.

Степень маскировки будет варьироваться в зависимости от характеристик как целевого сигнала, так и маскера, а также будет зависеть от конкретного слушателя. В то время как человек в приведенном выше примере смог обнаружить царапание кошки при уровне звукового давления 26 дБ, другой человек может не услышать, как царапается кошка при включенном пылесосе, пока уровень звука царапанья кошки не будет увеличен до 30 дБ УЗД ( тем самым делая величину маскировки для второго слушателя 20 дБ).

Одновременная маскировка

Одновременное маскирование происходит, когда звук становится неслышимым из-за шума или нежелательного звука той же продолжительности, что и исходный звук. [2] Например, мощный пик на частоте 1 кГц будет иметь тенденцию маскировать тон более низкого уровня на частоте 1,1 кГц. Кроме того, два синусоидальных тона с частотой 440 и 450 Гц могут четко восприниматься отдельно. Они не могут быть четко восприняты, если представлены одновременно.

Критическая пропускная способность

Если одновременно воспроизводятся два звука двух разных частот, часто можно услышать два отдельных звука, а не комбинацию тонов . Способность слышать частоты по отдельности известна как частотное разрешение или частотная избирательность . Когда сигналы воспринимаются как комбинированный тон, говорят, что они находятся в одной и той же критической полосе пропускания . Считается, что этот эффект возникает из-за фильтрации в улитке , органе слуха во внутреннем ухе. Сложный звук разделяется на различные частотные компоненты, и эти компоненты вызывают пик вибрации в определенном месте на ресничках внутри базилярной мембраны улитки. Эти компоненты затем независимо кодируются на слуховом нерве , который передает звуковую информацию в мозг. Это индивидуальное кодирование происходит только в том случае, если частотные составляющие достаточно различны по частоте, в противном случае они находятся в одной критической полосе, кодируются в одном и том же месте и воспринимаются как один звук вместо двух. [3]

Фильтры, отличающие один звук от другого, называются слуховыми фильтрами, каналами прослушивания или критической полосой пропускания . Разрешение частоты происходит на базилярной мембране благодаря тому, что слушатель выбирает фильтр, центрированный по частоте, которую он ожидает услышать, то есть частоте сигнала. Точно настроенный фильтр имеет хорошее частотное разрешение, поскольку пропускает центральные частоты, но не другие частоты (Pickles 1982). Повреждение улитки и внешних волосковых клеток улитки может ухудшить способность различать звуки (Moore 1986). Это объясняет, почему людям с потерей слуха из-за повреждения улитки будет труднее, чем нормально слышащему человеку, различать разные согласные в речи. [4]

Маскирование иллюстрирует пределы частотной избирательности. Если сигнал маскируется маскером с частотой, отличной от сигнала, то слуховая система не может различить эти две частоты. Экспериментируя с условиями, когда один звук может маскировать ранее услышанный сигнал, можно проверить частотную избирательность слуховой системы. [5]

Похожие частоты

Рисунок B – Адаптировано из книги Эмера

Насколько эффективно маскер повышает порог сигнала, зависит от частоты сигнала и частоты маскера. Графики на рисунке B представляют собой серию шаблонов маскирования, также известных как маскирующие аудиограммы . На каждом графике показана степень маскировки, создаваемая на каждой частоте маскера, показанной в верхнем углу: 250, 500, 1000 и 2000 Гц. Например, на первом графике маскер представлен на частоте 250 Гц одновременно с сигналом. На графике отображается величина, на которую маскер увеличивает порог сигнала, и это повторяется для разных частот сигнала, показанных по оси X. Частота маскера остается постоянной. Эффект маскировки показан на каждом графике при различных уровнях звука маскирующего устройства.

Рисунок C – Адаптировано из Гельфанда, 2004 г. [1]
Рисунок D – Адаптировано из Гельфанда, 2004 г. [1]

На рисунке B по оси Y показана степень маскировки. Наибольшая маскировка наблюдается, когда маскер и сигнал имеют одинаковую частоту, и она уменьшается по мере удаления частоты сигнала от частоты маскера. [1] Это явление называется маскированием на частоте и возникает потому, что маскер и сигнал находятся внутри одного и того же слухового фильтра (рис. C). Это означает, что слушатель не может их различить, и они воспринимаются как один звук, причем более тихий звук маскируется более громким (рис. D).

Рисунок E – адаптировано из Moore 1998 [5]

Величина, на которую маскер поднимает порог сигнала, намного меньше при маскировании внечастоты, но он имеет некоторый маскирующий эффект, поскольку часть маскера перекрывается со слуховым фильтром сигнала (рис. E) [5].

Рисунок F – адаптировано из Moore 1998 [5]

Внечастотная маскировка требует, чтобы уровень маскера был выше, чтобы обеспечить маскирующий эффект; это показано на рисунке F. Это связано с тем, что только определенная часть маскера перекрывается со слуховым фильтром сигнала, и для покрытия сигнала требуется больше маскирующего устройства. [5]

Более низкие частоты

Рисунок маскировки меняется в зависимости от частоты маскера и интенсивности (рис. B). Для низких уровней на графике 1000 Гц, например в диапазоне 20–40 дБ, кривая относительно параллельна. По мере увеличения интенсивности маскера кривые разделяются, особенно для сигналов с частотой выше маскера. Это показывает, что по мере увеличения интенсивности маскирующего эффекта происходит распространение маскирующего эффекта вверх по частоте. Кривая гораздо более пологая на высоких частотах, чем на низких. Это сглаживание называется расширением маскировки вверх, и именно поэтому мешающий звук маскирует высокочастотные сигналы гораздо лучше, чем низкочастотные сигналы. [1]

На рисунке B также показано, что по мере увеличения частоты маскировки шаблоны маскировки становятся все более сжатыми. Это показывает, что высокочастотные маскеры эффективны только в узком диапазоне частот, близких к частоте маскера. С другой стороны, низкочастотные маскеры эффективны в широком диапазоне частот. [1]

Рисунок G – адаптировано из схемы Гельфанда [1]

Харви Флетчер провел эксперимент, чтобы выяснить, какая часть полосы шума способствует маскировке тона. В эксперименте фиксированный тональный сигнал имел сосредоточенный на нем шум различной полосы пропускания. Маскированный порог записывался для каждой полосы пропускания. Его исследования показали, что существует критическая полоса пропускания шума, которая вызывает максимальный эффект маскировки, и энергия за пределами этой полосы не влияет на маскирование. Это можно объяснить тем, что слуховая система имеет слуховой фильтр, центр которого сосредоточен по частоте тона. Полоса пропускания маскера, находящегося внутри этого слухового фильтра, эффективно маскирует тон, но маскер вне фильтра не оказывает никакого эффекта (рис. G).

Это используется в файлах MP3 для уменьшения размера аудиофайлов. Части сигналов, находящиеся за пределами критической полосы пропускания, представляются с пониженной точностью. Те части сигналов, которые воспринимаются слушателем, воспроизводятся с более высокой точностью. [6]

Эффекты интенсивности

Рисунок H – адаптировано из Moore 1998 [5]

Различные уровни интенсивности также могут влиять на маскировку. Нижний конец фильтра становится более плоским с увеличением уровня децибел, тогда как верхний конец становится немного круче. Изменения наклона высокочастотной стороны фильтра в зависимости от интенсивности менее постоянны, чем на низких частотах. На средних частотах (1–4 кГц) крутизна увеличивается с увеличением интенсивности, но на низких частотах явного наклона с уровнем нет, а фильтры на высоких центральных частотах показывают небольшое уменьшение крутизны с увеличением уровня. Резкость фильтра зависит от входного уровня, а не от выходного уровня фильтра. Нижняя сторона слухового фильтра также расширяется с увеличением уровня. [5] Эти наблюдения проиллюстрированы на рисунке H.

Временная маскировка

Временная маскировка или неодновременная маскировка возникает, когда внезапный звук-стимул делает неслышимыми другие звуки, которые присутствуют непосредственно перед стимулом или после него. Маскирование, которое скрывает звук, непосредственно предшествующий маскеру, называется обратной маскировкой или предварительной маскировкой , а маскирование, скрывающее звук, следующий непосредственно за маскером, называется прямой маскировкой или пост-маскированием . [5] Эффективность временной маскировки снижается экспоненциально от начала и до конца действия маскера, причем начальное затухание длится примерно 20 мс, а затухание смещения длится примерно 100 мс.

Подобно одновременной маскировке, временная маскировка раскрывает частотный анализ, выполняемый слуховой системой; Пороги прямой маскировки для сложных гармонических тонов (например, пилообразный пробник с основной частотой 500 Гц) демонстрируют пороговые пики (т.е. высокие уровни маскирования) для полос частот, сосредоточенных на первых нескольких гармониках. Фактически, звуковая полоса пропускания, измеренная на основе порогов прямой маскировки, уже и более точна, чем измеренная с использованием одновременной маскировки.

Временную маскировку не следует путать с акустическим рефлексом уха — непроизвольной реакцией среднего уха, которая активируется для защиты деликатных структур уха от громких звуков.

Другие условия маскировки

рисунок I – ипсилатеральная одновременная маскировка

Ипсилатеральная («одна и та же сторона») маскировка - не единственное условие, при котором имеет место маскировка. Другая ситуация, когда происходит маскировка, называется одновременной маскировкой на контралатеральной («другой стороне»). В данном случае сигнал может быть слышен в одном ухе, но намеренно удаляется путем применения маскировки к другому уху.

Последняя ситуация, когда происходит маскировка, называется центральной маскировкой. Это относится к случаю, когда маскер вызывает повышение порога. Это может происходить в отсутствие другого эффекта или в дополнение к нему и происходит из-за взаимодействия внутри центральной нервной системы между отдельными нейронными входами, полученными от маскера, и сигналом. [1]

Эффекты различных типов стимулов

Были проведены эксперименты, чтобы увидеть различные эффекты маскировки при использовании маскера, который имеет форму узкополосного шума или синусоидального тона.

Когда синусоидальный сигнал и синусоидальный маскер (тон) предъявляются одновременно, огибающая комбинированного стимула колеблется по регулярной схеме, описываемой как биения. Колебания происходят со скоростью, определяемой разницей между частотами двух звуков. Если разность частот невелика, то звук воспринимается как периодическое изменение громкости одного тона. Если удары быстрые, это можно охарактеризовать как ощущение шероховатости. При большом разнесении частот эти два компонента слышны как отдельные тона без шероховатостей и биений. Удары могут быть признаком наличия сигнала, даже если сам сигнал не слышен. Влияние биений можно уменьшить, используя для сигнала или маскера узкополосный шум, а не синусоидальный тон. [3]

Механизмы маскировки

Существует множество различных механизмов маскировки, одним из которых является подавление. Это когда происходит снижение реакции на сигнал из-за присутствия другого. Это происходит потому, что первоначальная нейронная активность, вызванная первым сигналом, снижается из-за нейронной активности другого звука. [7]

Комбинированные тоны являются продуктом сигнала и маскера. Это происходит, когда два звука взаимодействуют, создавая новый звук, который может быть более слышимым, чем исходный сигнал. Это вызвано нелинейными искажениями, возникающими в ухе. Например, комбинация тонов двух маскеров может быть лучшим маскером, чем два исходных маскера по отдельности. [5]

Звуки взаимодействуют по-разному в зависимости от разницы в частоте между двумя звуками. Двумя наиболее важными являются кубические разностные тона [ необходимо определение ] и квадратичные разностные тона [ необходимо определение ] . [5]

Кубические разностные тона рассчитываются по сумме. [ нужны разъяснения ]

2Ф1 – Ф2 [8]

(F1 — первая частота, F2 — вторая). Они слышны большую часть времени, особенно когда уровень исходного тона низкий. Следовательно, они оказывают большее влияние на кривые психоакустической настройки, чем квадратичные разностные тона.

Квадратичные разностные тона являются результатом [ необходимы пояснения ]

Ф2 – Ф1

Это происходит на относительно высоких уровнях, поэтому оказывает меньшее влияние на кривые психоакустической настройки. [5]

Комбинированные тоны могут взаимодействовать с первичными тонами, приводя к образованию вторичных комбинированных тонов, поскольку они по своей природе подобны своим первоначальным первичным тонам, подобно стимулу. Примером этого является

3F1 – 2F2

Вторичные тона сочетания снова аналогичны тонам сочетания основного тона. [5]

Прослушивание на выключенной частоте

Прослушивание вне частоты — это когда слушатель выбирает фильтр чуть ниже частоты сигнала, чтобы улучшить свои слуховые характеристики. Этот фильтр с «выключенной частотой» снижает уровень маскера больше, чем сигнал на выходном уровне фильтра, что означает, что они могут слышать сигнал более четко, что приводит к улучшению слуховых характеристик. [2]

Приложения

Слуховая маскировка используется в маскировках тиннитуса для подавления раздражающего звона, шипения или жужжания, а также шума в ушах, который часто связан с потерей слуха. Он также используется в различных видах аудиометрии, включая аудиометрию чистого тона , и стандартном тесте слуха для односторонней проверки каждого уха и проверки распознавания речи в присутствии частично маскирующего шума.

Слуховая маскировка используется для сжатия данных звуковых сигналов ( MP3 ).

Смотрите также

Рекомендации

  1. ^ abcdefghij Гельфанд, С.А. (2004) Слух - введение в психологическую и физиологическую акустику, 4-е изд. Нью-Йорк, Марсель Деккер
  2. ^ Аб Мур, BCJ (2004) Введение в психологию слуха , 5-е изд. Лондон, Elsevier Academic Press
  3. ^ Аб Мур, BCJ (1986) Частотная избирательность слуха , Лондон, Academic Press
  4. ^ Мур, BCJ (1995) Перцептивные последствия повреждения улитки , Оксфорд, Oxford University Press
  5. ^ abcdefghijkl Moore, BCJ (1998) Потеря слуха Cochlear , Лондон, Whurr Publishers Ltd.
  6. ^ Селларс, П. (2000), Перцептивное кодирование: как работает сжатие MP3 , Кембридж: Звук на звуке, заархивировано из оригинала 31 июля 2015 г. , получено 12 декабря 2020 г.
  7. ^ Оксенхэм, А. Дж. Плак, С. Дж. Подавление и распространение маскировки вверх, Журнал Акустического общества Америки, 104 (6), стр. 3500–10.
  8. ^ Ли, Кёгу и Ким, Минджонг. Оценка амплитуды кубического разностного тона с использованием адаптивного фильтра Вольтерра третьего порядка , Материалы 8-й Международной конференции по цифровым аудиоэффектам (DAFx'05), Мадрид, Испания, 20–22 сентября 2005 г., стр. 297

Внешние ссылки