stringtranslate.com

Слуховая маскировка

При обработке аудиосигналов слуховая маскировка происходит, когда на восприятие одного звука влияет присутствие другого звука. [1]

Слуховая маскировка в частотной области известна как одновременная маскировка , частотная маскировка или спектральная маскировка . Слуховая маскировка во временной области известна как временная маскировка или неодновременная маскировка .

Замаскированный порог

Немаскированный порог — это самый тихий уровень сигнала, который может быть воспринят без присутствия маскирующего сигнала. Маскированный порог — это самый тихий уровень сигнала, воспринимаемый в сочетании с определенным маскирующим шумом. Величина маскировки — это разница между маскированным и немаскированным порогами.

Рисунок А – адаптировано из Гельфанда (2004) [1]

Гельфанд приводит простой пример. [1] Допустим, для данного человека звук кошки, царапающей столб, в тихой обстановке сначала слышен на уровне 10 дБ SPL . Однако при наличии маскирующего шума (например, пылесоса, работающего одновременно) этот же человек не может обнаружить звук кошачьего царапанья, если уровень звука царапания не составляет по крайней мере 26 дБ SPL. Мы бы сказали, что немаскированный порог для этого человека для целевого звука (т. е. царапания кошки) составляет 10 дБ SPL, в то время как маскированный порог составляет 26 дБ SPL. Величина маскировки — это просто разница между этими двумя порогами: 16 дБ.

Степень маскировки будет варьироваться в зависимости от характеристик как целевого сигнала, так и маскирующего, а также будет специфичной для каждого отдельного слушателя. В то время как человек в приведенном выше примере смог обнаружить кошачье царапанье при 26 дБ SPL, другой человек может не услышать кошачье царапанье при включенном пылесосе, пока уровень звука кошачьего царапания не будет увеличен до 30 дБ SPL (тем самым степень маскировки для второго слушателя составит 20 дБ).

Одновременная маскировка

Одновременная маскировка происходит, когда звук становится неслышимым из-за шума или нежелательного звука той же длительности, что и исходный звук. [2] Например, мощный всплеск на частоте 1 кГц будет стремиться замаскировать тон более низкого уровня на частоте 1,1 кГц. Кроме того, два синусоидальных тона на частотах 440 и 450 Гц могут быть четко восприняты, если они разделены. Они не могут быть четко восприняты, если представлены одновременно.

Критическая пропускная способность

Если два звука двух разных частот воспроизводятся одновременно, часто можно услышать два отдельных звука, а не комбинированный тон . Способность слышать частоты по отдельности известна как разрешение по частоте или частотная селективность . Когда сигналы воспринимаются как комбинированный тон, говорят, что они находятся в одной и той же критической полосе пропускания . Считается, что этот эффект возникает из-за фильтрации в улитке , органе слуха во внутреннем ухе. Сложный звук разделяется на различные частотные компоненты, и эти компоненты вызывают пик в паттерне вибрации в определенном месте на ресничках внутри базилярной мембраны внутри улитки. Затем эти компоненты кодируются независимо на слуховом нерве , который передает звуковую информацию в мозг. Это индивидуальное кодирование происходит только в том случае, если частотные компоненты достаточно различаются по частоте, в противном случае они находятся в одной и той же критической полосе и кодируются в одном и том же месте и воспринимаются как один звук, а не два. [3]

Фильтры, которые отличают один звук от другого, называются слуховыми фильтрами, каналами прослушивания или критическими полосами пропускания . Частотное разрешение происходит на базилярной мембране из-за того, что слушатель выбирает фильтр, который центрирован над частотой, которую он ожидает услышать, частотой сигнала. Остро настроенный фильтр имеет хорошее частотное разрешение, поскольку он пропускает центральные частоты, но не другие частоты (Pickles 1982). Повреждение улитки и наружных волосковых клеток в улитке может ухудшить способность различать звуки (Moore 1986). Это объясняет, почему человек с потерей слуха из-за повреждения улитки будет испытывать больше трудностей, чем человек с нормальным слухом, при различении разных согласных в речи. [4]

Маскировка иллюстрирует пределы частотной избирательности. Если сигнал маскируется маскером с другой частотой, то слуховая система неспособна различать две частоты. Экспериментируя с условиями, когда один звук может маскировать ранее услышанный сигнал, можно проверить частотную избирательность слуховой системы. [5]

Похожие частоты

Рисунок B – Адаптировано из Ehmer

Насколько эффективно маскирующее средство повышает порог сигнала, зависит от частоты сигнала и частоты маскирующего средства. Графики на рисунке B представляют собой ряд шаблонов маскирования, также известных как маскирующие аудиограммы . Каждый график показывает величину маскирования, производимого на каждой частоте маскирующего средства, показанной в верхнем углу, 250, 500, 1000 и 2000 Гц. Например, на первом графике маскирующее средство представлено на частоте 250 Гц одновременно с сигналом. Величина, на которую маскирующее средство увеличивает порог сигнала, нанесена на график, и это повторяется для различных частот сигнала, показанных на оси X. Частота маскирующего средства сохраняется постоянной. Маскирующий эффект показан на каждом графике при различных уровнях звука маскирующего средства.

Рисунок C – Адаптировано из Gelfand 2004 [1]
Рисунок D – Адаптировано из Gelfand 2004 [1]

Рисунок B показывает вдоль оси Y величину маскировки. Наибольшая маскировка происходит, когда маскировщик и сигнал имеют одну и ту же частоту, и она уменьшается по мере того, как частота сигнала удаляется от частоты маскировщика. [1] Это явление называется маскировкой на частоте и происходит, потому что маскировщик и сигнал находятся в одном и том же слуховом фильтре (рисунок C). Это означает, что слушатель не может различить их, и они воспринимаются как один звук, при этом более тихий звук маскируется более громким (рисунок D).

Рисунок E – адаптировано из Moore 1998 [5]

Маскирующий сигнал повышает порог сигнала гораздо меньше при внечастотной маскировке, но он все же имеет некоторый маскирующий эффект, поскольку часть маскирующего сигнала перекрывается слуховым фильтром сигнала (рисунок E) [5]

Рисунок F – адаптировано из Moore 1998 [5]

Маскировка вне частоты требует, чтобы уровень маскирующего сигнала был больше, чтобы иметь эффект маскирования; это показано на рисунке F. Это происходит потому, что только определенное количество маскирующего сигнала перекрывается слуховым фильтром сигнала, и для покрытия сигнала требуется больше маскирующего сигнала. [5]

Низкие частоты

Маскирующий рисунок меняется в зависимости от частоты маскирующего сигнала и интенсивности (рисунок B). Для низких уровней на графике 1000 Гц, таких как диапазон 20–40 дБ, кривая относительно параллельна. По мере увеличения интенсивности маскирующего сигнала кривые разделяются, особенно для сигналов на частоте выше, чем у маскирующего сигнала. Это показывает, что существует распространение маскирующего эффекта вверх по частоте по мере увеличения интенсивности маскирующего сигнала. Кривая намного более пологая на высоких частотах, чем на низких частотах. Это сглаживание называется распространением маскирования вверх, и именно поэтому мешающий звук маскирует высокочастотные сигналы гораздо лучше, чем низкочастотные. [1]

Рисунок B также показывает, что с увеличением частоты маскировки маскирующие паттерны становятся все более сжатыми. Это показывает, что высокочастотные маскировщики эффективны только в узком диапазоне частот, близком к частоте маскировки. Низкочастотные маскировщики, с другой стороны, эффективны в широком диапазоне частот. [1]

Рисунок G – адаптировано из диаграммы Гельфанда [1]

Харви Флетчер провел эксперимент, чтобы выяснить, насколько полоса шума способствует маскировке тона. В эксперименте фиксированный тональный сигнал имел различные полосы пропускания шума, центрированные на нем. Порог маскирования был записан для каждой полосы пропускания. Его исследование показало, что существует критическая полоса пропускания шума, которая вызывает максимальный эффект маскировки, а энергия за пределами этой полосы не влияет на маскировку. Это можно объяснить тем, что слуховая система имеет слуховой фильтр, который центрирован по частоте тона. Полоса пропускания маскировщика, который находится внутри этого слухового фильтра, эффективно маскирует тон, но маскировщик за пределами фильтра не оказывает никакого эффекта (рисунок G).

Это используется в файлах MP3 для уменьшения размера аудиофайлов. Части сигналов, которые находятся за пределами критической полосы пропускания, представлены с пониженной точностью. Части сигналов, которые воспринимаются слушателем, воспроизводятся с более высокой точностью. [6]

Эффекты интенсивности

Рисунок H – адаптировано из Moore 1998 [5]

Изменение уровней интенсивности также может оказывать влияние на маскировку. Нижний конец фильтра становится более плоским с увеличением уровня децибел, тогда как верхний конец становится немного круче. Изменения наклона высокочастотной стороны фильтра с интенсивностью менее последовательны, чем на низких частотах. На средних частотах (1–4 кГц) наклон увеличивается с увеличением интенсивности, но на низких частотах нет четкого наклона с уровнем, а фильтры на высоких центральных частотах показывают небольшое уменьшение наклона с увеличением уровня. Резкость фильтра зависит от входного уровня, а не от выходного уровня на фильтр. Нижняя сторона слухового фильтра также расширяется с увеличением уровня. [5] Эти наблюдения проиллюстрированы на рисунке H.

Временная маскировка

Временная маскировка или неодновременная маскировка происходит, когда внезапный стимулирующий звук делает неслышимыми другие звуки, которые присутствуют непосредственно перед стимулом или после него. Маскировка, которая скрывает звук, непосредственно предшествующий маскирующему, называется обратной маскировкой или предварительной маскировкой , а маскировка, которая скрывает звук, непосредственно следующий за маскирующим, называется прямой маскировкой или пост-маской . [5] Эффективность временной маскировки экспоненциально ослабевает от начала и окончания маскирующего, при этом начальное затухание длится приблизительно 20 мс, а смещение — приблизительно 100 мс.

Подобно одновременной маскировке, временная маскировка раскрывает частотный анализ, выполняемый слуховой системой; пороги прямой маскировки для сложных гармонических тонов (например, пилообразный зонд с основной частотой 500 Гц) демонстрируют пороговые пики (т. е. высокие уровни маскировки) для частотных диапазонов, центрированных на первых нескольких гармониках. Фактически, слуховые полосы пропускания, измеренные с помощью порогов прямой маскировки, уже и точнее, чем те, которые измерены с помощью одновременной маскировки.

Временную маскировку не следует путать с акустическим рефлексом уха — непроизвольной реакцией среднего уха, которая активируется для защиты нежных структур уха от громких звуков.

Другие условия маскировки

рисунок I – ипсилатеральная одновременная маскировка

Ипсилатеральная («с той же стороны») маскировка — не единственное условие, при котором происходит маскировка. Другая ситуация, при которой происходит маскировка, называется контралатеральной («с другой стороны») одновременной маскировкой. В этом случае сигнал может быть слышен в одном ухе, но намеренно заглушен путем наложения маскирующего устройства на другое ухо.

Последняя ситуация, когда происходит маскировка, называется центральной маскировкой. Это относится к случаю, когда маскировщик вызывает повышение порога. Это может быть при отсутствии или в дополнение к другому эффекту и обусловлено взаимодействием в центральной нервной системе между отдельными нейронными входами, полученными от маскировщика, и сигналом. [1]

Эффекты различных типов стимулов

Были проведены эксперименты, чтобы увидеть различные эффекты маскировки при использовании маскирующего сигнала в виде узкополосного шума или синусоидального тона.

Когда синусоидальный сигнал и синусоидальный маскирующий сигнал (тон) предъявляются одновременно, огибающая объединенного стимула колеблется в регулярном шаблоне, описываемом как биения. Колебания происходят со скоростью, определяемой разницей между частотами двух звуков. Если разница частот мала, то звук воспринимается как периодическое изменение громкости одного тона. Если биения быстрые, то это можно описать как ощущение грубости. Когда существует большое разделение частот, два компонента слышны как отдельные тона без грубости или биений. Биения могут быть сигналом о наличии сигнала, даже если сам сигнал не слышен. Влияние биений можно уменьшить, используя узкополосный шум вместо синусоидального тона либо для сигнала, либо для маскирующего сигнала. [3]

Механизмы маскировки

Существует много различных механизмов маскировки, одним из которых является подавление. Это когда происходит снижение реакции на сигнал из-за присутствия другого. Это происходит потому, что исходная нейронная активность, вызванная первым сигналом, снижается нейронной активностью другого звука. [7]

Комбинированные тоны являются продуктами сигнала и маскирующего сигнала. Это происходит, когда два звука взаимодействуют, вызывая новый звук, который может быть более слышимым, чем исходный сигнал. Это вызвано нелинейным искажением, которое происходит в ухе. Например, комбинированный тон двух маскирующих сигналов может быть лучшим маскирующим сигналом, чем два исходных маскирующих сигнала по отдельности. [5]

Звуки взаимодействуют многими способами в зависимости от разницы в частоте между двумя звуками. Наиболее важными являются кубические разностные тоны [ необходимо определение ] и квадратичные разностные тоны [ необходимо определение ] . [5]

Кубические разностные тона рассчитываются по сумме. [ необходимо разъяснение ]

2Ф1 – Ф2 [8]

(F1 — первая частота, F2 — вторая) Они слышны большую часть времени, особенно когда уровень исходного тона низкий. Поэтому они оказывают большее влияние на психоакустические кривые настройки, чем квадратичные разностные тоны.

Квадратичные разностные тона являются результатом [ необходимо разъяснение ]

Ф2 – Ф1

Это происходит на относительно высоких уровнях, поэтому оказывает меньшее влияние на психоакустические кривые настройки. [5]

Комбинированные тоны могут взаимодействовать с первичными тонами, что приводит к образованию вторичных комбинационных тонов, поскольку они по своей природе подобны своим исходным первичным тонам, стимулу. Примером этого является

3Ф1 – 2Ф2

Вторичные комбинированные тоны снова похожи на комбинированные тоны первичного тона. [5]

Прослушивание вне частоты

Прослушивание вне частоты — это когда слушатель выбирает фильтр чуть ниже частоты сигнала, чтобы улучшить свои слуховые характеристики. Этот фильтр «вне частоты» снижает уровень маскирующего сигнала больше, чем сигнал на выходном уровне фильтра, что означает, что слушатель может слышать сигнал более четко, следовательно, вызывая улучшение слуховых характеристик. [2]

Приложения

Слуховая маскировка используется в тиннитус-маскерах для подавления раздражающего звона, шипения или жужжания или тиннитуса, часто связанных с потерей слуха. Она также используется в различных видах аудиометрии, включая тональную аудиометрию и стандартный тест на слух для проверки каждого уха по отдельности и для проверки распознавания речи в присутствии частично маскирующего шума.

Слуховая маскировка используется для сжатия данных звуковых сигналов ( MP3 ).

Смотрите также

Ссылки

  1. ^ abcdefghij Гельфанд, С.А. (2004) Слух – Введение в психологическую и физиологическую акустику 4-е изд. Нью-Йорк, Марсель Деккер
  2. ^ ab Moore, BCJ (2004) Введение в психологию слуха , 5-е изд. Лондон, Elsevier Academic Press
  3. ^ ab Moore, BCJ (1986) Частотная избирательность в слухе , Лондон, Academic Press
  4. ^ Мур, BCJ (1995) Перцептивные последствия повреждения улитки , Оксфорд, Oxford University Press
  5. ^ abcdefghijkl Мур, BCJ (1998) Кохлеарная потеря слуха , Лондон, Whurr Publishers Ltd
  6. ^ Селларс, П. (2000), Perceptual Coding: How MP3 Compression Works, Кембридж: Sound on Sound, архивировано из оригинала 2015-07-31 , извлечено 12 декабря 2020
  7. ^ Оксенхэм, А. Дж. Плак, К. Дж. Подавление и распространение маскировки вверх, Журнал Акустического общества Америки, 104 (6) стр. 3500–10
  8. ^ Ли, Кёгу и Ким, Минджонг. Оценка амплитуды кубического разностного тона с использованием адаптивного фильтра Вольтерра третьего порядка , Труды 8-й Международной конференции по цифровым аудиоэффектам (DAFx'05), Мадрид, Испания, 20–22 сентября 2005 г., стр. 297

Внешние ссылки