Психоакустика — раздел психофизики, занимающийся научным изучением восприятия звука слуховой системой человека . Это раздел науки, изучающий психологические реакции, связанные со звуком, включая шум , речь и музыку . Психоакустика — междисциплинарная область, включающая психологию, акустику , электронную инженерию, физику, биологию, физиологию и информатику. [1]
Слух — это не чисто механическое явление распространения волн , но также сенсорное и перцептивное событие. Когда человек слышит что-то, это что-то достигает уха как механическая звуковая волна, распространяющаяся по воздуху, но внутри уха преобразуется в нейронные потенциалы действия . Затем эти нервные импульсы перемещаются в мозг, где они воспринимаются. Следовательно, во многих проблемах акустики, таких как обработка звука , полезно учитывать не только механику окружающей среды, но и тот факт, что и ухо, и мозг участвуют в процессе слушания человека. [ необходима цитата ]
Внутреннее ухо , например, выполняет значительную обработку сигнала при преобразовании звуковых волн в нейронные стимулы, эта обработка делает некоторые различия между волновыми формами незаметными. [2] Методы сжатия данных , такие как MP3 , используют этот факт. [3] Кроме того, ухо имеет нелинейную реакцию на звуки разной интенсивности; эта нелинейная реакция называется громкостью . Телефонные сети и системы шумоподавления используют этот факт, нелинейно сжимая образцы данных перед передачей, а затем расширяя их для воспроизведения. [4] Другим эффектом нелинейной реакции уха является то, что звуки, которые близки по частоте, производят фантомные биения или продукты интермодуляционных искажений. [5]
Термин психоакустика также возникает в дискуссиях о когнитивной психологии и эффектах, которые личные ожидания, предубеждения и предрасположенности могут оказывать на относительные оценки и сравнения слушателей звуковой эстетики и остроты, а также на различные определения слушателей относительно относительных качеств различных музыкальных инструментов и исполнителей. Выражение, что человек «слышит то, что хочет (или ожидает) услышать», может иметь отношение к таким дискуссиям. [ необходима цитата ]
Человеческое ухо номинально может слышать звуки в диапазоне20-20 000 Гц . Верхний предел имеет тенденцию к снижению с возрастом; большинство взрослых не способны слышать выше16 000 Гц . Самая низкая частота, которая была определена как музыкальный тон, составляет 12 Гц в идеальных лабораторных условиях. [6] Тоны между 4 и 16 Гц можно воспринимать через осязание тела .
Человеческое восприятие аудиосигнала с временным разделением было измерено как менее 10 микросекунд. Это не означает, что частоты выше 100 кГц слышны, но что временная дискриминация не связана напрямую с диапазоном частот. [7] [8]
Частотное разрешение уха составляет около 3,6 Гц в пределах октавы1000–2000 Гц То есть изменения высоты тона больше 3,6 Гц могут быть восприняты в клинических условиях. [6] Однако даже меньшие различия высоты тона могут быть восприняты другими способами. Например, интерференцию двух высот часто можно услышать как повторяющееся изменение громкости тона. Эта амплитудная модуляция происходит с частотой, равной разнице частот двух тонов, и известна как биение .
Шкала полутонов , используемая в западной музыкальной нотации, не является линейной, а логарифмической шкалой частот . Другие шкалы были получены непосредственно из экспериментов по восприятию человеческого слуха, такие как шкала мела и шкала Барка (они используются при изучении восприятия, но обычно не в музыкальном сочинении), и они приблизительно логарифмичны по частоте на высокочастотном конце, но почти линейны на низкочастотном конце.
Диапазон интенсивности слышимых звуков огромен. Человеческие барабанные перепонки чувствительны к изменениям звукового давления и могут обнаруживать изменения давления от нескольких микропаскалей (мкПа) до более100 кПа . По этой причине уровень звукового давления также измеряется логарифмически, причем все давления относятся к20 мкПа (или1,973 85 × 10 −10 атм . Нижний предел слышимости, таким образом, определяется как0 дБ , но верхний предел не так четко определен. Верхний предел — это скорее вопрос предела, при котором ухо будет физически повреждено или потенциально может вызвать потерю слуха из-за шума .
Более тщательное исследование нижних пределов слышимости определяет, что минимальный порог, при котором звук может быть услышан, зависит от частоты. Измеряя эту минимальную интенсивность для тестирования тонов различных частот, можно вывести кривую частотно-зависимого абсолютного порога слышимости (ATH). Обычно ухо показывает пик чувствительности (т. е. самый низкий ATH) между1–5 кГц , хотя порог меняется с возрастом, уши пожилых людей демонстрируют снижение чувствительности выше 2 кГц. [9]
ATH — самая низкая из кривых равной громкости . Кривые равной громкости указывают уровень звукового давления (дБ SPL) в диапазоне слышимых частот, которые воспринимаются как имеющие одинаковую громкость. Кривые равной громкости были впервые измерены Флетчером и Мансоном в Bell Labs в 1933 году с использованием чистых тонов, воспроизводимых через наушники, и собранные ими данные называются кривыми Флетчера–Мансона . Поскольку субъективную громкость было трудно измерить, кривые Флетчера–Мансона были усреднены по многим субъектам.
Робинсон и Дадсон усовершенствовали процесс в 1956 году, чтобы получить новый набор кривых равной громкости для фронтального источника звука, измеренного в безэховой камере . Кривые Робинсона-Дадсона были стандартизированы как ISO 226 в 1986 году. В 2003 году ISO 226 был пересмотрен как контур равной громкости с использованием данных, собранных в 12 международных исследованиях.
Локализация звука — это процесс определения местоположения источника звука. Мозг использует тонкие различия в громкости, тоне и времени между двумя ушами, чтобы позволить нам локализовать источники звука. [10] Локализацию можно описать в терминах трехмерного положения: азимут или горизонтальный угол, зенит или вертикальный угол и расстояние (для статических звуков) или скорость (для движущихся звуков). [11] Люди, как и большинство четвероногих животных , искусны в определении направления в горизонтальном направлении, но в меньшей степени в вертикальном из-за симметричного расположения ушей. У некоторых видов сов уши расположены асимметрично, и они могут обнаруживать звук во всех трех плоскостях, что является приспособлением для охоты на мелких млекопитающих в темноте. [12]
Предположим, что слушатель может слышать заданный акустический сигнал в тихих условиях. Когда сигнал воспроизводится во время воспроизведения другого звука (маскера), сигнал должен быть сильнее, чтобы слушатель его услышал. Маскеру не обязательно иметь частотные компоненты исходного сигнала для маскировки. Маскированный сигнал можно услышать, даже если он слабее маскера. Маскировка происходит, когда сигнал и маскер воспроизводятся вместе — например, когда один человек шепчет, а другой кричит — и слушатель не слышит более слабый сигнал, поскольку он был замаскирован более громким маскером. Маскировка также может произойти с сигналом до начала маскера или после его остановки. Например, один внезапный громкий звук хлопка может сделать неслышимыми звуки, которые непосредственно предшествуют или следуют за ним. Эффект обратной маскировки слабее, чем прямой маскировки. Эффект маскировки широко изучался в психоакустических исследованиях. Можно изменить уровень маскера и измерить порог, а затем создать диаграмму психофизической кривой настройки, которая выявит схожие особенности. Эффекты маскирования также используются при кодировании звука с потерями, например, в MP3 .
При предъявлении гармонического ряда частот в соотношении 2 f , 3 f , 4 f , 5 f и т. д. (где f — определенная частота) люди склонны воспринимать высоту тона как f . Слышимый пример можно найти на YouTube. [13]
Психоакустическая модель обеспечивает высококачественное сжатие сигнала с потерями , описывая, какие части заданного цифрового аудиосигнала могут быть удалены (или агрессивно сжаты) безопасно, то есть без значительных потерь в (сознательно) воспринимаемом качестве звука.
Это может объяснить, как резкий хлопок ладоней может показаться болезненно громким в тихой библиотеке, но едва заметен после того, как автомобиль разражается встречным пламенем на оживленной городской улице. Это обеспечивает большую выгоду для общей степени сжатия, и психоакустический анализ обычно приводит к сжатию музыкальных файлов, которые составляют от одной десятой до одной двенадцатой размера высококачественных мастеров, но с заметно меньшей пропорциональной потерей качества. Такое сжатие является особенностью почти всех современных форматов сжатия звука с потерями. Некоторые из этих форматов включают Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (используется для цифрового аудиовещания в нескольких странах) и ATRAC , сжатие, используемое в MiniDisc и некоторых моделях Walkman .
Психоакустика в значительной степени основана на анатомии человека , особенно на ограничениях уха в восприятии звука, как было описано ранее. Подводя итог, эти ограничения таковы:
Алгоритм сжатия может назначать более низкий приоритет звукам, находящимся за пределами диапазона человеческого слуха. Тщательно сдвигая биты от неважных компонентов к важным, алгоритм обеспечивает наиболее точное представление звуков, которые слушатель, скорее всего, воспримет.
Психоакустика включает темы и исследования, которые имеют отношение к музыкальной психологии и музыкальной терапии . Такие теоретики, как Бенджамин Борец, считают, что некоторые результаты психоакустики имеют смысл только в музыкальном контексте. [14]
Пластинки серии Environments Ирва Тейбеля ( 1969–79) являются ранним примером коммерчески доступных звуков, выпущенных специально для улучшения психологических способностей. [15]
Психоакустика уже давно находится в симбиотических отношениях с компьютерной наукой . Пионеры Интернета Дж. К. Р. Ликлайдер и Боб Тейлор оба закончили аспирантуру по психоакустике, в то время как BBN Technologies изначально специализировалась на консультировании по вопросам акустики, прежде чем начала строить первую сеть с коммутацией пакетов .
Ликлайдер написал статью под названием «Дуплексная теория восприятия высоты звука». [16]
Психоакустика применяется во многих областях разработки программного обеспечения, где разработчики отображают проверенные и экспериментальные математические закономерности в цифровой обработке сигналов. Многие кодеки сжатия звука, такие как MP3 и Opus, используют психоакустическую модель для увеличения коэффициентов сжатия. Успех обычных аудиосистем для воспроизведения музыки в театрах и дома можно отнести к психоакустике [17] , а психоакустические соображения привели к появлению новых аудиосистем, таких как психоакустический синтез звукового поля . [18] Кроме того, ученые экспериментировали с ограниченным успехом в создании нового акустического оружия, которое излучает частоты, которые могут ослаблять, наносить вред или убивать. [19] Психоакустика также используется в сонификации , чтобы сделать несколько независимых измерений данных слышимыми и легко интерпретируемыми. [20] Это обеспечивает слуховое руководство без необходимости в пространственном звуке и в компьютерных играх с сонификацией [21] и других приложениях, таких как управление дронами и хирургия с визуальным контролем . [22] Сегодня это также применяется в музыке, где музыканты и художники продолжают создавать новые слуховые впечатления, маскируя нежелательные частоты инструментов, усиливая другие частоты. Еще одно применение — это разработка небольших или низкокачественных громкоговорителей, которые могут использовать явление отсутствия основных тонов для создания эффекта басовых нот на более низких частотах, чем громкоговорители физически способны воспроизвести (см. ссылки).
Производители автомобилей проектируют свои двигатели и даже двери так, чтобы они издавали определенный звук. [23]