Высота тона — это перцептивное свойство, которое позволяет упорядочивать звуки по шкале , связанной с частотой , [1] или, что более распространено, высота тона — это качество, которое позволяет судить о звуках как о «высоких» и «низких» в смысле, связанном с музыкальными мелодиями . [2] Высота тона — это основной слуховой атрибут музыкальных тонов , наряду с длительностью , громкостью и тембром . [3]
Высота тона может быть количественно определена как частота , но высота тона не является чисто объективным физическим свойством; это субъективный психоакустический атрибут звука. Исторически изучение высоты тона и восприятия высоты тона было центральной проблемой в психоакустике и сыграло важную роль в формировании и проверке теорий звукового представления, обработки и восприятия в слуховой системе. [4]
Высота тона — это слуховое ощущение, при котором слушатель назначает музыкальные тона относительным позициям на музыкальной шкале, основываясь в первую очередь на своем восприятии частоты вибрации ( звуковой частоты ). [5] Высота тона тесно связана с частотой, но эти два параметра не эквивалентны. Частота — это объективный научный атрибут, который можно измерить. Высота тона — это субъективное восприятие звуковой волны отдельным человеком, которое нельзя измерить напрямую. Однако это не обязательно означает, что люди не будут соглашаться, какие ноты выше, а какие ниже.
Колебания звуковых волн часто можно охарактеризовать с точки зрения частоты . Высоты обычно связаны с частотами (в циклах в секунду или герцах) и, таким образом, количественно определяются как частоты ( в циклах в секунду или герцах), путем сравнения оцениваемых звуков со звуками с чистыми тонами (с периодическими синусоидальными волновыми формами). Сложные и апериодические звуковые волны часто могут быть назначены с помощью этого метода. [6] [7] [8]
Согласно Американскому национальному институту стандартов , высота тона — это слуховой атрибут звука, позволяющий упорядочивать эти звуки по шкале от низкого до высокого. Поскольку высота тона является таким близким заменителем частоты, она почти полностью определяется тем, насколько быстро звуковая волна заставляет воздух вибрировать, и не имеет почти ничего общего с интенсивностью или амплитудой волны. То есть «высокий» тон означает очень быстрое колебание, а «низкий» тон соответствует более медленному колебанию. Несмотря на это, идиома, связывающая вертикальную высоту с высотой звука, является общей для большинства языков. [9] По крайней мере, в английском языке, это всего лишь одна из многих глубоких концептуальных метафор, которые включают в себя вверх/вниз. Точная этимологическая история музыкального смысла высокой и низкой высоты тона до сих пор неясна. Есть доказательства того, что люди действительно воспринимают, что источник звука находится немного выше или ниже в вертикальном пространстве, когда частота звука увеличивается или уменьшается. [9]
В большинстве случаев высота тона сложных звуков, таких как речь и музыкальные ноты, очень близко соответствует частоте повторения периодических или почти периодических звуков или обратной величине временного интервала между повторением аналогичных событий в форме звуковой волны. [7] [8]
Высота сложных тонов может быть неоднозначной, что означает, что могут быть восприняты два или более различных тона, в зависимости от наблюдателя. [4] Когда фактическая основная частота может быть точно определена посредством физического измерения, она может отличаться от воспринимаемой высоты из-за обертонов , также известных как верхние парциальные, гармонические или иные. Сложный тон, состоящий из двух синусоидальных волн 1000 и 1200 Гц, иногда может быть услышан как до трех тонов: два спектральных тона на 1000 и 1200 Гц, полученных из физических частот чистых тонов, и комбинированный тон на 200 Гц, соответствующий частоте повторения формы волны. В такой ситуации восприятие на 200 Гц обычно называют отсутствующим основным тоном , который часто является наибольшим общим делителем присутствующих частот. [10]
Высота тона в меньшей степени зависит от уровня звукового давления (громкости, громкости) тона, особенно на частотах ниже 1000 Гц и выше 2000 Гц. Высота тона более низких тонов понижается по мере увеличения звукового давления. Например, тон в 200 Гц, который очень громкий, кажется на один полутон ниже по высоте, чем если бы он был едва слышен. Выше 2000 Гц высота тона становится выше по мере того, как звук становится громче. [11] Эти результаты были получены в пионерских работах С. Стивенса [12] и У. Сноу. [13] Более поздние исследования, например, А. Коэна, показали, что в большинстве случаев видимые сдвиги высоты тона не значительно отличались от ошибок сопоставления высоты тона. При усреднении оставшиеся сдвиги следовали направлениям кривых Стивенса, но были небольшими (2% или менее по частоте, т.е. не более полутона). [14]
Теории восприятия высоты звука пытаются объяснить, как физический звук и специфическая физиология слуховой системы работают вместе, чтобы дать опыт высоты звука. В целом, теории восприятия высоты звука можно разделить на кодирование места и временное кодирование . Теория места утверждает, что восприятие высоты звука определяется местом максимального возбуждения на базилярной мембране .
Код места, использующий преимущества тонотопии в слуховой системе, должен быть эффективен для восприятия высоких частот, поскольку нейроны имеют верхний предел того, как быстро они могут синхронизировать фазы своих потенциалов действия . [5] Однако чисто теория, основанная на месте, не может объяснить точность восприятия высоты тона в диапазонах низких и средних частот. Более того, есть некоторые свидетельства того, что у некоторых нечеловеческих приматов отсутствуют реакции слуховой коры на высоту тона, несмотря на наличие четких тонотопических карт в слуховой коре, что показывает, что тонотопических кодов места недостаточно для реакций высоты тона. [15]
Временные теории предлагают альтернативу, которая апеллирует к временной структуре потенциалов действия, в основном к фазовой синхронизации потенциалов действия с частотами в стимуле. Точный способ, которым эта временная структура помогает кодировать высоту тона на более высоких уровнях, все еще обсуждается, но обработка, по-видимому, основана на автокорреляции потенциалов действия в слуховом нерве. [16] Однако давно отмечено, что нейронный механизм, который может выполнять задержку — необходимую операцию истинной автокорреляции — не был найден. [5] По крайней мере одна модель показывает, что временная задержка необязательна для создания автокорреляционной модели восприятия высоты тона, апеллируя к фазовым сдвигам между кохлеарными фильтрами; [17] однако более ранние работы показали, что определенные звуки с заметным пиком в их автокорреляционной функции не вызывают соответствующего восприятия высоты тона, [18] [19] и что определенные звуки без пика в их автокорреляционной функции тем не менее вызывают высоту тона. [20] [21] Чтобы модель была более полной, автокорреляция должна применяться к сигналам, которые представляют выход улитки , например, через гистограммы межспайковых интервалов слухового нерва. [19] Некоторые теории восприятия высоты звука утверждают, что высота звука имеет присущие октавные неоднозначности и, следовательно, лучше всего разлагается на цветовую насыщенность высоты звука , периодическое значение вокруг октавы, как названия нот в западной музыке, и высоту высоты звука , которая может быть неоднозначной, что указывает на октаву, в которой находится высота звука. [4]
Едва заметная разница (jnd) ( порог , при котором воспринимается изменение) зависит от частотного содержания тона. Ниже 500 Гц jnd составляет около 3 Гц для синусоидальных волн и 1 Гц для сложных тонов; выше 1000 Гц jnd для синусоидальных волн составляет около 0,6% (около 10 центов). [22] Jnd обычно проверяется путем воспроизведения двух тонов в быстрой последовательности, при этом слушателя спрашивают, есть ли разница в их высоте. [11] Jnd становится меньше, если два тона воспроизводятся одновременно , поскольку тогда слушатель может различать частоты биений . Общее количество воспринимаемых шагов высоты тона в диапазоне человеческого слуха составляет около 1400; общее количество нот в равномерно темперированной гамме от 16 до 16 000 Гц составляет 120. [11]
Относительное восприятие высоты звука может быть обмануто, что приводит к слуховым иллюзиям . Существует несколько таких иллюзий, например, парадокс тритона , но наиболее примечательна гамма Шепарда , где непрерывная или дискретная последовательность специально сформированных тонов может звучать так, как будто последовательность продолжает восходить или нисходить вечно.
Не все музыкальные инструменты издают ноты с четкой высотой тона. Нетональные ударные инструменты (класс ударных инструментов ) не издают определенных высот. Звук или нота определенной высоты тона — это тот, где слушатель может (или относительно легко) различить высоту тона. Звуки с определенной высотой тона имеют гармонические частотные спектры или близкие к гармоническим спектрам. [11]
Звук, генерируемый на любом инструменте, производит много режимов вибрации, которые происходят одновременно. Слушатель слышит несколько частот одновременно. Вибрация с самой низкой частотой называется основной частотой ; другие частоты являются обертонами . [23] Гармоники являются важным классом обертонов с частотами, которые являются целыми кратными основной. Независимо от того, являются ли более высокие частоты целыми кратными, они в совокупности называются парциалами , ссылаясь на различные части, которые составляют общий спектр.
Звук или нота неопределенной высоты — это тот, который слушатель считает невозможным или относительно сложным для определения высоты тона. Звуки с неопределенной высотой тона не имеют гармонических спектров или имеют измененные гармонические спектры — характеристика, известная как негармоничность .
Все еще возможно, что два звука неопределенной высоты будут явно выше или ниже друг друга. Например, малый барабан звучит выше, чем большой барабан , хотя оба имеют неопределенную высоту, потому что его звук содержит более высокие частоты. Другими словами, возможно и часто легко грубо различить относительные высоты двух звуков неопределенной высоты, но звуки неопределенной высоты не соответствуют точно какой-либо определенной высоте.
Стандарт высоты тона (также концертный питч ) — это общепринятый эталон высоты тона, на который настраиваются музыкальные инструменты в группе для исполнения. Концертный питч может варьироваться от ансамбля к ансамблю и значительно менялся на протяжении музыкальной истории.
Стандартная высота тона — более широко распространенное соглашение. A выше средней C обычно устанавливается на 440 Гц (часто пишется как «A = 440 Гц » или иногда «A440»), хотя другие частоты, такие как 442 Гц, также часто используются как варианты. Другая стандартная высота тона, так называемая барочная высота тона , была установлена в 20 веке как A = 415 Гц — примерно на равнотемперированный полутон ниже A440 для облегчения транспонирования. Классическая высота тона может быть установлена либо на 427 Гц (примерно на полпути между A415 и A440), либо на 430 Гц (также между A415 и A440, но немного выше четверти тона). А ансамбли, специализирующиеся на аутентичном исполнении, устанавливают A выше средней C на 432 Гц или 435 Гц при исполнении репертуара эпохи романтизма .
Транспонирующие инструменты берут свое начало в разнообразии стандартов высоты тона. В наше время их партии традиционно транспонируются в разные тональности от голосов и других инструментов (и даже друг от друга). В результате музыкантам нужен способ недвусмысленно обозначать определенную высоту тона, общаясь друг с другом.
Например, наиболее распространенный тип кларнета или трубы , при игре ноты, записанной в их партии как C, звучит высотой, которая называется B ♭ на нетранспонирующем инструменте, таком как скрипка (что указывает на то, что когда-то эти духовые инструменты играли на стандартной высоте на тон ниже высоты скрипки). Чтобы обозначить эту высоту однозначно, музыкант называет ее концертной B ♭ , что означает «высота, которую кто-то, играющий на нетранспонирующем инструменте, таком как скрипка, называет B ♭ ».
Маркировка полей осуществляется с помощью:
Например, можно ссылаться на A выше средней C как на a′ , A 4 или 440 Гц . В стандартной западной равномерной темперации понятие высоты тона нечувствительно к «написанию»: описание «G 4 дубль-диез» относится к той же высоте тона, что и A 4 ; в других темперациях это могут быть разные высоты тона. Человеческое восприятие музыкальных интервалов приблизительно логарифмично по отношению к основной частоте : воспринимаемый интервал между высотами тона «A220» и «A440» такой же, как воспринимаемый интервал между высотами тона A440 и A880 . Мотивированные этим логарифмическим восприятием, музыкальные теоретики иногда представляют высоты тона с помощью числовой шкалы, основанной на логарифме основной частоты. Например, можно принять широко используемый стандарт MIDI для сопоставления основной частоты, f , с действительным числом, p , следующим образом.
Это создает линейное пространство высоты тона , в котором октавы имеют размер 12, полутоны (расстояние между соседними клавишами на клавиатуре пианино) имеют размер 1, а A440 присвоен номер 69. (См. Частоты нот .) Расстояние в этом пространстве соответствует музыкальным интервалам, как их понимают музыканты. Равномерно темперированный полутон подразделяется на 100 центов . Система достаточно гибка, чтобы включать «микротоны», которых нет на стандартных клавиатурах пианино. Например, высота тона на полпути между C (60) и C ♯ (61) может быть обозначена как 60.5.
В следующей таблице показаны частоты в герцах для нот в различных октавах, названных в соответствии с «немецким методом» номенклатуры октав :
Относительные высоты отдельных нот в гамме могут быть определены одной из ряда систем настройки . На западе двенадцатинотонная хроматическая гамма является наиболее распространенным методом организации, а равномерная темперация в настоящее время является наиболее широко используемым методом настройки этой гаммы. В ней соотношение высоты тона между любыми двумя последовательными нотами гаммы составляет ровно двенадцатый корень из двух (или около 1,05946). В хорошо темперированных системах (которые использовались во времена Иоганна Себастьяна Баха , например) использовались различные методы музыкальной настройки .
Почти во всех этих системах интервал октавы удваивает частоту ноты; например, октава выше A440 составляет 880 Гц. Однако, если первый обертон резкий из-за негармоничности , как в крайностях фортепиано, настройщики прибегают к растяжению октавы .
В атональной , двенадцатитоновой или музыкальной теории множеств «высота» — это определенная частота, в то время как класс высоты — это все октавы частоты. Во многих аналитических обсуждениях атональной и посттональной музыки высоты называются целыми числами из-за октавной и энгармонической эквивалентности (например, в последовательной системе C ♯ и D ♭ считаются одной высотой, в то время как C 4 и C 5 функционально одинаковы, с разницей в одну октаву).
Дискретные высоты, а не непрерывно изменяющиеся высоты, являются практически универсальными, за исключением « падающих напряжений » [26] и «неопределенно-высотных скандирований». [27] Скользящие высоты используются в большинстве культур, но связаны с дискретными высотами, на которые они ссылаются или которые украшают. [28]
Для целей этой книги мы решили использовать консервативный подход и сосредоточиться на связи между высотой тона и музыкальными мелодиями. Следуя более раннему определению ASA, мы определяем высоту тона как «тот атрибут ощущения, вариация которого связана с музыкальными мелодиями». Хотя некоторые могут посчитать это слишком ограничительным, преимущество этого определения в том, что оно обеспечивает четкую процедуру для проверки того, вызывает ли стимул высоту тона или нет, и четкое ограничение на диапазон стимулов, которые нам необходимо учитывать в наших обсуждениях.
Тот, у которого самая медленная скорость вибрации — самый низкий по высоте — называется основной частотой, а остальные вместе называются обертонами.