Форманта

Эта статья содержит фонетические транскрипции в Международном фонетическом алфавите (IPA) . Вводное руководство по символам IPA см. в разделе Help:IPA . О различии между [ ] , / / и ⟨ ⟩ см. IPA § Скобки и разделители транскрипции .

В речевой науке и фонетике формантой называют широкий спектральный максимум, возникающий в результате акустического резонанса речевого тракта человека . ^[1]^[2] В акустике формантой обычно называют широкий пик или локальный максимум в спектре. ^[3]^[4] Для гармонических звуков в этом определении формантная частота иногда принимается как частота гармоники , которая больше всего увеличивается за счет резонанса. Разница между этими двумя определениями заключается в том, характеризуют ли «форманты» механизмы производства звука или сам производимый звук. На практике частота спектрального пика немного отличается от соответствующей резонансной частоты, за исключением случаев, когда гармоники по счастливой случайности совпадают с резонансной частотой или когда источник звука в основном негармоничен, как при шепоте и вокале .

Можно сказать, что комната имеет форманты, характерные для этой конкретной комнаты из-за ее резонансов, то есть того, как звук отражается от ее стен и предметов. Комнатные форманты такого типа усиливают себя, подчеркивая определенные частоты и поглощая другие, как это использовал, например, Элвин Люсье в своей пьесе «Я сижу в комнате ». При цифровой обработке акустических сигналов то, как совокупность формант (например, комната) влияет на сигнал, может быть представлено импульсной характеристикой .

И в речи, и в комнате форманты являются характерными чертами резонансов пространства. Говорят, что их возбуждают акустические источники, такие как голос, и они формируют (фильтруют) звуки источников, но сами по себе они не являются источниками.

История

С акустической точки зрения фонетика столкнулась с серьезной проблемой, связанной с идеей о том, что эффективная длина речевого тракта меняет гласные. ^[5] Действительно, когда длина речевого тракта изменяется, все акустические резонаторы, образованные ротовыми полостями, масштабируются, как и их резонансные частоты. Поэтому было неясно, как гласные могут зависеть от частот, когда говорящие с разной длиной речевого тракта, например, певцы баса и сопрано , могут производить звуки, которые воспринимаются как принадлежащие к одной и той же фонетической категории. Должен был быть какой-то способ нормализовать спектральную информацию, лежащую в основе идентичности гласных. Герман предложил решение этой проблемы в 1894 году, введя термин «форманта». Гласный звук, по его мнению, представляет собой особое акустическое явление, зависящее от периодического возникновения особого частичного, или «формантного», или «характеристического» признака. Частота «форманты» может немного меняться без изменения характера гласной. Например, для «длинного е» ( ee или iy ) самая низкочастотная «форманта» может варьироваться от 350 до 440 Гц даже у одного и того же человека. ^[6]

Фонетика

Форманты — отличительные частотные составляющие акустического сигнала, производимого речью, музыкальными инструментами ^[8] или пением . Информация, необходимая людям для различения звуков речи, может быть представлена чисто количественно путем указания пиков в частотном спектре. Большинство этих формант производятся в результате резонанса трубки и камеры , но несколько свистящих тонов возникают в результате периодического коллапса зон низкого давления в результате эффекта Вентури . ^[9]

Форманта с самой низкой частотой называется F ₁ , вторая F ₂ , третья F ₃ и так далее. Основная частота или высота голоса иногда обозначается как F ₀ , но это не форманта. Чаще всего для идентификации гласной достаточно двух первых формант, F ₁ и F _{2 .}Взаимосвязь между воспринимаемым качеством гласных и первыми двумя формантными частотами можно оценить, слушая «искусственные гласные», которые генерируются путем пропускания последовательности щелчков (для имитации последовательности голосовых импульсов) через пару полосовых фильтров (для имитации голосового тракта). резонансы). Гласные переднего ряда имеют более высокий F ₂ , а гласные нижнего ряда имеют более высокий F ₁ . Округление губ имеет тенденцию понижать F ₁ и F ₂ в гласных заднего ряда и F ₂ и F ₃ в гласных переднего ряда. ^[10]

Носовые согласные обычно имеют дополнительную форманту около 2500 Гц. Жидкий [l] обычно имеет дополнительную форманту на частоте 1500 Гц, тогда как английский звук «r» ( [ɹ] ) отличается очень низкой третьей формантой (значительно ниже 2000 Гц).

Взрывные звуки (и, в некоторой степени, фрикативные звуки ) изменяют расположение формант в окружающих гласных. Двугубные звуки (например, /b/ и /p/ в словах «шар» или «сок») вызывают понижение формант; на спектрограммах велярные звуки ( /k/ и /ɡ/ на английском языке) почти всегда показывают, что F ₂ и F ₃ собираются вместе в «веларном сжатии» перед велярным сжатием и отделяются от того же «щепотки» при отпускании велярного звука; альвеолярные звуки (английские /t/ и /d/ ) вызывают меньше систематических изменений в формантах соседних гласных, частично в зависимости от того, какая именно гласная присутствует. Временной ход этих изменений частот формант гласных называется «формантными переходами».

В нормальной звонкой речи основная вибрация, создаваемая голосовыми связками, напоминает пилообразную волну , богатую гармоническими обертонами. Если основная частота или (чаще) один из обертонов выше резонансной частоты системы, то резонанс будет возбуждаться слабо и форманта, обычно сообщаемая этим резонансом, будет в основном потеряна. Это наиболее очевидно в случае оперных певцов -сопрано , которые поют на такой высоте, что их гласные становится очень трудно различить.

Контроль резонансов является важным компонентом вокальной техники, известной как обертонное пение , при которой исполнитель поет низкий основной тон и создает резкие резонансы для выделения верхних гармоник , создавая впечатление одновременного пения нескольких тонов.

Спектрограммы можно использовать для визуализации формант. На спектрограммах может быть трудно отличить форманты от естественных гармоник, возникающих при пении. Однако можно услышать естественные форманты в форме гласных с помощью атональных техник, таких как вокальная обработка .

Формантная оценка

Форманты, независимо от того, рассматриваются ли они как акустические резонансы речевого тракта или как локальные максимумы в речевом спектре, как полосовые фильтры , определяются их частотой и шириной спектра ( шириной полосы пропускания ).

Существуют разные методы получения этой информации. Формантные частоты в их акустическом определении можно оценить по частотному спектру звука с помощью спектрограммы (на рисунке) или анализатора спектра. Однако для оценки акустических резонансов речевого тракта (т.е. определения формант речи) по записи речи можно использовать кодирование с линейным предсказанием . Промежуточный подход состоит в выделении огибающей спектра путем нейтрализации основной частоты ^[11] и только затем поиске локальных максимумов в огибающей спектра.

Формантные графики

Первые две форманты важны для определения качества гласных, и часто говорят, что они соответствуют размерам открытия/закрытия (или низкого/высокого) и переднего/заднего размеров (которые традиционно связывались с формой и положением языка ) . . Таким образом, первая форманта F ₁ имеет более высокую частоту для открытой или низкой гласной, такой как [a] и более низкую частоту для закрытой или высокой гласной, такой как [i] или [u] ; а вторая форманта F ₂ имеет более высокую частоту для гласной переднего ряда, например [i] и более низкую частоту для гласной заднего ряда, например [u] . ^[12]^[13]

Гласные почти всегда имеют четыре или более различимых форманты, а иногда и более шести. Однако первые две форманты являются наиболее важными для определения качества гласных и часто наносятся друг на друга на диаграммах гласных, ^[14] хотя это упрощение не отражает некоторые аспекты качества гласных, такие как округление. ^[15]

Многие авторы обращались к проблеме нахождения оптимального выравнивания положений гласных на формантных графиках с позициями на обычном четырехугольнике гласных. В новаторской работе Ладефогеда ^[16] использовалась шкала Мела , поскольку утверждалось, что эта шкала более точно соответствует слуховой шкале высоты звука , чем акустической мере основной частоты , выраженной в герцах. Двумя альтернативами шкале Мела являются шкала Барка и шкала ERB . ^[17] Другая широко распространенная стратегия – откладывать на горизонтальной оси разницу между F ₁ и F ₂ , а не F _{2 .}^{[ нужна цитата ]}

Формата Сингера

Исследования частотного спектра подготовленных говорящих и классических певцов , особенно певцов мужского пола, указывают на четкую форманту около 3000 Гц (между 2800 и 3400 Гц), которая отсутствует в речи или в спектрах неподготовленных говорящих или певцов. Считается, что это связано с одним или несколькими высшими резонансами речевого тракта. ^[18]^[19] Именно это увеличение энергии на частоте 3000 Гц позволяет певцам быть услышанными и понятыми в оркестре . Эта форманта активно развивается посредством тренировки вокала , например, с помощью так называемых упражнений voce di strega или «ведьмин голос» ^[20] и обусловлена тем, что часть речевого тракта действует как резонатор . ^[21] В классической музыке и вокальной педагогике это явление также известно как скилло .

Смотрите также

Внешние ссылки

Форманты для удовольствия и прибыли
Форманты и педали вау-вау
Что такое формант? Обсуждение трех различных значений слова «формант».
Формантная настройка певцов-сопрано из Университета Нового Южного Уэльса.
Акустика гармонического или обертонового пения от Университета Нового Южного Уэльса.
Материалы для измерения и построения формант гласных