stringtranslate.com

Акустическая фонетика

Акустическая фонетика — это раздел фонетики , который занимается акустическими аспектами звуков речи . Акустическая фонетика исследует такие характеристики временной области, как среднеквадратичная амплитуда сигнала , его продолжительность, его основная частота или характеристики частотной области, такие как частотный спектр , или даже комбинированные спектровременные характеристики и взаимосвязь этих свойств с другими ветвями фонетики ( например, артикуляционная или слуховая фонетика ), а также абстрагировать лингвистические понятия, такие как фонемы , фразы или высказывания.

Изучение акустической фонетики значительно расширилось в конце 19 века с изобретением фонографа Эдисона . Фонограф позволял записывать речевой сигнал, а затем обрабатывать и анализировать его. Воспроизводя один и тот же речевой сигнал с фонографа несколько раз, каждый раз фильтруя его с помощью другого полосового фильтра , можно построить спектрограмму речевого высказывания. В серии статей Людимара Германа , опубликованных в Pflügers Archiv за последние два десятилетия XIX века, исследовались спектральные свойства гласных и согласных с использованием фонографа Эдисона, и именно в этих статьях впервые был введен термин формант . Германн также воспроизводил записи гласных, сделанные на фонографе Эдисона, на разных скоростях, чтобы различать теории образования гласных Уиллиса и Уитстона .

Дальнейший прогресс в акустической фонетике стал возможен благодаря развитию телефонной промышленности . (Кстати, отец Александра Грэма Белла , Александр Мелвилл Белл , был фонетиком.) Во время Второй мировой войны работа в Bell Telephone Laboratories (которая изобрела спектрограф ) значительно облегчила систематическое изучение спектральных свойств периодической и апериодической речи. звуки, резонансы речевого тракта и форманты гласных , качество голоса , просодия и т. д.

Интегрированные остатки линейного предсказания (ILPR) были эффективной функцией, предложенной TV Ananthapadmanabha в 1995 году, которая близко аппроксимирует сигнал голосового источника. [1] Это оказалось очень эффективным для точной оценки эпох или момента закрытия голосовой щели. [2] А.Г. Рамакришнан и др. в 2015 году показали, что коэффициенты дискретного косинусного преобразования ILPR содержат информацию о говорящем, которая дополняет кепстральные коэффициенты мел-частоты. [3] Индекс взрыва – это еще одна скалярная характеристика во временной области, которая была введена Т.В. Анантападманабхой и др. для характеристики перехода замыкание-взрыв стоповых согласных. [4]

На теоретическом уровне акустику речи можно смоделировать аналогично электрическим цепям . Лорд Рэлей был одним из первых, кто признал, что новая электрическая теория может быть использована в акустике, но только в 1941 году схемная модель была эффективно использована в книге Чибы и Каджиямы под названием «Гласная: ее природа и структура». . (Эта книга японских авторов, работавших в Японии, была опубликована на английском языке в разгар Второй мировой войны.) В 1952 году Роман Якобсон , Гуннар Фант и Моррис Халле написали «Предварительные сведения к анализу речи», плодотворную работу, связывающую акустическую фонетику и фонологию. теорию вместе. За этой небольшой книгой в 1960 году последовала книга Фанта «Акустическая теория речевого производства», которая остается основной теоретической основой для исследований акустики речи как в академических кругах, так и в промышленности. (Фант сам активно участвовал в телефонной индустрии.) Среди других важных разработчиков этой области - Кеннет Н. Стивенс , написавший «Акустическую фонетику», Осаму Фудзимура и Питер Ладефогед .

Смотрите также

Библиография

Рекомендации

  1. ^ ТВ Анантападманабха, «Акустические факторы, определяющие воспринимаемое качество голоса», в книге «Физиология голосовых связок - контроль качества голоса», О. Фуджимура и М. Хирано, ред. Сан-Диего, Калифорния: Издательская группа Singualr, 1995, гл. 7, стр. 113–126.
  2. ^ А. П. Пратош, Т. В. Анантападманабха и А. Г. Рамакришнан, «Извлечение эпох на основе интегрированного остатка линейного предсказания с использованием индекса взрыва», Транзакции IEEE по обработке звука, речи и языка, 2013, Vol. 21, вып. 12, стр. 2471-2480.
  3. ^ А. Г. Рамакришнан, Б. Абхирам и С. Р. Махадева Прасанна, «Характеристика источника голоса с использованием синхронного дискретного косинусного преобразования для идентификации говорящего», Журнал Акустического общества Америки Express Letters, Vol. 137(), стр., 2015.
  4. ^ Т.В. Анантападманабха, А.П. Пратош, А.Г. Рамакришнан, «Обнаружение переходов замыкания-всплеска стоп и аффрикат в непрерывной речи с использованием индекса взрыва», Журнал Акустического общества Америки, Vol. 137, 2015.

Внешние ссылки