Фонематическая орфография

Эта статья содержит фонетические транскрипции в Международном фонетическом алфавите (IPA) . Вводное руководство по символам IPA см. в разделе Help:IPA . О различии между [ ] , / / и ⟨ ⟩ см. IPA § Скобки и разделители транскрипции .

Фонематическая орфография — это орфография (система письменности языка ), в которой графемы (письменные символы) соответствуют фонемам языка (наименьшим единицам речи, которые могут различать слова). Естественные языки редко имеют идеальную фонематическую орфографию; в орфографиях, основанных на алфавитных системах письма, можно ожидать высокой степени соответствия графем и фонем, но они различаются по степени полноты этого соответствия. Английская орфография , например, является алфавитной, но в значительной степени нефонематической; Когда-то на среднеанглийском этапе, когда зародилось современное правописание, он был в основном фонематическим, но разговорный английский быстро менялся, а орфография была гораздо более стабильной, что привело к современной нефонематической ситуации. Напротив, албанская , сербская / хорватская / боснийская / черногорская , румынская , итальянская , турецкая , испанская , финская , чешская , латвийская , эсперанто , корейская и суахили орфографические системы гораздо ближе подходят к последовательным фонематическим представлениям.

В менее формальных терминах язык с ярко выраженной фонематической орфографией можно охарактеризовать как язык с регулярным написанием . Другая терминология - это глубокая и поверхностная орфография , в которой глубина орфографии - это степень, в которой она отличается от истинно фонематической. Эту концепцию можно также применить к неалфавитным системам письма, таким как слоговые письма .

Идеальная фонематическая орфография

В идеальной фонематической орфографии должно быть полное взаимно однозначное соответствие ( биекция ) между графемами (буквами) и фонемами языка, и каждая фонема неизменно будет представлена соответствующей графемой. Таким образом, написание слова однозначно и прозрачно указывало бы на его произношение, и наоборот, говорящий, знающий произношение слова, мог бы без всякого сомнения сделать вывод о его написании. Такая идеальная ситуация встречается редко, но существует в нескольких языках.

Спорным примером идеальной фонематической орфографии является сербско-хорватский язык. ^{[ противоречиво ]} В его алфавите ( латинском , а также сербском кириллическом алфавите ) 30 графем, каждая из которых однозначно соответствует одной из фонем. Эта, казалось бы, совершенная, но простая фонематическая орфография была достигнута в 19 веке: кириллица впервые была создана в 1814 году сербским лингвистом Вуком Караджичем , а латинский алфавит — в 1830 году хорватским лингвистом Людевитом Гаем . Однако и латиница Гая, и сербская кириллица не различают короткие и долгие гласные, а также нетонические (пишется короткая), восходящие и нисходящие тона, которые есть в сербохорватском языке. В сербско-хорватском языке тона и длины гласных опционально записывались как (на латыни) ⟨e⟩, ⟨ē⟩, ⟨è⟩, ⟨é⟩, ⟨ş⟩ и ⟨ş⟩, особенно в словарях.

Другая такая идеальная фонематическая орфография является родной для эсперанто , в которой используется сформулированный тогда принцип создателя языка Л. Л. Заменгофа «одна буква, один звук». ^[1]

Отклонения от фонематической орфографии

Существует два различных типа отклонения от фонематического идеала. В первом случае точное взаимно-однозначное соответствие может быть потеряно (например, какая-то фонема может быть представлена орграфом вместо одной буквы), но «закономерность» сохраняется: алгоритм все равно существует ( но более сложный) для предсказания написания по произношению и наоборот. Во втором случае возникает истинная неравномерность, так как одни слова начинают писаться и произноситься по иным правилам, чем другие, и предсказание написания по произношению и наоборот уже невозможно.

Случай 1: Обычный

Произношение и написание по-прежнему предсказуемо совпадают.

Фонема может быть представлена последовательностью букв, называемой мультиграфом , а не одной буквой (как в случае орграфа ch во французском языке и триграфа sch в немецком языке). Это сохраняет предсказуемость только в том случае, если мультиграф нельзя разбить на более мелкие единицы. В некоторых языках диакритические знаки используются для различения орграфа и последовательности отдельных букв, а в других для их различения требуется знание языка; сравните goatherd и loather на английском языке.

Примеры:

sch против s-ch на ретороманском языке

ng против n + g на валлийском

ch против çh в мэнском гэльском языке : это немного другой случай, когда один и тот же диграф используется для двух разных одиночных фонем.

ai против ai по- французски

Часто это происходит из-за использования алфавита, который изначально использовался для другого языка ( в этих примерах — латинского алфавита ), и поэтому не имеет отдельных букв для всех фонем, используемых в текущем языке (хотя в некоторых орфографиях используются такие устройства, как в качестве диакритических знаков для увеличения количества доступных букв).

Иногда, наоборот, одна буква может представлять последовательность более чем одной фонемы (поскольку x может представлять последовательность /ks/ в английском и других языках).
Иногда правила соответствия более сложны и зависят от соседних букв, часто в результате исторических звуковых изменений (как в случае с правилами произношения ca и ci в итальянском языке и молчаливого e в английском языке).

Случай 2: Нерегулярный

Произношение и написание не всегда совпадают предсказуемым образом.

Иногда одной и той же фонеме соответствуют разные буквы (например, u и ó в польском языке произносятся как фонема /u/). Часто это происходит по историческим причинам (первоначально польские буквы обозначали разные фонемы, которые позже фонологически слились ). Это влияет на предсказуемость написания по произношению, но не обязательно наоборот. Другой пример можно найти в новогреческом языке , чья фонема /i/ может быть записана шестью различными способами: ι, η, υ, ει, οι и υι.
И наоборот, буква или группа букв могут соответствовать разным фонемам в разных контекстах. Например, th в английском языке может произноситься как /ð/ (как в this ) или /θ/ (как в Thin ), а также /th/ (как в Goatherd ).
В противном случае правописание может представлять собой историческое произношение; орфография не обязательно соответствует звуковым изменениям в разговорной речи. Например, и буква k , и диграф gh английского рыцаря когда-то произносились (последний до сих пор произносится в некоторых шотландских вариантах), но после утраты их звуков они больше не представляют фонематическую структуру слова или его произношение.
Орфография может представлять собой произношение диалекта, отличного от рассматриваемого.
Написание заимствованных слов часто соответствует орфографии исходного языка или находится под ее влиянием (как в случае с английскими словами ballet и fajita из французского и испанского языков соответственно). Однако для некоторых заимствований регулярность сохраняется либо за счет
- нативизация произношения в соответствии с написанием (как в случае с русским словом шофёр, от французского шофер , но произносимым [ʂɐˈfʲor] в соответствии с обычными правилами сокращения русских гласных ; см. также орфографическое произношение ) или путем
- адаптация написания (например, слово «футбол» пишется «футбол» на испанском языке, а «футбол» на португальском языке ).
Орфография может отражать народную этимологию (как в английских словах « иккау» и « остров », написанные так из-за воображаемой связи со словами «кашель » и «остров ») или отдаленную этимологию (как в английском слове « долг» , в котором безмолвное « б» было добавлено под влияние латыни).
Орфография может отражать морфонемную структуру, а не чисто фонематическую (см. следующий раздел), хотя часто она также является отражением исторического произношения.

Большинство орфографий не отражают изменения в произношении, известные как сандхи , при которых на произношение влияют соседние звуки в соседних словах (однако письменный санскрит и другие индийские языки отражают такие изменения). В языке также могут использоваться разные наборы символов или разные правила для разных наборов словарных единиц, таких как японские слоги хирагана и катакана (а также различная трактовка в английской орфографии слов, заимствованных из латыни и греческого языка).

Морфонематические особенности

Алфавитные орфографии часто имеют морфонематические , а не чисто фонематические особенности . Это означает, что написание в некоторой степени отражает основную морфологическую структуру слов, а не только их произношение. Следовательно, разные формы морфемы ( минимальной значимой единицы языка) часто пишутся одинаково или одинаково, несмотря на различия в их произношении. Зачастую это происходит по историческим причинам; морфонемное написание отражает предыдущее произношение, существовавшее до исторических звуковых изменений , которые вызвали изменения в произношении данной морфемы. Такое написание может помочь в распознавании слов при чтении.

Некоторые примеры морфонематических особенностей в орфографии описаны ниже.

Английская морфема множественного числа пишется -s независимо от того, произносится ли она как /s/ или /z/ , например, cat s и Dog s , а не cat s и Dog z . Это связано с тем, что звуки [s] и [z] являются формами одной и той же базовой морфофонемы , которая автоматически произносится по-разному в зависимости от окружающей среды. (Однако, когда эта морфема принимает форму /ɪz/ , добавление гласной отражается в написании: Church es , Mass es .)
Аналогичным образом английская морфема прошедшего времени пишется -ed независимо от того, произносится ли она как /d/ , /t/ или /ɪd/ (за некоторыми исключениями: wikt:spilt, wikt:knelt).
Многие английские слова сохраняют написание, которое отражает их этимологию и морфологию, а не их современное произношение. Например, знак и подпись включают написание ⟨sign⟩ , что означает одно и то же, но произносится по-разному в этих двух словах. Другие примеры: наука / saɪ / против совести /ʃ/ , предубеждение /prɛ/ против pre quel / priː / , нация / neɪ/ против национализма / næ/ и специальное / spɛ / против .вид / spiː / .
Фонологическая ассимиляция часто не отражается в правописании даже в фонематических орфографиях, таких как испанская, в которой obtener «получать» и optimista «оптимист» пишутся с помощью b и p , но обычно нейтрализуются в отношении озвучивания и произносятся различными способами, например как оба [β] в нейтральном стиле или оба [p] в выразительном произношении. ^[2] С другой стороны, сербско-хорватское (сербское, хорватское, боснийское и черногорское) написание отражает ассимиляцию, поэтому пишут Ср б ија/Sr b ija «Сербия», а ср п ски /sr pski «сербский».
Финально -затруднительное девокирование , встречающееся во многих языках (например, в немецком, польском и русском), обычно не отражается в правописании. Например, в немецком языке Bad «ванна» пишется с конечной буквой ⟨d⟩ , хотя оно произносится /t/ , что соответствует другим морфологически связанным формам, таким как глагол baden (купаться), в котором d произносится как /d. / . (Сравните Rat , raten («совет», «совет»), в которых буква t произносится /t/ в обеих позициях.) Однако турецкая орфография более строго фонематична: например, повелительное наклонение слова eder «делает» пишется et , как оно произносится (и так же, как слово «мясо»), а не *ed , как было бы, если бы использовалось немецкое написание.

Корейский хангыль за прошедшие столетия изменился с высоко фонематической орфографии на преимущественно морфонемную. ^{[ нужна цитата ]} Японская кана почти полностью фонематична, но имеет несколько морфонематических аспектов, в частности, использование ぢdi и づdu (а не じji и ずzu , их произношение в стандартном токийском диалекте ), когда иероглиф является озвучиванием основного ちили つ. Это результат изменения звука рендаку в сочетании со слиянием формально разных мораэ йотсугана . Русская орфография также по большей части морфонемна, поскольку не отражает редукции гласных, ассимиляции согласных и конечно-заглушенного оглушения. Кроме того, в некоторых сочетаниях согласных есть тихие согласные.

Дефектные орфографии

Дефектная орфография – это орфография, которая не способна передать все фонемы или фонематические различия в языке. Примером такого недостатка в английской орфографии является отсутствие различия между звонкими и глухими фонемами «th» ( / ð / и / θ / соответственно), встречающимися в таких словах, как / ˈ ð ɪ s / (звонкий) и тонкий / ˈ θ ɪ n / (глухой) соответственно, с написанием ⟨th⟩ .

Сравнение языков

Языки, текущая орфография которых имеет высокое соответствие графемы к фонемам и фонемам к графемам (за исключением исключений, связанных с заимствованиями и ассимиляцией), включают:

африкаанс
амхарский
Арабский (с диакритическими знаками )
курдский
мальтийский
Эстонский (кроме палатализации или различия в длине длинных и «сверхдлинных» фонем)
финский
албанский
грузинский
Хинди (кроме удаления шва)
санскрит
Каннада
телугу
малаялам
Дивехи
Турецкий (кроме ğ и различных палатальных и гласных аллофонов)
Сербско-хорватский ( сербский , хорватский , боснийский и черногорский язык ; написан кириллицей или латиницей )
словенский
болгарский
Македонский (если учитывать апостроф, обозначающий шва , хотя могут быть обнаружены небольшие несоответствия)
Восточноармянский (кроме o , v )
Баскский (кроме палатализированных l , n )
гаитянский креольский
Испанский (кроме h , x , b / v , а иногда и k , c , g , j , z )
Чешский (кроме ě , ů , y , ý )
Польский (кроме ó , ch , rz и носовых гласных ą и ę )
Румынский (кроме â или î (см. Î против Â ))
Украинский (в основном фонематический с некоторыми другими историческими/морфологическими правилами, а также палатализацией)
Белорусский (фонематический для гласных, но в основном морфонематический для согласных, за исключением ў, написанного фонетически)
Суахили (отсутствуют придыхательные согласные, которые встречаются не во всех вариантах и в любом случае используются редко)
Монгольский (кириллица) (кроме букв, обозначающих несколько звуков в зависимости от гласных переднего или заднего ряда, мягкого и твердого знака, тихих букв для обозначения / ŋ / от / n / и звонких и глухих согласных)
Азербайджанский (кроме k )
Венгерский (кроме j и ly )
Оромо

Многие фонематические орфографии в остальном немного дефектны, см. страницу «Дефектное письмо» § Латинское письмо . Графемы b и v представляют одну и ту же фонему во всех вариантах испанского языка (кроме Валенсии), тогда как в испанском языке Америки /s/ может быть представлен графемами s , c или z .

В современных индоарийских языках, таких как хинди , пенджаби , гуджарати , майтхили и некоторых других, присутствует удаление шва , при котором неявная гласная по умолчанию подавляется без явной маркировки как таковая. Другие, такие как маратхи , не имеют высокого соответствия длины гласных между графемами и фонемами.

Бенгальский и ассамский языки , несмотря на несколько поверхностную орфографию, имеют более глубокую орфографию, чем его индоарийские родственники, поскольку местами в них присутствуют тихие согласные . Более того, из-за слияния звуков одни и те же фонемы часто представляются разными графемами. Это также приводит к существованию множества омофонов в этих языках.

Французскому языку с его немыми буквами , обильным использованием носовых гласных и пропусками может показаться, что не хватает большого соответствия между написанием и произношением, но его правила произношения, хотя и сложны, последовательны и предсказуемы с достаточной степенью точности. С другой стороны, соответствие фонем буквам часто невелико, и последовательность звуков может иметь несколько способов написания, часто с разными значениями.

Орфографии, такие как немецкий , венгерский (в основном фонематический, за исключением ly , j представляет один и тот же звук, но длина согласного и гласного не всегда точна, а различные варианты написания отражают этимологию, а не произношение), португальский и новогреческий ( написанный с помощью Греческий алфавит ), а также корейский хангыль иногда считаются промежуточными по глубине (например, они включают в себя множество морфонематических особенностей, как описано выше).

Как и во французском языке, гораздо легче определить произношение немецкого слова по его написанию, чем наоборот. Например, для говорящих, которые объединяют /eː/ и /ɛː/, фонема /eː/ может писаться как e , ee , eh , ä или äh .

Английская орфография в высшей степени не фонематична. Неравномерность английского правописания возникает отчасти потому, что Великий сдвиг гласных произошел после того, как была установлена орфография; отчасти потому, что английский язык в разное время приобрел большое количество заимствованных слов, сохраняя свое первоначальное написание на разных уровнях; и отчасти потому, что регуляризация написания (отход от ситуации, когда для одного и того же слова было приемлемо много разных вариантов написания) произошла произвольно в течение периода без какого-либо центрального плана. Однако даже в английском языке есть общие, хотя и сложные правила, которые предсказывают произношение на основе написания, и некоторые из этих правил в большинстве случаев успешны; Правила прогнозирования правописания по произношению имеют более высокий процент неудач.

Большинство искусственных языков, таких как эсперанто и ложбан, имеют в основном фонематическую орфографию.

Слоговые системы японского языка ( хирагана и катакана ) являются примерами почти совершенно поверхностной орфографии – исключения включают использование ぢ и づ (обсуждалось выше), а также использование は, を и へ для обозначения звуков わ, お и え. как реликвии исторического использования каны . Также отсутствует указание на тональный акцент, что приводит к омографии таких слов, как 箸 и 橋 (はし в хирагане), которые различаются в речи.

Ксавье Маржу ^[3] использует искусственную нейронную сеть для ранжирования 17 орфографий в соответствии с их уровнем орфографической глубины . Среди протестированных орфографий китайская и французская орфографии, за которыми следуют английская и русская, являются наиболее непрозрачными в отношении письма (т.е. направление фонем к графемам), а английская, за которой следует голландский, является наиболее непрозрачной в отношении чтения (т.е. направление графем к фонемам); Эсперанто, арабский, финский, корейский, сербохорватский и турецкий языки очень поверхностны как для чтения, так и для письма; Итальянский плохо читает и очень поверхностно пишет, бретонский, немецкий, португальский и испанский плохо читают и пишут.

Перестройка орфографии

Со временем произношение меняется , а написание устаревает, как это произошло с английским и французским языками . Чтобы поддерживать фонематическую орфографию, такая система будет нуждаться в периодическом обновлении, как это пытались сделать различные регуляторы языка и предложили другие реформаторы орфографии .

Иногда произношение слова меняется в соответствии с его написанием; это называется орфографическим произношением . Это чаще всего встречается с заимствованными словами, но иногда случается и с устоявшимися родными словами.

В некоторых английских личных именах и географических названиях связь между написанием имени и его произношением настолько далека, что ассоциации между фонемами и графемами невозможно легко определить. Более того, во многих других словах произношение впоследствии развилось из фиксированного написания, так что следует сказать, что фонемы представляют собой графемы, а не наоборот. А во многих технических жаргонах основным средством общения является письменная речь, а не устная, поэтому фонемы представляют собой графемы, и не имеет значения, как произносится слово. Более того, звуки, которые грамотные люди воспринимают в слове, существенно зависят от фактического написания слова. ^[4]

Иногда в странах письменный язык подвергается реформе орфографии , чтобы привести письмо в соответствие с современным разговорным языком. Они могут варьироваться от простых изменений в написании и словоформах до переключения всей системы письма, как это произошло, когда Турция перешла с арабского алфавита на турецкий алфавит латинского происхождения.

Фонетическая транскрипция

Методы фонетической транскрипции, такие как Международный фонетический алфавит (IPA), направлены на описание произношения в стандартной форме. Они часто используются для устранения двусмысленностей в написании письменной речи. Их также можно использовать для написания языков, у которых ранее не было письменной формы. Такие системы, как IPA, можно использовать для фонематического представления или для отображения более подробной фонетической информации (см. Узкая и широкая транскрипция ).

Фонематическая орфография отличается от фонетической транскрипции; тогда как в фонематической орфографии аллофоны обычно представляются одной и той же графемой, чисто фонетический сценарий потребует различения фонетически различных аллофонов. Возьмем пример из американского английского: звук /t/ в словах «table» и «cat» в фонематической орфографии будет писаться одним и тем же символом; однако в строго фонетическом сценарии будет проводиться различие между придыхательной буквой «t» в слове «стол», лоскутом в слове «масло», безнаддувной «t» в слове «стоп» и голосовой буквой «t» в слове «кошка» (не все эти аллофоны существуют во всех диалектах английского языка ). Другими словами, звук, который большинство носителей английского языка воспринимают как /t/, на самом деле представляет собой группу звуков, произносимых немного по-разному в зависимости от того, где они встречаются в слове. В идеальной фонематической орфографии одна буква на группу звуков (фонема), а разные буквы только там, где звуки различают слова (поэтому «кровать» пишется иначе, чем «бет»).

Узкая фонетическая транскрипция представляет телефоны — звуки, которые способен воспроизводить человек, многие из которых часто группируются в одну фонему в любом естественном языке, хотя группы различаются в разных языках. В английском языке, например, не делается различия между согласными с придыханием и без придыхания, но в других языках, таких как корейский , бенгальский и хинди , это делается.

Звуки речи всех языков мира могут быть записаны довольно небольшим универсальным фонетическим алфавитом. Стандартом для этого является Международный фонетический алфавит .