Диграф (орфография)

В этой статье содержатся фонетические транскрипции в Международном фонетическом алфавите (МФА) . Для вводного руководства по символам МФА см. Help:IPA . Для различия между [ ] , / / и ⟨ ⟩ см. IPA § Скобки и разделители транскрипции .

В валлийском языке диграф ⟨ll⟩ на некоторое время слился с лигатурой .

Диграф (от др.-греч. δίς (dís) «двойной» и γράφω (gráphō) «писать») или биграмма — пара символов, используемых в орфографии языка для записи либо одной фонемы ( отдельного звука ) , либо последовательности фонем , которая не соответствует обычным значениям двух символов вместе.

Некоторые диграфы представляют фонемы, которые не могут быть представлены одним символом в системе письма языка, например, ⟨ ch ⟩ в испанском chico и ocho . Другие диграфы представляют фонемы, которые также могут быть представлены одним символом. Диграф, который разделяет свое произношение с одним символом, может быть реликтом из более раннего периода языка, когда диграф имел другое произношение, или может представлять различие, которое проводится только в определенных диалектах , например, английский ⟨ wh ⟩ . Некоторые такие диграфы используются по чисто этимологическим причинам, например, ⟨ ph ⟩ во французском.

В некоторых орфографиях диграфы (а иногда и триграфы ) считаются отдельными буквами , что означает, что они имеют свое собственное место в алфавите и не могут быть разделены на составляющие их места графемы при сортировке , сокращении или переносе слов. Диграфы используются в некоторых схемах латинизации , например, ⟨ zh ⟩ как латинизация русской ⟨ ж ⟩ .

Регистр букв в диграфах может различаться , например, ⟨sz⟩ в польском языке пишется с заглавной буквы ⟨Sz⟩ , а ⟨kj⟩ в норвежском языке пишется с заглавной буквы ⟨Kj⟩ , в то время как ⟨ĳ ⟩ в голландском языке пишется с заглавной буквы ⟨Ĳ⟩ , а начальная буква слова ⟨dt⟩ в ирландском языке пишется с заглавной буквы ⟨dT⟩ .

Диграфы могут развиваться в лигатуры , но это отдельная концепция: лигатура подразумевает графическое слияние двух символов в один, например, когда ⟨o⟩ и ⟨e⟩ становятся ⟨œ⟩ , например, как во французском cœur «сердце».

Двойные буквы

Диграфы могут состоять из двух разных символов (гетерогенные диграфы) или двух экземпляров одного и того же символа (гомогенные диграфы). В последнем случае их обычно называют двойными (или удвоенными ) буквами .

Удвоенные гласные буквы обычно используются для обозначения долгого гласного звука. Так обстоит дело , например, в финском и эстонском языках , где ⟨uu⟩ представляет собой более длинную версию гласной, обозначенной ⟨u⟩ , ⟨ää⟩ представляет собой более длинную версию гласной, обозначенной ⟨ä⟩ , и так далее. В среднеанглийском языке последовательности ⟨ee⟩ и ⟨oo⟩ использовались аналогичным образом для обозначения удлиненных звуков «e» и «o» соответственно; оба написания были сохранены в современной английской орфографии , но Великий сдвиг гласных и другие исторические звуковые изменения означают, что современное произношение сильно отличается от первоначального.

Удвоенные согласные буквы также могут использоваться для обозначения долгого или удвоенного согласного звука. Например, в итальянском языке согласные, написанные удвоенными, произносятся дольше, чем одинарные. Это было изначальное использование удвоенных согласных букв в древнеанглийском языке , но в период среднеанглийского и раннего современного английского языка фонематическая длина согласных была утрачена, и развилась орфографическая конвенция, в которой удвоенная согласная служит для указания на то, что предшествующая гласная должна произноситься кратко. Например, в современном английском языке ⟨pp⟩ в tapping отличает первый гласный звук от звука taping . В редких случаях удвоенные согласные буквы представляют собой настоящий удвоенный согласный в современном английском языке; это может произойти, когда два экземпляра одного и того же согласного происходят из разных морфем , например ⟨nn⟩ в unnatural ( un + natural ) или ⟨tt⟩ в cattail ( cat + tail ).

В некоторых случаях звук, представленный удвоенной согласной буквой, отличается от звука соответствующей одинарной согласной буквы не только долготой:

В валлийском и гренландском языках ⟨ll⟩ обозначает глухой боковой согласный , а в испанском и каталонском — палатальный согласный .
В нескольких языках Западной Европы, включая английский, французский , португальский и каталонский, диграф ⟨ss⟩ используется между гласными для обозначения глухого шипящего /s/ , поскольку диграф ⟨s⟩ между гласными обычно обозначает звонкий шипящий /z/ .
В испанском, итальянском, португальском, каталонском и баскском языках ⟨rr⟩ используется между гласными для альвеолярного треля /r/ , поскольку ⟨r⟩ между гласными представляет собой альвеолярный створ /ɾ/ (в этих языках это разные фонемы).
В испанском языке диграф ⟨nn⟩ раньше обозначал /ɲ/ ( нёбный носовой звук ); он развился в букву ñ .
В баскском языке двойные согласные буквы обычно обозначают палатализованные версии одинарной согласной буквы, как в ⟨dd⟩ , ⟨ll⟩ , ⟨tt⟩ . Однако ⟨rr⟩ — это вибрация, которая контрастирует с однобуквенным лоскутом, как в испанском языке, а палатальная версия ⟨n⟩ пишется как ⟨ñ⟩ .

В нескольких европейских системах письма, включая английскую, удвоение буквы ⟨c⟩ или ⟨k⟩ представлено в виде гетерогенного диграфа ⟨ck⟩ вместо ⟨cc⟩ или ⟨kk⟩ соответственно. В исконно немецких словах удвоение ⟨z⟩ , которое соответствует /ts/ , заменяется диграфом ⟨tz⟩ .

Пандиалектные диграфы

Некоторые языки имеют единую орфографию с диграфами, которые представляют различные произношения в разных диалектах ( диафонемы ). Например, в бретонском языке есть диграф ⟨zh⟩ , который представляет [z] в большинстве диалектов, но [h] в ваннетском. Аналогично, диалект французского языка сентонже имеет диграф ⟨jh⟩ , который представляет [h] в словах, которые соответствуют [ʒ] в стандартном французском языке. Аналогично, в каталонском есть диграф ⟨ix⟩ , который представляет [ʃ] в восточнокаталонском , но [jʃ] или [js] в западнокаталонском – валенсийском .

Разделенные орграфы

Буквы, составляющие фонему, не всегда соседствуют. Так обстоит дело с английским немым e . Например, последовательность a_e имеет звук /eɪ/ в английском cake. Это результат трех исторических звуковых изменений: cake изначально было /kakə/ , открытый слог /ka/ стал произноситься с долгой гласной , а позже конечный шва отпал, оставив /kaːk/ . Еще позже гласный /aː/ стал /eɪ/ . В английском языке существует шесть таких диграфов: ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩ . ^[1]

Однако алфавиты могут также быть разработаны с прерывистыми диграфами. Например, в татарском кириллическом алфавите буква ю используется для записи как /ju/, так и /jy/ . Обычно разница очевидна из остальной части слова, но когда это не так, последовательность ю...ь используется для /jy/ , как в юнь /jyn/ 'дешевый'.

Индийские алфавиты отличаются своими прерывистыми гласными, такими как тайский เ...อ/ɤː/ в เกอ/kɤː/ . Технически, однако, их можно считать диакритическими знаками , а не полноценными буквами; являются ли они диграфами, таким образом, вопрос определения.

Неоднозначные последовательности букв

Найдите категорию:Английские термины с псевдодиграфами в Викисловаре, бесплатном словаре.

Некоторые пары букв не следует интерпретировать как диграфы, а появляются из-за словосложения : hogshead и cooperation . Они часто никак не обозначены и поэтому должны быть запомнены как исключения. Некоторые авторы, однако, обозначают это либо разделением диграфа дефисом , как в hogs-head , co-operate , либо знаком тремы , как в coöperate , но использование диэрезиса в английском языке сократилось в течение последнего столетия. Когда он встречается в таких именах, как Clapham , Townshend и Hartshorne, он никогда не обозначен каким-либо образом. Позиционные альтернативные глифы могут помочь устранить неоднозначность в некоторых случаях: когда round, ⟨s⟩ использовался как конечный вариант long ⟨ſ⟩ , а английский диграф для /ʃ/ всегда будет ⟨ſh⟩ .

В романизации японского языка составляющие звуки ( morae ) обычно обозначаются диграфами, но некоторые обозначаются одной буквой, а некоторые — триграфом. Случай неоднозначности — слоговоеん, которое пишется как n (или иногда m ), за исключением случаев перед гласными или y , когда за ним следует апостроф n ' . Например, имя じゅんいちろう романизируется как Jun'ichirō, так что оно разбирается как «Jun-i-chi-rou», а не как «Ju-ni-chi-rou». Похожее использование апострофа наблюдается в пиньинь , где 嫦娥 пишется как Chang'e, потому что g относится к конечной (-ang) части первого слога, а не к начальной части второго слога. Без апострофа Change понималось бы как слог chan (конечный -an), за которым следует слог ge (начальный g-).

В алфавитном порядке

В некоторых языках определенные диграфы и триграфы считаются отдельными буквами и занимают определенное место в алфавите , отдельное от последовательности символов, из которых они состоят, в целях орфографии и сопоставления :

В латинском алфавите Гаджа , используемом для записи сербскохорватского языка , диграфы ⟨ dž ⟩ , ⟨ lj ⟩ и ⟨ nj ⟩ , соответствующие отдельным кириллическим буквам ⟨џ⟩ , ⟨љ⟩ , ⟨њ⟩ , рассматриваются как отдельные буквы.
В чешском и словацком алфавите ⟨ ch ⟩ рассматривается как отдельная буква, идущая после ⟨ h ⟩ в алфавите. Также в словацком алфавите относительно редкие диграфы ⟨ dz ⟩ и ⟨ dž ⟩ рассматриваются как отдельные буквы.
В датском и норвежском алфавитах бывший диграф ⟨ aa ⟩ , встречающийся в старых именах, сортируется так, как если бы это была буква ⟨ å ⟩ , которая его заменила.
В норвежском алфавите существует несколько диграфов и буквосочетаний, представляющих отдельный звук.
В голландском алфавите диграф ⟨ ij ⟩ иногда пишется как лигатура и может сортироваться с ⟨ y ⟩ (в Нидерландах , хотя обычно не в Бельгии ); однако, независимо от того, где он используется, когда голландское слово, начинающееся с ⟨ij⟩, пишется с заглавной буквы, весь диграф пишется с заглавной буквы ( IJmeer , IJmuiden ). Другие голландские диграфы никогда не рассматриваются как отдельные буквы.
В венгерском языке диграфы ⟨ cs ⟩ , ⟨ dz ⟩ , ⟨ gy ⟩ , ⟨ ly ⟩ , ⟨ ny ⟩ , ⟨ sz ⟩ , ⟨ ty ⟩ , ⟨ zs ⟩ и триграф ⟨ dzs ⟩ имеют свои собственные места в алфавите (где, например, ⟨ny⟩ стоит сразу после ⟨n⟩ ).
В испанском языке диграфы ⟨ ch ⟩ и ⟨ ll ⟩ раньше считались отдельными буквами, но теперь они разделены на составляющие их буквы.
В валлийском алфавите есть диграфы ⟨ ch ⟩ , ⟨ dd ⟩ , ⟨ ff ⟩ , ⟨ ll ⟩ , ⟨ ng ⟩ , ⟨ ph ⟩ , ⟨ rh ⟩ , ⟨ th ⟩ . Однако ⟨ mh ⟩ , ⟨ nh ⟩ и ⟨ ngh ⟩ , которые представляют собой измененные глухие согласные, не рассматриваются как отдельные буквы.
При латинизации нескольких славянских стран, использующих кириллицу, такие буквы, как ш, ж и ю, могли записываться как sh, zh и yu, однако иногда в результате латинизации буква может превратиться из диграфа в диакритический знак.
В мальтийском языке используются два диграфа: ⟨ għ ⟩ , который следует сразу после ⟨g⟩ , и ⟨ ie ⟩, который следует сразу после ⟨i⟩ .

В большинстве других языков, включая большинство романских языков, диграфы рассматриваются как комбинации отдельных букв в целях алфавитной организации.

Примеры

латиница

Английский

В английском языке есть как однородные диграфы (удвоенные буквы), так и неоднородные диграфы (диграфы, состоящие из двух разных букв). К последнему типу относятся следующие:

⟨sc⟩ обычно представляет /s/ ( глухой альвеолярный фрикативный согласный - сценический ) или /ʃ/ ( глухой постальвеолярный фрикативный согласный - сознательный ) перед ⟨e⟩ или ⟨i⟩ .
⟨ng⟩ представляет /ŋ/ ( заднеязычный носовой согласный ), как в слове thing .
⟨ ch ⟩ обычно соответствует /tʃ/ ( глухая постальвеолярная аффриката - church ), /k/ ( глухая велярная взрывная согласные ) при использовании в качестве этимологического диграфа в словах греческого происхождения ( christ ), реже /ʃ/ ( глухая постальвеолярная фрикативная согласные ) в словах французского происхождения ( champang ).
⟨ck⟩ соответствует /k/, как в check .
⟨ gh ⟩ представляет /ɡ/ ( звонкий велярный взрывной согласный ) в начале слов ( ghost ), представляет /f/ ( глухой губно-зубной фрикативный согласный в enough ) или не произносится в конце слов ( sigh ).
⟨ph⟩ представляет звук /f/ ( глухой губно-зубной фрикативный звук ), как в слове siphon .
⟨rh⟩ представляет английскую /r/ в словах греческого происхождения, таких как ритм .
⟨ sh ⟩ представляет /ʃ/ ( глухой постальвеолярный фрикативный звук ), как в слове sheep .
⟨ti⟩ обычно представляет /ʃ/ в середине слова перед гласной, как в слове education .
⟨ th ⟩ обычно соответствует /θ/ ( глухой межзубный щелевой ) в thin или /ð/ ( звонкий межзубный щелевой ) в then . См. также Произношение английского ⟨th⟩ .
⟨wh⟩ представляет /hw/ в некоторых консервативных диалектах; /w/ в других диалектах ( while ); и /h/ в нескольких словах, в которых за ним следует ⟨o⟩ , таких как who и whole . См. также Фонологическая история ⟨wh⟩ .
⟨zh⟩ представляет /ʒ/ в словах, транслитерированных из славянских языков ^{[ which? ]} , и в американском словаре произношения и правописания.
⟨ci⟩ обычно появляется как /ʃ/ перед гласными, как в словах facial и artificial . В противном случае это /si/ , как в fancier и icier или /sɪ/, как в acid и rancid .
⟨wr⟩ представляет /r/ . Первоначально он обозначал лабиализованный звук, в то время как ⟨r⟩ без ⟨w⟩ был нелабиализованным, но в большинстве диалектов это различие утрачено, и два звука слились в один альвеолярный аппроксимант , аллофонически лабиализованный в начале слогов, как в red [ɹʷɛd] . См. также ротический согласный .
⟨qu⟩ обычно представляет /kw/ ; за ⟨q⟩ традиционно следует ⟨u⟩ и гласная буква, как в слове quick , за некоторыми исключениями.

Диграфы также могут состоять из гласных. Некоторые буквы ⟨a, e, o⟩ предпочтительны для первой позиции, другие для второй ⟨i, u⟩ . Последние имеют аллографы ⟨y, w⟩ в английской орфографии .

Другие языки, использующие латинский алфавит

На сербскохорватском языке :

⟨ lj ⟩ соответствует /ʎ/ ( палатальный боковой аппроксимант )
⟨ nj ⟩ соответствует /ɲ/ ( палатально-носовой )
⟨ dž ⟩ соответствует /d͡ʒ/ ( звонкая постальвеолярная аффриката )

Обратите внимание, что в кириллической орфографии эти звуки представлены отдельными буквами (љ, њ, џ).

На чешском и словацком языках :

⟨ ch ⟩ соответствует /x/ ( глухой велярный фрикативный звук ), считается отдельной буквой
⟨ dz ⟩ соответствует /d͡z/ ( звонкая альвеолярная аффриката ), считается отдельной буквой в словацком языке, относительно редкий диграф
⟨ dž ⟩ соответствует /d͡ʒ/ ( звонкая постальвеолярная аффриката ), считается отдельной буквой в словацком языке, относительно редкий диграф

На датском и норвежском языках :

Диграф ⟨ aa ⟩ представлял /ɔ/ до 1917 года в Норвегии и до 1948 года в Дании, но сегодня пишется как ⟨ å ⟩ . Диграф все еще используется в старых именах, но сортируется так, как если бы это была буква с диакритическим знаком.

В норвежском языке несколько звуков могут быть представлены только диграфом или комбинацией букв. Это наиболее распространенные комбинации, но существуют и крайние региональные различия, особенно в восточных диалектах . Примечательным отличием является придыхание ⟨rs⟩ в восточных диалектах, где оно соответствует ⟨skj⟩ и ⟨sj⟩ . Среди многих молодых людей, особенно в западных регионах Норвегии и в крупных городах или вокруг них, разница между / ç / и / ʃ / полностью стерта и теперь произносятся одинаково.

⟨kj⟩ представляет /ç/
⟨tj⟩ представляет /ç/ .
⟨skj⟩ представляет /ʃ/ .
⟨sj⟩ представляет /ʃ/ .
⟨sk⟩ представляет /ʃ/ (перед i или y).
⟨ ng ⟩ представляет собой /ŋ/, как в английском языке ng .

На каталонском :

⟨ll⟩ представляет /ʎ/ ( палатальный латеральный аппроксимант )
⟨ny⟩ представляет /ɲ/ ( нёбный носовой )
⟨rr⟩ представляет /r/ ( постальвеолярный трель )
⟨ss⟩ представляет /s/ ( глухой альвеолярный втянутый шипящий звук )
⟨qu⟩ представляет /k/ ( глухой велярный взрывной согласный )
⟨gu⟩ представляет /g/ ( звонкий велярный взрывной согласный )
поствокальный ⟨ix⟩ представляет /ʃ/ ( глухой постальвеолярный фрикативный звук ) в восточных диалектах, в западных диалектах он представляет /jʃ/ .

На голландском языке :

⟨ ij ⟩ соответствует /ɛi/ (см. выше о его возможном статусе как отдельной буквы).
⟨ ng ⟩ представляет собой /ŋ/ ( велярно-носовой )
⟨ ch ⟩ представляет /x/ ( глухой велярный фрикативный согласный )
⟨sj⟩ представляет /ʃ/ ( глухой постальвеолярный фрикативный согласный )
⟨ie⟩ представляет /i/ ( неогубленный гласный переднего ряда )
⟨oe⟩ представляет /u/ ( закрытый округленный гласный заднего ряда )
⟨eu⟩ представляет /ø/ ( огубленный гласный переднего ряда среднего подъёма )

На французском :

⟨ch⟩ представляет /ʃ/ ( глухой постальвеолярный фрикативный согласный )
⟨gn⟩ представляет /ɲ/ ( нёбный носовой )
⟨qu⟩ представляет /k/ ( глухой велярный смычный звук ), как правило, перед историческими гласными переднего ряда

См. также французскую фонологию .

На немецком языке :

⟨ ch ⟩ представляет /x/ ( глухой велярный фрикативный звук ) или /ç/ ( глухой палатальный фрикативный звук )
⟨ck⟩ представляет /k/ ( глухой велярный взрывной согласный )
⟨ei⟩ представляет /a͡ɪ/ ( открытый передний неогубленный гласный ), за которым следует ( почти закрытый передний неогубленный гласный )
⟨eu⟩ представляет /ɔ͡ʏ/ ( открытый-средний задний огубленный гласный ), за которым следует ( почти закрытый-почти передний огубленный гласный )

На венгерском языке :

⟨ cs ⟩ представляет /tʃ/ ( глухая постальвеолярная аффриката )
⟨ zs ⟩ представляет /ʒ/ ( звонкий постальвеолярный фрикативный согласный )
⟨ gy ⟩ представляет /ɟ/ ( звонкий палатальный взрывной согласный )
⟨ ly ⟩ изначально представлял собой /ʎ/ ( палатальный латеральный аппроксимант ), но в современном языке обозначает /j/ ( палатальный латеральный аппроксимант )
⟨ ny ⟩ представляет /ɲ/ ( нёбный носовой )
⟨ ty ⟩ представляет /c/ ( глухой палатальный взрывной согласный )
⟨ dz ⟩ представляет /dz/ ( звонкая постальвеолярная аффриката )
⟨ sz ⟩ представляет /s/ ( глухой альвеолярный фрикативный звук ) ( ⟨s⟩ произносится как /ʃ/ )
Венгерский алфавит дополнительно содержит триграф ⟨ dzs ⟩ / dʒ / .

На итальянском :

⟨sc⟩ соответствует /ʃ/ ( глухой постальвеолярный щелевой согласный ) перед -i и -e (но /sk/ перед другими буквами)
⟨ch⟩ соответствует /k/ (только перед i, e)
⟨gh⟩ соответствует /ɡ/ (только перед i, e)
⟨gl⟩ представляет /ʎ/ , палатальный боковой аппроксимант , перед -i (за некоторыми исключениями)
⟨gn⟩ представляет /ɲ/ ( нёбный носовой )

В мэнском гэльском языке ⟨ch⟩ представляет / χ/ , а ⟨çh⟩ представляет /tʃ/ .

На польском языке :

⟨ ch ⟩ соответствует /x/ ( глухой велярный фрикативный звук )
⟨ cz ⟩ соответствует /tʂ/ ( глухая ретрофлексная аффриката )
⟨ dz ⟩ соответствует /dz/ ( звонкая альвеолярная аффриката )
⟨ dź ⟩ соответствует /dʑ/ ( звонкая альвеоло-палатальная аффриката )
⟨ dż ⟩ соответствует /dʐ/ ( звонкая ретрофлексная аффриката )
⟨ rz ⟩ соответствует /ʐ/ ( звонкий ретрофлексный фрикативный )
⟨ sz ⟩ соответствует /ʂ/ ( глухой ретрофлексный фрикативный звук )

На португальском языке :

⟨ ch ⟩ соответствует /ʃ/ ( глухой постальвеолярный фрикативный согласный )
⟨ lh ⟩ соответствует /ʎ/ ( палатальный латеральный аппроксимант )
⟨ nh ⟩ соответствует /ɲ/ ( нёбно-носовой )
⟨qu⟩ обычно представляет /k/ ( глухой велярный взрывной звук )

На испанском языке :

⟨ll⟩ традиционно произносится /ʎ/ , но в диалектах с yeísmo произносится /ʝ/
⟨ch⟩ представляет /tʃ/ ( глухую постальвеолярную аффрикату ). С 2010 года ни одна из них не считается частью алфавита. Раньше они сортировались как отдельные буквы, но реформа 1994 года, проведенная Испанской королевской академией, позволила разделить их на составляющие буквы для сопоставления. Диграф ⟨ rr ⟩ , произносимый как отдельная альвеолярная вибрация , никогда официально не считался буквой испанского алфавита, и то же самое верно для ⟨gu⟩ и ⟨qu⟩ (для /ɡ/ и /k/ соответственно перед ⟨e⟩ или ⟨i⟩ ).

На валлийском языке :

⟨ng⟩ представляет собой /ŋ/ ( заднеязычный носовой звук ), тот же звук, что и в английском языке (но в некоторых словах он представляет собой две отдельные буквы и произносится как /ng/ ).
⟨ch⟩ представляет /χ/ ( глухой увулярный фрикативный согласный )
⟨rh⟩ представляет собой /r̥/ ( глухой альвеолярный трель ), произносимый примерно как сочетание hr (но, опять же, в некоторых словах он представляет собой две отдельные буквы и произносится как /rh/ ).
⟨th⟩ представляет /θ/ ( глухой межзубный фрикативный звук )
⟨ dd ⟩ представляет /ð/ ( звонкий зубной фрикативный звук ), как английское ⟨th⟩ в слове then (но во многих контекстах произносится как глухой).
⟨ ff ⟩ представляет собой /f/ ( глухой губно-зубной фрикативный звук ), как в английском ⟨f⟩ , поскольку валлийский ⟨f⟩ произносится как /v/, как в английском ⟨v⟩ .
⟨ph⟩ также представляет /f/ (глухой губно-зубной фрикативный звук), но в современной орфографии используется только для придыхательной мутации слов, начинающихся с ⟨p⟩ .
⟨ ll ⟩ представляет /ɬ/ ( глухой альвеолярный боковой фрикативный согласный )

Перечисленные выше диграфы представляют собой различные фонемы и рассматриваются как отдельные буквы для целей сопоставления. С другой стороны, диграфы ⟨ mh ⟩ , ⟨ nh ⟩ и триграф ⟨ ngh ⟩ , которые обозначают глухие согласные , но встречаются только в начале слов в результате носовой мутации ^{[ необходимо разрешение неоднозначности ]} , не рассматриваются как отдельные буквы и, таким образом, не включены в алфавит.

Система транскрипции Daighi tongiong pingim , используемая для тайваньского диалекта хоккиен , включает в себя или , представляющие /ə/ ( средне-центральный гласный ) или /o/ ( верхне-среднезадний огубленный гласный ), а также другие диграфы.

В языке йоруба ⟨gb⟩ — это буква, представляющая взрывной звук, который наиболее точно произносится, если попытаться произнести /g/ и /b/ одновременно.

кириллица

Современные славянские языки, написанные на кириллице, мало используют диграфы, за исключением ⟨дж⟩ для /dʐ/ , ⟨дз⟩ для /dz/ (в украинском, белорусском и болгарском языках), а также ⟨жж⟩ и ⟨зж⟩ для редкой русской фонемы /ʑː/ . В русском языке последовательности ⟨дж⟩ и ⟨дз⟩ встречаются (в основном в заимствованных словах), но произносятся как комбинации имплозивного (иногда рассматриваемого как аффриката) и фрикативного; имплозивные звуки рассматриваются как аллофоны взрывного /d̪/ , поэтому эти последовательности не считаются диграфами. В кириллице мало диграфов, если только она не используется для записи неславянских языков, особенно кавказских языков .

арабская письменность

Поскольку гласные обычно не пишутся, диграфы редки в абджадах , таких как арабский. Например, если бы sh использовалось для š, то последовательность sh могла бы означать либо ša, либо saha. Однако диграфы используются для придыхательных и бормочущих согласных (которые пишутся с помощью диграфов h- в латинской транскрипции) в языках Южной Азии, таких как урду , которые пишутся в арабском письме особой формой буквы h , которая используется только для придыхательных диграфов, как можно видеть на примере следующих соединительных (kh) и несоединительных (ḍh) согласных:

армянский

В армянском языке диграф ու ⟨ou⟩ передает звук / u / , пришедший из греческого языка.

грузинский

Грузинский алфавит использует несколько диграфов для записи других языков. Например, в сванском языке / ø/ пишется как ჳე ⟨we⟩ , а /y/ как ჳი ⟨wi⟩ .

греческий

В современном греческом языке имеются следующие диграфы:

αι ( ai ) представляет /e̞/
ει ( ei ) представляет /i/
οι ( oi ) представляет /i/
ου ( oy ) представляет /u/
υι ( yi ) представляет /i/

По -гречески они называются «дифтонгами» ; в классические времена большинство из них представляли собой дифтонги , и это название закрепилось.

γγ ( gg ) представляет /ŋɡ/ или /ɡ/
τσ ( ts ) представляет собой аффрикату /ts/
τζ ( tz ) представляет собой аффрикату /dz/
Начальная γκ ( gk ) представляет /ɡ/
Начальная μπ ( mp ) представляет /b/
Начальная ντ ( nt ) представляет /d/

В древнегреческом языке также были «дифтонги», перечисленные выше, хотя их произношение в древние времена оспаривается. Кроме того, в древнегреческом языке также использовалась буква γ в сочетании с велярной остановкой для получения следующих диграфов:

γγ ( gg ) представляет /ŋɡ/
γκ ( gk ) представляет /ŋɡ/
γχ ( gkh ) представляет собой /ŋkʰ/

В языке Цаконян есть несколько дополнительных диграфов:

ρζ ( rz ) /ʒ/ (исторически, возможно, фрикативная трель )
κχ ( kkh ) представляет /kʰ/
τθ ( tth ) представляет /tʰ/
πφ ( pph ) представляет /pʰ/
σχ ( skh ) представляет /ʃ/

Кроме того, палатальные согласные обозначаются гласной буквой ι , что, однако, в значительной степени предсказуемо. Когда /n/ и /l/ не палатализируются перед ι , они пишутся νν и λλ .

В бактрийском языке диграфы ββ , δδ и γγ использовались для /b/ , /d/ и /ŋg/ соответственно.

иврит

В еврейском алфавите תס ‎ и תש ‎ иногда можно встретить вместо צ ‎ / ts / . Современный иврит также использует диграфы, образованные с помощью символа ׳ ‎ для неродных звуков: ג׳ ‎ / dʒ / , ז׳ ‎ / ʒ / , צ׳ ‎ / tʃ / ; и другие диграфы букв, когда они пишутся без гласных: וו ‎ для согласной буквы ו ‎ в середине слова и יי ‎ для /aj/ или /aji/ и т. д., то есть согласной буквы י ‎ в местах, где ее можно было бы не ожидать. В идише существует своя собственная традиция транскрипции, поэтому для некоторых из тех же звуков используются разные диграфы: דז ‎ / dz / , זש ‎ / ʒ / , טש ‎ / tʃ / и דזש ‎ (буквально dzš ) для / dʒ / , וו ‎ / v / , также доступные как один символ Unicode װ ‎, וי ‎ или как один символ в Unicode ױ ‎ / oj/ , יי ‎ или ײ ‎ / ej/ , и ײַ ‎ / aj/ . Односимвольные диграфы называются « лигатурами » в Unicode. י ‎ может также использоваться после согласного для обозначения палатализации в славянских заимствованиях.

Индийский

Большинство индийских письменностей имеют составные гласные диакритические знаки , которые невозможно предсказать по их отдельным элементам. Это можно проиллюстрировать на примере тайского языка , в котором диакритический знак เ, произносимый отдельно /eː/ , изменяет произношение других гласных:

Кроме того, сочетание รร произносится как /a/ или /an/ , есть некоторые слова, в которых сочетания ทร и ศร обозначают /s/, а буква ห, как префикс к согласному, меняет свой тонический класс на высокий, изменяя тон слога.

инуиты

Слоговое письмо инуктитута добавляет к кри два диграфа:

рк для д: ᙯ qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q

нг для ŋ: ᖕ ng

Последний образует триграфы и тетраграфы.

Персонажи CJK

китайский

Несколько комбинаций китайских иероглифов (ханьцзы), образованных из двух или более различных символов, называются диграфами.

японский

Две каны можно объединить в слог C V , добавив вторую; соглашение отменяет гласную первой. Это обычно делается для слогов CyV , называемых yōon , как в ひょ (ひ_よ) hyo ⟨hi _yo ⟩ . Они не являются диграфами, поскольку сохраняют нормальное последовательное чтение двух глифов. Однако некоторые устаревшие последовательности больше не сохраняют это чтение, как в くゎkwa,ぐゎgwa и むゎmwa, которые теперь произносятся как ka, ga, ma . Кроме того, несеквенируемые орграфы используются для иностранных займов, которые не соответствуют обычным японским образцам ассибиляции , например ティti , トゥtu , チェtye/che , スェswe , ウィwi , ツォtso , ズィzi . (Полные таблицы см. в катакане и транскрипции на японский язык .)

Долгие гласные записываются добавлением каны для этой гласной, по сути удваивая ее. Однако долгая ō может быть написана как oo или ou , как в とうきょうtoukyou [toːkʲoː] 'Tōkyō'. Для диалектов, которые не различают ē и ei , последнее написание используется для долгой e , как в へいせいheisei [heːseː] ' Heisei '. В заимствованных словах chōonpu , строка, следующая направлению текста, как в ビールbīru [biːru] bīru 'пиво'. За исключением слогов, начинающихся с n , удвоенные согласные звуки записываются с помощью префикса уменьшенной версии tsu (пишется っ и ッ в хирагане и катакане соответственно), как в きってkitte 'штамп'. Согласные, начинающиеся с n , вместо этого используют в качестве префикса символ каны n (пишется ん или ン).

Существует несколько соглашений окинавской каны , которые включают подстрочные диграфы или лигатуры. Например, в системе Университета Рюкю ウ — это /ʔu/ , ヲ — это /o/ , но ヲゥ (ヲ_ウ) — это /u/ .

корейский

Как и в греческом, в корейском языке есть гласные, произошедшие от дифтонгов, которые до сих пор пишутся двумя буквами. Эти диграфы, ㅐ /ɛ/ и ㅔ /e/ (также ㅒ /jɛ/ , ㅖ /je/ ), а в некоторых диалектах ㅚ /ø/ и ㅟ /y/ , все заканчиваются на историческое ㅣ /i/ .

Хангул был разработан с серией диграфов для представления « мутных » согласных: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; также ᅇ, с неопределенным значением. Эти значения сейчас устарели, но большинство удвоенных букв были воскрешены в 19 веке для записи согласных, которых не существовало, когда был изобретен хангыль: ㅃ /p͈/ , ㄸ /t͈/ , ㅉ /t͈ɕ/ , ㄲ /k͈/ , ㅆ /s͈/ .

Лигатуры и новые буквы

Диграфы иногда пишутся как одна лигатура. Со временем лигатуры могут эволюционировать в новые буквы или буквы с диакритическими знаками. Например, sz превратилась в ß в немецком языке, а "nn" превратилась в ñ в испанском языке.

В Юникоде

Обычно диграф просто представляется с помощью двух символов в Unicode . ^[2] Однако по разным причинам Unicode иногда предоставляет отдельную кодовую точку для диграфа, закодированную как один символ.

Диграфы DZ и IJ , а также сербско-хорватские диграфы DŽ, LJ и NJ имеют отдельные кодовые точки в Unicode.

См. также Лигатуры в Unicode .

Смотрите также

Ссылки

^ Брукс (2015) Словарь британской английской орфографической системы, стр. 460 и далее.
^ "FAQ – Лигатуры, диграфы и формы представления". Консорциум Unicode: Домашняя страница . Unicode Inc . 1991–2009 . Получено 2009-05-11 .
^ "Стандарт Unicode, версия 15.1" (PDF) . Unicode . Получено 20.12.2023 .