stringtranslate.com

Диграф (орфография)

В валлийском языке диграф ⟨ll⟩ на некоторое время слился с лигатурой .

Диграф (от др.-греч. δίς (dís) «двойной» и γράφω (gráphō) «писать») или биграмма — пара символов, используемых в орфографии языка для записи либо одной  фонемы ( отдельного звука )  , либо последовательности фонем , которая не соответствует обычным значениям двух символов вместе.

Некоторые диграфы представляют фонемы, которые не могут быть представлены одним символом в системе письма языка, например, ⟨ ch ⟩ в испанском chico и ocho . Другие диграфы представляют фонемы, которые также могут быть представлены одним символом. Диграф, который разделяет свое произношение с одним символом, может быть реликтом из более раннего периода языка, когда диграф имел другое произношение, или может представлять различие, которое проводится только в определенных диалектах , например, английский ⟨ wh ⟩ . Некоторые такие диграфы используются по чисто этимологическим причинам, например, ⟨ ph ⟩ во французском.

В некоторых орфографиях диграфы (а иногда и триграфы ) считаются отдельными буквами , что означает, что они имеют свое собственное место в алфавите и не могут быть разделены на составляющие их места графемы при сортировке , сокращении или переносе слов. Диграфы используются в некоторых схемах латинизации , например, ⟨ zh ⟩ как латинизация русской ⟨ ж ⟩ .

Регистр букв в диграфах может различаться , например, ⟨sz⟩ в польском языке пишется с заглавной буквы ⟨Sz⟩ , а ⟨kj⟩ в норвежском языке пишется с заглавной буквы ⟨Kj⟩ , в то время как ⟨ij ⟩ в голландском языке пишется с заглавной буквы ⟨IJ⟩ , а начальная буква слова ⟨dt⟩ в ирландском языке пишется с заглавной буквы ⟨dT⟩ .

Диграфы могут развиваться в лигатуры , но это отдельная концепция: лигатура подразумевает графическое слияние двух символов в один, например, когда ⟨o⟩ и ⟨e⟩ становятся ⟨œ⟩ , например, как во французском cœur «сердце».

Двойные буквы

Диграфы могут состоять из двух разных символов (гетерогенные диграфы) или двух экземпляров одного и того же символа (гомогенные диграфы). В последнем случае их обычно называют двойными (или удвоенными ) буквами .

Удвоенные гласные буквы обычно используются для обозначения долгого гласного звука. Так обстоит дело , например, в финском и эстонском языках , где ⟨uu⟩ представляет собой более длинную версию гласной, обозначенной ⟨u⟩ , ⟨ää⟩ представляет собой более длинную версию гласной, обозначенной ⟨ä⟩ , и так далее. В среднеанглийском языке последовательности ⟨ee⟩ и ⟨oo⟩ использовались аналогичным образом для обозначения удлиненных звуков «e» и «o» соответственно; оба написания были сохранены в современной английской орфографии , но Великий сдвиг гласных и другие исторические звуковые изменения означают, что современное произношение сильно отличается от первоначального.

Удвоенные согласные буквы также могут использоваться для обозначения долгого или удвоенного согласного звука. Например, в итальянском языке согласные, написанные удвоенными, произносятся дольше, чем одинарные. Это было изначальное использование удвоенных согласных букв в древнеанглийском языке , но в период среднеанглийского и раннего современного английского языка фонематическая длина согласных была утрачена, и развилась орфографическая конвенция, в которой удвоенная согласная служит для указания на то, что предшествующая гласная должна произноситься кратко. Например, в современном английском языке ⟨pp⟩ в tapping отличает первый гласный звук от звука taping . В редких случаях удвоенные согласные буквы представляют собой настоящий удвоенный согласный в современном английском языке; это может произойти, когда два экземпляра одного и того же согласного происходят из разных морфем , например ⟨nn⟩ в unnatural ( un + natural ) или ⟨tt⟩ в cattail ( cat + tail ).

В некоторых случаях звук, представленный удвоенной согласной буквой, отличается от звука соответствующей одинарной согласной буквы не только долготой:

В нескольких европейских системах письма, включая английскую, удвоение буквы ⟨c⟩ или ⟨k⟩ представлено в виде гетерогенного диграфа ⟨ck⟩ вместо ⟨cc⟩ или ⟨kk⟩ соответственно. В исконно немецких словах удвоение ⟨z⟩ , которое соответствует /ts/ , заменяется диграфом ⟨tz⟩ .

Пандиалектные диграфы

Некоторые языки имеют единую орфографию с диграфами, которые представляют различные произношения в разных диалектах ( диафонемы ). Например, в бретонском языке есть диграф ⟨zh⟩ , который представляет [z] в большинстве диалектов, но [h] в ваннетском. Аналогично, диалект французского языка сентонже имеет диграф ⟨jh⟩ , который представляет [h] в словах, которые соответствуют [ʒ] в стандартном французском языке. Аналогично, в каталонском есть диграф ⟨ix⟩ , который представляет [ʃ] в восточнокаталонском , но [jʃ] или [js] в западнокаталонскомваленсийском .

Разделенные орграфы

Буквы, составляющие фонему, не всегда соседствуют. Так обстоит дело с английским немым e . Например, последовательность a_e имеет звук /eɪ/ в английском cake. Это результат трех исторических звуковых изменений: cake изначально было /kakə/ , открытый слог /ka/ стал произноситься с долгой гласной , а позже конечный шва отпал, оставив /kaːk/ . Еще позже гласный /aː/ стал /eɪ/ . В английском языке существует шесть таких диграфов: ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩ . [1]

Однако алфавиты могут также быть разработаны с прерывистыми диграфами. Например, в татарском кириллическом алфавите буква ю используется для записи как /ju/, так и /jy/ . Обычно разница очевидна из остальной части слова, но когда это не так, последовательность ю...ь используется для /jy/ , как в юнь /jyn/ 'дешевый'.

Индийские алфавиты отличаются своими прерывистыми гласными, такими как тайский เ...อ/ɤː/ в เกอ/kɤː/ . Технически, однако, их можно считать диакритическими знаками , а не полноценными буквами; являются ли они диграфами, таким образом, вопрос определения.

Неоднозначные последовательности букв

Некоторые пары букв не следует интерпретировать как диграфы, а появляются из-за словосложения : hogshead и cooperation . Они часто никак не обозначены и поэтому должны быть запомнены как исключения. Некоторые авторы, однако, обозначают это либо разделением диграфа дефисом , как в hogs-head , co-operate , либо знаком тремы , как в coöperate , но использование диэрезиса в английском языке сократилось в течение последнего столетия. Когда он встречается в таких именах, как Clapham , Townshend и Hartshorne, он никогда не обозначен каким-либо образом. Позиционные альтернативные глифы могут помочь устранить неоднозначность в некоторых случаях: когда round, ⟨s⟩ использовался как конечный вариант long ⟨ſ⟩ , а английский диграф для /ʃ/ всегда будет ⟨ſh⟩ .

В романизации японского языка составляющие звуки ( morae ) обычно обозначаются диграфами, но некоторые обозначаются одной буквой, а некоторые — триграфом. Случай неоднозначности — слоговоеん, которое пишется как n (или иногда m ), за исключением случаев перед гласными или y , когда за ним следует апостроф n ' . Например, имя じゅんいちろう романизируется как Jun'ichirō, так что оно разбирается как «Jun-i-chi-rou», а не как «Ju-ni-chi-rou». Похожее использование апострофа наблюдается в пиньинь , где 嫦娥 пишется как Chang'e, потому что g относится к конечной (-ang) части первого слога, а не к начальной части второго слога. Без апострофа Change понималось бы как слог chan (конечный -an), за которым следует слог ge (начальный g-).

В алфавитном порядке

В некоторых языках определенные диграфы и триграфы считаются отдельными буквами и занимают определенное место в алфавите , отдельное от последовательности символов, из которых они состоят, в целях орфографии и сопоставления :

В большинстве других языков, включая большинство романских языков, диграфы рассматриваются как комбинации отдельных букв в целях алфавитной организации.

Примеры

латиница

Английский

В английском языке есть как однородные диграфы (удвоенные буквы), так и неоднородные диграфы (диграфы, состоящие из двух разных букв). К последнему типу относятся следующие:

Диграфы также могут состоять из гласных. Некоторые буквы ⟨a, e, o⟩ предпочтительны для первой позиции, другие для второй ⟨i, u⟩ . Последние имеют аллографы ⟨y, w⟩ в английской орфографии .

Другие языки, использующие латинский алфавит

На сербскохорватском языке :

Обратите внимание, что в кириллической орфографии эти звуки представлены отдельными буквами (љ, њ, џ).

На чешском и словацком языках :

На датском и норвежском языках :

В норвежском языке несколько звуков могут быть представлены только диграфом или комбинацией букв. Это наиболее распространенные комбинации, но существуют и крайние региональные различия, особенно в восточных диалектах . Примечательным отличием является придыхание ⟨rs⟩ в восточных диалектах, где оно соответствует ⟨skj⟩ и ⟨sj⟩ . Среди многих молодых людей, особенно в западных регионах Норвегии и в крупных городах или вокруг них, разница между / ç / и / ʃ / полностью стерта и теперь произносятся одинаково.

На каталонском :

На голландском языке :

На французском :

См. также французскую фонологию .

На немецком языке :

На венгерском языке :

На итальянском :

В мэнском гэльском языке ⟨ch⟩ представляет / χ/ , а ⟨çh⟩ представляет /tʃ/ .

На польском языке :

На португальском языке :

На испанском языке :

На валлийском языке :

Перечисленные выше диграфы представляют собой различные фонемы и рассматриваются как отдельные буквы для целей сопоставления. С другой стороны, диграфы ⟨ mh ⟩ , ⟨ nh ⟩ и триграф ⟨ ngh ⟩ , которые обозначают глухие согласные , но встречаются только в начале слов в результате носовой мутации [ необходимо разрешение неоднозначности ] , не рассматриваются как отдельные буквы и, таким образом, не включены в алфавит.

Система транскрипции Daighi tongiong pingim , используемая для тайваньского диалекта хоккиен , включает в себя или , представляющие /ə/ ( средне-центральный гласный ) или /o/ ( верхне-среднезадний огубленный гласный ), а также другие диграфы.

В языке йоруба ⟨gb⟩ — это буква, представляющая взрывной звук, который наиболее точно произносится, если попытаться произнести /g/ и /b/ одновременно.

кириллица

Современные славянские языки, написанные на кириллице, мало используют диграфы, за исключением ⟨дж⟩ для /dʐ/ , ⟨дз⟩ для /dz/ (в украинском, белорусском и болгарском языках), а также ⟨жж⟩ и ⟨зж⟩ для редкой русской фонемы /ʑː/ . В русском языке последовательности ⟨дж⟩ и ⟨дз⟩ встречаются (в основном в заимствованных словах), но произносятся как комбинации имплозивного (иногда рассматриваемого как аффриката) и фрикативного; имплозивные звуки рассматриваются как аллофоны взрывного /d̪/ , поэтому эти последовательности не считаются диграфами. В кириллице мало диграфов, если только она не используется для записи неславянских языков, особенно кавказских языков .

арабская письменность

Поскольку гласные обычно не пишутся, диграфы редки в абджадах , таких как арабский. Например, если бы sh использовалось для š, то последовательность sh могла бы означать либо ša, либо saha. Однако диграфы используются для придыхательных и бормочущих согласных (которые пишутся с помощью диграфов h- в латинской транскрипции) в языках Южной Азии, таких как урду , которые пишутся в арабском письме особой формой буквы h , которая используется только для придыхательных диграфов, как можно видеть на примере следующих соединительных (kh) и несоединительных (ḍh) согласных:

армянский

В армянском языке диграф ու ⟨ou⟩ передает звук / u / , пришедший из греческого языка.

грузинский

Грузинский алфавит использует несколько диграфов для записи других языков. Например, в сванском языке / ø/ пишется как ჳე ⟨we⟩ , а /y/ как ჳი ⟨wi⟩ .

греческий

В современном греческом языке имеются следующие диграфы:

По -гречески они называются «дифтонгами» ; в классические времена большинство из них представляли собой дифтонги , и это название закрепилось.

В древнегреческом языке также были «дифтонги», перечисленные выше, хотя их произношение в древние времена оспаривается. Кроме того, в древнегреческом языке также использовалась буква γ в сочетании с велярной остановкой для получения следующих диграфов:

В языке Цаконян есть несколько дополнительных диграфов:

Кроме того, палатальные согласные обозначаются гласной буквой ι , что, однако, в значительной степени предсказуемо. Когда /n/ и /l/ не палатализируются перед ι , они пишутся νν и λλ .

В бактрийском языке диграфы ββ , δδ и γγ использовались для /b/ , /d/ и /ŋg/ соответственно.

иврит

В еврейском алфавите תס ‎ и תש ‎ иногда можно встретить вместо צ ‎ / ts / . Современный иврит также использует диграфы, образованные с помощью символа ׳ ‎ для неродных звуков: ג׳ ‎ / / , ז׳ ‎ / ʒ / , צ׳ ‎ / / ; и другие диграфы букв, когда они пишутся без гласных: וו ‎ для согласной буквы ו ‎ в середине слова и יי ‎ для /aj/ или /aji/ и т. д., то есть согласной буквы י ‎ в местах, где ее можно было бы не ожидать. В идише существует своя собственная традиция транскрипции, поэтому для некоторых из тех же звуков используются разные диграфы: דז ‎ / dz / , זש ‎ / ʒ / , טש ‎ / / и דזש ‎ (буквально dzš ) для / / , וו ‎ / v / , также доступные как один символ Unicode װ ‎, וי ‎ или как один символ в Unicode ױ ‎ / oj/ , יי ‎ или ײ ‎ / ej/ , и ײַ ‎ / aj/ . Односимвольные диграфы называются « лигатурами » в Unicode. י ‎ может также использоваться после согласного для обозначения палатализации в славянских заимствованиях.

Индийский

Большинство индийских письменностей имеют составные гласные диакритические знаки , которые невозможно предсказать по их отдельным элементам. Это можно проиллюстрировать на примере тайского языка , в котором диакритический знак เ, произносимый отдельно /eː/ , изменяет произношение других гласных:

Кроме того, сочетание รร произносится как /a/ или /an/ , есть некоторые слова, в которых сочетания ทร и ศร обозначают /s/, а буква ห, как префикс к согласному, меняет свой тонический класс на высокий, изменяя тон слога.

инуиты

Слоговое письмо инуктитута добавляет к кри два диграфа:

рк для д
qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q

и

нг для ŋ
ng

Последний образует триграфы и тетраграфы.

Персонажи CJK

китайский

Несколько комбинаций китайских иероглифов (ханьцзы), образованных из двух или более различных символов, называются диграфами.

японский

Две каны можно объединить в слог C V , добавив вторую; соглашение отменяет гласную первой. Это обычно делается для слогов CyV , называемых yōon , как в ひょ (ひ) hyo ⟨hi yo . Они не являются диграфами, поскольку сохраняют нормальное последовательное чтение двух глифов. Однако некоторые устаревшие последовательности больше не сохраняют это чтение, как в くゎkwa,ぐゎgwa и むゎmwa, которые теперь произносятся как ka, ga, ma . Кроме того, несеквенируемые орграфы используются для иностранных займов, которые не соответствуют обычным японским образцам ассибиляции , например ティti , トゥtu , チェtye/che , スェswe , ウィwi , ツォtso , ズィzi . (Полные таблицы см. в катакане и транскрипции на японский язык .)

Долгие гласные записываются добавлением каны для этой гласной, по сути удваивая ее. Однако долгая ō может быть написана как oo или ou , как в とうきょうtoukyou [toːkʲoː] 'Tōkyō'. Для диалектов, которые не различают ē и ei , последнее написание используется для долгой e , как в へいせいheisei [heːseː] ' Heisei '. В заимствованных словах chōonpu , строка, следующая направлению текста, как в ビールbīru [biːru] bīru 'пиво'. За исключением слогов, начинающихся с n , удвоенные согласные звуки записываются с помощью префикса уменьшенной версии tsu (пишется っ и ッ в хирагане и катакане соответственно), как в きってkitte 'штамп'. Согласные, начинающиеся с n , вместо этого используют в качестве префикса символ каны n (пишется ん или ン).

Существует несколько соглашений окинавской каны , которые включают подстрочные диграфы или лигатуры. Например, в системе Университета Рюкю ウ — это /ʔu/ , ヲ — это /o/ , но ヲゥ (ヲ) — это /u/ .

корейский

Как и в греческом, в корейском языке есть гласные, произошедшие от дифтонгов, которые до сих пор пишутся двумя буквами. Эти диграфы, ㅐ /ɛ/ и ㅔ /e/ (также ㅒ /jɛ/ , ㅖ /je/ ), а в некоторых диалектах ㅚ /ø/ и ㅟ /y/ , все заканчиваются на историческое ㅣ /i/ .

Хангул был разработан с серией диграфов для представления « мутных » согласных: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; также ᅇ, с неопределенным значением. Эти значения сейчас устарели, но большинство удвоенных букв были воскрешены в 19 веке для записи согласных, которых не существовало, когда был изобретен хангыль: ㅃ /p͈/ , ㄸ /t͈/ , ㅉ /t͈ɕ/ , ㄲ /k͈/ , ㅆ /s͈/ .

Лигатуры и новые буквы

Диграфы иногда пишутся как одна лигатура. Со временем лигатуры могут эволюционировать в новые буквы или буквы с диакритическими знаками. Например, sz превратилась в ß в немецком языке, а "nn" превратилась в ñ в испанском языке.

В Юникоде

Обычно диграф просто представляется с помощью двух символов в Unicode . [2] Однако по разным причинам Unicode иногда предоставляет отдельную кодовую точку для диграфа, закодированную как один символ.

Диграфы DZ и IJ , а также сербско-хорватские диграфы DŽ, LJ и NJ имеют отдельные кодовые точки в Unicode.

См. также Лигатуры в Unicode .

Смотрите также

Ссылки

  1. ^ Брукс (2015) Словарь британской английской орфографической системы, стр. 460 и далее.
  2. ^ "FAQ – Лигатуры, диграфы и формы представления". Консорциум Unicode: Домашняя страница . Unicode Inc . 1991–2009 . Получено 2009-05-11 .
  3. ^ "Стандарт Unicode, версия 15.1" (PDF) . Unicode . Получено 20.12.2023 .