stringtranslate.com

Диграф (орфография)

В валлийском языке диграф ⟨ll⟩ на время слился в лигатуру .

Диграф или диграмма (от древнегреческого : δίς dis , «двойной» и γράφω gráphō , « писать») — это пара символов , используемых в орфографии языка для написания либо одной фонемы (отдельного звука), либо последовательность фонем, которая не соответствует нормальным значениям двух объединенных символов.

Некоторые диграфы представляют фонемы, которые не могут быть представлены одним символом в системе письма языка, например ⟨ sh ⟩ в английском языке Ship и Fish . Другие диграфы представляют фонемы, которые также могут быть представлены отдельными символами. Диграф, произношение которого совпадает с одним символом, может быть пережитком более раннего периода языка, когда диграф имел другое произношение, или может представлять собой различие, которое проводится только в определенных диалектах , например английском ⟨ wh ⟩ . Некоторые такие орграфы используются чисто по этимологическим причинам, например ⟨ rh ⟩ в английском языке.

В некоторых орфографиях орграфы (а иногда и триграфы ) считаются отдельными буквами , а это означает, что они имеют собственное место в алфавите и не могут быть разделены на составляющие их места графемы при сортировке , сокращении или расстановке переносов слов. Диграфы используются в некоторых схемах латинизации , например, ⟨ zh ⟩ как латинизация русского ⟨ ж ⟩ .

Заглавные буквы орграфов могут различаться, например, ⟨ch⟩ на английском языке пишется с заглавной буквы ⟨Ch⟩ , тогда как ⟨ ij ⟩ на голландском языке пишется с заглавной буквы ⟨IJ⟩ , а начальная буква слова ⟨dt⟩ на ирландском языке пишется с заглавной буквы ⟨dT⟩ .

Диграфы могут превращаться в лигатуры , но это отдельная концепция: лигатура предполагает графическое слияние двух символов в один, например, когда ⟨o⟩ и ⟨e⟩ становятся ⟨œ⟩ , например, как во французском cœur «сердце».

Двойные буквы

Орграфы могут состоять из двух разных символов (неоднородные орграфы) или двух экземпляров одного и того же символа (однородные орграфы). В последнем случае их обычно называют двойными (или сдвоенными ) буквами .

Двойные гласные буквы обычно используются для обозначения долгого гласного звука. Так обстоит дело, например, в финском и эстонском языках , где ⟨uu⟩ представляет собой более длинную версию гласной, обозначаемой ⟨u⟩ , ⟨ää⟩ представляет собой более длинную версию гласной, обозначаемой ⟨ä⟩ , и так далее. В среднеанглийском языке последовательности ⟨ee⟩ и ⟨oo⟩ использовались аналогичным образом для обозначения удлиненных звуков «e» и «o» соответственно; оба написания были сохранены в современной английской орфографии , но Большой сдвиг гласных и другие исторические звуковые изменения означают, что современное произношение сильно отличается от оригинального.

Двойные согласные буквы также могут использоваться для обозначения долгого или удвоенного согласного звука. В итальянском языке , например, согласные, написанные двойно, произносятся дольше, чем одиночные. Это было первоначальное использование удвоенных согласных букв в древнеанглийском языке , но в период среднеанглийского и раннего современного английского длина фонематических согласных была потеряна, и было разработано соглашение о написании, в котором удвоенная согласная служит для обозначения того, что должна произноситься предыдущая гласная. короткий. Например, в современном английском языке звук ⟨pp⟩ при постукивании отличает первый гласный звук от звука при постукивании . В редких случаях удвоенные согласные буквы представляют собой настоящую близнецовую согласную в современном английском языке; это может произойти, когда два экземпляра одной и той же согласной происходят от разных морфем , например ⟨nn⟩ в неестественном ( un + natural ).

В некоторых случаях звук, представленный двойной согласной буквой, отличается не по длине, а по-иному, чем звук соответствующей одинарной согласной буквы:

В нескольких европейских системах письма, включая английскую, удвоение буквы ⟨c⟩ или ⟨k⟩ представлено как гетерогенный орграф ⟨ck⟩ вместо ⟨cc⟩ или ⟨kk⟩ соответственно. В родных немецких словах удвоение ⟨z⟩ , соответствующее /ts/ , заменяется орграфом ⟨tz⟩ .

Пандиалектические орграфы

Некоторые языки имеют единую орфографию с диграфами, которые представляют собой разные произношения на разных диалектах ( диафонемы ). Например, в бретонском языке есть орграф ⟨zh⟩ , который обозначает [z] в большинстве диалектов, но [h] в Ваннетаисе. Точно так же в диалекте французского языка Сентонге есть орграф ⟨jh⟩ , который представляет [h] в словах, которые соответствуют [ʒ] в стандартном французском языке. Точно так же в каталанском языке есть диграф ⟨ix⟩ , который представляет [ʃ] в восточно-каталанском языке , но [jʃ] или [js] в западно-каталонскомваленсийском языке .

Разделить орграфы

Пара букв, составляющих фонему, не всегда находится рядом. Так обстоит дело с английским молчаливым e . Например, последовательность a_e в английском торте имеет звук /eɪ/ . Это результат трех исторических звуковых изменений: торт изначально назывался /kakə/ , открытый слог /ka/ стал произноситься с долгой гласной , а позже конечная шва исчезла, оставив /kaːk/ . Еще позже гласная /aː/ стала /eɪ/ . В английском языке шесть таких орграфов: ⟨a_e, e_e, i_e, o_e, u_e, y_e⟩ . [1]

Однако алфавиты также могут быть разработаны с прерывистыми орграфами. В татарской кириллице , например, буква ю используется для написания как /ju/ , так и /jy/ . Обычно разница очевидна по остальной части слова, но когда это не так, для /jy/ используется последовательность ю...ь , как в юнь /jyn/ «дешево».

Индийские алфавиты отличаются прерывистыми гласными, например, тайский เ...อ/ɤː/ в เกอ/kɤː/ . Однако технически их можно считать диакритическими знаками , а не полными буквами; Таким образом, вопрос о том, являются ли они орграфами, является вопросом определения.

Неоднозначные последовательности букв

Некоторые пары букв не следует интерпретировать как орграфы, а появляются из- за соединения : hogshead исотрудничество . Они часто никак не помечаются, поэтому их следует запомнить как исключения. Некоторые авторы, однако, указывают на это либо разбивая диграф дефисом , как в hogs-head , сотрудничать , либо знаком тремы , как в сотрудничать , но использование диаэрезиса в английском языке за последнее время сократилось. век. Когда оно встречается в таких именах, как Клэпхэм , Тауншенд и Хартсхорн, оно никогда не отмечается каким-либо образом. Позиционные альтернативные глифы могут помочь устранить неоднозначность в определенных случаях: когда округлый, ⟨s⟩ использовался как окончательный вариант длинного ⟨ſ⟩ , а английский диграф, напоминающий /ʃ/, всегда будет ⟨ſh⟩ .

При латинизации японского языка составляющие звуки ( мораэ ) обычно обозначаются диграфами, но некоторые обозначаются одной буквой, а некоторые — триграфом. Случаем двусмысленности является слоговое письмоん, которое пишется как n (или иногда m ), за исключением гласных или y , где за ним следует апостроф как n' . Например, имя じゅんいちろう латинизируется как Дзюнъитиро, так что оно анализируется как «Дзюн-и-чи-ру», а не как «Дзю-ни-чи-ру». Аналогичное использование апострофа наблюдается в пиньинь , где 嫦娥 пишется Чанъэ , ​​потому что g принадлежит последнему (-анг) первому слогу, а не началу второго слога. Без апострофа «Изменение» можно было бы понимать как слог чан (конечный -ан), за которым следует слог ге (начальный г-).

В некоторых славянских языках , например, в чешском , двойные буквы могут встречаться в составных словах, но они не считаются орграфами. Примеры: bezzubý 'беззубый', cenny 'ценный', černooký 'черноглазый'.

В алфавитном порядке

В некоторых языках определенные орграфы и триграфы сами по себе считаются отдельными буквами и присваиваются определенному месту в алфавите , отдельному от места последовательности символов, из которых они состоят, в целях орфографии и сопоставления . Например:

В большинстве других языков, включая английский, французский, немецкий, польский и т. д., орграфы рассматриваются как комбинации отдельных букв для целей алфавитизации.

Примеры

Латиница

Английский

В английском языке есть как однородные орграфы (двойные буквы), так и гетерогенные орграфы (орграфы, состоящие из двух разных букв). К последнему типу относятся следующие:

Диграфы также могут состоять из гласных. Некоторые буквы ⟨a, e, o⟩ предпочтительны для первой позиции, другие — для второй ⟨i, u⟩ . Последние имеют аллографы ⟨y, w⟩ в английской орфографии .

Другие языки, использующие латинский алфавит

На сербско-хорватском языке :

Обратите внимание, что в кириллической орфографии эти звуки представлены одиночными буквами (љ, њ, џ).

На чешском и словацком языках :

На датском и норвежском :

В норвежском языке некоторые звуки могут быть представлены только орграфом или сочетанием букв. Это наиболее распространенные комбинации, но существуют крайние региональные различия, особенно в восточных диалектах . Примечательным отличием является стремление rs в восточных диалектах, где оно соответствует skj и sj . Среди многих молодых людей, особенно в западных регионах Норвегии, а также в крупных городах или вокруг них, разница между ç и ʃ полностью стерта, и теперь они произносятся одинаково.

На каталанском :

На голландском :

На французском :

См. также французскую фонологию .

На немецком :

На венгерском :

По- итальянски :

В мэнском гэльском языке ⟨ch⟩ представляет / χ/ , а ⟨çh⟩ представляет /tʃ/ .

На польском :

На португальском :

На испанском :

На валлийском :

Перечисленные выше орграфы представляют собой отдельные фонемы и для целей сопоставления рассматриваются как отдельные буквы. С другой стороны, диграфы ⟨ mh ⟩ , ⟨ nh ⟩ и триграф ⟨ ngh ⟩ , которые обозначают глухие согласные , но встречаются только в начале слов в результате носовой мутации , не рассматриваются как отдельные буквы, и поэтому не включены в алфавит.

Daighi tongiong pingim , система транскрипции, используемая для тайваньского хоккиена , включает или представляет /ə/ ( средняя центральная гласная ) или /o/ ( закругленная гласная ближней середины спины ), а также другие диграфы.

В Йорубе :

Кириллица

В современных славянских языках, написанных кириллицей , мало используются орграфы, за исключением ⟨дж⟩ для / dʐ/ , ⟨дз⟩ для / dz/ (на украинском, белорусском и болгарском языках), а также ⟨жж⟩ и ⟨зж⟩ для необычная русская фонема /ʑː/ . В русском языке последовательности ⟨дж⟩ и ⟨дз⟩ встречаются (в основном в заимствованных словах), но произносятся как комбинации имплозивного звука (иногда рассматриваемого как аффриката) и фрикативного звука; имплозивные элементы рассматриваются как аллофоны взрывного звука /d̪/, и поэтому эти последовательности не считаются орграфами. В кириллице мало диграфов, если только она не используется для написания неславянских языков, особенно кавказских .

арабская письменность

Поскольку гласные обычно не пишутся, диграфы в абджадах , таких как арабский, встречаются редко. Например, если вместо š используется sh , то последовательность sh может означать либо ša , либо саха. Однако диграфы используются для придыхательных и бормочущих согласных (те, которые пишутся с диграфами h в латинской транскрипции) в языках Южной Азии, таких как урду , которые написаны арабским письмом с помощью особой формы буквы h , которая используется только для диграфов стремления, как это можно увидеть на следующих соединительных (kh) и несоединительных (ḍh) согласных:

Армянский

В армянском языке диграф ու ⟨ou⟩ транскрибирует / u / , условность, пришедшую из греческого языка.

грузинский

Грузинский алфавит использует несколько орграфов для написания других языков. Например, на сванском / ø/ пишется ჳე ⟨we⟩ , а /y/ как ჳი ⟨wi⟩ .

Греческий

В современном греческом языке есть следующие орграфы:

По- гречески они называются «дифтонги» ; в классические времена большинство из них представляли собой дифтонги , и это название прижилось.

В древнегреческом языке также были перечислены выше «дифтонги», хотя их произношение в древние времена оспаривается. Кроме того, в древнегреческом языке также использовалась буква γ в сочетании с велярной остановкой для создания следующих орграфов:

У Цаконяна есть несколько дополнительных диграфов:

Кроме того, небные согласные обозначаются гласной буквой ι , что, впрочем, во многом предсказуемо. Когда /n/ и /l/ не палатализованы перед ι , они записываются νν и λλ .

В бактрийском языке орграфы ββ , δδ и γγ использовались для /b/ , /d/ и /ŋg/ соответственно.

иврит

В еврейском алфавите תס ‎ и תש ‎ иногда можно встретить вместо צ ‎/ ts / . В современном иврите также используются диграфы, состоящие из символа ׳ ‎ для неродных звуков: ג׳ ‎ / / , ז׳ ‎ / ʒ / , צ׳ ‎ / / ; и другие диграфы букв, когда оно пишется без гласных: וו ‎ для согласной буквы ו ‎ в середине слова и יי ‎ для /aj/ или /aji/ и т. д., то есть согласной буквы י там, где этого можно было не ожидать. Идиш имеет свою собственную традицию транскрипции, поэтому для некоторых одних и тех же звуков используются разные орграфы: דז ‎ / dz / , זש ‎ / ʒ / , טש ‎ / / и דזש ‎ (буквально dzš ) для / / , וו. ‎ / v / , также доступен как одиночный символ Юникода װ ‎, וי ‎ или как одиночный символ Юникода ױ ‎ / oj/ , יי ‎ или ײ ‎ / ej/ и ײַ ‎ / aj/ . Односимвольные орграфы называются в Юникоде « лигатурами ». י ‎ также может использоваться после согласной для обозначения палатализации в славянских заимствованных словах.

Индийский

В большинстве индийских письменностей есть диакритические знаки сложных гласных , которые невозможно предсказать на основе их отдельных элементов. Это можно проиллюстрировать на примере тайского языка , где диакритический знак เ, произносимый отдельно /eː/ , изменяет произношение других гласных:

Кроме того, сочетание รร произносится /a/ или /an/ , есть слова, в которых сочетания ทร и ศร обозначают /s/ , а буква ห как приставка к согласной меняет свой тонический класс на высокий, изменяющий тон слога.

Инуиты

Слоговое письмо инуктитут добавляет к кри два орграфа:

рк для q
qai , ᕿ qi , ᖁ qu , ᖃ qa , ᖅ q

и

нг для ŋ
нг

Последний образует триграфы и тетраграфы.

Персонажи CJK

Китайский

Несколько комбинаций китайских иероглифов (ханзи), образованных из двух или более разных иероглифов, называются диграфами.

Японский

Две каны можно объединить в слог CV , добавив второй индекс; соглашение отменяет первую гласную. Обычно это делается для слогов CyV , называемых yōon , например ひょ (ひ) hyo ⟨hi yo . Они не являются диграфами, поскольку сохраняют нормальное последовательное чтение двух символов. Однако некоторые устаревшие последовательности больше не сохраняют это чтение, например, くゎkwa,ぐゎgwa и むゎmwa, которые теперь произносятся как ka, ga, ma . Кроме того, несеквенируемые орграфы используются для иностранных займов, которые не соответствуют обычным японским образцам ассибиляции , например ティti , トゥtu , チェtye/che , スェswe , ウィwi , ツォtso , ズィzi . ( Полные таблицы см. в катакане и транскрипции на японский язык .)

Долгие гласные записываются добавлением каны к этой гласной, что фактически удваивает ее. Однако длинный ō может писаться как oo , так и ou , как в とうきょうtoukyou [toːkʲoː] 'Tōkyō'. В диалектах, которые не различают ē и ei , последнее написание используется для длинного e , как в へいせいheisei [heːseː] ' Heisei '. В заимствованных словах chōonpu — строка, следующая за направлением текста, например ビールbīru [bi:ru] bīru «пиво». За исключением слогов, начинающихся с буквы n , удвоенные согласные звуки записываются с добавлением уменьшенной версии цу (написанной っ и ッ в хирагане и катакане соответственно), как в きってkitte «штамп». Согласные, начинающиеся с n, вместо этого используют символ кана n (написанный ん или ン) в качестве префикса.

Существует несколько условных обозначений окинавской каны , в которых используются подстрочные диграфы или лигатуры. Например, в системе Университета Рюкю ウ — это /ʔu/ , ヲ — /o/ , но ヲゥ (ヲ) — /u/ .

Корейский

Как и в греческом языке, в корейском языке гласные произошли от дифтонгов, которые до сих пор пишутся двумя буквами. Эти диграфы ㅐ /ɛ/ и ㅔ /e/ (также ㅒ /jɛ/ , ㅖ /je/ ), а в некоторых диалектах ㅚ /ø/ и ㅟ /y/ оканчиваются на исторический ㅣ /i/ .

Хангыль был разработан с серией диграфов для обозначения « мутных » согласных: ㅃ *[b] , ㄸ *[d] , ㅉ *[dz] , ㄲ *[ɡ] , ㅆ *[z] , ㆅ *[ɣ] ; также ᅇ, с неопределенным значением. Эти значения сейчас устарели, но большинство удвоенных букв были возрождены в 19 веке для написания согласных, которых не существовало на момент изобретения хангыля: ㅃ /p͈/ , ㄸ /t͈/ , ㅉ /t͈ɕ/ , ㄲ /k͈/ , ㅆ /с͈/ .

Лигатуры и новые буквы

Диграфы иногда пишутся одной лигатурой. Со временем лигатуры могут превратиться в новые буквы или буквы с диакритическими знаками. Например, sz в немецком языке превратилось в ß , а в испанском «nn» превратилось в ñ .

В Юникоде

Обычно в Юникоде орграф просто представляется двумя символами . [2] Однако по разным причинам Unicode иногда предоставляет отдельную кодовую точку для орграфа, закодированную как один символ.

Диграфы DZ и IJ , а также сербско-хорватские диграфы DŽ, LJ и NJ имеют отдельные кодовые точки в Юникоде.

См. также Лигатуры в Юникоде .

Смотрите также

Рекомендации

  1. ^ Брукс (2015) Словарь орфографической системы британского английского языка, стр. 460 и далее
  2. ^ «Часто задаваемые вопросы - Лигатуры, орграфы и формы представления» . Консорциум Unicode: домашняя страница . Юникод Инк . 1991–2009 гг . Проверено 11 мая 2009 г.
  3. ^ «Стандарт Юникод, версия 15.1» (PDF) . Юникод . Проверено 20 декабря 2023 г.