stringtranslate.com

Диакритический

Латинская буква A с несколькими диакритическими знаками

Диакритический знак ( также диакритический знак , диакритическая точка , диакритический знак или акцент ) — это глиф , добавляемый к букве или к базовому глифу. Термин происходит от древнегреческого διακριτικός ( diakritikós , «различающий»), от διακρίνω ( diakrínō , «различать»). Слово диакритический является существительным , хотя иногда оно используется в атрибутивном смысле, тогда как диакритический — это только прилагательное . Некоторые диакритические знаки, такие как острый ⟨ó⟩ , тупой ⟨ò⟩ и циркумфлекс ⟨ô⟩ (все показаны над «o»), часто называются акцентами . Диакритические знаки могут располагаться над или под буквой или в каком-либо другом месте, например внутри буквы или между двумя буквами.

Основное применение диакритических знаков в латинском письме — изменение звуковых значений букв, к которым они добавляются. Исторически английский язык использовал диакритический знак диэрезис для указания правильного произношения неоднозначных слов, таких как "coöperate", без которого последовательность букв <oo> могла бы быть неверно истолкована как произносимая /ˈkuːpəreɪt/ . Другими примерами являются острые и тупые ударения, которые могут указывать на то, что гласная должна произноситься иначе, чем обычно в этой позиции, например, не сокращаться до /ə/ или непроизносимой, как в случае двух использований буквы e в существительном résumé (в отличие от глагола resume ), а также помощь, иногда оказываемая в произношении некоторых слов, таких как doggèd , learnèd , blessèd , и особенно слов, произносящихся иначе, чем обычно в поэзии (например, movèd , breathèd ).

Большинство других слов с диакритическими знаками в английском языке являются заимствованиями из таких языков, как французский , для лучшего сохранения правописания, например, диэрезис в словах naïve и Noël , акут в café , циркумфлекс в слове crêpe и седиль в façade . Однако все эти диакритические знаки часто опускаются на письме, и английский является единственным крупным современным европейским языком , в котором диакритические знаки не используются в общем употреблении. [a]

В латинских алфавитах других языков диакритические знаки могут различать омонимы , например, французское («there») и la («the»), которые оба произносятся как /la/ . В гэльском шрифте точка над согласной указывает на смягчение рассматриваемой согласной. В других системах письма диакритические знаки могут выполнять другие функции. Системы указания гласных , а именно арабская система harakat и еврейская система niqqud , указывают на гласные, которые не передаются основным алфавитом. Индийская система virama (   и т. д.) и арабская система sukūn (  ـْـ  ) обозначают отсутствие гласных. Знаки кантилляции указывают на просодию . Другие применения включают в себя раннюю кириллическую черту титло (  ◌҃  ) и еврейский гершаим (  ״  ), которые, соответственно, отмечают аббревиатуры или акронимы , и греческие диакритические знаки, которые показывали, что буквы алфавита использовались в качестве цифр . Во вьетнамском языке и официальной системе романизации Ханьюй Пиньинь для мандаринского языка в Китае диакритические знаки используются для обозначения тонов слогов, в которых встречаются отмеченные гласные.

В орфографии и сопоставлении буква, измененная диакритическим знаком, может рассматриваться либо как новая, отдельная буква, либо как комбинация буквы и диакритического знака. Это варьируется от языка к языку и может варьироваться от случая к случаю в пределах одного языка.

В некоторых случаях буквы используются как «диакритические знаки в строке» с той же функцией, что и вспомогательные глифы, то есть они изменяют звучание предшествующей им буквы, как в случае с «h» в английском произношении «sh» и «th». [2] Такие сочетания букв иногда даже объединяются в одну отдельную букву. Например, написание sch традиционно часто рассматривалось как отдельная буква в немецком языке. Слова с таким написанием были перечислены после всех других слов, написанных с s, в карточных каталогах в Венских публичных библиотеках, например (до оцифровки).

Типы

К типам диакритических знаков, используемых в алфавитах на основе латинской графики, относятся:

Тильда, точка, запятая, титло , апостроф, черта и двоеточие иногда являются диакритическими знаками, но имеют и другие применения.

Не все диакритические знаки встречаются рядом с буквой, которую они изменяют. Например, в языке вали в Гане апостроф указывает на изменение качества гласной, но стоит в начале слова, как в диалектах 'Bulengee и 'Dolimi . Из-за гармонии гласных все гласные в слове изменяются, поэтому областью действия диакритического знака является все слово. В письмах абугида , таких как те, которые используются для записи хинди и тайского , диакритические знаки обозначают гласные и могут встречаться над, под, перед, после или вокруг согласной буквы, которую они изменяют.

Точка ( титул ) на букве ⟨i⟩ или букве ⟨j⟩ латинского алфавита возникла как диакритический знак, чтобы четко отличать ⟨i⟩ от минимов (нисходящих штрихов) соседних букв. Впервые она появилась в 11 веке в последовательности ii (как в ingeníí ), затем распространилась на i рядом с m, n, u , и, наконец, на все строчные i s. ⟨j⟩ , изначально являвшаяся вариантом i , унаследовала титул. Форма диакритического знака развивалась от первоначального напоминавшего современный острый акцент до длинного росчерка к 15 веку. С появлением римского шрифта она была уменьшена до круглой точки, которую мы имеем сегодня. [3]

Несколько языков Восточной Европы используют диакритические знаки как на согласных, так и на гласных, тогда как в Западной Европе диграфы чаще используются для изменения согласных звуков. Большинство языков в Европе используют диакритические знаки на гласных, за исключением английского, где их обычно нет (за некоторыми исключениями ).

Диакритические знаки, характерные для нелатинских алфавитов

арабский

греческий

Эти диакритические знаки используются в дополнение к акутовому, гравису, циркумфлексному ударению и диерезису:

иврит

Бытие 1:9 "И сказал Бог: да соберется вода".
Буквы черным цветом, никкуд красным , кантилляция синим цветом

( Знаки кантилляции обычно отображаются неправильно; см. Кантилляция на иврите#Названия и формы таамим для получения полной таблицы вместе с инструкциями о том, как максимально увеличить возможность их просмотра в веб-браузере.)

корейский

Хангыль , корейский алфавит

Диакритические знаки и  , известные как Bangjeom ( 방점; 傍點), использовались для обозначения тональных акцентов в хангыле для среднекорейского языка . Они писались слева от слога в вертикальном письме и над слогом в горизонтальном письме.

Санскрит и индийские

В письменности деванагари (брахмической семьи) сложные буквы, которые являются гласными в сочетании с согласными, имеют диакритические знаки. Здесь (k) показан с гласными диакритическими знаками. То есть: ा, ि, े, ु, ौ ़, ः и т. д.

сирийский

В дополнение к вышеуказанным гласным знакам, транслитерация сирийского языка иногда включает ə , или надстрочный e (или часто вообще ничего) для представления оригинального арамейского шва , который был утерян позднее в какой-то момент развития сирийского языка. [4] Некоторые схемы транслитерации считают его включение необходимым для отображения спирантизации или по историческим причинам. [5] [6]

Неалфавитные письменности

В некоторых неалфавитных системах письма также используются символы, которые по сути выполняют функцию диакритических знаков.

Алфавитный порядок или сортировка

В разных языках используются разные правила для размещения диакритических знаков в алфавитном порядке. Например, французский и португальский языки рассматривают буквы с диакритическими знаками так же, как и базовую букву для целей упорядочивания и словарей. Скандинавские языки и финский язык , напротив, рассматривают символы с диакритическими знаками ⟨å⟩ , ⟨ä⟩ и ⟨ö⟩ как отдельные буквы алфавита и сортируют их после ⟨z⟩ . Обычно ⟨ä⟩ (a-умлаут) и ⟨ö⟩ (o-умлаут) [используемые в шведском и финском языках] сортируются как эквивалентные ⟨æ⟩ (ash) и ⟨ø⟩ (o-слэш) [используемые в датском и норвежском языках]. Кроме того, aa , когда используется в качестве альтернативного написания для ⟨å⟩ , сортируется как таковой. Другие буквы, измененные диакритическими знаками, рассматриваются как варианты базовой буквы, за исключением ⟨ü⟩ , которая часто сортируется как ⟨y⟩ .

Языки, которые рассматривают ударные буквы как варианты базовой буквы, обычно располагают в алфавитном порядке слова с такими символами сразу после похожих неотмеченных слов. Например, в немецком языке, где два слова отличаются только умлаутом, слово без него сортируется первым в немецких словарях (например, schon , а затем schön или fallen , а затем fällen ). Однако, когда речь идет об именах (например, в телефонных книгах или в каталогах авторов в библиотеках), умлауты часто рассматриваются как комбинации гласной с суффиксом ⟨e⟩ ; австрийские телефонные книги теперь рассматривают символы с умлаутами как отдельные буквы (сразу следующие за базовой гласной).

В испанском языке графема ⟨ñ⟩ считается отдельной буквой, отличной от ⟨n⟩ и сопоставляемой между ⟨n⟩ и ⟨o⟩ , поскольку она обозначает звук, отличный от звука простой ⟨n⟩ . Но ударные гласные ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ не отделены от безударных гласных ⟨a⟩ , ⟨e⟩ , ⟨i⟩ , ⟨o⟩ , ⟨u⟩ , поскольку острое ударение в испанском языке изменяет только ударение в слове или обозначает различие между омонимами , но не изменяет звучание буквы.

Полный список порядков сортировки на разных языках см. в разделе Последовательность сортировки .

Поколение с компьютерами

Немецкая клавиатура с умлаутами

Современные компьютерные технологии были разработаны в основном в странах, говорящих на западноевропейских языках (в частности, на английском), и многие ранние двоичные кодировки были разработаны с уклоном в пользу английского языка — языка, написанного без диакритических знаков. С учетом того, что компьютерная память и хранение данных были в приоритете, ранние наборы символов были ограничены латинским алфавитом, десятью цифрами и несколькими знаками препинания и обычными символами. Американский стандартный код для обмена информацией ( ASCII ), впервые опубликованный в 1963 году, кодировал всего 95 печатных символов. Он включал всего четыре отдельно стоящих диакритических знака — акут, гравис, циркумфлекс и тильда, — которые должны были использоваться путем отступа и надпечатки базовой буквы. Стандарт ISO/IEC 646 (1967) определил национальные вариации, которые заменяют некоторые американские графемы предварительно составленными символами (такими как ⟨é⟩ , ⟨è⟩ и ⟨ë⟩ ), в зависимости от языка, — но оставался ограниченным 95 печатными символами.

Unicode был задуман для решения этой проблемы путем назначения каждому известному символу собственного кода; если этот код известен, большинство современных компьютерных систем предоставляют метод для его ввода . По историческим причинам почти всем комбинациям букв с ударением, используемым в европейских языках, были присвоены уникальные кодовые точки , и они называются предсоставленными символами . Для других языков обычно необходимо использовать комбинированный диакритический знак вместе с желаемой базовой буквой. К сожалению, даже по состоянию на 2024 год многие приложения и веб-браузеры по-прежнему не могут правильно использовать концепцию комбинированного диакритического знака.

В зависимости от раскладки клавиатуры и отображения клавиатуры , вводить буквы с диакритическими знаками на компьютерах и пишущих машинках более или менее легко. Клавиатуры, используемые в странах, где буквы с диакритическими знаками являются нормой, имеют клавиши с выгравированными соответствующими символами. В других случаях, например, когда используются международные отображения США или расширенные отображения Великобритании , акцентированная буква создается путем нажатия сначала клавиши с диакритическим знаком, а затем буквы, на которую ее следует поместить. Этот метод известен как метод мертвых клавиш , поскольку он не производит собственного вывода, а изменяет вывод клавиши, нажатой после нее.

Языки с буквами, содержащими диакритические знаки

В следующих языках есть буквы с диакритическими знаками, которые орфографически отличаются от букв без диакритических знаков.

латиница

Балтийский

  • В латышском языке есть следующие буквы: ⟨ ā ⟩ , ⟨ ē ⟩ , ⟨ ī ⟩ , ⟨ ū ⟩ , ⟨ č ⟩ , ⟨ ģ ⟩ , ⟨ ķ ⟩ , ⟨ ļ ⟩ , ⟨ ņ ⟩ , ⟨ š ⟩ , ⟨ ž ⟩
  • Литовский . В общем случае, когда буквы появляются с кароном ( ⟨č⟩ , ⟨š⟩ и ⟨ž⟩ ), они рассматриваются как отдельные буквы от ⟨c⟩ , ⟨s⟩ или ⟨z⟩ и сопоставляются отдельно; буквы с огонёком ( ⟨ ą ⟩ , ⟨ ę ⟩ , ⟨ į ⟩ и ⟨ ų ⟩ ), макроном ( ⟨ ū ⟩ ) и точкой над точкой ( ⟨ ė ⟩ ) также считаются отдельными буквами, но им не дается уникальный порядок сопоставления.

кельтский

  • В валлийском языке используются циркумфлекс, диэрезис, акут и гравис на семи гласных ⟨a⟩ , ⟨e⟩ , ⟨i⟩ , ⟨o⟩ , ⟨u⟩ , ⟨w⟩ , ⟨y⟩ ( отсюда композиты ⟨â⟩ , ⟨ê⟩ , ⟨î⟩ , ⟨ô⟩ , ⟨û⟩ , ⟨ŵ⟩ , ⟨ŷ⟩ , ⟨ä⟩ , ⟨ë⟩ , ⟨ï⟩ , ⟨ö⟩ , ⟨ü⟩ , ⟨ẅ⟩ , ⟨ÿ⟩ , ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ , ⟨ẃ⟩ , ⟨ý⟩ , ⟨à⟩ , ⟨è⟩ , ⟨ì⟩ , ⟨ò⟩ , ⟨ù⟩ , ⟨ẁ⟩ , ⟨ỳ⟩ ). Однако все, за исключением циркумфлекса (который используется как макрон), встречаются довольно редко.
  • После реформ правописания с 1970-х годов, шотландский гэльский использует только гравис, который может использоваться на любой гласной ( ⟨ à ⟩ , ⟨ è ⟩ , ⟨ ì ⟩ , ⟨ ò ⟩ , ⟨ ù ⟩ ). Раньше острые ударения могли использоваться на ⟨á⟩ , ⟨ó⟩ и ⟨é⟩ , которые использовались для указания определенного качества гласной. С устранением этих ударений новая орфография полагается на то, что читатель имеет предварительное знание произношения данного слова.
  • В мэнском языке используется диакритический знак седиля ⟨ ç ⟩ в сочетании с h, чтобы получить диграф ⟨çh⟩ (произносится /tʃ/ ), чтобы обозначить различие между ним и диграфом ⟨ch⟩ (произносится /h/ или /x/ ). Другие диакритические знаки, используемые в мэнском языке, включают циркумфлекс и диэрезис, как в ⟨â⟩ , ⟨ê⟩ , ⟨ï⟩ и т. д., чтобы обозначить различие между двумя похожими по написанию словами, но с немного отличающимся произношением.
  • В ирландском языке для обозначения долгих гласных используются только острые ударения в соответствии с реформой правописания 1948 года. В гэльском шрифте лениция обозначается точкой сверху ( ċ , ⟨ḋ⟩ , ⟨ḟ⟩ , ġ , ⟨ṁ⟩ , ⟨ṗ⟩ , , ⟨ṫ⟩ ); в римском шрифте используется суффикс ⟨h⟩ . Таким образом, ṁáṫair эквивалентен mháthair .
  • В бретонском языке нет единой орфографии (системы правописания), но для ряда целей используются диакритические знаки. Тререза ​​используется для обозначения того, что две гласные произносятся отдельно, а не как дифтонг/диграф. Циркумфлекс используется для обозначения долгих гласных, но обычно только в тех случаях, когда длительность гласного не предсказуема фонологией. Назализация гласных может быть отмечена тильдой или следующей за гласной буквой ⟨ñ⟩ . Суффикс множественного числа -où используется в качестве унифицированного написания для представления суффикса с рядом произношений в разных диалектах и ​​для отличия этого суффикса от диграфа ⟨ou⟩ , который произносится как /u:/ . Апостроф используется для различения ⟨c'h⟩ , произносимого как /x/, поскольку в других кельтских языках используется диграф ⟨ch⟩ , от возникшего под влиянием французского языка диграфа ch, произносимого как /ʃ/ .

финно-угорские

  • В эстонском языке есть отдельная буква ⟨ õ ⟩ , которая содержит тильду. Эстонские гласные с двойными диакритическими знаками ⟨ä⟩ , ⟨ö⟩ , ⟨ü⟩ похожи на немецкие, но это также отдельные буквы, в отличие от немецких умлаутированных букв. Все четыре имеют свое собственное место в алфавите, между ⟨w⟩ и ⟨x⟩ . Кароны в ⟨š⟩ или ⟨ž⟩ появляются только в иностранных именах собственных и заимствованных словах . Это также отдельные буквы, размещенные в алфавите между s и t .
  • В финском языке используются гласные с двумя точками ( ⟨ä⟩ и ⟨ö⟩ ). Как и в шведском и эстонском языках, они рассматриваются как отдельные буквы, а не как комбинации «гласная + диакритический знак» (как в немецком языке). В иностранных именах и заимствованных словах также используются символы ⟨å⟩ , ⟨š⟩ и ⟨ž⟩ . В финском и шведском алфавитах ⟨å⟩ , ⟨ä⟩ и ⟨ö⟩ рассматриваются как отдельные буквы после ⟨z⟩ , остальные — как варианты их базовой буквы.
  • В венгерском языке используются диакритические знаки «двойная точка», «акут» и «двойной акут» (последний уникален для венгерского языка): ( ⟨ö⟩ , ⟨ü⟩ ), ( ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ ) и ( ⟨ő⟩ , ⟨ű⟩ ). Акут указывает на долгую форму гласной (в случае ⟨i⟩ / ⟨í⟩ , ⟨o⟩ / ⟨ó⟩ , ⟨u⟩ / ⟨ú⟩ ), в то время как двойной акут выполняет ту же функцию для ⟨ö⟩ и ⟨ü⟩ . Акут также может указывать на другой звук (более открытый, как в случае ⟨a⟩ / ⟨á⟩ , ⟨e⟩ / ⟨é⟩ ). В венгерском алфавите как долгие, так и краткие формы гласных указаны отдельно , но члены пар ⟨a⟩ / ⟨á⟩ , ⟨e⟩ / ⟨é⟩ , ⟨i⟩ / ⟨í⟩ , ⟨o⟩ / ⟨ó⟩ , ⟨ö⟩ / ő , ⟨u⟩ / ⟨ú⟩ и ⟨ü⟩ / ű сопоставляются в словарях как одна и та же буква.
  • В ливонском языке есть следующие буквы: ⟨ā⟩ , ⟨ä⟩ , ⟨ ٟ ⟩ , ⟨ ḑ ⟩ , ⟨ē⟩ , ⟨ī⟩ , ⟨ļ⟩ , ⟨ņ⟩ , ⟨ō⟩ , ⟨ ş ⟩ , ⟨ ⟩ , ⟨ õ ⟩ , ⟨ ş ⟩ , ⟨ŗ⟩ , ⟨š⟩ , ⟨ş⟩ , ⟨ū⟩ , ⟨ž⟩ .

германский

  • В немецком языке используется диакритический знак с двумя точками (умляут ) : буквы ⟨ ä , ö , ü , которые используются для обозначения выдвижения вперед гласных заднего ряда (см. умляут (лингвистика) ).
  • В голландском языке используются диакритические знаки «акут», «циркумфлекс», «гравит» и «две точки» с большинством гласных, а также седиль с «c», как во французском языке. В результате получается ⟨ á ⟩ , ⟨ à ⟩ , ⟨ ä ⟩ , ⟨ é ⟩ , ⟨ è ⟩ , ⟨ ê ⟩ , ⟨ ë ⟩ , ⟨ í ⟩ , ⟨ î ⟩ , ⟨ ï ⟩ , ⟨ ó ⟩ , ⟨ ô ⟩ , ⟨ ö ⟩ , ⟨ ú ⟩ , ⟨ û ⟩ , ⟨ ü ⟩ и ⟨ ç ⟩ . Это в основном касается слов (и имен), происходящих из французского языка (например, crème, café, gêne, façade ). Акут также используется для подчеркивания гласной (например, één ). Диакритический знак из двух точек используется как языковая диэрезис ( перерыв между гласными ), который разделяет две гласные, например, reële, reünie, coördinatie ), а не для обозначения языкового умлаута , как в немецком языке.
  • В африкаансе используются 16 дополнительных форм гласных, как прописных, так и строчных: ⟨ á ⟩ , ⟨ ä ⟩ , ⟨ é ⟩ , ⟨ è ⟩ , ⟨ ê ⟩ , ⟨ ë ⟩ , ⟨ í ⟩ , ⟨ î ⟩ , ⟨ ï ⟩ , ⟨ ó ⟩ , ⟨ ô ⟩ , ⟨ ö ⟩ , ⟨ ú ⟩ , ⟨ û ⟩ , ⟨ ü ⟩ , ⟨ ý ⟩ .
  • Фарерский язык использует острые и некоторые дополнительные буквы. Все они считаются отдельными буквами и имеют свое место в алфавите: ⟨ á ⟩ , ⟨ í ⟩ , ⟨ ó ⟩ , ⟨ ú ⟩ , ⟨ ý ⟩ и ⟨ ø ⟩ .
  • В исландском языке используются акуты и другие дополнительные буквы. Все они считаются отдельными буквами и имеют свое место в алфавите: {{angbrZ á }}, ⟨ é ⟩ , ⟨ í ⟩ , ⟨ ó ⟩ , ⟨ ú ⟩ , ⟨ ý ⟩ и ⟨ ö ⟩ .
  • В датском и норвежском языках используются дополнительные символы, такие как косая черта o ⟨ ø ⟩ и кольцо a ⟨ å ⟩ . Эти буквы идут после ⟨z⟩ и ⟨ æ ⟩ в порядке ⟨ø⟩ , ⟨å⟩ . Исторически ⟨å⟩ развилась из лигатуры путем написания небольшого надстрочного индекса ⟨a⟩ над строчной ⟨a⟩ ; если символ ⟨å⟩ недоступен, некоторые скандинавские языки допускают замену удвоенным a , таким образом ⟨aa⟩ . Скандинавские языки сопоставляют эти буквы после ⟨z⟩ , но имеют разные национальные стандарты сопоставления .
  • В шведском языке используются а-диаэрезис ( ⟨ ä ⟩ ) и о-диаэрезис ( ⟨ ö ⟩ ) вместо ash ( ⟨æ⟩ ) и косая o ( ⟨ ø ⟩ ) в дополнение к а-надкольцу ( ⟨å⟩ ). Исторически диакритические знаки из двух точек для шведских букв ⟨ä⟩ и ⟨ö⟩ произошли от маленькой готической ⟨e⟩, написанной над буквами. Эти буквы располагаются после ⟨z⟩ в порядке ⟨å⟩ , ⟨ä⟩ , ⟨ö⟩ .

Романтика

  • Корсиканец использует в своем алфавите следующие символы : ⟨À⟩ / ⟨à⟩ , ⟨È⟩ / ⟨è⟩ , ⟨Ì⟩ / ⟨ì⟩ , ⟨Ò⟩ / ⟨ò⟩ , ⟨Ù⟩ / ⟨ù⟩ .
  • Во французском языке используются четыре диакритических знака, которые появляются над гласными (циркумфлекс, акут, гравис, диэрезис) и седиль, появляющийся в ⟨ç⟩ .
  • В итальянском языке используются два диакритических знака, которые появляются над гласными (акут, гравис).
  • Леонский : можно использовать ⟨ñ⟩ или ⟨ nn ⟩ .
  • В португальском языке тильда используется с гласными ⟨a⟩ и ⟨o⟩, а седиль — с c.
  • Румынский язык использует бреве над буквой a ( ⟨ ă ⟩ ) для обозначения звука шва /ə/ , а также циркумфлекс над буквами a ( ⟨ â ⟩ ) и i ( ⟨ î ⟩ ) для обозначения звука /ɨ/ . Румынский язык также пишет запятую под буквами s ( ⟨ ș ⟩ ) и t ( ⟨ ț ⟩ ) для обозначения звуков /ʃ/ и /t͡s/ , соответственно. Эти символы сопоставляются после их недиакритического эквивалента.
  • В испанском языке используются острые ударения ( ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ ) для обозначения ударения, падающего на другой слог, а не на тот, на который оно падает по правилам по умолчанию, а также для различения некоторых односложных омонимов (например, el (определенный артикль мужского рода единственного числа) и él [he]). Диаерезис используется только на u, чтобы отличить сочетания gue, gui /ge/, /gi/ от güe, güi /gwe/, /gwi/ , например , vergüenza, lingüística . Тильда над ⟨ñ⟩ не считается диакритическим знаком, поскольку ⟨ñ⟩ считается отдельной буквой от ⟨n⟩ , а не ее видоизмененной формой.

славянский

  • Латинский алфавит Гайя , используемый в хорватском и латинизированном сербском языках , имеет символы ⟨ č ⟩ , ⟨ ć ⟩ , ⟨ đ ⟩ , ⟨ š ⟩ и ⟨ ž ⟩ , которые считаются отдельными буквами и указаны как таковые в словарях и других контекстах, в которых слова перечислены в соответствии с алфавитным порядком. Он также имеет один диграф , включающий диакритический знак, , который также расположен в алфавитном порядке независимо и следует за ⟨ d ⟩ и предшествует ⟨ đ ⟩ в алфавитном порядке.
  • В чешском алфавите используются акут (á é í ó ú ý), карон ( č ď ě ň ř š ť ž ), а для одной буквы ( ů ) — кольцо. (В ď и ť карон изменен так, чтобы выглядеть скорее как апостроф.) Буквы с кароном считаются отдельными буквами, тогда как гласные рассматриваются только как более длинные варианты безударных букв. Акут не влияет на алфавитный порядок, буквы с кароном располагаются после исходных аналогов.
  • В польском языке есть следующие буквы: ą ć ę ł ń ó ś ź ż . Они считаются отдельными буквами: каждая из них размещается в алфавите сразу после своего латинского аналога (например, ⟨ą⟩ между ⟨a⟩ и ⟨b⟩ ), ⟨ź⟩ и ⟨ż⟩ размещаются после ⟨z⟩ в указанном порядке.
  • В сербском кириллическом алфавите нет диакритических знаков, вместо этого для каждой буквы латинского аналога (включая латинские буквы с диакритическими знаками и диграфы dž, lj и nj ) имеется графема ( глиф ) .
  • В словацком алфавите используются акут (á é í ó ú ý ĺ ŕ ), карон (č ď ľ ň š ť ž dž), умлаут (ä) и циркумфлекс (ô). Все они считаются отдельными буквами и располагаются сразу после исходного аналога в алфавите . [8]
  • В базовом словенском алфавите есть символы ⟨ č ⟩ , ⟨ š ⟩ и ⟨ ž ⟩ , которые считаются отдельными буквами и указаны как таковые в словарях и других контекстах, в которых слова перечислены в алфавитном порядке. Буквы с кароном располагаются сразу после букв, написанных без диакритического знака. Буква ⟨đ⟩ ('d с чертой') может использоваться в нетранслитерируемых иностранных словах, в частности, в именах, и располагается после ⟨č⟩ и перед ⟨d⟩ .

тюркский

  • Азербайджанский язык включает отдельные буквы турецкого алфавита Ç , Ğ , I , İ , Ö , Ş и Ü .
  • Крымскотатарский язык включает в себя отличительные буквы турецкого алфавита Ç , Ğ , I , İ , Ö , Ş и Ü . В отличие от турецкого, в крымскотатарском языке также есть буква Ñ .
  • Гагаузский язык включает в себя отдельные буквы турецкого алфавита Ç , Ğ , I , İ , Ö и Ü . В отличие от турецкого, в гагаузском языке также есть буквы Ä , Ê , Ș и Ț . Ș и Ț произошли от румынского алфавита для тех же звуков. Иногда вместо Ș может использоваться турецкая Ş .
  • В турецком языке используется буква ⟨G⟩ с бреве ( ⟨ Ğ ⟩ ), две буквы с двумя точками ( ⟨ Ö ⟩ и ⟨ Ü ⟩ , представляющие две огубленные гласные переднего ряда), две буквы с седилем ( ⟨ Ç ⟩ и ⟨ Ş ⟩ , представляющие аффрикату /tʃ/ и фрикативный /ʃ/ ), а также заглавная буква с точкой ⟨İ⟩строчная буква без точки ⟨ı⟩, представляющая высокий неогубленный гласный заднего ряда). В турецком языке каждая из них является отдельной буквой, а не версией других букв, где заглавная с точкой ⟨İ⟩ и строчная ⟨i⟩ являются одной и той же буквой, как и заглавная без точки ⟨I⟩ и строчная ⟨ı⟩ . Типографски ⟨Ç⟩ и ⟨Ş⟩ иногда передаются с точкой , как в ⟨Ṣ⟩ . Новые азербайджанский, крымскотатарский и гагаузский алфавиты основаны на турецком алфавите и его тех же диакритических буквах, с некоторыми дополнениями.
  • Туркменский язык включает в себя отдельные буквы турецкого алфавита Ç , Ö , Ş и Ü . Кроме того, туркменский язык использует A с диэрезисом ( Ä ) для представления /æ/ , N с кароном ( ⟨ Ň ⟩ ) для представления велярного носового /ŋ/ , Y с акутом ( ⟨ Ý ⟩ ) для представления палатального аппроксиманта /j/ и Z с кароном ( ⟨ Ž ⟩ ) для представления /ʒ/ .

Другой

  • В албанском языке есть две специальные буквы Ç и Ë , заглавные и строчные. Они располагаются рядом с наиболее похожими буквами в алфавите, c и e соответственно.
  • В эсперанто есть символы ŭ , ĉ , ĝ , ĥ , ĵ и ŝ , которые включены в алфавит и считаются отдельными буквами.
  • В филиппинском языке также есть буква ñ , которая располагается между n и o.
  • В современном гренландском языке диакритические знаки не используются, хотя ø и å используются для написания заимствованных слов, особенно из датского и английского языков. [9] [10] С 1851 по 1973 год гренландский язык писался с помощью алфавита, изобретенного Самуэлем Кляйншмидтом , в котором долгие гласные и геминальные согласные обозначались диакритическими знаками на гласных (в случае геминации согласных диакритические знаки ставились на гласной, предшествующей затронутой согласной). Например, имя Калааллит Нунаат писалось как Kalâdlit Nunât . В этой схеме используется циркумфлекс (◌̂) для обозначения долгого гласного (например, ⟨ât, ît, ût⟩ ; современные: ⟨aat, iit, uut⟩ ), острый акцент (◌́) для обозначения геминации следующего согласного: (т.е. ⟨ák, ík, úk⟩ ; современный: ⟨akk, ikk, ukk⟩ ) и, наконец, тильда (◌̃) или серьезный ударение (◌̀), в зависимости от автора, указывает на длину гласного и геминацию следующего согласного (например, ⟨ãt/àt, ĩt/ìt, ũt/ùt⟩ ; современные: ⟨aatt, iitt, ​​uutt⟩ ). ⟨ê, ô⟩ , использовавшиеся только перед ⟨r, q⟩ , теперь в гренландском языке пишутся как ⟨ee, oo⟩ .
  • Гавайский использует kahakō ( макрон ) над гласными, хотя есть некоторые разногласия по поводу того, считать ли их отдельными буквами. Kahakō над гласной может полностью изменить значение слова, которое пишется так же, но без kahakō.
  • В курдском языке используются символы Ç , Ê , Î , Ş и Û , а также другие 26 стандартных символов латинского алфавита.
  • В алфавите лакота используется карон для букв č , ȟ , ǧ , š и ž . Также используется акут для ударных гласных á, é, í, ó, ú, áŋ, íŋ, úŋ.
  • В малайском языке используются некоторые диакритические знаки, такие как á, ā, ç, í, ñ, ó, š, ú . Использование диакритических знаков продолжалось до конца 19 века, за исключением ā и ē .
  • В мальтийском языке используются буквы C, G и Z с точкой над ними (Ċ, Ġ, Ż), а также есть буква H с дополнительной горизонтальной чертой. Для заглавной буквы H дополнительная черта пишется немного выше обычной черты. Для строчной буквы H дополнительная черта пишется пересекающей вертикаль, как t , и не касающейся нижней части ( Ħ , ħ). Вышеуказанные символы считаются отдельными буквами. Буква «c» без точки вышла из употребления из-за избыточности. «Ċ» произносится как английская «ch», а «k» используется как твердая «c», как в слове «cat». «Ż» произносится так же, как английская «Z», как в слове «Zebra», в то время как «Z» используется для создания звука «ts» в английском языке (например, «tsunami» или «maths»). «Ġ» используется как мягкая «G», как в «geometry», в то время как «G» звучит как твёрдая «G», как в «log». Диграф «għ» (называемый għajn по названию арабской буквы ʻayn для غ) считается отдельным и иногда располагается после «g», тогда как в других томах он помещается между «n» и «o» (латинская буква «o» изначально произошла от формы финикийской ʻayin , которая традиционно сопоставлялась с финикийской nūn ).
  • В романизации сирийского языка используются измененные буквы Ā , Č , Ḏ , Ē , Ë , Ġ , Ḥ , Ō , Š , Ṣ , Ṭ , Ū , Ž наряду с 26 стандартными символами латинского алфавита. [11]
  • Вьетнамский язык использует рожковый диакритический знак для букв ơ и ư ; циркумфлекс для букв â , ê , и ô ; бреве для буквы ă ; и черту через букву đ . Отдельно в нем также есть á, à, ả, ã и ạ, пять тонов, используемых для гласных, помимо ровного тона «a».

Буквы кириллицы

  • В белорусской и узбекской кириллице есть буква ⟨ ў ⟩ .
  • В белорусском, болгарском , русском и украинском языках есть буква ⟨ й ⟩ .
  • В белорусском и русском языках есть буква ⟨ ё ⟩ . В русском языке эта буква обычно заменяется на ⟨ е ⟩ , хотя у неё разное произношение. Использование ⟨е⟩ вместо ⟨ё⟩ не влияет на произношение. Ё всегда используется в детских книгах и словарях. Минимальная пара — все ( вс'е , мн. ч.) и всё ( вс'о , сущ. ч.). В белорусском языке замена на ⟨е⟩ является ошибкой; в русском языке допустимо использовать либо ⟨е⟩ , либо ⟨ё⟩ вместо ⟨ё⟩, но первое чаще встречается в повседневной письменной речи (в отличие от учебной или детской письменной речи).
  • Кириллический украинский алфавит состоит из букв ⟨ґ⟩ , ⟨й⟩ и ⟨ї⟩ . В украинской латыни их гораздо больше .
  • В македонском языке есть буквы ⟨ ќ ⟩ и ⟨ ѓ ⟩ .
  • В болгарском и македонском языках притяжательное местоимение ѝ ( ì , «её») пишется с ударением, чтобы отличить его от союза и ( i , «и»).
  • Знак ударения ◌́ над любой гласной в кириллических алфавитах используется в словарях, книгах для детей и учебниках для изучения иностранных языков для обозначения ударения в слове, а также для устранения неоднозначности в словах с похожим написанием, но разным лексическим ударением.

Диакритические знаки, не создающие новых букв

Доска, используемая на занятиях в Гарварде, демонстрирует попытки студентов расставить диакритические знаки ü и акут, используемые в испанской орфографии .

Английский

Английский — один из немногих европейских языков, в котором не так много слов, содержащих диакритические знаки. Вместо этого диграфы являются основным способом, которым современный английский алфавит адаптирует латынь к своим фонемам. Исключениями являются неассимилированные иностранные заимствования, включая заимствования из французского (и, все чаще, из испанского , например, jalapeño и piñata ); однако диакритический знак в таких словах иногда опускается. Заимствованные слова, которые часто появляются с диакритическим знаком в английском языке, включают café , résumé или resumé (употребление, которое помогает отличить его от глагола resume ), soufflé и naïveté (см. английские термины с диакритическими знаками ). В более старой практике (и даже среди некоторых консервативных в орфографическом отношении современных писателей) можно увидеть такие примеры, как elite , mêlée и rôle.

Англоговорящие и писатели раньше использовали диэрезис чаще, чем сейчас, в таких словах, как coöperation (от фр. coopération ), zoölogy (от греч. zoologia ) и seeër (теперь чаще see-er или просто seer ) как способ указать, что соседние гласные принадлежат к разным слогам, но эта практика стала гораздо менее распространенной. Журнал New Yorker является крупным изданием, которое продолжает использовать диэрезис вместо дефиса для ясности и экономии места. [12]

Несколько английских слов, часто используемых вне контекста, особенно изолированно, можно отличить от других слов с тем же написанием только с помощью диакритических знаков или измененных букв. К ним относятся exposé , lamé , maté , öre , øre , résumé и rosé. В нескольких словах диакритические знаки, которых не было в оригинале, были добавлены для устранения неоднозначности, как в maté ( от исп. и порт. mate) , saké ( стандартная романизация японского языка не имеет знака ударения ) и Malé ( от дивехи ܉ܧ܍ܬ ) , чтобы четко отличать их от английских слов mate, sake и male.

Акут и гравис иногда используются в поэзии и текстах песен: акут для явного указания на ударение, которое может быть неоднозначным ( rébel против rebél ) или нестандартным по метрическим причинам ( caléndar ), гравис для указания на то, что обычно непроизносимый или выпадающий слог произносится ( warnèd, parlìament ).

В некоторых личных именах, таких как Рене и Зоэ , часто существуют два варианта написания, и предпочтения самого человека будут известны только его близким. Даже когда имя человека пишется с диакритическим знаком, как Шарлотта Бронте , это может быть пропущено в англоязычных статьях и даже в официальных документах, таких как паспорта , либо из-за небрежности, когда машинистка не знает, как вводить буквы с диакритическими знаками, либо по техническим причинам ( например, Калифорния не допускает [ требуется разъяснение ] имен с диакритическими знаками, поскольку компьютерная система не может обрабатывать такие символы). Они также появляются в некоторых всемирных названиях компаний и/или товарных знаках, таких как Nestlé и Citroën .

Другие языки

В следующих языках есть сочетания букв и диакритических знаков, которые не считаются самостоятельными буквами.

Транслитерация

Некоторые языки, в которых не используется латинский алфавит , транслитерируются или романизируются с помощью диакритических знаков. Примеры:

Пределы

орфографический

Возможно, наибольшее количество комбинированных диакритических знаков, необходимых для составления допустимого символа в любом языке Unicode, составляет 8, для «известного кластера графем в тибетском и ранджанском письмах» или HAKṢHMALAWARAYAṀ . [14]

Он состоит из

  1. U+0F67 ТИБЕТСКАЯ БУКВА ХА
  2. U+0F90 ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА КА
  3. U+0FB5 ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА SSA
  4. U+0FA8 ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА МА
  5. U+0FB3 ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА LA
  6. U+0FBA ТИБЕТСКАЯ ПРИСОЕДИНЕННАЯ БУКВА ФИКСИРОВАННОЙ ФОРМЫ WA
  7. U+0FBC ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА ФИКСИРОВАННОЙ ФОРМЫ RA
  8. U+0FBB ТИБЕТСКАЯ ПРИСОЕДИНЕННАЯ БУКВА ФИКСИРОВАННОЙ ФОРМЫ YA
  9. U+0F82 ТИБЕТСКИЙ ЗНАК NYI ZLA NAA DA

Пример рендеринга, который может быть некорректным в зависимости от браузера:

ཧྐྵྨླྺྼྻྂ

Неортографический/орнаментальный

Некоторые пользователи исследовали ограничения отображения в веб-браузерах и другом программном обеспечении, «украшая» слова чрезмерными бессмысленными диакритическими знаками на символ, чтобы создать так называемый текст Zalgo .

Список диакритических знаков в Unicode

Диакритические знаки для латинского алфавита в Unicode:

Смотрите также

Примечания

  1. Сообщается, что The New Yorker является уникальным изданием, продолжающим использовать их. [1]

Ссылки

  1. ^ Baum, Dan (16 декабря 2010 г.). «Странный знак The New Yorker — диэрезис». dscriber . Архивировано из оригинала 16 декабря 2010 г. Среди многих загадок The New Yorker есть этот забавный маленький умлаут над словами вроде coöperate и reëlect. The New Yorker, кажется, единственное издание на планете, которое его использует, и я всегда находил его немного претенциозным, пока не провел небольшое исследование. Оказывается, это не умлаут. Это диэрезис.
  2. ^ Sweet, Henry (1877). Справочник по фонетике . Кембридж: Издательство Кембриджского университета. стр. 174–175. Даже буквы с ударениями и диакритическими знаками [...], отлитые только для нескольких шрифтов, действуют практически как новые буквы. [...] Мы можем рассматривать h в sh и th просто как диакритический знак, написанный для удобства на одной строке с буквой, которую он изменяет.
  3. ^ Оксфордский словарь английского языка
  4. ^ Нестле, Эберхард (1888). Syrische Grammatik mit Litteratur, Chrestomathie und Glossar . Берлин: Verlagsbuchhandlung Х. Ройтера. [переведено на английский язык как сирийская грамматика с библиографией, хрестоматией и глоссарием Р. С. Кеннеди. Лондон: Уильямс и Норгейт, 1889].
  5. ^ Кокли, Дж. Ф. (2002). Парадигмы и упражнения Робинсона по сирийской грамматике (5-е изд.). Oxford University Press. ISBN 978-0-19-926129-1
  6. ^ Михаэлис, Иоаннис Давидис (1784). Грамматика Сирийская .
  7. ^ Gramática de la Llingua Asturiana (PDF) (3-е изд.). Академия языка Астурии. 2001. раздел 1.2. ISBN 84-8168-310-8. Архивировано из оригинала (PDF) 2011-05-25 . Получено 2011-06-07 .
  8. ^ http://www.juls.savba.sk/ediela/psp2000/psp.pdf страница 12, раздел I.2
  9. ^ Grønlands sprognævn (1992)
  10. ^ Петерсен (1990)
  11. ^ SP Brock, «Введение в сирийские исследования», в JH Eaton (ред.), Horizons in Semitic Studies (1980)
  12. Норрис, Мэри (26 апреля 2012 г.). «Проклятие диэрезиса». The New Yorker . Получено 18 апреля 2014 г.
  13. ^ ван Геловен, Сандер (2012). Diakritische tekens in het Nederlands (на голландском языке). Утрехт: Хеллебаард. Архивировано из оригинала 29 октября 2013 г.
  14. ^ Стил, Шон (2010-01-25). "Самое большое количество сочетающихся символов в глифе/символе/чем-либо в Unicode". Microsoft. Архивировано из оригинала 2019-05-16 . Получено 2019-11-25 .

Внешние ссылки