Диакритический

Эта статья содержит специальные символы . Без надлежащей поддержки рендеринга вы можете увидеть вопросительные знаки, квадраты или другие символы .

Эта страница использует обозначения для орфографического или другого лингвистического анализа. Для понимания того, как здесь используются ⟨ ⟩, | |, / /, и ,[ ] см . эту страницу .

Диакритический знак ( также диакритический знак , диакритическая точка , диакритический знак или акцент ) — это глиф , добавляемый к букве или к базовому глифу. Термин происходит от древнегреческого διακριτικός ( diakritikós , «различающий»), от διακρίνω ( diakrínō , «различать»). Слово диакритический является существительным , хотя иногда оно используется в атрибутивном смысле, тогда как диакритический — это только прилагательное . Некоторые диакритические знаки, такие как острый ⟨ó⟩ , тупой ⟨ò⟩ и циркумфлекс ⟨ô⟩ (все показаны над «o»), часто называются акцентами . Диакритические знаки могут располагаться над или под буквой или в каком-либо другом месте, например внутри буквы или между двумя буквами.

Основное применение диакритических знаков в латинском письме — изменение звуковых значений букв, к которым они добавляются. Исторически английский язык использовал диакритический знак диэрезис для указания правильного произношения неоднозначных слов, таких как "coöperate", без которого последовательность букв <oo> могла бы быть неверно истолкована как произносимая /ˈkuːpəreɪt/ . Другими примерами являются острые и тупые ударения, которые могут указывать на то, что гласная должна произноситься иначе, чем обычно в этой позиции, например, не сокращаться до /ə/ или непроизносимой, как в случае двух использований буквы e в существительном résumé (в отличие от глагола resume ), а также помощь, иногда оказываемая в произношении некоторых слов, таких как doggèd , learnèd , blessèd , и особенно слов, произносящихся иначе, чем обычно в поэзии (например, movèd , breathèd ).

Большинство других слов с диакритическими знаками в английском языке являются заимствованиями из таких языков, как французский , для лучшего сохранения правописания, например, диэрезис в словах naïve и Noël , акут в café , циркумфлекс в слове crêpe и седиль в façade . Однако все эти диакритические знаки часто опускаются на письме, и английский является единственным крупным современным европейским языком , в котором диакритические знаки не используются в общем употреблении. ^[a]

В латинских алфавитах других языков диакритические знаки могут различать омонимы , например, французское là («there») и la («the»), которые оба произносятся как /la/ . В гэльском шрифте точка над согласной указывает на смягчение рассматриваемой согласной. В других системах письма диакритические знаки могут выполнять другие функции. Системы указания гласных , а именно арабская система harakat и еврейская система niqqud , указывают на гласные, которые не передаются основным алфавитом. Индийская система virama ( ् и т. д.) и арабская система sukūn ( ـْـ ) обозначают отсутствие гласных. Знаки кантилляции указывают на просодию . Другие применения включают в себя раннюю кириллическую черту титло ( ◌҃ ) и еврейский гершаим ( ״ ), которые, соответственно, отмечают аббревиатуры или акронимы , и греческие диакритические знаки, которые показывали, что буквы алфавита использовались в качестве цифр . Во вьетнамском языке и официальной системе романизации Ханьюй Пиньинь для мандаринского языка в Китае диакритические знаки используются для обозначения тонов слогов, в которых встречаются отмеченные гласные.

В орфографии и сопоставлении буква, измененная диакритическим знаком, может рассматриваться либо как новая, отдельная буква, либо как комбинация буквы и диакритического знака. Это варьируется от языка к языку и может варьироваться от случая к случаю в пределах одного языка.

В некоторых случаях буквы используются как «диакритические знаки в строке» с той же функцией, что и вспомогательные глифы, то есть они изменяют звучание предшествующей им буквы, как в случае с «h» в английском произношении «sh» и «th». ^[2] Такие сочетания букв иногда даже объединяются в одну отдельную букву. Например, написание sch традиционно часто рассматривалось как отдельная буква в немецком языке. Слова с таким написанием были перечислены после всех других слов, написанных с s, в карточных каталогах в Венских публичных библиотеках, например (до оцифровки).

Типы

К типам диакритических знаков, используемых в алфавитах на основе латинской графики, относятся:

ударения (названные так потому, что акут, гравис и циркумфлекс изначально использовались для обозначения различных типов ударений в политонической транскрипции греческого языка )
- ◌́ – острый ( лат . apex ); например ó
- ◌̀ – могила ; например ò
- ◌̂ – циркумфлекс ; например ô
- ◌̌ – карон , клин; например ǒ
- ◌̋ – двойной острый ; например Ё
- ◌̏ – двойная могила ; например ȍ
одна точка
- ◌̇ – точка над буквой используется во многих орфографиях и транскрипциях; например, ȯ
- ◌̣ — во многих орфографиях и транскрипциях также используется нижняя точка ; например ọ
- ◌·◌ – в каталонском языке ela Geminada (l·l) используется вставочный знак .
- ◌͘ – точка справа вверху используется в Pe̍h-ōe-jī
- tittle , надстрочная точка современных строчных латинских букв ⟨i⟩ и ⟨j⟩
две точки :
- Две точки сверху ( ◌̈ ) используются для умлаута , диэрезиса и других знаков; (например , ö )
- Две точки снизу ( ◌̤ ) используются в Международном фонетическом алфавите (МФА) и системе латинизации ALA-LC.
- ◌ː – треугольное двоеточие , используется в МФА для обозначения долгих гласных («точки» треугольные, а не круглые).
кривые
- ◌̆ – бреве ; например ŏ
- ◌̑ – перевернутое бреве ; например ȏ
- ◌͗ – sicilicus , палеографический диакритический знак, похожий на карон или бреве
- ◌̃ – тильда ; например х
- ◌҃ – титло
вертикальный ход
- ◌̩ – вертикальная черта нижнего индекса используется в МФА для обозначения слогов , а в Rheinische Dokumenta – для обозначения шва
- ◌̍ – в Pe̍h-ōe-jī используется надстрочный вертикальный штрих
макрон или горизонтальная линия
- ◌̄ – макрон ; например ō
- ◌̱ – подчеркивание
накладки
- ◌⃓ – вертикальная черта через символ
- ◌̷ – перечеркнуть символ; например ø
- ◌̵ – перекладина через персонажа
кольцо
- ◌̊ – преобладание : например å
надстрочные завитки
- ◌̓ – апостроф
- ◌̒ – перевернутый апостроф
- ◌̔ – перевернутый апостроф
- ◌̉ — крючок выше ( вьетнамский : dấu hỏi )
- ◌̛ – рог ( вьетнамский : dấu móc ); например ơ
подстрочные завитки
- ◌̦ – нижняя запятая ; например Ù
- ◌̧ – седиль ; например ç
- ◌̡ ◌̢ – крючок , левый или правый, иногда надстрочный
- ◌̨ – огонёк ; например Ё
двойные знаки (над или под двумя базовыми символами)
- ◌͝◌ – двойной бревис
- ◌͡◌ – зажим для галстука или верхняя лигатура
- ◌᷍◌ – двойной циркумфлекс
- ◌͞◌ – лонгум
- ◌͠◌ – двойная тильда
двойные подстрочные/надстрочные диакритические знаки
- ◌̧ ̧ – двойная седиль
- ◌̨ ̨ – двойной огонек
- ◌̈ ̈ – двойной диэрезис
- ◌ͅͺ – двойные ипогеграммы

Тильда, точка, запятая, титло , апостроф, черта и двоеточие иногда являются диакритическими знаками, но имеют и другие применения.

Не все диакритические знаки встречаются рядом с буквой, которую они изменяют. Например, в языке вали в Гане апостроф указывает на изменение качества гласной, но стоит в начале слова, как в диалектах 'Bulengee и 'Dolimi . Из-за гармонии гласных все гласные в слове изменяются, поэтому областью действия диакритического знака является все слово. В письмах абугида , таких как те, которые используются для записи хинди и тайского , диакритические знаки обозначают гласные и могут встречаться над, под, перед, после или вокруг согласной буквы, которую они изменяют.

Точка ( титул ) на букве ⟨i⟩ или букве ⟨j⟩ латинского алфавита возникла как диакритический знак, чтобы четко отличать ⟨i⟩ от минимов (нисходящих штрихов) соседних букв. Впервые она появилась в 11 веке в последовательности ii (как в ingeníí ), затем распространилась на i рядом с m, n, u , и, наконец, на все строчные i s. ⟨j⟩ , изначально являвшаяся вариантом i , унаследовала титул. Форма диакритического знака развивалась от первоначального напоминавшего современный острый акцент до длинного росчерка к 15 веку. С появлением римского шрифта она была уменьшена до круглой точки, которую мы имеем сегодня. ^[3]

Несколько языков Восточной Европы используют диакритические знаки как на согласных, так и на гласных, тогда как в Западной Европе диграфы чаще используются для изменения согласных звуков. Большинство языков в Европе используют диакритические знаки на гласных, за исключением английского, где их обычно нет (за некоторыми исключениями ).

Диакритические знаки, характерные для нелатинских алфавитов

арабский

(ئ ؤ إ أ и отдельный ء) хамза : указывает на гортанную остановку .
(ــًــٍــٌـ) tanwīn ( تنوين ) символы: Выполняют грамматическую роль в арабском языке . Знак ـً чаще всего пишется в сочетании с alif , например ـًا .
(ــّـ) шадда : Удвоение согласных.
(ٱ) waṣla : Чаще всего встречается в начале слова. Указывает на тип хамзы , которая произносится только тогда, когда буква читается в начале речи.
(آ) мадда : Письменная замена хамзы , за которой следует алиф, т. е. ( ءا ). Читается как гортанная смычка, за которой следует долгий /aː/ , например ءاداب، ءاية، قرءان، مرءاة пишутся соответственно как آداب، آية، قرآن، مرآة . Это правило написания не применяется, когда алиф, следующий за хамзой, не является частью основы слова, например نتوءات не пишется как نتوآت , поскольку основа نتوء не имеет алифа, следующего за ее хамзой .
(ــٰـ) надстрочный алиф (также «короткий» или «кинжальный алиф»): замена оригинального алифа, который опускается при написании некоторых редких слов, например, لاكن не пишется с оригинальным алифом, встречающимся в произношении слова, вместо этого оно пишется как لٰكن .
Харакат (по-арабски: حركات , также называемый تشكيل ташкил ):
- (ــَـ) фатха (а)
- (ــِـ) касра (i)
- (ــُـ) Дамма (у)
- (ــْـ) сукун (без гласной)
Харакат или знаки огласовки служат двум целям :
- Они служат фонетическим ориентиром. Они указывают на наличие кратких гласных ( fatḥa , kasra или ḍamma ) или их отсутствие ( sukūn ).
- На последней букве слова гласная точка отражает падеж склонения или наклонение.
  - Для существительных ḍamma обозначает именительный падеж, fatḥa — винительный падеж, а kasra — родительный падеж.
  - Для глаголов ḍamma используется для несовершенного вида, fatḥa — для совершенного вида, а sukūn — для глаголов в повелительном или юссивном наклонении.
Знаки гласных или ташкиль не следует путать с знаками согласных или иджам ( إعجام ) — одна, две или три точки, которые пишутся над или под согласной для различения букв одинаковой или похожей формы .

греческий

Эти диакритические знаки используются в дополнение к акутовому, гравису, циркумфлексному ударению и диерезису:

◌ͺ – нижний индекс йоты ( ᾳ, εͅ, ῃ, ιͅ, οͅ, υͅ, ῳ )
῾◌ — грубое дыхание ( древнегреческий : δασὺ πνεῦμα , латинизированное : dasỳ pneûma , латынь : spīritus asper ): стремление
᾿◌ — плавное (или мягкое) дыхание ( древнегреческий : ψιλὸν πνεῦμα , латинизированный : psilòn pneûma , латынь : spīritus lēnis ): отсутствие устремления

иврит

Бытие 1:9 "И сказал Бог: да соберется вода".
Буквы черным цветом, никкуд красным , кантилляция синим цветом

Никкуд
- ּ – Дагеш
- ּ – Маппик
- ֿ – Рэйф
- ׁ – точка Шин (в правом верхнем углу)
- ׂ – точка Sin (в левом верхнем углу)
- ְ – Шва
- ֻ – Кубуц
- ֹ◌ – Холам
- ָ – Камац
- ַ – Патах
- ֶ – Сегол
- ֵ – Цейре
- ִ – Хирик

( Знаки кантилляции обычно отображаются неправильно; см. Кантилляция на иврите#Названия и формы таамим для получения полной таблицы вместе с инструкциями о том, как максимально увеличить возможность их просмотра в веб-браузере.)

Другой
- ׳ – Гереш
- ״ – Гершаим

корейский

Диакритические знаки 〮 и 〯 , известные как Bangjeom ( 방점; 傍點), использовались для обозначения тональных акцентов в хангыле для среднекорейского языка . Они писались слева от слога в вертикальном письме и над слогом в горизонтальном письме.

Санскрит и индийские

сирийский

Точка над и точка под буквой представляют [a] , транслитерируемую как a или ă ,
Две точки, расположенные по диагонали над буквой, представляют [ɑ] , транслитерируемые как ā или â или å ,
Две горизонтально расположенные точки под буквой представляют [ɛ] , транслитерируемую как e или ĕ ; часто произносимую как [ɪ] и транслитерируемую как i в восточносирийском диалекте ,
Две точки, расположенные по диагонали под буквой, представляют [e] , транслитерируемую как ē ,
Точка под буквой «бет» обозначает мягкий звук [в] , транслитерируемый как «в».
Тильда (~) под буквой «Gamel» обозначает звук [dʒ] , транслитерируемый как j.
Буква Вав с точкой под ней представляет собой [u] , транслитерируемую как ū или u ,
Буква Вав с точкой над ней представляет собой [o] , транслитерируемую как ō или o ,
Буква Ёд с точкой под ней представляет собой [i] , транслитерируемую как ī или i ,
Тильда (~) под буквой Kaph обозначает звук [t͡ʃ] , транслитерируемый как ch или č ,
Полукруг под буквой Пе обозначает звук [ф] , транслитерируемый как f или ph .

В дополнение к вышеуказанным гласным знакам, транслитерация сирийского языка иногда включает ə , e̊ или надстрочный ^e (или часто вообще ничего) для представления оригинального арамейского шва , который был утерян позднее в какой-то момент развития сирийского языка. ^[4] Некоторые схемы транслитерации считают его включение необходимым для отображения спирантизации или по историческим причинам. ^[5]^[6]

Неалфавитные письменности

В некоторых неалфавитных системах письма также используются символы, которые по сути выполняют функцию диакритических знаков.

Нечистые абджады (например, еврейское и арабское письмо) и абугиды используют диакритические знаки для обозначения гласных . Иврит и арабский язык также обозначают удвоение и изменение согласных с помощью диакритических знаков; иврит и деванагари используют их для иностранных звуков. Деванагари и родственные абугиды также используют диакритический знак, называемый вирама, для обозначения отсутствия гласной. Кроме того, деванагари использует лунную точку чандрабинду ( ँ ) для назализации гласных.
В единой канадской аборигенной слоговой азбуке используется несколько типов диакритических знаков, включая диакритические знаки с алфавитными свойствами, известные как медиальные и финальные. Хотя изначально долгие гласные обозначались отрицательной чертой через слоговые глифы, из-за чего глиф выглядел сломанным, в современных формах для указания долготы гласного используется точка сверху . В некоторых стилях кольцо сверху обозначает долгую гласную с отступом [j]. Другой диакритический знак, «внутреннее кольцо», помещается в головке глифа, чтобы изменить [p] на [f] и [t] на [θ]. Медиальные знаки, такие как «точка w», помещенная рядом с глифом слоговой азбуки, указывают на [w], помещенную между согласным начала слога и гласным ядра. Финальные знаки обозначают согласный конца слога; Некоторые согласные в конце слога, находящиеся в середине слова, например, с «h-tick», указывают на усиление согласного в следующем за ним слоге.
В японских слогах хирагана и катакана используются символы дакутен (◌゛) и хандакутен (◌゜) (по-японски: 濁点 и 半濁点), также известные как нигори (濁 «загрязнение») или десять-десять (点々 «точка-точка»). ) и мару (丸 «круг») для обозначения звонких согласных или других фонетических изменений.
Эмотиконы обычно создаются с помощью диакритических символов, особенно японские эмотиконы на популярных имиджбордах .

Алфавитный порядок или сортировка

В разных языках используются разные правила для размещения диакритических знаков в алфавитном порядке. Например, французский и португальский языки рассматривают буквы с диакритическими знаками так же, как и базовую букву для целей упорядочивания и словарей. Скандинавские языки и финский язык , напротив, рассматривают символы с диакритическими знаками ⟨å⟩ , ⟨ä⟩ и ⟨ö⟩ как отдельные буквы алфавита и сортируют их после ⟨z⟩ . Обычно ⟨ä⟩ (a-умлаут) и ⟨ö⟩ (o-умлаут) [используемые в шведском и финском языках] сортируются как эквивалентные ⟨æ⟩ (ash) и ⟨ø⟩ (o-слэш) [используемые в датском и норвежском языках]. Кроме того, aa , когда используется в качестве альтернативного написания для ⟨å⟩ , сортируется как таковой. Другие буквы, измененные диакритическими знаками, рассматриваются как варианты базовой буквы, за исключением ⟨ü⟩ , которая часто сортируется как ⟨y⟩ .

Языки, которые рассматривают ударные буквы как варианты базовой буквы, обычно располагают в алфавитном порядке слова с такими символами сразу после похожих неотмеченных слов. Например, в немецком языке, где два слова отличаются только умлаутом, слово без него сортируется первым в немецких словарях (например, schon , а затем schön или fallen , а затем fällen ). Однако, когда речь идет об именах (например, в телефонных книгах или в каталогах авторов в библиотеках), умлауты часто рассматриваются как комбинации гласной с суффиксом ⟨e⟩ ; австрийские телефонные книги теперь рассматривают символы с умлаутами как отдельные буквы (сразу следующие за базовой гласной).

В испанском языке графема ⟨ñ⟩ считается отдельной буквой, отличной от ⟨n⟩ и сопоставляемой между ⟨n⟩ и ⟨o⟩ , поскольку она обозначает звук, отличный от звука простой ⟨n⟩ . Но ударные гласные ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ не отделены от безударных гласных ⟨a⟩ , ⟨e⟩ , ⟨i⟩ , ⟨o⟩ , ⟨u⟩ , поскольку острое ударение в испанском языке изменяет только ударение в слове или обозначает различие между омонимами , но не изменяет звучание буквы.

Полный список порядков сортировки на разных языках см. в разделе Последовательность сортировки .

Поколение с компьютерами

Современные компьютерные технологии были разработаны в основном в странах, говорящих на западноевропейских языках (в частности, на английском), и многие ранние двоичные кодировки были разработаны с уклоном в пользу английского языка — языка, написанного без диакритических знаков. С учетом того, что компьютерная память и хранение данных были в приоритете, ранние наборы символов были ограничены латинским алфавитом, десятью цифрами и несколькими знаками препинания и обычными символами. Американский стандартный код для обмена информацией ( ASCII ), впервые опубликованный в 1963 году, кодировал всего 95 печатных символов. Он включал всего четыре отдельно стоящих диакритических знака — акут, гравис, циркумфлекс и тильда, — которые должны были использоваться путем отступа и надпечатки базовой буквы. Стандарт ISO/IEC 646 (1967) определил национальные вариации, которые заменяют некоторые американские графемы предварительно составленными символами (такими как ⟨é⟩ , ⟨è⟩ и ⟨ë⟩ ), в зависимости от языка, — но оставался ограниченным 95 печатными символами.

Unicode был задуман для решения этой проблемы путем назначения каждому известному символу собственного кода; если этот код известен, большинство современных компьютерных систем предоставляют метод для его ввода . По историческим причинам почти всем комбинациям букв с ударением, используемым в европейских языках, были присвоены уникальные кодовые точки , и они называются предсоставленными символами . Для других языков обычно необходимо использовать комбинированный диакритический знак вместе с желаемой базовой буквой. К сожалению, даже по состоянию на 2024 год многие приложения и веб-браузеры по-прежнему не могут правильно использовать концепцию комбинированного диакритического знака.

В зависимости от раскладки клавиатуры и отображения клавиатуры , вводить буквы с диакритическими знаками на компьютерах и пишущих машинках более или менее легко. Клавиатуры, используемые в странах, где буквы с диакритическими знаками являются нормой, имеют клавиши с выгравированными соответствующими символами. В других случаях, например, когда используются международные отображения США или расширенные отображения Великобритании , акцентированная буква создается путем нажатия сначала клавиши с диакритическим знаком, а затем буквы, на которую ее следует поместить. Этот метод известен как метод мертвых клавиш , поскольку он не производит собственного вывода, а изменяет вывод клавиши, нажатой после нее.

Языки с буквами, содержащими диакритические знаки

В следующих языках есть буквы с диакритическими знаками, которые орфографически отличаются от букв без диакритических знаков.

латиница

Балтийский

В латышском языке есть следующие буквы: ⟨ ā ⟩ , ⟨ ē ⟩ , ⟨ ī ⟩ , ⟨ ū ⟩ , ⟨ č ⟩ , ⟨ ģ ⟩ , ⟨ ķ ⟩ , ⟨ ļ ⟩ , ⟨ ņ ⟩ , ⟨ š ⟩ , ⟨ ž ⟩
Литовский . В общем случае, когда буквы появляются с кароном ( ⟨č⟩ , ⟨š⟩ и ⟨ž⟩ ), они рассматриваются как отдельные буквы от ⟨c⟩ , ⟨s⟩ или ⟨z⟩ и сопоставляются отдельно; буквы с огонёком ( ⟨ ą ⟩ , ⟨ ę ⟩ , ⟨ į ⟩ и ⟨ ų ⟩ ), макроном ( ⟨ ū ⟩ ) и точкой над точкой ( ⟨ ė ⟩ ) также считаются отдельными буквами, но им не дается уникальный порядок сопоставления.

кельтский

В валлийском языке используются циркумфлекс, диэрезис, акут и гравис на семи гласных ⟨a⟩ , ⟨e⟩ , ⟨i⟩ , ⟨o⟩ , ⟨u⟩ , ⟨w⟩ , ⟨y⟩ ( отсюда композиты ⟨â⟩ , ⟨ê⟩ , ⟨î⟩ , ⟨ô⟩ , ⟨û⟩ , ⟨ŵ⟩ , ⟨ŷ⟩ , ⟨ä⟩ , ⟨ë⟩ , ⟨ï⟩ , ⟨ö⟩ , ⟨ü⟩ , ⟨ẅ⟩ , ⟨ÿ⟩ , ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ , ⟨ẃ⟩ , ⟨ý⟩ , ⟨à⟩ , ⟨è⟩ , ⟨ì⟩ , ⟨ò⟩ , ⟨ù⟩ , ⟨ẁ⟩ , ⟨ỳ⟩ ). Однако все, за исключением циркумфлекса (который используется как макрон), встречаются довольно редко.
После реформ правописания с 1970-х годов, шотландский гэльский использует только гравис, который может использоваться на любой гласной ( ⟨ à ⟩ , ⟨ è ⟩ , ⟨ ì ⟩ , ⟨ ò ⟩ , ⟨ ù ⟩ ). Раньше острые ударения могли использоваться на ⟨á⟩ , ⟨ó⟩ и ⟨é⟩ , которые использовались для указания определенного качества гласной. С устранением этих ударений новая орфография полагается на то, что читатель имеет предварительное знание произношения данного слова.
В мэнском языке используется диакритический знак седиля ⟨ ç ⟩ в сочетании с h, чтобы получить диграф ⟨çh⟩ (произносится /tʃ/ ), чтобы обозначить различие между ним и диграфом ⟨ch⟩ (произносится /h/ или /x/ ). Другие диакритические знаки, используемые в мэнском языке, включают циркумфлекс и диэрезис, как в ⟨â⟩ , ⟨ê⟩ , ⟨ï⟩ и т. д., чтобы обозначить различие между двумя похожими по написанию словами, но с немного отличающимся произношением.
В ирландском языке для обозначения долгих гласных используются только острые ударения, согласно реформе правописания 1948 года. В гэльском шрифте лениция обозначается точкой сверху ; в римском шрифте используется суффикс ⟨h⟩ . Таким образом, ṁáṫair эквивалентен mháthair .
В бретонском языке нет единой орфографии (системы правописания), но для ряда целей используются диакритические знаки. Тререза используется для обозначения того, что две гласные произносятся отдельно, а не как дифтонг/диграф. Циркумфлекс используется для обозначения долгих гласных, но обычно только в тех случаях, когда длительность гласного не предсказуема фонологией. Назализация гласных может быть отмечена тильдой или следующей за гласной буквой ⟨ñ⟩ . Суффикс множественного числа -où используется в качестве унифицированного написания для представления суффикса с рядом произношений в разных диалектах и для отличия этого суффикса от диграфа ⟨ou⟩ , который произносится как /u:/ . Апостроф используется для различения ⟨c'h⟩ , произносимого как /x/, поскольку в других кельтских языках используется диграф ⟨ch⟩ , от возникшего под влиянием французского языка диграфа ch, произносимого как /ʃ/ .

финно-угорские

В эстонском языке есть отдельная буква ⟨ õ ⟩ , которая содержит тильду. Эстонские гласные с двойными диакритическими знаками ⟨ä⟩ , ⟨ö⟩ , ⟨ü⟩ похожи на немецкие, но это также отдельные буквы, в отличие от немецких умлаутированных букв. Все четыре имеют свое собственное место в алфавите, между ⟨w⟩ и ⟨x⟩ . Кароны в ⟨š⟩ или ⟨ž⟩ появляются только в иностранных именах собственных и заимствованных словах . Это также отдельные буквы, размещенные в алфавите между s и t .
В финском языке используются гласные с двумя точками ( ⟨ä⟩ и ⟨ö⟩ ). Как и в шведском и эстонском языках, они рассматриваются как отдельные буквы, а не как комбинации «гласная + диакритический знак» (как в немецком языке). В иностранных именах и заимствованных словах также используются символы ⟨å⟩ , ⟨š⟩ и ⟨ž⟩ . В финском и шведском алфавитах ⟨å⟩ , ⟨ä⟩ и ⟨ö⟩ рассматриваются как отдельные буквы после ⟨z⟩ , остальные — как варианты их базовой буквы.
В венгерском языке используются диакритические знаки «двойная точка», «акут» и «двойной акут» (последний уникален для венгерского языка): ( ⟨ö⟩ , ⟨ü⟩ ), ( ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ ) и ( ⟨ő⟩ , ⟨ű⟩ ). Акут указывает на долгую форму гласной (в случае ⟨i⟩ / ⟨í⟩ , ⟨o⟩ / ⟨ó⟩ , ⟨u⟩ / ⟨ú⟩ ), в то время как двойной акут выполняет ту же функцию для ⟨ö⟩ и ⟨ü⟩ . Акут также может указывать на другой звук (более открытый, как в случае ⟨a⟩ / ⟨á⟩ , ⟨e⟩ / ⟨é⟩ ). В венгерском алфавите как долгие, так и краткие формы гласных указаны отдельно , но члены пар ⟨a⟩ / ⟨á⟩ , ⟨e⟩ / ⟨é⟩ , ⟨i⟩ / ⟨í⟩ , ⟨o⟩ / ⟨ó⟩ , ⟨ö⟩ / ⟨ ő ⟩ , ⟨u⟩ / ⟨ú⟩ и ⟨ü⟩ / ⟨ ű ⟩ сопоставляются в словарях как одна и та же буква.
В ливонском языке есть следующие буквы: ⟨ā⟩ , ⟨ä⟩ , ⟨ ٟ ⟩ , ⟨ ḑ ⟩ , ⟨ē⟩ , ⟨ī⟩ , ⟨ļ⟩ , ⟨ņ⟩ , ⟨ō⟩ , ⟨ ş ⟩ , ⟨ ⟩ , ⟨ õ ⟩ , ⟨ ş ⟩ , ⟨ŗ⟩ , ⟨š⟩ , ⟨ş⟩ , ⟨ū⟩ , ⟨ž⟩ .

германский

В немецком языке используется диакритический знак с двумя точками (умляут ) : буквы ⟨ ä ⟩ , ⟨ ö ⟩ , ⟨ ü ⟩ , которые используются для обозначения выдвижения вперед гласных заднего ряда (см. умляут (лингвистика) ).
В голландском языке используются диакритические знаки «акут», «циркумфлекс», «гравит» и «две точки» с большинством гласных, а также седиль с «c», как во французском языке. В результате получается ⟨ á ⟩ , ⟨ à ⟩ , ⟨ ä ⟩ , ⟨ é ⟩ , ⟨ è ⟩ , ⟨ ê ⟩ , ⟨ ë ⟩ , ⟨ í ⟩ , ⟨ î ⟩ , ⟨ ï ⟩ , ⟨ ó ⟩ , ⟨ ô ⟩ , ⟨ ö ⟩ , ⟨ ú ⟩ , ⟨ û ⟩ , ⟨ ü ⟩ и ⟨ ç ⟩ . Это в основном касается слов (и имен), происходящих из французского языка (например, crème, café, gêne, façade ). Акут также используется для подчеркивания гласной (например, één ). Диакритический знак из двух точек используется как языковая диэрезис ( перерыв между гласными ), который разделяет две гласные, например, reële, reünie, coördinatie ), а не для обозначения языкового умлаута , как в немецком языке.
В африкаансе используются 16 дополнительных форм гласных, как прописных, так и строчных: ⟨ á ⟩ , ⟨ ä ⟩ , ⟨ é ⟩ , ⟨ è ⟩ , ⟨ ê ⟩ , ⟨ ë ⟩ , ⟨ í ⟩ , ⟨ î ⟩ , ⟨ ï ⟩ , ⟨ ó ⟩ , ⟨ ô ⟩ , ⟨ ö ⟩ , ⟨ ú ⟩ , ⟨ û ⟩ , ⟨ ü ⟩ , ⟨ ý ⟩ .
Фарерский язык использует острые и некоторые дополнительные буквы. Все они считаются отдельными буквами и имеют свое место в алфавите: ⟨ á ⟩ , ⟨ í ⟩ , ⟨ ó ⟩ , ⟨ ú ⟩ , ⟨ ý ⟩ и ⟨ ø ⟩ .
В исландском языке используются акуты и другие дополнительные буквы. Все они считаются отдельными буквами и имеют свое место в алфавите: {{angbrZ á }}, ⟨ é ⟩ , ⟨ í ⟩ , ⟨ ó ⟩ , ⟨ ú ⟩ , ⟨ ý ⟩ и ⟨ ö ⟩ .
В датском и норвежском языках используются дополнительные символы, такие как косая черта o ⟨ ø ⟩ и кольцо a ⟨ å ⟩ . Эти буквы идут после ⟨z⟩ и ⟨ æ ⟩ в порядке ⟨ø⟩ , ⟨å⟩ . Исторически ⟨å⟩ развилась из лигатуры путем написания небольшого надстрочного индекса ⟨a⟩ над строчной ⟨a⟩ ; если символ ⟨å⟩ недоступен, некоторые скандинавские языки допускают замену удвоенным a , таким образом ⟨aa⟩ . Скандинавские языки сопоставляют эти буквы после ⟨z⟩ , но имеют разные национальные стандарты сопоставления .
В шведском языке используются а-диаэрезис ( ⟨ ä ⟩ ) и о-диаэрезис ( ⟨ ö ⟩ ) вместо ash ( ⟨æ⟩ ) и косая o ( ⟨ ø ⟩ ) в дополнение к а-надкольцу ( ⟨å⟩ ). Исторически диакритические знаки из двух точек для шведских букв ⟨ä⟩ и ⟨ö⟩ произошли от маленькой готической ⟨e⟩, написанной над буквами. Эти буквы располагаются после ⟨z⟩ в порядке ⟨å⟩ , ⟨ä⟩ , ⟨ö⟩ .

Романтика

В астурийском , галисийском и испанском языках символ ⟨ñ ⟩ является буквой и располагается между n и o .
В астурийском языке используется нижняя точка: ⟨ Ḷ ⟩ ( строчная буква , ⟨ḷ⟩ ) и ⟨ Ḥ ⟩ ( строчная буква ⟨ḥ⟩ ) ^[7]
В каталонском языке используется острый акцент ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ , серьезный акцент ⟨à⟩ , ⟨è⟩ , ⟨ò⟩ , диэрезис ⟨ï⟩ , ⟨ü⟩ , седиль ⟨ç. ⟩ и интерпункт ⟨l·l⟩ .

В валенсийском языке также может использоваться циркумфлекс ⟨â⟩ , ⟨ê⟩ , ⟨î⟩ , ⟨ô⟩ , ⟨û⟩ .

Корсиканец использует в своем алфавите следующие символы : ⟨À⟩ / ⟨à⟩ , ⟨È⟩ / ⟨è⟩ , ⟨Ì⟩ / ⟨ì⟩ , ⟨Ò⟩ / ⟨ò⟩ , ⟨Ù⟩ / ⟨ù⟩ .
Во французском языке используются четыре диакритических знака, которые появляются над гласными (циркумфлекс, акут, гравис, диэрезис) и седиль, появляющийся в ⟨ç⟩ .
В итальянском языке используются два диакритических знака, которые появляются над гласными (акут, гравис).
Леонский : можно использовать ⟨ñ⟩ или ⟨ nn ⟩ .
В португальском языке тильда используется с гласными ⟨a⟩ и ⟨o⟩, а седиль — с c.
Румынский язык использует бреве над буквой a ( ⟨ ă ⟩ ) для обозначения звука шва /ə/ , а также циркумфлекс над буквами a ( ⟨ â ⟩ ) и i ( ⟨ î ⟩ ) для обозначения звука /ɨ/ . Румынский язык также пишет запятую под буквами s ( ⟨ ș ⟩ ) и t ( ⟨ ț ⟩ ) для обозначения звуков /ʃ/ и /t͡s/ , соответственно. Эти символы сопоставляются после их недиакритического эквивалента.
В испанском языке используются острые ударения ( ⟨á⟩ , ⟨é⟩ , ⟨í⟩ , ⟨ó⟩ , ⟨ú⟩ ) для обозначения ударения, падающего на другой слог, а не на тот, на который оно падает по правилам по умолчанию, а также для различения некоторых односложных омонимов (например, el (определенный артикль мужского рода единственного числа) и él [he]). Диаерезис используется только на u, чтобы отличить сочетания gue, gui /ge/, /gi/ от güe, güi /gwe/, /gwi/ , например , vergüenza, lingüística . Тильда над ⟨ñ⟩ не считается диакритическим знаком, поскольку ⟨ñ⟩ считается отдельной буквой от ⟨n⟩ , а не ее видоизмененной формой.

славянский

Латинский алфавит Гайя , используемый в хорватском и латинизированном сербском языках , имеет символы ⟨ č ⟩ , ⟨ ć ⟩ , ⟨ đ ⟩ , ⟨ š ⟩ и ⟨ ž ⟩ , которые считаются отдельными буквами и указаны как таковые в словарях и других контекстах, в которых слова перечислены в соответствии с алфавитным порядком. Он также имеет один диграф , включающий диакритический знак, dž , который также расположен в алфавитном порядке независимо и следует за ⟨ d ⟩ и предшествует ⟨ đ ⟩ в алфавитном порядке.
В чешском алфавите используются акут (á é í ó ú ý), карон ( č ď ě ň ř š ť ž ), а для одной буквы ( ů ) — кольцо. (В ď и ť карон изменен так, чтобы выглядеть скорее как апостроф.) Буквы с кароном считаются отдельными буквами, тогда как гласные рассматриваются только как более длинные варианты безударных букв. Акут не влияет на алфавитный порядок, буквы с кароном располагаются после исходных аналогов.
В польском языке есть следующие буквы: ą ć ę ł ń ó ś ź ż . Они считаются отдельными буквами: каждая из них размещается в алфавите сразу после своего латинского аналога (например, ⟨ą⟩ между ⟨a⟩ и ⟨b⟩ ), ⟨ź⟩ и ⟨ż⟩ размещаются после ⟨z⟩ в указанном порядке.
В сербском кириллическом алфавите нет диакритических знаков, вместо этого для каждой буквы латинского аналога (включая латинские буквы с диакритическими знаками и диграфы dž, lj и nj ) имеется графема ( глиф ) .
В словацком алфавите используются акут (á é í ó ú ý ĺ ŕ ), карон (č ď ľ ň š ť ž dž), умлаут (ä) и циркумфлекс (ô). Все они считаются отдельными буквами и располагаются сразу после исходного аналога в алфавите . ^[8]
В базовом словенском алфавите есть символы ⟨ č ⟩ , ⟨ š ⟩ и ⟨ ž ⟩ , которые считаются отдельными буквами и указаны как таковые в словарях и других контекстах, в которых слова перечислены в алфавитном порядке. Буквы с кароном располагаются сразу после букв, написанных без диакритического знака. Буква ⟨đ⟩ ('d с чертой') может использоваться в нетранслитерируемых иностранных словах, в частности, в именах, и располагается после ⟨č⟩ и перед ⟨d⟩ .

тюркский

Азербайджанский язык включает отдельные буквы турецкого алфавита Ç , Ğ , I , İ , Ö , Ş и Ü .
Крымскотатарский язык включает в себя отличительные буквы турецкого алфавита Ç , Ğ , I , İ , Ö , Ş и Ü . В отличие от турецкого, в крымскотатарском языке также есть буква Ñ .
Гагаузский язык включает в себя отдельные буквы турецкого алфавита Ç , Ğ , I , İ , Ö и Ü . В отличие от турецкого, в гагаузском языке также есть буквы Ä , Ê , Ș и Ț . Ș и Ț произошли от румынского алфавита для тех же звуков. Иногда вместо Ș может использоваться турецкая Ş .
В турецком языке используется буква ⟨G⟩ с бреве ( ⟨ Ğ ⟩ ), две буквы с двумя точками ( ⟨ Ö ⟩ и ⟨ Ü ⟩ , представляющие две огубленные гласные переднего ряда), две буквы с седилем ( ⟨ Ç ⟩ и ⟨ Ş ⟩ , представляющие аффрикату /tʃ/ и фрикативный /ʃ/ ), а также заглавная буква с точкой ⟨İ⟩ (и строчная буква без точки ⟨ı⟩, представляющая высокий неогубленный гласный заднего ряда). В турецком языке каждая из них является отдельной буквой, а не версией других букв, где заглавная с точкой ⟨İ⟩ и строчная ⟨i⟩ являются одной и той же буквой, как и заглавная без точки ⟨I⟩ и строчная ⟨ı⟩ . Типографски ⟨Ç⟩ и ⟨Ş⟩ иногда передаются с точкой , как в ⟨Ṣ⟩ . Новые азербайджанский, крымскотатарский и гагаузский алфавиты основаны на турецком алфавите и его тех же диакритических буквах, с некоторыми дополнениями.
Туркменский язык включает в себя отдельные буквы турецкого алфавита Ç , Ö , Ş и Ü . Кроме того, туркменский язык использует A с диэрезисом ( Ä ) для представления /æ/ , N с кароном ( ⟨ Ň ⟩ ) для представления велярного носового /ŋ/ , Y с акутом ( ⟨ Ý ⟩ ) для представления палатального аппроксиманта /j/ и Z с кароном ( ⟨ Ž ⟩ ) для представления /ʒ/ .

Другой

В албанском языке есть две специальные буквы Ç и Ë , заглавные и строчные. Они располагаются рядом с наиболее похожими буквами в алфавите, c и e соответственно.
В эсперанто есть символы ŭ , ĉ , ĝ , ĥ , ĵ и ŝ , которые включены в алфавит и считаются отдельными буквами.
В филиппинском языке также есть буква ñ , которая располагается между n и o.
В современном гренландском языке диакритические знаки не используются, хотя ø и å используются для написания заимствованных слов, особенно из датского и английского языков. ^[9]^[10] С 1851 по 1973 год гренландский язык писался с помощью алфавита, изобретенного Самуэлем Кляйншмидтом , в котором долгие гласные и геминальные согласные обозначались диакритическими знаками на гласных (в случае геминации согласных диакритические знаки ставились на гласной, предшествующей затронутой согласной). Например, имя Калааллит Нунаат писалось как Kalâdlit Nunât . В этой схеме используется циркумфлекс (◌̂) для обозначения долгой гласной (например, ⟨ât, ît, ût⟩ ; современные: ⟨aat, iit, uut⟩ ), острый ударение (◌́) для обозначения геминации следующей согласной: (т.е. ⟨ák, ík, ût⟩ ; современные: ⟨akk, ikk, ukk⟩ ) и, наконец, тильда (◌̃) или серьезный ударение (◌̀), в зависимости от автора, указывает на длину гласного и геминацию следующего согласного (например, ⟨ãt/àt, ĩt/ìt, ũt/ùt⟩ ; современные: ⟨aatt, iitt, uutt⟩ ). ⟨ê, ô⟩ , использовавшиеся только перед ⟨r, q⟩ , теперь в гренландском языке пишутся как ⟨ee, oo⟩ .
Гавайский использует kahakō ( макрон ) над гласными, хотя есть некоторые разногласия по поводу того, считать ли их отдельными буквами. Kahakō над гласной может полностью изменить значение слова, которое пишется так же, но без kahakō.
В курдском языке используются символы Ç , Ê , Î , Ş и Û , а также другие 26 стандартных символов латинского алфавита.
В алфавите лакота используется карон для букв č , ȟ , ǧ , š и ž . Также используется акут для ударных гласных á, é, í, ó, ú, áŋ, íŋ, úŋ.
В малайском языке используются некоторые диакритические знаки, такие как á, ā, ç, í, ñ, ó, š, ú . Использование диакритических знаков продолжалось до конца 19 века, за исключением ā и ē .
В мальтийском языке используются буквы C, G и Z с точкой над ними (Ċ, Ġ, Ż), а также есть буква H с дополнительной горизонтальной чертой. Для заглавной буквы H дополнительная черта пишется немного выше обычной черты. Для строчной буквы H дополнительная черта пишется пересекающей вертикаль, как t , и не касающейся нижней части ( Ħ , ħ). Вышеуказанные символы считаются отдельными буквами. Буква «c» без точки вышла из употребления из-за избыточности. «Ċ» произносится как английская «ch», а «k» используется как твердая «c», как в слове «cat». «Ż» произносится так же, как английская «Z», как в слове «Zebra», в то время как «Z» используется для создания звука «ts» в английском языке (например, «tsunami» или «maths»). «Ġ» используется как мягкая «G», как в «geometry», в то время как «G» звучит как твёрдая «G», как в «log». Диграф «għ» (называемый għajn по названию арабской буквы ʻayn для غ) считается отдельным и иногда располагается после «g», тогда как в других томах он помещается между «n» и «o» (латинская буква «o» изначально произошла от формы финикийской ʻayin , которая традиционно сопоставлялась с финикийской nūn ).
В романизации сирийского языка используются измененные буквы Ā , Č , Ḏ , Ē , Ë , Ġ , Ḥ , Ō , Š , Ṣ , Ṭ , Ū , Ž наряду с 26 стандартными символами латинского алфавита. ^[11]
Вьетнамский язык использует рожковый диакритический знак для букв ơ и ư ; циркумфлекс для букв â , ê , и ô ; бреве для буквы ă ; и черту через букву đ . Отдельно в нем также есть á, à, ả, ã и ạ, пять тонов, используемых для гласных, помимо ровного тона «a».

Буквы кириллицы

В белорусской и узбекской кириллице есть буква ⟨ ў ⟩ .
В белорусском, болгарском , русском и украинском языках есть буква ⟨ й ⟩ .
В белорусском и русском языках есть буква ⟨ ё ⟩ . В русском языке эта буква обычно заменяется на ⟨ е ⟩ , хотя у неё разное произношение. Использование ⟨е⟩ вместо ⟨ё⟩ не влияет на произношение. Ё всегда используется в детских книгах и словарях. Минимальная пара — все ( вс'е , мн. ч.) и всё ( вс'о , сущ. ч.). В белорусском языке замена на ⟨е⟩ является ошибкой; в русском языке допустимо использовать либо ⟨е⟩ , либо ⟨ё⟩ вместо ⟨ё⟩, но первое чаще встречается в повседневной письменной речи (в отличие от учебной или детской письменной речи).
Кириллический украинский алфавит состоит из букв ⟨ґ⟩ , ⟨й⟩ и ⟨ї⟩ . В украинской латыни их гораздо больше .
В македонском языке есть буквы ⟨ ќ ⟩ и ⟨ ѓ ⟩ .
В болгарском и македонском языках притяжательное местоимение ѝ ( ì , «её») пишется с ударением, чтобы отличить его от союза и ( i , «и»).
Знак ударения ◌́ над любой гласной в кириллических алфавитах используется в словарях, книгах для детей и учебниках для изучения иностранных языков для обозначения ударения в слове, а также для устранения неоднозначности в словах с похожим написанием, но разным лексическим ударением.

Диакритические знаки, не создающие новых букв

Английский

Английский — один из немногих европейских языков, в котором не так много слов, содержащих диакритические знаки. Вместо этого диграфы являются основным способом, которым современный английский алфавит адаптирует латынь к своим фонемам. Исключениями являются неассимилированные иностранные заимствования, включая заимствования из французского (и, все чаще, из испанского , например, jalapeño и piñata ); однако диакритический знак в таких словах иногда опускается. Заимствованные слова, которые часто появляются с диакритическим знаком в английском языке, включают café , résumé или resumé (употребление, которое помогает отличить его от глагола resume ), soufflé и naïveté (см. английские термины с диакритическими знаками ). В более старой практике (и даже среди некоторых консервативных в орфографическом отношении современных писателей) можно увидеть такие примеры, как elite , mêlée и rôle.

Англоговорящие и писатели раньше использовали диэрезис чаще, чем сейчас, в таких словах, как coöperation (от фр. coopération ), zoölogy (от греч. zoologia ) и seeër (теперь чаще see-er или просто seer ) как способ указать, что соседние гласные принадлежат к разным слогам, но эта практика стала гораздо менее распространенной. Журнал New Yorker является крупным изданием, которое продолжает использовать диэрезис вместо дефиса для ясности и экономии места. ^[12]

Несколько английских слов, часто используемых вне контекста, особенно изолированно, можно отличить от других слов с тем же написанием только с помощью диакритических знаков или измененных букв. К ним относятся exposé , lamé , maté , öre , øre , résumé и rosé. В нескольких словах диакритические знаки, которых не было в оригинале, были добавлены для устранения неоднозначности, как в maté ( от исп. и порт. mate) , saké ( стандартная романизация японского языка не имеет знака ударения ) и Malé ( от дивехи ܉ܧ܍ܬ ) , чтобы четко отличать их от английских слов mate, sake и male.

Акут и гравис иногда используются в поэзии и текстах песен: акут для явного указания на ударение, которое может быть неоднозначным ( rébel против rebél ) или нестандартным по метрическим причинам ( caléndar ), гравис для указания на то, что обычно непроизносимый или выпадающий слог произносится ( warnèd, parlìament ).

В некоторых личных именах, таких как Рене и Зоэ , часто существуют два варианта написания, и предпочтения самого человека будут известны только его близким. Даже когда имя человека пишется с диакритическим знаком, как Шарлотта Бронте , это может быть пропущено в англоязычных статьях и даже в официальных документах, таких как паспорта , либо из-за небрежности, когда машинистка не знает, как вводить буквы с диакритическими знаками, либо по техническим причинам ( например, Калифорния не допускает ^{[ требуется разъяснение ]} имен с диакритическими знаками, поскольку компьютерная система не может обрабатывать такие символы). Они также появляются в некоторых всемирных названиях компаний и/или товарных знаках, таких как Nestlé и Citroën .

Другие языки

В следующих языках есть сочетания букв и диакритических знаков, которые не считаются самостоятельными буквами.

В африкаансе диэрезис используется для обозначения гласных, которые произносятся отдельно, а не так, как можно было бы ожидать, когда они встречаются вместе, например, voel (чувствовать) в отличие от voël (птица). Циркумфлекс используется в ê, î, ô и û, как правило, для обозначения долгих гласных закрытого и среднего подъема , в отличие от гласных открытого и среднего подъема , например, в словах wêreld (мир) и môre (утро, завтра). Акут используется для выделения так же, как подчеркивание или написание жирным шрифтом или курсивом в английском языке, например, Dit is jóú boek (это твоя книга). Гравус используется для различения слов, которые отличаются только местом ударения, например, appel (яблоко) и appèl (обращение), а также в некоторых случаях, когда это не влияет на произношение, но различает омофоны. Два наиболее распространенных случая последнего встречаются в поговорках òf... òf (или... или) и nòg... nòg (ни... ни), чтобы отличать их от of (или) и nog (снова, все еще).
В языке аймара над буквами p, q, t, k, ch используется диакритический знак «рог» .
В каталонском языке имеются следующие составные знаки: à, ç, é, è, í, ï, ó, ò, ú, ü, l·l . Акут и гравис указывают на ударение и высоту гласного , седиль отмечает результат исторической палатализации , диэрезис указывает либо на паузу , либо на то, что буква u произносится, когда за графемами gü, qü следуют e или i , интерпункт (·) различает различные значения ll/l·l .
Некоторые орфографии корнского языка, такие как Kernowek Standard и Unified Cornish, используют диакритические знаки, в то время как другие, такие как Kernewek Kemmyn и Standard Written Form, не используют их (или используют только факультативно в учебных материалах).
В голландском языке используется диэрезис. Например, в слове ruïne это означает, что u и i произносятся по отдельности обычным образом, а не так, как обычно произносится сочетание ui . Таким образом, это работает как разделительный знак, а не как указание на альтернативную версию i . Диакритические знаки могут использоваться для акцента ( érg koud для very cold) или для устранения неоднозначности между несколькими словами, которые пишутся одинаково, когда контекст не указывает на правильное значение ( één appel = одно яблоко, een appel = яблоко; vóórkomen = происходить, voorkómen = предотвращать). Граве и акут используются в очень небольшом количестве слов, в основном заимствованных. ç также встречается в некоторых заимствованных словах. ^[13]
Фарерский . Нефарерские акцентированные буквы не добавлены в фарерский алфавит. К ним относятся é , ö , ü , å, а в последнее время также такие буквы, как š , ł и ć .
В филиппинском языке есть следующие составные символы: á, à, â, é, è, ê, í, ì, î, ó, ò, ô, ú, ù, û . Однако повседневное использование диакритических знаков в филиппинском языке встречается редко и предназначено только для различения омонимов между словом с обычным предпоследним ударением и словом с другим расположением ударения. Это помогает как пониманию, так и произношению, если оба слова относительно смежны в тексте или если само слово неоднозначно по значению. Буква ñ (" eñe ") не является n с диакритическим знаком, а скорее сопоставляется как отдельная буква, одна из восьми, заимствованных из испанского языка. Диакритические знаки появляются в испанских заимствованиях и именах, соблюдая правила испанской орфографии.
Финский . Кароны в š и ž встречаются только в иностранных именах собственных и заимствованных словах , но могут быть заменены на sh или zh, если и только если технически невозможно воспроизвести акцентированные буквы в среде. В отличие от эстонского языка, š и ž не считаются отдельными буквами в финском языке.
Во французском языке используется пять диакритических знаков. Грав ( accent grave ) обозначает звук /ɛ/ над e, как в père («отец»), или используется для различения слов, которые в противном случае являются омографами, такими как a / à («имеет»/«к») или ou / où («или»/«где»). Акут ( accent aigu ) используется только в «é», изменяя «e» для получения звука /e/ , как в étoile («звезда»). Циркумфлекс ( accent circonflexe ) обычно обозначает, что S когда-то следовала за гласной в старофранцузском или латинском, как в fête («вечеринка»), старофранцузское — feste , а латинское — festum . Изменяет ли циркумфлекс произношение гласной, зависит от диалекта и гласной. Седиль ( cédille ) указывает на то, что обычно твёрдая «c » (перед гласными «a», «o» и «u») произносится как /s/ , как в слове ça («тот»). Диакритический знак диэрезис ( фр . tréma ) указывает на то, что две соседние гласные, которые обычно произносятся как одна, следует произносить отдельно, как в слове Noël («Рождество»).
Галисийские гласные могут иметь ударение ( á, é, í, ó, ú ) для обозначения ударения или различия между двумя в остальном одинаково написанными словами ( é , 'is' против e , 'and'), но диэрезис используется только с ï и ü, чтобы показать два отдельных гласных звука в произношении. Только в иностранных словах галисийский может использовать другие диакритические знаки, такие как ç (распространенные в Средние века), ê или à .
В немецком языке используются три умлаутированных символа ä , ö и ü . Эти диакритические знаки обозначают изменения гласных. Например, слово Ofen [ˈoːfən] «печь» имеет множественное число Öfen [ˈøːfən] . Знак возник как надстрочный e ; рукописная готическая e напоминает две параллельные вертикальные линии, как диэрезис. Благодаря этой истории «ä», «ö» и «ü» могут быть написаны как «ae», «oe» и «ue» соответственно, если умлаутные буквы недоступны.
В иврите есть много различных диакритических знаков, известных как никкуд , которые используются над и под письмом для представления гласных. Их следует отличать от кантилляции , которая является ключом к произношению и синтаксису.
Международный фонетический алфавит использует диакритические символы и знаки для обозначения фонетических особенностей или вторичных артикуляций.
В ирландском языке акут обозначает долгую гласную : á , é , í , ó , ú . На ирландском языке он известен как síneadh fada «длинный знак» или просто fada «длинный». В старом гэльском шрифте дополнительные точки используются для обозначения лениции согласного: ḃ , ċ , ḋ , ḟ , ġ , ṁ , ṗ , ṡ , ṫ .
В итальянском языке в основном используются акут и гравис ( à , è / é , ì , ò / ó , ù ), как правило, для обозначения ударного слога, который не был бы ударным при обычных правилах произношения, но иногда также для различения слов, которые в противном случае пишутся одинаково (например, "e" и; "è", is). Несмотря на его редкое использование, итальянская орфография допускает циркумфлекс (î) также в двух случаях: его можно найти в старом литературном контексте (примерно до 19 века) для обозначения синкопы ( fêro→fecero, они делали), или в современном итальянском для обозначения сокращения ″-ii″ из-за окончания множественного числа -i, тогда как корень заканчивается на другое -i; например, s. demonio, p. demonii→demonî; в этом случае циркумфлекс также сигнализирует о том, что подразумеваемое слово не является demoni, множественным числом от «demone», путем смещения ударения (demònî, «дьяволы»; dèmoni, «демоны»).
В литовских словарях для обозначения типов ударения в системе тонального акцента используются знаки акута , грависа и тильды .
В мальтийском языке ударение на гласных также ставится на конце слова, состоящего из двух и более слогов: строчные буквы: à, è, ì, ò, ù; заглавные буквы: À, È, Ì, Ò, Ù.
В языке маори для обозначения долгих гласных используются макроны.
В окситанском языке есть следующие составные знаки: á, à, ç, é, è, í, ï, ó, ò, ú, ü, n·h, s·h . Акут и гравис указывают на ударение и высоту гласного , седиль отмечает результат исторической палатализации , диэрезис указывает либо на паузу , либо на то, что буква u произносится, когда за графемами gü, qü следуют e или i , а интерпункт (·) различает разные значения nh/n·h и sh/s·h (т. е. что буквы должны произноситься раздельно, а не объединяться в «ny» и «sh»).
В португальском языке есть следующие составные символы: à, á, â, ã, ç, é, ê, í, ó, ô, õ, ú . Акут и циркумфлекс указывают на ударение и высоту гласной, могила указывает на кразис, тильда представляет назализацию, а седиль отмечает результат исторического лениции.
Акуты также используются в славянских словарях и учебниках для обозначения лексического ударения , которое ставится над гласной ударного слога. Это также может служить для устранения неоднозначности значения (например, в русском языке писа́ть ( pisáť ) означает «писать», но пи́сать ( písať ) означает «писать»), или «бо́льшая часть» (самая большая часть) vs «больша́я часть» (большая часть).
В испанском языке используются акут и диэрезис. Акут используется на гласной в ударном слоге в словах с нерегулярным ударением. Он также может использоваться для «разрыва» дифтонга, как в tío (произносится [ˈti.o] , а не [ˈtjo] , как это было бы без ударения). Более того, акут может использоваться для различения слов, которые в остальном пишутся одинаково, например, si («если») и sí («да»), а также для различения вопросительных и восклицательных местоимений от омофонов с другой грамматической функцией, например, donde/¿dónde? («где»/«где?») или como/¿cómo? («как»/«как?»). Акут также может использоваться для избежания типографской двусмысленности, как в 1 ó 2 («1 или 2»; без акута это можно было бы интерпретировать как «1 0 2». Трема используется только над u ( ü ), чтобы она произносилась как [w] в сочетаниях gue и gui, где u обычно не произносится, например ambigüedad. В поэзии трема может использоваться над i и u как способ заставить сделать паузу. Как было указано выше, в носовом ñ тильда ( закорючка ) вообще не считается диакритическим знаком, а является составной частью отдельного глифа, имеющего собственную главу в словаре: глифа, обозначающего 15-ю букву испанского алфавита.
В шведском языке акут используется для указания нестандартного ударения, например, в kafé (кафе) и resumé (резюме). Иногда это помогает разрешить двусмысленности, например, ide (спячка) против idé (идея). В этих словах акут не является необязательным. В некоторых именах собственных используются нестандартные диакритические знаки, например, Carolina Klüft и Staël von Holstein . Для иностранных заимствованных слов настоятельно рекомендуется использовать оригинальные ударения, если только слово не было внедрено в язык, в этом случае они необязательны. Следовательно, crème fraîche, но ampere . В шведском языке также есть буквы å , ä и ö , но они считаются отдельными буквами, а не a и o с диакритическими знаками.
В тамильском языке нет диакритических знаков, но в качестве диакритических знаков используются арабские цифры 2, 3 и 4 для обозначения придыхательных, звонких и звонких-придыхательных согласных при использовании тамильского письма для записи длинных отрывков на санскрите .
В тайском языке существует собственная система диакритических знаков, происходящая от индийских цифр , которые обозначают различные тона .
Вьетнамский язык использует акут ( dấu sắc ), могилу ( dấu huyền ), тильду ( dấu nga ), нижнюю точку ( dấu nặng ) и крючок над гласными ( dấu hỏi ) на гласных как индикаторы тона .
В валлийском языке используются циркумфлекс, диэрезис, акут и гравис на семи гласных a, e, i, o, u, w, y . Наиболее распространенным является циркумфлекс (который он называет bach , что означает «маленькая крыша», или acen grom «изогнутый акцент», или hirnod «длинный знак») для обозначения долгого гласного, обычно для устранения неоднозначности его от похожего слова с коротким гласным или полугласным. Более редкий гравис имеет противоположный эффект, сокращая гласные звуки, которые обычно произносятся долго. Акут и диэрезис также иногда используются для обозначения ударения и разделения гласных соответственно. W -циркумфлекс ŵ и y -циркумфлекс ŷ являются одними из наиболее часто используемых символов с ударением в валлийском языке, но необычны для языков в целом, и до недавнего времени их было очень трудно получить в текстовых и HTML-документах.

Транслитерация

Некоторые языки, в которых не используется латинский алфавит , транслитерируются или романизируются с помощью диакритических знаков. Примеры:

В арабском языке существует несколько романизаций , в зависимости от типа приложения, региона, целевой аудитории, страны и т. д. Многие из них широко используют диакритические знаки, например, некоторые методы используют нижнюю точку для передачи эмфатических согласных (ṣ, ṭ, ḍ, ẓ, ḥ). Макрон часто используется для передачи долгих гласных. š часто используется для /ʃ/ , ġ для /ɣ/ .
В китайском языке есть несколько романизаций , в которых используется умлаут, но только на u ( ü ). В Hanyu Pinyin четыре тона мандаринского китайского языка обозначаются диакритическими знаками macron (первый тон), shark (второй тон), caron (третий тон) и grave (четвертый тон). Пример: ā, á, ǎ, à .
Романизированный японский язык ( ромадзи ) иногда использует макроны для обозначения долгих гласных. Система романизации Хепберн использует макроны для обозначения долгих гласных , а системы Кунрей-сики и Нихон-сики используют циркумфлекс .
Санскрит , как и многие его потомки, такие как хинди и бенгали , использует систему романизации без потерь , IAST . Она включает в себя несколько букв с диакритическими знаками, такими как макрон (ā, ī, ū), точки над и под точками (ṛ, ḥ, ṃ, ṇ, ṣ, ṭ, ḍ), а также несколько других (ś, ñ).

Пределы

орфографический

Возможно, наибольшее количество комбинированных диакритических знаков, необходимых для составления допустимого символа в любом языке Unicode, составляет 8, для «известного кластера графем в тибетском и ранджанском письмах» или HAKṢHMALAWARAYAṀ . ^[14]

Он состоит из

U+0F67 ཧ ТИБЕТСКАЯ БУКВА ХА
U+0F90 ྐ ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА КА
U+0FB5 ྵ ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА SSA
U+0FA8 ྨ ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА МА
U+0FB3 ླ ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА LA
U+0FBA ྺ ТИБЕТСКАЯ ПРИСОЕДИНЕННАЯ БУКВА ФИКСИРОВАННОЙ ФОРМЫ WA
U+0FBC ྼ ТИБЕТСКАЯ ПОДЧИНЕННАЯ БУКВА ФИКСИРОВАННОЙ ФОРМЫ RA
U+0FBB ྻ ТИБЕТСКАЯ ПРИСОЕДИНЕННАЯ БУКВА ФИКСИРОВАННОЙ ФОРМЫ YA
U+0F82 ྂ ТИБЕТСКИЙ ЗНАК NYI ZLA NAA DA

Пример рендеринга, который может быть некорректным в зависимости от браузера:

ཧྐྵྨླྺྼྻྂ

Неортографический/орнаментальный

Некоторые пользователи исследовали ограничения отображения в веб-браузерах и другом программном обеспечении, «украшая» слова чрезмерными бессмысленными диакритическими знаками на символ, чтобы создать так называемый текст Zalgo .

Список диакритических знаков в Unicode

Диакритические знаки для латинского алфавита в Unicode:

Смотрите также

Латинские алфавиты
Альтернативный код
Категория:Буквы с диакритическими знаками
Последовательность сортировки
Сочетание характера
Составить ключ
Английские термины с диакритическими знаками
Хэви-метал умлаут
ISO/IEC 8859 8-битные расширенные европейские кодировки символов латинского алфавита
латинский алфавит
Список латинских букв
Список предварительно составленных латинских символов в Unicode
Список городов США с диакритическими знаками
Романизация

Примечания

↑ Сообщается, что The New Yorker^{является уникальным изданием, продолжающим использовать их. [1]}

Ссылки

^ Баум, Дэн (16 декабря 2010 г.). «Странный знак The New Yorker — диэрезис». dscriber . Архивировано из оригинала 16 декабря 2010 г. Среди многих загадок The New Yorker есть этот забавный маленький умлаут над словами вроде coöperate и reëlect. The New Yorker, кажется, единственное издание на планете, которое его использует, и я всегда находил его немного претенциозным, пока не провел небольшое исследование. Оказывается, это не умлаут. Это диэрезис.
^ Sweet, Henry (1877). Справочник по фонетике . Кембридж: Издательство Кембриджского университета. стр. 174–175. Даже буквы с ударениями и диакритическими знаками [...], отлитые только для нескольких шрифтов, действуют практически как новые буквы. [...] Мы можем рассматривать h в sh и th просто как диакритический знак, написанный для удобства на одной строке с буквой, которую он изменяет.
^ Оксфордский словарь английского языка
^ Нестле, Эберхард (1888). Syrische Grammatik mit Litteratur, Chrestomathie und Glossar . Берлин: Verlagsbuchhandlung Х. Ройтера. [переведено на английский язык как сирийская грамматика с библиографией, хрестоматией и глоссарием Р. С. Кеннеди. Лондон: Уильямс и Норгейт, 1889].
^ Кокли, Дж. Ф. (2002). Парадигмы и упражнения Робинсона по сирийской грамматике (5-е изд.). Oxford University Press. ISBN 978-0-19-926129-1 .
^ Михаэлис, Иоаннис Давидис (1784). Грамматика Сирийская .
^ Gramática de la Llingua Asturiana (PDF) (3-е изд.). Академия языка Астурии. 2001. раздел 1.2. ISBN 84-8168-310-8. Архивировано из оригинала (PDF) 2011-05-25 . Получено 2011-06-07 .
^ http://www.juls.savba.sk/ediela/psp2000/psp.pdf страница 12, раздел I.2
^ Grønlands sprognævn (1992)
^ Петерсен (1990)
^ SP Brock, «Введение в сирийские исследования», в JH Eaton (ред.), Horizons in Semitic Studies (1980)
↑ Норрис, Мэри (26 апреля 2012 г.). «Проклятие диэрезиса». The New Yorker . Получено 18 апреля 2014 г.
^ ван Геловен, Сандер (2012). Diakritische tekens in het Nederlands (на голландском языке). Утрехт: Хеллебаард. Архивировано из оригинала 29 октября 2013 г.
^ Стил, Шон (2010-01-25). "Самое большое количество сочетающихся символов в глифе/символе/чем-либо в Unicode". Microsoft. Архивировано из оригинала 2019-05-16 . Получено 2019-11-25 .

Внешние ссылки

Контекст диакритических знаков | Исследовательский проект Архивировано 2014-10-12 на Wayback Machine
Проект «Диакритика»
Юникод
Орфографические диакритические знаки и многоязычные вычисления, Дж. К. Уэллс
Заметки об использовании диакритических знаков, Маркус Лонг
Ввод международных символов (в Linux, KDE)
Стандартный набор символов для Macintosh PDF в Adobe