Диакритические знаки из двух точек ¨ , расположенных рядом над или под буквой, используются в нескольких языках для различных целей. Наиболее знакомыми для носителей английского языка являются диэрезис и умлаут , хотя есть и множество других. Например, в албанском языке ë представляет собой шва . Такие диакритические знаки также иногда используются по стилистическим причинам (как в фамилии Бронте или названии группы Mötley Crüe ).
В современных компьютерных системах, использующих Unicode , двухточечные диакритические знаки почти всегда кодируются одинаково, имея одинаковую кодовую точку . [1] Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИАЭРЕЗОЙ представляет как o-умляут, так и o-диарезис . Их внешний вид в печати или на экране может различаться в разных гарнитурах , но редко в пределах одной гарнитуры.
Слово «трема» ( фр . tréma ), используемое в лингвистике и классической науке , описывает форму как диакритического знака умлаута, так и диэрезиса, а не их функцию, и используется в этих контекстах для обозначения того и другого.
Как диакритический знак «диерезис», он используется для обозначения разделения двух отдельных гласных в соседних слогах, когда встречается диерезис (или хиатус) , чтобы отличить его от диграфа или дифтонга . Например, в устаревшем написании «coöperate» диерезис напоминал читателю, что слово имеет четыре слога co-op-er-ate , а не три. Он используется в нескольких языках Западной и Южной Европы, хотя сейчас редко в английском языке. [2] Одно из известных его применений — во французском языке — диерезис используется в слове naïve, которое в английском языке обычно пишется без диерезиса. Однако во французском языке обязательно указывать, что оно произносится как [na.iv], а не [nev].
Как диакритический знак «умлаут», он обозначает звуковой сдвиг — также известный как умлаут — при котором гласный заднего ряда становится гласным переднего ряда . Это специфическая черта немецкого и других германских языков, влияющая на графемы ⟨a⟩ , ⟨o⟩ , ⟨u⟩ и ⟨au⟩ , которые модифицируются в ⟨ ä ⟩ , ⟨ ö ⟩ , ⟨ ü ⟩ и ⟨äu⟩ .
Он происходит от шрифта Зюттерлина , который ранее широко использовался в немецком рукописном письме, в котором буква e формируется в виде двух коротких параллельных вертикальных линий, расположенных очень близко друг к другу (см. в разделе Характеристики шрифта Зюттерлина ).
Диакритический знак в виде двух точек иногда используется и по чисто стилистическим причинам. Например, семья Бронте , чья фамилия произошла от гэльского языка и была англизирована как «Пранти» или «Бранти»: В какой-то момент отец сестёр, Патрик Бронте (урождённый Бранти), решил использовать альтернативное написание с диакритическим знаком трема над конечной ⟨e⟩ , чтобы указать, что имя состоит из двух слогов.
Аналогично « металлический умлаут » — это диакритический знак, который иногда используется без причины или в декоративных целях над буквами в названиях хард-рок- или хэви-метал -групп, например, Motörhead и Mötley Crüe , а также пародийных групп, таких как Spın̈al Tap .
Двойная точка также используется как диакритический знак в случаях, когда она не выполняет функции ни диэрезиса, ни умлаута. В Международном фонетическом алфавите (МФА) двойная точка над буквой используется для обозначения централизованной гласной , что больше похоже на умлаут, чем на диэрезис. В других языках она используется для обозначения долготы гласной, назализирования, тона и различных других случаев, когда диэрезис или умлаут были доступны типографически. МФА использует двойную точку под буквой для обозначения придыхательного (бормотания) голоса . [3] [b]
Якальтекский ( язык майя ) и малагасийский — одни из немногих языков, в которых есть двойная точка над буквой «n»; в обоих языках n̈ — это велярный носовой звук [ŋ] .
В удмуртском языке двойная точка также используется с согласными буквами ӝ [dʒ] (от ж [ʒ] ), ӟ [dʑ] (от з [z] ~ [ʑ] ) и ӵ [tʃ] (от ч [tɕ] ).
Когда различие важно, Ḧ и ẍ используются для представления [ħ] и [ɣ] в курдском алфавите курманджи (которые в противном случае представлены как "h" и "x"). Эти звуки заимствованы из арабского языка.
Ẅ и ÿ : Ÿ — это, как правило, гласный звук, но в тлингитском языке он используется как (полугласный) согласный [ɰ] (a [w] без использования губ) . Этот звук также встречается в прибрежном цимшианском языке , где он пишется как ẅ .
В ряде языков Вануату используются двойные точки на согласных, чтобы представлять лингволабиальные (или «апиколабиальные») фонемы в их орфографии. Так, Араки противопоставляет билабиальный p [p] лингволабиальному p̈ [t̼] ; билабиальный m [m] лингволабиальному m̈ [n̼] ; и билабиальный v [β] лингволабиальному v̈ [ð̼] .
Сенека использует ⟨s̈⟩ вместо [ʃ] .
В арабском языке буква ẗ используется в транслитерации ISO 233 для tāʾ marbūṭah [ة], используемой для обозначения женского рода в существительных и прилагательных.
В сирийском языке используется две точки над буквой, называемые Siyame, чтобы указать, что слово следует понимать как множественное число. Например, ܒܝܬܐ ( bayta ) означает «дом», а ܒܝ̈ܬܐ ( bayte ) означает «дома». Этот знак используется, особенно когда отсутствуют гласные знаки, которые могли бы различать эти две формы. Хотя происхождение Siyame отличается от происхождения знака диэрезиса, в современных компьютерных системах оба представлены одним и тем же символом Unicode. Однако это часто приводит к неправильной передаче сирийского текста.
В письме н'ко , используемом для записи языков манде в Западной Африке, используется двухточечный диакритический знак (среди прочих) для представления неродных звуков. Точки немного больше тех, которые используются для диэрезиса или умлаута.
В IPA указан «умлаут с нижним индексом», например, хинди [kʊm̤ar] «гончар»; [3] : 25 система латинизации ALA-LC предусматривает его использование и является одной из основных схем латинизации персидского языка (например, переводя ⟨ ض ⟩ как ⟨z̤⟩ ). Эта нотация использовалась для записи некоторых азиатских языков латинским шрифтом, например, Red Karen .
Двойная точка под гласной до сих пор используется в романизации восточноминьского языка в Фучжоу для обозначения измененного гласного звука; размещение диакритического знака-модификатора под гласной буквой упрощает его сочетание с тональными диакритическими знаками над буквой, как в слове Mìng-dĕ̤ng-ngṳ̄ («восточноминьский язык»).
Диакритические знаки 〮 и 〯 , известные как Bangjeom ( 방점; 傍點), использовались для обозначения тональных акцентов в хангыле для среднекорейского языка . Они писались слева от слога в вертикальном письме и над слогом в горизонтальном письме.
Кодировка символов обычно рассматривает умлаут и диарезис как один и тот же диакритический знак. Unicode называет их диарезисами, не делая никаких различий, хотя сам термин имеет более точное литературное значение. Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИЕРЕЗОЙ представляет как o-умлаут , так и o-диарезис , в то время как для представления всех таких случаев используются похожие коды.
Unicode кодирует ряд случаев «буквы с двумя диакритическими знаками» как предварительные символы , и они показаны ниже. (Unicode использует термин «Диаэрезис» для всех двухточечных диакритических знаков, независимо от фактического термина, используемого для рассматриваемого языка.) Кроме того, многие другие символы могут быть составлены с помощью возможности комбинирования символов , U+0308 ◌̈ ОБЪЕДИНЕНИЕ ДИАЭРЕЗЫ , которая может использоваться с любой буквой или другим диакритическим знаком для создания настраиваемого символа, но это не означает, что результат имеет какое-либо реальное применение, и не показан в таблице.
Как объединяющий символ U+0308 , так и предварительно составленные кодовые точки могут рассматриваться как умлаут или диэрезис в зависимости от контекста. Возможны составные диакритические знаки, например, U+01DA ǚ СТРОЧНАЯ ЛАТИНСКАЯ БУКВА U С ДИЭРЕЗОЙ И КАРОНОМ , используемые в качестве тональных знаков для Hanyu Pinyin , в котором используются как диакритический знак из двух точек, так и диакритический знак карона . И наоборот, когда буква, на которую нужно поставить ударение, — это ⟨i⟩ , диакритический знак заменяет букву , таким образом: ⟨ï⟩ .
Иногда необходимо различать знак умлаута и знак диэрезиса. Например, любой из них может встречаться в немецком имени . ISO/IEC JTC 1/SC 2/WG 2 рекомендует следующее для таких случаев: [6]
Тот же совет можно найти в официальном разделе часто задаваемых вопросов по Unicode. [7]
Начиная с версии 3.2.0, Unicode также предоставляет U+0364 ◌ͤ ОБЪЕДИНЕНИЕ СТРОЧНОЙ ЛАТИНСКОЙ БУКВЫ E, что позволяет создавать устаревшую типографику с умлаутом.
Unicode предоставляет объединяющую двойную точку ниже как U+0324 ◌̤ ОБЪЕДИНЯЮЩАЯ ДИАЭРЕЗА НИЖЕ .
Наконец, для использования со скриптом N'Ko есть U+07F3 ◌++ NKO ОБЪЕДИНЯЮЩАЯ ДВОЙНАЯ ТОЧКА НАД НИМИ .
ASCII , семибитный код с 95 «печатаемыми» символами, не предусматривает никаких диакритических знаков. Последующая стандартизация рассматривала ASCII как национальный вариант ISO/IEC 646 в США : французский, немецкий и другие национальные варианты переназначили несколько кодовых точек определенным гласным с диакритическими знаками в качестве предсоставных символов. Некоторые из этих вариантов также определяли последовательность e ,backspace, " как производящую ë , но немногие терминалы поддерживали это.
Последующая (восьмибитная) кодировка символов ISO 8859-1 включает буквы ä , ë , ï , ö , ü и их соответствующие заглавные формы, а также ÿ только в нижнем регистре , с добавлением Ÿ в пересмотренном издании ISO 8859-15 и Windows-1252 .
Кодировка символов обычно рассматривает умлаут и диарезис как один и тот же диакритический знак. Unicode называет их диарезисами, не делая никаких различий, хотя сам термин имеет более точное литературное значение. Например, U+00F6 ö ЛАТИНСКАЯ СТРОЧНАЯ БУКВА O С ДИЕРЕЗОЙ представляет как o-умлаут , так и o-диарезис , в то время как для представления всех таких случаев используются похожие коды.
В странах, где местные языки обычно включают буквы с диакритическими знаками, местные клавиатуры обычно гравируются с этими символами. Если на клавиатуре нет букв с двойными точками, существует ряд способов ввести их в компьютерную систему.
iOS обеспечивает акцентированные буквы посредством нажатия и удержания на большинстве европейских клавиатур с латинским алфавитом, включая английскую. Некоторые раскладки клавиатуры имеют клавиши с комбинированным акцентом, которые могут добавлять акценты к любой подходящей букве. Буква с двойными точками может быть получена нажатием ⌥ Option+ U, а затем буквы. Это работает на английской и других клавиатурах и подробно описано в прилагаемых руководствах. [8]
Для ChromeOS с настройкой клавиатуры US-International комбинация будет + . [9] Для ChromeOS с расширенной настройкой UK используйте , отпустите, затем букву. [ необходима ссылка ] В качестве альтернативы кодовую точку Unicode можно ввести напрямую, используя ++ , отпустите, затем четырехзначный код, затем или . [10]"(letter)AltGr⇧ Shift2Ctrl⇧ Shiftu↵ EnterSpace
Раскладки клавиатуры AZERTY и QZERTY (используемые в большинстве стран Европы) включают в себя стандартные предустановленные символы (буквы с ударениями), которые полностью поддерживаются Microsoft Windows и обычно вызываются с помощью клавиши AltGr .
Для пользователей с раскладкой клавиатуры США в Windows есть настройка «Международная США» , которая поддерживает создание букв с диакритическими знаками путем изменения функции некоторых клавиш на мертвые клавиши . Если пользователь вводит «, на экране ничего не появится, пока пользователь не введет другой символ, после чего символы будут объединены, если это возможно, или добавлены независимо друг от друга, если нет. В качестве альтернативы нужный символ может быть сгенерирован с помощью кодов Alt .
Для пользователей в Великобритании и Ирландии с клавиатурами QWERTY в Windows предусмотрена настройка « Расширенный », позволяющая создать букву с ударением, используя базовую букву.AltGr2
При использовании Microsoft Word для Windows или Outlook букву с двумя точками можно создать, нажав клавишу , а затем саму букву.Ctrl⇧ Shift:
Системы на основе X производят ä, и аналогично для многих других букв, включая заглавные.Composea"
Кроме того, можно ввести любую кодовую точку Unicode, например, + + даст U+00F6, что соответствует ö.Ctrl⇧ ShiftUF6Space
Немецкая клавиатура имеет специальные клавиши для ü ö ä . Скандинавская и турецкая клавиатуры имеют специальные клавиши для соответствующих им языковых букв, включая ö для шведского, финского и исландского языков, а также ö и ü для турецкого языка. Французская и бельгийская клавиатуры AZERTY имеют мертвую клавишу , которая добавляет циркумфлекс (если без Shift) или диэрезис/умлаут (если с Shift) к буквенной клавише, следующей сразу за ней (например, Shift-^ с последующим e дает ë).
Для нелатинских шрифтов греческий и русский используют нажатие и удержание для диакритических знаков с двумя точками только на нескольких символах. Греческая клавиатура имеет варианты dialytica и dialytica–tonos для ипсилона и йоты (ϋ ΰ ϊ ΐ), но не для ε ο α η ω, следуя современному монотонному использованию. Русские клавиатуры имеют отдельные клавиши для е и ё.
В начале 21 века наблюдается заметный рост числа интерфейсов, управляемых стилусом и сенсорным экраном, что делает использование экранных клавиатур, управляемых указательными устройствами (мышью, стилусом или пальцем), более важным. Эти «мягкие» клавиатуры могут копировать клавиши-модификаторы, имеющиеся на аппаратных клавиатурах, но они также могут использовать другие способы выбора опций из базовой клавиши, такие как щелчок правой кнопкой мыши или нажатие и удержание. Мягкие клавиатуры также могут иметь несколько контекстов, таких как буква, цифра и символ.
В HTML гласные с двойными точками можно вводить с помощью ссылки на сущность в форме &?uml;
, где ?
может быть любое из a
, e
, i
, o
, u
, y
или их прописные аналоги. Например, Ä
получается Ä.
TeX (и его производные, в частности LaTeX ) также позволяет размещать двойные точки над буквами. Стандартный способ — использовать управляющую последовательность, \"
за которой следует соответствующая буква, например \"u
. Хорошей практикой является выделение последовательности фигурными скобками: {\"u}
или \"{u}
.
Можно использовать пакет TeX"
"German": он добавляет управляющую последовательность (без обратной косой черты) для создания умлаута. Однако это может вызвать конфликты, если основным языком документа не является немецкий. С момента интеграции Unicode посредством разработки XeTeX и XeLaTeX также стало возможным вводить символы Unicode непосредственно в документ, используя один из признанных методов, таких как клавиша Compose или прямой ввод Unicode .
Традиционные управляющие последовательности TeX по-прежнему можно использовать, и они будут давать тот же результат (в самых ранних версиях TeX эти последовательности создавали двойные точки, которые располагались слишком высоко над телом буквы).
Все эти методы можно использовать со всеми доступными вариантами шрифтов (подчеркнутыми, зачеркнутыми и т. д.).
Среди многих загадок The New Yorker есть этот забавный маленький умлаут над словами вроде coöperate и reëlect. The New Yorker, кажется, единственное издание на планете, которое его использует, и я всегда находил его немного претенциозным, пока не провел небольшое исследование. Оказывается, это не умлаут. Это диэрезис.