stringtranslate.com

Необъединитель нулевой ширины

Символ клавиатуры ISO‌ для ZWNJ
ZWNJ между двойной широкой тильдой и акутом центрирует акут над тильдой, а не над , как это было бы в противном случае. [1]

Необъединитель нулевой ширины ( ZWNJ , / z w ɪ n / ; отображается: ; HTML сущность : или ) — это непечатаемый символ, используемый при компьютеризации систем письма , использующих лигатуры . При размещении между двумя символами, которые в противном случае были бы соединены в лигатуру, ZWNJ заставляет их печататься в их конечной и начальной формах соответственно. Это также эффект символа пробела , но ZWNJ используется, когда желательно расположить символы ближе друг к другу или связать слово с его морфемой.‌‌

ZWNJ кодируется в Юникоде как U+200C НУЛЕВАЯ ШИРИНА, НЕ ОБЪЕДИНЯЮЩАЯСЯ ( ).

Использование ZWNJ для правильной типографики

В некоторых языках ZWNJ необходим для однозначного указания правильной типографской формы последовательности символов.

На рисунке показано, как выглядит код, когда он отображается правильно, и в каждой строке правильные и неправильные изображения должны отличаться. В системе, которая не настроена на правильное отображение Unicode, правильное и неправильное отображение могут выглядеть одинаково, или любое из них может существенно отличаться от соответствующего изображения.

В этом примере из библейского иврита размещение метега слева от сеголя является правильным, что означает знак шва, написанный как две вертикальные точки для обозначения краткой гласной. Если бы метег был размещен слева от шва , это было бы ошибкой. В современном иврите нет причин использовать метег для разговорной речи, поэтому он редко используется в наборе на современном иврите.

В немецкой типографике лигатуры не могут пересекать границы составляющих внутри соединений . Таким образом, в первом немецком примере префикс Auf- отделен от остальной части слова, чтобы запретить лигатуру fl . Аналогично, в английском языке некоторые утверждают, что лигатуры не должны пересекать границы морфем . [2] [ требуется лучший источник ] Например, в некоторых словах fly и fish являются морфемами, а в других — нет; поэтому, по их рассуждениям, такие слова, как deaf‌ly и self‌ish (здесь показаны с несоединительным словом) не должны иметь лигатур (соответственно fl и fi), в то время как dayfly и catfish должны их иметь.

В персидском языке этот символ широко используется для определенных префиксов, суффиксов и сложных слов. [3] Он необходим для устранения неоднозначности составных слов от несоставных, в которых используется полный пробел.

В малайском письме джави ZWNJ используется всякий раз, когда в конце любой фразы написано более одного согласного ( سا ء ين‌س , малайское слово для «науки» или sains в латинском письме, произносится /ˈsa.ɪ ns /.) Он используется для обозначения того, что между двумя согласными буквами нет гласных (в частности, «a» или «ə»), поскольку в противном случае سا ء ينس произносилось бы либо /ˈsa.ɪnas/, либо /ˈsa.ɪnəs/. Пробел разделил бы фразу на разные слова, где такие фразы, как سا ء ين س, теперь означали бы «подписать арабскую букву грех » ( sain sin в латинском письме.)

Использование ZWNJ для отображения альтернативных форм

Использование ZWNJ и ZWJ для выбора альтернативных форм деванагари , тамильского , каннада , сингальского языка и эмодзи .

В индийских письменностях вставка ZWNJ после согласной с халантом или перед зависимой гласной препятствует правильному соединению символов: [4]

В деванагари символы क् и обычно объединяются, образуя क्ष , но когда между ними вставляется ZWNJ, вместо этого появляется क्‌ष (код: ).क्‌ष

В каннада символы ನ್ и ನ объединяются, образуя ನ್ನ, но когда между ними вставляется ZWNJ, отображается ನ್‌ನ. Этот стиль обычно используется для записи иностранных слов в письме каннада: « Facebook » пишется как ಫೇಸ್‌ಬುಕ್, хотя его можно написать как ಫೇಸ್ಬುಕ್. ರಾಜ್‌ಕುಮಾರ್ и ರಾಮ್‌ಗೊಪಾಲ್ являются примерами других имен собственных, которым требуется ZWNJ.

Чтобы вставить ZWNJ на каннада, используйте Shift-V в Linux ( iBus , InScript). В Windows ( InScript ) вы можете создать ZWNJ с помощью Ctrl+Shift+2 или Alt+0157. Для LipikaIME на Mac курсор возвращает ZWNJ.

В бенгальском языке , когда бенгальская буква য встречается в конце группы согласных, то есть, когда য предшествует ◌্ ( hôsôntô ), она появляется в особой форме,Перевод бенгальского Ja-phala, известный как য-ফলা ( ja-phala ), например, в ক্য (ক ্ য). Таким образом, когда мы хотим написать উদ্‌যাপন (правильное бенгальское написание для celebration), оно становится উদ্যাপন (что неверно). Здесь работает ZWNJ. Если мы хотим написать উদ্‌যাপন, мы должны написать в следующей последовательности (код: উদ্যাপন), [5] [6] тогда мы получим правильный рендеринг и правильное написание. В бенгальском языке hôsôntô используется для создания любых союзов и фала (таких как ra-fala, ba-fala и т. д.) . Там, где hôsôntô необходимо отобразить явно, необходимо вставить ZWNJ после hôsôntô .

Также в бенгальском языке , когда бенгальская буква র встречается в начале согласного кластера — например, র, за которым следует hôsôntô — она появляется в особой форме, известной как রেফ (reph). Таким образом, последовательность র ্ য по умолчанию отображается как র্য. Когда необходимо сохранить форму য-ফলা, а не форму রেফ, ZWJ U+200D ZERO WIDTH JOINER ( ) вставляется сразу после র, например, র‍্য для отображения র‍্য. [5] [6] র‍্য обычно используется для заимствований из английского языка, таких как র‍্যাম (RAM), র‍্যান্ডম (случайный) и т. д.

Символ

Немецкая клавиатура T2 (фрагмент), на клавише «.» изображен символ ZWNJ

Символ, который должен использоваться на клавиатурах, позволяющих вводить ZWNJ напрямую, стандартизирован в Поправке 1 (2012) к стандарту ISO/IEC 9995-7 :2009 «Информационные технологии. Раскладки клавиатуры для текстовых и офисных систем. Символы, используемые для представления функций» как символ номер 81, а также в стандарте IEC 60417 «Графические символы для использования на оборудовании» как символ номер IEC 60417-6177-2.

Смотрите также

Ссылки

  1. ^ Наварро Томас (1962) Лингвистический атлас Иберийского полуострова (ALPI), том 1 «Fonética». Высший совет научных исследований, Мадрид. С карты 69, локация 240.
  2. ^ «Когда не следует использовать лигатуру при наборе текста на английском языке?». english.stackexchange.org .
  3. ^ "The Zero-Width-Non-Joiner". Национальный центр языковых ресурсов Ближнего Востока . Архивировано из оригинала 8 июля 2012 г.
  4. ^ "FAQ - Индийские письменности и языки". www.unicode.org . Получено 2020-03-15 .
  5. ^ ab "Часто задаваемые вопросы по бенгальскому языку в Unicode".
  6. ^ ab См. также главу 12 Unicode, бенгальский (Bangla) между страницами 475 и 479 здесь в формате PDF.

Внешние ссылки