stringtranslate.com

Несоединяемый элемент нулевой ширины

Символ клавиатуры ISO для ZWNJ

Несоединитель нулевой ширины ( ZWNJ , / z w ɪ n / ) ( ‌ ) — это непечатаемый символ, используемый при компьютеризации систем письма , в которых используются лигатуры . При размещении между двумя символами, которые в противном случае были бы соединены в лигатуру, ZWNJ заставляет их печатать в окончательной и начальной формах соответственно. Это тоже эффект пробела , но ZWNJ используется, когда желательно расположить символы ближе друг к другу или соединить слово с его морфемой.

ZWNJ кодируется в Юникоде как U+200C НУЛЕВАЯ ШИРИНА, НЕ ОБЪЕДИНЯЮЩАЯСЯ ( ).

Использование ZWNJ и разделителя единиц для правильной типографики.

В некоторых языках ZWNJ необходим для однозначного указания правильной типографской формы последовательности символов.

Раньше использовался разделитель единиц управляющего кода ASCII . [ сомнительно ]

На картинке показано, как выглядит код, когда он отрисован правильно, причем в каждой строке правильные и неправильные картинки должны быть разными. В системе, которая не настроена на правильное отображение Юникода, правильное и неправильное отображение могут выглядеть одинаково или любое из них может значительно отличаться от соответствующего изображения.

В этом примере на библейском иврите правильное расположение метега слева от сегола , на котором есть знак шва , написанный в виде двух вертикальных точек для обозначения короткой гласной. Если бы метег стоял слева от швы , это было бы ошибочно. В современном иврите нет причин использовать метег для разговорной речи, поэтому он редко используется в наборе текста на современном иврите.

В немецкой типографике лигатуры не могут пересекать границы составных частей . Так, в первом немецком примере приставка Auf- отделена от остального слова, чтобы запретить лигатуру fl . Точно так же в английском языке некоторые утверждают, что лигатуры не должны пересекать границы морфем . [1] [ нужен лучший источник ] Например, в некоторых словах «мухать» и «рыба» являются морфемами, а в других — нет; следовательно, по их рассуждениям, такие слова, как глухой и эгоистичный (здесь показаны с несоединяемым знаком), не должны иметь лигатур (соответственно fl и fi), в то время как подсолнечник и сом должны их иметь.

В персидском языке этот символ широко используется для определенных префиксов, суффиксов и сложных слов. [2] Это необходимо для устранения неоднозначности сложных слов из несоставных слов, в которых используется полный пробел.

В малайском алфавите джави ZWNJ используется всякий раз, когда в конце любой фразы пишется более одной согласной ( سا ء ين‌س , по-малайски «наука» или sains в латинском алфавите, произносится /ˈsa.ɪ ns /.). используется для обозначения отсутствия гласных (в частности, «a» или «ə») между двумя согласными буквами, поскольку سا ء ينس в противном случае произносилось бы либо /ˈsa.ɪnas/, либо /ˈsa.ɪnəs/. Пробел будет разделять фразу на разные слова, где такие фразы, как سا ء ين س, теперь будут означать «подписать арабскую букву грех » ( sain sin на латинице).

Использование ZWNJ для отображения альтернативных форм

Использование ZWNJ и ZWJ для выбора альтернативных форм деванагари , тамильского , каннада , сингальского и эмодзи .

В индийских сценариях вставка ZWNJ после согласной либо с галантом , либо перед зависимой гласной препятствует правильному соединению символов: [3]

В Деванагари символы क् и обычно объединяются, образуя क्ष , но когда между ними вставляется ZWNJ, вместо этого отображается क्‌ष (код: ).क्‌ष

В каннада символы ನ್ и ನ объединяются, образуя ನ್ನ, но когда между ними вставляется ZWNJ, отображается ನ್‌ನ. Этот стиль обычно используется для написания слов, отличных от каннада, шрифтом каннада: « Facebook » пишется как ಫೇಸ್‌ಬುಕ್, хотя его можно написать и как ಫೇಸ್ಬುಕ್. ರಾಜ್‌ಕುಮಾರ್ и ರಾಮ್‌ಗೊಪಾಲ್ являются примерами других имен собственных, которым нужен ZWNJ.

В бенгальском языке , когда бенгальская буква য встречается в конце группы согласных, т. е. перед য стоит ◌্ ( hôsôntô ), она появляется в особой форме:Передача бенгальского Джа-пхала, известный как য-ফলা ( ja-phala ), например, в ক্য (ক ্ য). Таким образом, когда мы хотим написать উদ্‌যাপন (правильное написание бенгальского слова «праздник»), оно становится উদ্যাপন (что неверно). Здесь ZWNJ работает. Если мы хотим написать উদ্‌যাপন, нам нужно писать в следующей последовательности (код: উদ্যাপন), [4] [5] , тогда мы получим правильный рендеринг и правильное написание. В бенгали хосонто используется для образования любых союзов и фала (таких как ра-фала, ба-фала и т. д. ) . Если хосонто необходимо отобразить явно, необходимо вставить ZWNJ после хосонто .

Также в бенгальском языке , когда бенгальская буква র встречается в начале группы согласных (т. е. за র следует хосонто), она появляется в особой форме, известной как রেফ (reph). Таким образом, последовательность র ্ য по умолчанию отображается как র্য. Когда необходимо сохранить форму য-ফলা, а не форму রেফ, ZWJ U+200D ZERO WIDTH JOINER ( ) вставляется сразу после র, т. е. র‍্য для визуализации র‍্য. [4] [5] র‍্য обычно используется для заимствований из английского языка, таких как র‍্যাম (RAM), র‍্যান্ডম (случайный) и т. д.

Символ

Немецкая клавиатура T2 (фрагмент) с символом ZWNJ на "." ключ

Символ, используемый на клавиатурах, позволяющих вводить ZWNJ напрямую, стандартизирован в Поправке 1 (2012) к стандарту ISO/IEC 9995-7 :2009 «Информационные технологии. Раскладки клавиатуры для текстовых и офисных систем. Символы, используемые для представления функций». как символ номер 81, а в МЭК 60417 «Графические символы для использования на оборудовании» как символ №. МЭК 60417-6177-2.

Смотрите также

Рекомендации

  1. ^ «Когда не следует использовать лигатуру при наборе текста на английском языке?» английский.stackexchange.org .
  2. ^ "Нестыковка нулевой ширины" . Национальный ближневосточный языковой ресурсный центр . Архивировано из оригинала 8 июля 2012 года.
  3. ^ «Часто задаваемые вопросы - Индийские сценарии и языки» . www.unicode.org . Проверено 15 марта 2020 г.
  4. ^ ab «Часто задаваемые вопросы по бенгальскому языку в Юникоде» .
  5. ^ ab Также см. главу 12 Юникода, бенгальский (бангла) между страницами 475–479 здесь, в PDF.

Внешние ссылки