stringtranslate.com

Столяр слов

Слово joiner ( WJ ) — это символ формата Юникода , который используется для обозначения того, что разрыв строки не должен происходить в его позиции. [1] Он не влияет на формирование лигатур или соединение скорописей и игнорируется при сегментации текста. [1] Начиная с версии Unicode 3.2 (выпущенной в 2002 году), он кодируется как U+2060 WORD JOINER ( ).

Слово joiner заменяет неразрывный пробел нулевой ширины ( ZWNBSP , U+FEFF) в качестве использования неразрывного пробела нулевой ширины. ZWNBSP изначально и в настоящее время используется в качестве метки порядка байтов (BOM) в начале файла. Однако, если он встречается где-либо еще, согласно Unicode, его следует рассматривать как соединение слов, неразрывный пробел нулевой ширины.

Намеренное использование U+FEFF для этой цели не рекомендуется начиная с Unicode 3.2, при этом слово joiner настоятельно предпочтительнее. [1] [2]

Смотрите также

Рекомендации

  1. ^ abc «Элементы управления макетом» (PDF) . Стандарт Юникод, версия 12.0.0 . Консорциум Юникод. п. 871.
  2. ^ Часто задаваемые вопросы — UTF-8, UTF-16, UTF-32 и спецификация: «Что мне делать с U + FEFF в середине файла?».