stringtranslate.com

Региональный индикаторный символ

Символы региональных индикаторов представляют собой набор из 26 буквенных символов Unicode (A–Z), предназначенных для кодирования двухбуквенных кодов стран ISO 3166-1 alpha-2 таким образом, чтобы обеспечить возможность специальной обработки.

Они были определеныкак часть поддержки Unicode 6.0 для эмодзи , как альтернатива кодированию отдельных символов для каждого флага страны. Хотя они могут отображаться как латинские буквы, предполагается, что реализации могут отображать их другими способами, например, с помощью национальных флагов . [1] [2] В разделе часто задаваемых вопросов Unicode указано, что следует использовать этот механизм и что символы для национальных флагов не будут напрямую кодироваться. [3]

Они кодируются в диапазоне от U+1F1E6 🇦 РЕГИОНАЛЬНЫЙ ИНДИКАТОРНЫЙ СИМВОЛ БУКВА A до U+1F1FF 🇿 РЕГИОНАЛЬНЫЙ ИНДИКАТОРНЫЙ СИМВОЛ БУКВА Z в блоке Enclosed Alphanumeric Supplement в Supplementary Multilingual Plane . [4]

Последовательности флагов эмодзи

Пара символов региональных индикаторов называется последовательностью флагов эмодзи (хотя она представляет собой конкретный регион, а не конкретный флаг для этого региона). [6]

Из 676 возможных пар региональных индикаторных символов (26 × 26) только 270 считаются допустимыми региональными кодами Unicode. Это подмножество региональных последовательностей в Common Locale Data Repository (CLDR): [6] [7] [8]

Отдельный механизм ( последовательности тегов эмодзи ) используется для региональных флагов, таких как Англия 🏴󠁧󠁢󠁥󠁮󠁧󠁿, Шотландия 🏴󠁧󠁢󠁳󠁣󠁴󠁿, Уэльс 🏴󠁧󠁢󠁷󠁬󠁳󠁿, Техас 🏴󠁵󠁳󠁴󠁸󠁿 или Калифорния 🏴󠁵󠁳󠁣󠁡󠁿. [12] Он использует U+ 1F3F4 🏴 РАЗМАХИВАЕТСЯ ЧЕРНЫМ ФЛАГОМ и символы тега форматирования вместо символов регионального индикатора. Он основан на регионах ISO 3166-2 с удаленным дефисом и строчными буквами, например, GB-ENG → gbeng, заканчивающийся на U+ E007F CANCEL TAG . Таким образом, флаг Англии представлен последовательностью U+1F3F4 , U+E0067 , U+E0062 , U+E0065 , U+E006E , U+E0067 , U+E007F . В десятой редакции консорциум Unicode рассматривал вместо этого U+ 1F3F3 🏳 РАЗМАХИВАЮЩИЙСЯ БЕЛЫЙ ФЛАГ [13] , но с одиннадцатой он черный. [14] Некоторые поставщики предпочитают включать пользовательские последовательности объединения нулевой ширины , которые отображаются только на их платформе, например WhatsApp и их флаг страны беженцев 🏳️‍🟧‍⬛️‍🟧. [15]

блок Юникода

Фон

В 2007 году Техническому комитету Unicode был представлен проект предложения по кодированию символов эмодзи , в частности тех, которые широко используются на мобильных телефонах японскими телекоммуникационными компаниями DoCoMo , KDDI и SoftBank . [16] Предложенные символы включали десять национальных флагов: [17] Китай (🇨🇳), Германия (🇩🇪), Испания (🇪🇸), Франция (🇫🇷), Великобритания (🇬🇧), Италия (🇮🇹), Япония (🇯🇵), Южная Корея (🇰🇷), Россия (🇷🇺) и США (🇺🇸). Кодирование этих флагов, но не флагов других стран, было сочтено некоторыми предвзятым. [18] Одно из отклоненных решений состояло в том, чтобы закодировать десять флагов, но назвать их «СИМВОЛ СОВМЕСТИМОСТИ EMOJI-n» и представить их визуально в Стандарте как «EC n» вместо того, чтобы показывать флаги, которые они представляют. [19] Другое отклоненное решение выделило бы 676 кодовых точек (26×26) для каждой возможной двухбуквенной комбинации A–Z. Они представляли бы политические образования на основе ISO 3166, такие как «JP» для Японии или Интернет-ccTLD ( домены верхнего уровня с кодом страны ), такие как «EU» для Европейского Союза. [20]

Принятым решением было добавить 26 символов для букв, используемых для представления региональных индикаторов, которые, используемые парами, представляли бы десять национальных флагов и возможные будущие расширения. [2] Согласно стандарту Unicode , «основная цель таких пар [символов региональных индикаторов] — обеспечить однозначные обратные сопоставления с определенными символами, используемыми в основных наборах эмодзи» [21], в частности, десятью национальными флагами: [22] 🇨🇳, 🇩🇪, 🇪🇸, 🇫🇷, 🇬🇧, 🇮🇹, 🇯🇵, 🇰🇷, 🇷🇺 и 🇺🇸.

Смотрите также

Ссылки

  1. ^ Эндрю Уэст . "Что нового в Unicode 6.0". Babelstone. Архивировано из оригинала 2014-04-06 . Получено 2014-08-18 .
  2. ^ ab Майкл Эверсон и Кен Уистлер. "N3727: Предложение по кодированию региональных индикаторных символов в UCS" (PDF) . Документ рабочей группы, ISO/IEC JTC1/SC2/WG2 и UTC . Получено 18 августа 2014 г.
  3. ^ "Часто задаваемые вопросы по Unicode: эмодзи и дингбаты". Консорциум Unicode. 2009-10-28 . Получено 2014-08-18 .
  4. ^ "Приложенное алфавитно-цифровое приложение, диапазон 1F100 - 1F1FF, стандарт Unicode, версия 6.0" (PDF) . Консорциум Unicode. 2010 . Получено 18 августа 2014 г. .
  5. ^ "Флаги". emojipedia.com . Получено 2020-02-04 .
  6. ^ ab UTR #51: Unicode Emoji, Приложение B: Допустимые последовательности флагов Emoji, веб-сайт Unicode Consortium, 2024-08-15
  7. ^ "UTR #35: Язык разметки данных локали Unicode (LDML), данные о валидности". Консорциум Unicode.
  8. ^ "CLDR Releases". Репозиторий данных Unicode Common Locale (CLDR) . 2024-10-23.
  9. ^ "UCD: Данные последовательности эмодзи для UTR #51". Консорциум Unicode. 2024-05-01.
  10. ^ "UTR #35: Язык разметки данных локали Unicode (LDML), Дополнительные метаданные". Консорциум Unicode.
  11. ^ "CLDR v38 Supplemental Metadata". Репозиторий данных Unicode Common Locale (CLDR) . 2020-10-28.
  12. ^ "UTR #51: Unicode Emoji". Консорциум Unicode. 2017-05-18.
  13. ^ "UTR #51: Эмодзи Unicode".
  14. ^ "UTS #51: Эмодзи Unicode".
  15. ^ "WhatsApp Portal". Копировать-вставить дамп . R74n. 2020. Архивировано из оригинала 22 июня 2021 г. Получено 23 июня 2021 г.
  16. ^ Момой, Кэт; Дэвис, Марк; Шерер, Маркус (2007-08-03). "L2/07-257: Рабочий проект предложения по кодированию символов эмодзи" . Получено 18 августа 2014 г.
  17. ^ «Соответствие Unicode для эмодзи с привязкой к японским операторам, AU/KDDI, DoCoMo и Softbank» (формат файла архива ZIP) . Получено 18 августа 2014 г.
  18. ^ "L2/09-114 N3607: На пути к кодированию символов, используемых в качестве эмодзи" (PDF) . 2009-04-06 . Получено 2014-08-18 .
  19. ^ "INCITS/L2/09-304: Комментарии, сопровождающие отрицательное голосование США по PDAM 8 в ISO/IEC 10646:2003 (SC2 N4078)" (PDF) . 2009-08-15 . Получено 2014-08-18 .
  20. ^ Пентцлин, Карл (09.08.2008). "L2/08-305: Некоторые предложения по кодированию национальных флагов в соответствии с предложением Emoji" (PDF) . Получено 18.08.2014 .
  21. ^ Стандарт Unicode, версия 6.2, глава 15: символы (PDF) . Unicode, Inc. Сентябрь 2012 г. стр. 534. ISBN 978-1-936213-07-8.
  22. ^ "Источники эмодзи" (обычный текст) . Unicode, Inc. 2013-12-17 . Получено 2014-08-18 .

Дальнейшее чтение