Символы региональных индикаторов представляют собой набор из 26 буквенных символов Unicode (A–Z), предназначенных для кодирования двухбуквенных кодов стран ISO 3166-1 alpha-2 таким образом, чтобы обеспечить возможность специальной обработки.
Они были определеныкак часть поддержки Unicode 6.0 для эмодзи , как альтернатива кодированию отдельных символов для каждого флага страны. Хотя они могут отображаться как латинские буквы, предполагается, что реализации могут отображать их другими способами, например, с помощью национальных флагов . [1] [2] В разделе часто задаваемых вопросов Unicode указано, что следует использовать этот механизм и что символы для национальных флагов не будут напрямую кодироваться. [3]
Они кодируются в диапазоне от U+1F1E6 🇦 РЕГИОНАЛЬНЫЙ ИНДИКАТОРНЫЙ СИМВОЛ БУКВА A до U+1F1FF 🇿 РЕГИОНАЛЬНЫЙ ИНДИКАТОРНЫЙ СИМВОЛ БУКВА Z в блоке Enclosed Alphanumeric Supplement в Supplementary Multilingual Plane . [4]
Пара символов региональных индикаторов называется последовательностью флагов эмодзи (хотя она представляет собой конкретный регион, а не конкретный флаг для этого региона). [6]
Из 676 возможных пар региональных индикаторных символов (26 × 26) только 270 считаются допустимыми региональными кодами Unicode. Это подмножество региональных последовательностей в Common Locale Data Repository (CLDR): [6] [7] [8]
Отдельный механизм ( последовательности тегов эмодзи ) используется для региональных флагов, таких как Англия 🏴, Шотландия 🏴, Уэльс 🏴, Техас 🏴 или Калифорния 🏴. [12] Он использует U+ 1F3F4 🏴 РАЗМАХИВАЕТСЯ ЧЕРНЫМ ФЛАГОМ и символы тега форматирования вместо символов регионального индикатора. Он основан на регионах ISO 3166-2 с удаленным дефисом и строчными буквами, например, GB-ENG → gbeng, заканчивающийся на U+ E007F CANCEL TAG . Таким образом, флаг Англии представлен последовательностью U+1F3F4 , U+E0067 , U+E0062 , U+E0065 , U+E006E , U+E0067 , U+E007F . В десятой редакции консорциум Unicode рассматривал вместо этого U+ 1F3F3 🏳 РАЗМАХИВАЮЩИЙСЯ БЕЛЫЙ ФЛАГ [13] , но с одиннадцатой он черный. [14] Некоторые поставщики предпочитают включать пользовательские последовательности объединения нулевой ширины , которые отображаются только на их платформе, например WhatsApp и их флаг страны беженцев 🏳️🟧⬛️🟧. [15]
В 2007 году Техническому комитету Unicode был представлен проект предложения по кодированию символов эмодзи , в частности тех, которые широко используются на мобильных телефонах японскими телекоммуникационными компаниями DoCoMo , KDDI и SoftBank . [16] Предложенные символы включали десять национальных флагов: [17] Китай (🇨🇳), Германия (🇩🇪), Испания (🇪🇸), Франция (🇫🇷), Великобритания (🇬🇧), Италия (🇮🇹), Япония (🇯🇵), Южная Корея (🇰🇷), Россия (🇷🇺) и США (🇺🇸). Кодирование этих флагов, но не флагов других стран, было сочтено некоторыми предвзятым. [18] Одно из отклоненных решений состояло в том, чтобы закодировать десять флагов, но назвать их «СИМВОЛ СОВМЕСТИМОСТИ EMOJI-n» и представить их визуально в Стандарте как «EC n» вместо того, чтобы показывать флаги, которые они представляют. [19] Другое отклоненное решение выделило бы 676 кодовых точек (26×26) для каждой возможной двухбуквенной комбинации A–Z. Они представляли бы политические образования на основе ISO 3166, такие как «JP» для Японии или Интернет-ccTLD ( домены верхнего уровня с кодом страны ), такие как «EU» для Европейского Союза. [20]
Принятым решением было добавить 26 символов для букв, используемых для представления региональных индикаторов, которые, используемые парами, представляли бы десять национальных флагов и возможные будущие расширения. [2] Согласно стандарту Unicode , «основная цель таких пар [символов региональных индикаторов] — обеспечить однозначные обратные сопоставления с определенными символами, используемыми в основных наборах эмодзи» [21], в частности, десятью национальными флагами: [22] 🇨🇳, 🇩🇪, 🇪🇸, 🇫🇷, 🇬🇧, 🇮🇹, 🇯🇵, 🇰🇷, 🇷🇺 и 🇺🇸.