stringtranslate.com

символ Юникода

В вычислительной технике символ Unicode — это символ Unicode , который не является частью скрипта, используемого для записи естественного языка, но тем не менее доступен для использования как часть текста.

Многие символы взяты из существующих наборов символов или стандартов ISO / IEC или других национальных и международных стандартов. Стандарт Unicode гласит, что «вселенная символов богата и открыта», но для того, чтобы быть рассмотренным, символ должен иметь «продемонстрированную потребность или сильное желание обмениваться в простом тексте». [1] Это делает вопрос о том, какие символы кодировать и как символы должны кодироваться, более сложным, чем вопросы, связанные с системами письма. Unicode фокусируется на символах, которые имеют смысл в одномерном контексте простого текста. Например, типичное двухмерное расположение символов электронной схемы оправдывает их исключение. [2] ( Символы рисования прямоугольников являются частичным исключением для целей наследия, и ряд символов электронной схемы действительно закодированы в блоке Miscellaneous Technical Unicode .) Для адекватной обработки в простом тексте символы также должны отображаться в монохромной обстановке. Даже с этими ограничениями — монохромными, одномерными и основанными на стандартах — область потенциальных символов Unicode обширна. (Однако эмодзи  — идеограммы , графические символы  , — которые были приняты в Unicode, допускают использование цветов, хотя цвета не стандартизированы.)

Список блоков символов

Существует 154 998 символов в кодировке Unicode 16.0 [3] [4], включая следующие блоки символов:

Смотрите также

Ссылки

  1. ^ "Раздел 22: Символы". Стандарт Unicode . Консорциум Unicode. Сентябрь 2024 г.
  2. ^ "Раздел 22: Разные технические сведения". Стандарт Unicode . Консорциум Unicode. Сентябрь 2024 г.
  3. ^ "База данных символов Unicode". Стандарт Unicode . Получено 2020-03-15 .
  4. ^ "Перечисленные версии стандарта Unicode". Стандарт Unicode . Получено 2020-03-15 .

Внешние ссылки