В вычислительной технике символ Unicode — это символ Unicode , который не является частью скрипта, используемого для записи естественного языка, но тем не менее доступен для использования как часть текста.
Многие символы взяты из существующих наборов символов или стандартов ISO / IEC или других национальных и международных стандартов. Стандарт Unicode гласит, что «вселенная символов богата и открыта», но для того, чтобы быть рассмотренным, символ должен иметь «продемонстрированную потребность или сильное желание обмениваться в простом тексте». [1] Это делает вопрос о том, какие символы кодировать и как символы должны кодироваться, более сложным, чем вопросы, связанные с системами письма. Unicode фокусируется на символах, которые имеют смысл в одномерном контексте простого текста. Например, типичное двухмерное расположение символов электронной схемы оправдывает их исключение. [2] ( Символы рисования прямоугольников являются частичным исключением для целей наследия, и ряд символов электронной схемы действительно закодированы в блоке Miscellaneous Technical Unicode .) Для адекватной обработки в простом тексте символы также должны отображаться в монохромной обстановке. Даже с этими ограничениями — монохромными, одномерными и основанными на стандартах — область потенциальных символов Unicode обширна. (Однако эмодзи — идеограммы , графические символы , — которые были приняты в Unicode, допускают использование цветов, хотя цвета не стандартизированы.)
Список блоков символов
Существует 154 998 символов в кодировке Unicode 16.0 [3] [4], включая следующие блоки символов:
- Буквенно-цифровые варианты (на основе латинских символов в Unicode )
- Закрытые варианты
- Стрелки
- Математический
- Технический
- Мюзикл
- Игры
- Эмодзи и смайлики
- Дингбат (U+2700–U+27BF)
- Смайлики (U+1F600–U+1F64F)
- Различные символы (U+2600–U+26FF)
- Различные символы и пиктограммы (U+1F300–U+1F5FF)
- Дополнительные символы и пиктограммы (U+1F900–1F9FF)
- Символы и пиктограммы расширенные-A
- Транспортные и картографические символы (U+1F680..U+1F6FF)
- Дополнительные эмодзи можно найти в следующих блоках Unicode: стрелки , базовая латиница , символы и знаки препинания CJK , вложенное буквенно-цифровое дополнение , вложенные буквенно-цифровые символы , вложенные буквы CJK и месяцы , вложенное идеографическое дополнение , общая пунктуация , геометрические фигуры , дополнение Latin-1 , буквоподобные символы , плитки маджонга , различные символы и стрелки , различные технические символы , игральные карты и дополнительные стрелки-B .
- Разнообразный
Смотрите также
Ссылки
- ^ "Раздел 22: Символы". Стандарт Unicode . Консорциум Unicode. Сентябрь 2024 г.
- ^ "Раздел 22: Разные технические сведения". Стандарт Unicode . Консорциум Unicode. Сентябрь 2024 г.
- ^ "База данных символов Unicode". Стандарт Unicode . Получено 2020-03-15 .
- ^ "Перечисленные версии стандарта Unicode". Стандарт Unicode . Получено 2020-03-15 .
Внешние ссылки
- Таблицы кодов символов Unicode — unicode.org
- Проект технического отчета Unicode № 25: Поддержка Unicode для математики на unicode.org
- Поиск по имени, коду или типу (например, «тайские символы») на сайте unicodelookup.com
- shapecatcher.com — Поиск персонажей путем их наброска.