stringtranslate.com

Дополнение Latin-1

Latin -1 Supplement (также называемый C1 Controls и Latin-1 Supplement ) — второй блок Unicode в стандарте Unicode . Он кодирует верхний диапазон ISO 8859-1 : 80 (U+0080) — FF (U+00FF). C1 Controls (0080–009F) не являются графическими. Этот блок находится в диапазоне от U+0080 до U+00FF, содержит 128 символов и включает в себя C1 controls , пунктуацию и символы Latin-1 , 30 пар прописных и строчных латинских символов с ударением и 2 математических оператора.

Блок C1 Controls и Latin-1 Supplement был включён в его нынешнем виде с тем же набором символов, что и в версии 1.0 стандарта Unicode . [3] Его название блока в Unicode 1.0 было просто Latin1 . [4]

Таблица символов

Подзаголовки

Блок «Элементы управления C1 и дополнение Latin-1» имеет четыре подзаголовка в своей коллекции символов: элементы управления C1, знаки препинания и символы Latin-1, буквы и математические операторы. [5]

С1 элементы управления

Подзаголовок C1 controls содержит 32 дополнительных управляющих кода, унаследованных от ISO/IEC 8859-1 и многих других стандартов 8-битных символов. Псевдонимы для управляющих кодов C0 и C1 взяты из ISO/IEC 6429:1992. [5]

Знаки препинания и символы Latin-1

Подзаголовок «Пунктуация и символы Latin-1» содержит 32 символа общепринятых международных знаков пунктуации, таких как перевернутые вопросительный и восклицательный знаки, средняя точка, а также такие символы, как знаки валют, пробельные диакритические знаки, вульгарные дроби и надстрочные цифры. [5]

Письма

Подзаголовок «Буквы» содержит 30 пар прописных и минускульных акцентированных или новых латинских символов для западноевропейских языков, а также два дополнительных минускульных символа ( ß и ÿ ), которые обычно не используются в качестве первых букв слов. [5]

Математический оператор

Подзаголовок «Математический оператор» используется для знаков умножения и деления. [5]

Количество символов, букв и контрольных кодов

В таблице ниже показано количество букв, символов и контрольных кодов в каждом из подзаголовков в блоках «Управление C1» и «Дополнение Latin-1».

Компактный стол

Эмодзи

Блок Latin-1 Supplement содержит два эмодзи : U+00A9 и U+00AE. [6] [7]

Блок имеет четыре стандартизированных варианта, определенных для указания стиля эмодзи (U+FE0F VS16) или текстового представления (U+FE0E VS15) для двух эмодзи, оба из которых по умолчанию имеют текстовое представление. [8]

История

В следующих документах, связанных с Unicode, описаны цель и процесс определения конкретных символов в блоке Latin-1 Supplement:

Смотрите также

Ссылки

  1. ^ "База данных символов Unicode". Стандарт Unicode . Получено 2023-07-26 .
  2. ^ "Перечисленные версии стандарта Unicode". Стандарт Unicode . Получено 2023-07-26 .
  3. Стандарт Unicode, версия 1.0, том 1. Addison-Wesley Publishing Company, Inc. 1991 [1990]. ISBN 0-201-56788-1.
  4. ^ "3.8: Поблочные диаграммы" (PDF) . Стандарт Unicode . версия 1.0. Консорциум Unicode .
  5. ^ abcde "Таблицы кодов Unicode 6.2" (PDF) . Стандарт Unicode . Получено 1 апреля 2013 г. .
  6. ^ "UTR #51: Unicode Emoji". Консорциум Unicode. 2023-09-05.
  7. ^ "UCD: Данные эмодзи для UTR #51". Консорциум Unicode. 2023-02-01.
  8. ^ "UTS #51 Последовательности вариаций эмодзи". Консорциум Unicode.