Блок Basic Latin Unicode , [3] иногда неофициально называемый C0 Controls и Basic Latin , [4] является первым блоком стандарта Unicode и единственным блоком, который закодирован в один байт в UTF-8 . Блок содержит все буквы и управляющие коды кодировки ASCII. Он варьируется от U+0000 до U+007F, содержит 128 символов и включает элементы управления C0 , знаки препинания и символы ASCII , цифры ASCII , как прописные , так и строчные буквы английского алфавита , а также управляющий символ .
Блок базовой латиницы был включен в его нынешней форме из версии 1.0.0 стандарта Unicode без добавления или изменения набора символов. [5] Имя блока в Юникоде 1.0 было ASCII . [6]
Блок C0 Controls and Basic Latin содержит шесть подзаголовков. [8]
Элементы управления C0 , называемые в версии 1.0 управляющими кодами C0 ASCII, унаследованы от ASCII и других 7-битных и 8-битных схем кодирования. Псевдонимы элементов управления C0 взяты из стандарта ISO/IEC 6429:1992. [8]
В этом подзаголовке упоминаются стандартные знаки пунктуации, простые математические операторы и такие символы, как знак доллара, процент, амперсанд, подчеркивание и трубка. [8]
Подзаголовок ASCII Digits содержит стандартные европейские числовые символы 1–9 и 0. [8]
Подзаголовок «Прописной латинский алфавит» содержит стандартный 26-буквенный латинский алфавит без ударения в маюскуле . [8]
Подзаголовок «Строчные латинские алфавиты» содержит стандартный 26-буквенный латинский алфавит без ударения в минускулах . [8]
Подзаголовок «Управляющий символ» содержит символ «Удалить» . [8]
В таблице ниже указано количество букв , символов и управляющих кодов в каждом из подзаголовков блока C0 Controls и Basic Latin.
Некоторые символы определены для отображения как стандартизированный вариант , если за ним следуют индикаторы варианта.
Вариант определен для нуля с короткой диагональной чертой: U+0030 ЦИФРА НОЛЬ, U+FE00 VS1 (0︀). [9] [10]
За двенадцатью символами (#, * и цифры) могут следовать U+FE0E VS15 или U+FE0F VS16 для создания вариантов эмодзи . [11] [12] [13] [14] Это базовые символы клавиатуры , например #️⃣ (U+0023 ЗНАК ЦИФРЫ U+FE0F VS16 U+20E3 КОМБИНИРОВАНИЕ КЛАВИАТУРЫ). Версия VS15 представляет собой «текстовое представление», а версия VS16 — «стиль эмодзи». [10]
В следующих документах, связанных с Unicode, записаны цель и процесс определения определенных символов в блоке базовой латиницы: