Базовый латинский блок Unicode [3] , иногда неофициально называемый C0 Controls и Basic Latin [4] , является первым блоком стандарта Unicode и единственным блоком, который кодируется одним байтом в UTF-8 . Блок содержит все буквы и управляющие коды кодировки ASCII. Он имеет диапазон от U+0000 до U+007F, содержит 128 символов и включает в себя элементы управления C0 , знаки препинания и символы ASCII , цифры ASCII , как заглавные , так и строчные буквы английского алфавита и управляющий символ .
Блок Basic Latin был включён в его нынешнем виде из версии 1.0.0 стандарта Unicode, без добавления или изменения репертуара символов. [5] Его название блока в Unicode 1.0 было ASCII . [6]
Блок C0 Controls и Basic Latin содержит шесть подзаголовков. [8]
Элементы управления C0 , называемые в версии 1.0 кодами управления C0 ASCII, унаследованы от ASCII и других 7-битных и 8-битных схем кодирования. Имена псевдонимов для элементов управления C0 взяты из стандарта ISO/IEC 6429:1992 . [8]
Этот подзаголовок относится к стандартным знакам пунктуации, простым математическим операторам и таким символам, как знак доллара, процент, амперсанд, подчеркивание и вертикальная черта. [8]
Подзаголовок «Цифры ASCII» содержит стандартные европейские числовые символы 1–9 и 0. [8]
Подзаголовок «Заглавные латинские буквы» содержит стандартный 26-буквенный латинский алфавит без ударений в прописных буквах . [8]
Подзаголовок «Строчные латинские буквы» содержит стандартный 26-буквенный латинский алфавит без ударений в минускуле . [8]
Подзаголовок «Управляющий символ» содержит символ «Удалить» . [8]
В таблице ниже показано количество букв , символов и кодов управления в каждом из подзаголовков в блоке C0 Controls и Basic Latin.
Некоторые символы определяются как стандартизированный вариант , если за ними следуют индикаторы вариантов.
Определен вариант для нуля с короткой диагональной чертой: U+0030 ЦИФРА НОЛЬ, U+FE00 VS1 (0︀). [9] [10]
Двенадцать символов (#, * и цифры) могут сопровождаться U+FE0E VS15 или U+FE0F VS16 для создания вариантов эмодзи . [11] [12] [13] [14] Это базовые символы клавиш , например #️⃣ (U+0023 ЗНАК ЦИФРЫ U+FE0F VS16 U+20E3 ОБЪЕДИНЯЮЩИЙ ВКЛЮЧАЮЩИЙ КЛАВИШУ). Версия VS15 представляет собой «текстовое представление», а версия VS16 — «стиль эмодзи». [10]
В следующих документах, связанных с Unicode, описаны цель и процесс определения конкретных символов в блоке Basic Latin: