stringtranslate.com

Базовая латиница (блок Unicode)

Базовый латинский блок Unicode [3] , иногда неофициально называемый C0 Controls и Basic Latin [4] , является первым блоком стандарта Unicode и единственным блоком, который кодируется одним байтом в UTF-8 . Блок содержит все буквы и управляющие коды кодировки ASCII. Он имеет диапазон от U+0000 до U+007F, содержит 128 символов и включает в себя элементы управления C0 , знаки препинания и символы ASCII , цифры ASCII , как заглавные , так и строчные буквы английского алфавита и управляющий символ .

Блок Basic Latin был включён в его нынешнем виде из версии 1.0.0 стандарта Unicode, без добавления или изменения репертуара символов. [5] Его название блока в Unicode 1.0 было ASCII . [6]

Таблица символов

A Буква U+005C (\) может отображаться как знак йены (¥) или воны (₩) в японских/корейских шрифтах, ошибочно принимая Unicode (особенно UTF-8 ) за устаревший набор символов, который заменил обратную косую черту этими знаками. [7]

Подзаголовки

Блок C0 Controls и Basic Latin содержит шесть подзаголовков. [8]

C0-контроль

Элементы управления C0 , называемые в версии 1.0 кодами управления C0 ASCII, унаследованы от ASCII и других 7-битных и 8-битных схем кодирования. Имена псевдонимов для элементов управления C0 взяты из стандарта ISO/IEC 6429:1992 . [8]

Знаки препинания и символы ASCII

Этот подзаголовок относится к стандартным знакам пунктуации, простым математическим операторам и таким символам, как знак доллара, процент, амперсанд, подчеркивание и вертикальная черта. [8]

ASCII-цифры

Подзаголовок «Цифры ASCII» содержит стандартные европейские числовые символы 1–9 и 0. [8]

Заглавные буквы латинского алфавита

Подзаголовок «Заглавные латинские буквы» содержит стандартный 26-буквенный латинский алфавит без ударений в прописных буквах . [8]

Строчные буквы латинского алфавита

Подзаголовок «Строчные латинские буквы» содержит стандартный 26-буквенный латинский алфавит без ударений в минускуле . [8]

Управляющий символ

Подзаголовок «Управляющий символ» содержит символ «Удалить» . [8]

Количество символов, букв и контрольных кодов

В таблице ниже показано количество букв , символов и кодов управления в каждом из подзаголовков в блоке C0 Controls и Basic Latin.

Диаграмма

Варианты

Некоторые символы определяются как стандартизированный вариант , если за ними следуют индикаторы вариантов.

Определен вариант для нуля с короткой диагональной чертой: U+0030 ЦИФРА НОЛЬ, U+FE00 VS1 (0︀). [9] [10]

Двенадцать символов (#, * и цифры) могут сопровождаться U+FE0E VS15 или U+FE0F VS16 для создания вариантов эмодзи . [11] [12] [13] [14] Это базовые символы клавиш , например #️⃣ (U+0023 ЗНАК ЦИФРЫ U+FE0F VS16 U+20E3 ОБЪЕДИНЯЮЩИЙ ВКЛЮЧАЮЩИЙ КЛАВИШУ). Версия VS15 представляет собой «текстовое представление», а версия VS16 — «стиль эмодзи». [10]

История

В следующих документах, связанных с Unicode, описаны цель и процесс определения конкретных символов в блоке Basic Latin:

Смотрите также

Ссылки

  1. ^ "База данных символов Unicode". Стандарт Unicode . Получено 2023-07-26 .
  2. ^ "Перечисленные версии стандарта Unicode". Стандарт Unicode . Получено 2023-07-26 .
  3. ^ "block.txt". Консорциум Unicode . Получено 2023-03-23 .
  4. ^ "C0 Controls and Basic Latin" (PDF) . Стандарт Unicode, версия 15.0 . Unicode, Inc. 2022 . Получено 22 марта 2023 г. .
  5. Стандарт Unicode, версия 1.0, том 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  6. ^ "3.8: Поблочные диаграммы" (PDF) . Стандарт Unicode . версия 1.0. Консорциум Unicode .
  7. ^ Майкл С. Каплан (2005-09-17). "Когда обратная косая черта не является обратной косой чертой?". Sorting it all Out . Microsoft. Архивировано из оригинала 2010-06-12.Также доступно по адресу: http://archives.miloush.net/michkap/archive/2005/09/17/469941.html
  8. ^ abcdefg "Таблицы кодов Unicode 6.2" (PDF) . Стандарт Unicode . Получено 1 апреля 2013 г. .
  9. ^ Битон, Барбара; Фрейтаг, Асмус; Янку, Лаурентиу; Сарджент, Мюррей (30 октября 2015 г.). «L2 / 15-268: Предложение представить вариант пустого набора с перечеркнутым нулем» (PDF) .
  10. ^ ab "UTS #51 Последовательности вариаций эмодзи". Консорциум Unicode.
  11. ^ Эдберг, Питер (22.12.2011). «L2/11-438: Последовательности вариаций эмодзи (пересмотр L2/11-429)» (PDF) .
  12. ^ Пурнадер, Рузбех (01.11.2015). «L2/15-301: Предложение по 278 стандартизированным последовательностям вариаций для эмодзи» (PDF) .
  13. ^ "UTR #51: Unicode Emoji". Консорциум Unicode. 2023-09-05.
  14. ^ "UCD: Данные эмодзи для UTR #51". Консорциум Unicode. 2023-02-01.

Внешние ссылки

Послушайте эту статью ( 5 минут )
Разговорный значок Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 8 ноября 2023 года и не отражает последующие правки. ( 2023-11-08 )