stringtranslate.com

Базовая латиница (блок Unicode)

Блок Basic Latin Unicode , [3] иногда неофициально называемый C0 Controls и Basic Latin , [4] является первым блоком стандарта Unicode и единственным блоком, который закодирован в один байт в UTF-8 . Блок содержит все буквы и управляющие коды кодировки ASCII. Он варьируется от U+0000 до U+007F, содержит 128 символов и включает элементы управления C0 , знаки препинания и символы ASCII , цифры ASCII , как прописные , так и строчные буквы английского алфавита , а также управляющий символ .

Блок базовой латиницы был включен в его нынешней форме из версии 1.0.0 стандарта Unicode без добавления или изменения набора символов. [5] Имя блока в Юникоде 1.0 было ASCII . [6]

Таблица персонажей

A Буква U+005C (\) может отображаться как знак иены (¥) или воны (₩) в японских/корейских шрифтах, принимая Unicode (особенно UTF-8 ) за устаревший набор символов, который заменил обратную косую черту этими знаками. [7]

Подзаголовки

Блок C0 Controls and Basic Latin содержит шесть подзаголовков. [8]

Управление C0

Элементы управления C0 , называемые в версии 1.0 управляющими кодами C0 ASCII, унаследованы от ASCII и других 7-битных и 8-битных схем кодирования. Псевдонимы элементов управления C0 взяты из стандарта ISO/IEC 6429:1992. [8]

Знаки препинания и символы ASCII

В этом подзаголовке упоминаются стандартные знаки пунктуации, простые математические операторы и такие символы, как знак доллара, процент, амперсанд, подчеркивание и трубка. [8]

цифры ASCII

Подзаголовок ASCII Digits содержит стандартные европейские числовые символы 1–9 и 0. [8]

Прописная латиница

Подзаголовок «Прописной латинский алфавит» содержит стандартный 26-буквенный латинский алфавит без ударения в маюскуле . [8]

Строчный латинский алфавит

Подзаголовок «Строчные латинские алфавиты» содержит стандартный 26-буквенный латинский алфавит без ударения в минускулах . [8]

Управляющий персонаж

Подзаголовок «Управляющий символ» содержит символ «Удалить» . [8]

Количество символов, букв и кодов управления

В таблице ниже указано количество букв , символов и управляющих кодов в каждом из подзаголовков блока C0 Controls и Basic Latin.

Диаграмма

Варианты

Некоторые символы определены для отображения как стандартизированный вариант , если за ним следуют индикаторы варианта.

Вариант определен для нуля с короткой диагональной чертой: U+0030 ЦИФРА НОЛЬ, U+FE00 VS1 (0︀). [9] [10]

За двенадцатью символами (#, * и цифры) могут следовать U+FE0E VS15 или U+FE0F VS16 для создания вариантов эмодзи . [11] [12] [13] [14] Это базовые символы клавиатуры , например #️⃣ (U+0023 ЗНАК ЦИФРЫ U+FE0F VS16 U+20E3 КОМБИНИРОВАНИЕ КЛАВИАТУРЫ). Версия VS15 представляет собой «текстовое представление», а версия VS16 — «стиль эмодзи». [10]

История

В следующих документах, связанных с Unicode, записаны цель и процесс определения определенных символов в блоке базовой латиницы:

Смотрите также

Рекомендации

  1. ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 26 июля 2023 г.
  2. ^ «Перечисленные версии стандарта Unicode» . Стандарт Юникод . Проверено 26 июля 2023 г.
  3. ^ "блок.txt". Консорциум Юникод . Проверено 23 марта 2023 г.
  4. ^ «Элементы управления C0 и базовая латиница» (PDF) . Стандарт Юникод, версия 15.0 . Юникод, Инк. 2022 . Проверено 22 марта 2023 г.
  5. ^ Стандарт Unicode, версия 1.0, том 1 . Addison-Wesley Publishing Company, Inc., 1990. ISBN. 0-201-56788-1.
  6. ^ «3.8: Поблочные диаграммы» (PDF) . Стандарт Юникод . версия 1.0. Консорциум Юникод .
  7. ^ Майкл С. Каплан (17 сентября 2005 г.). «Когда обратная косая черта не является обратной косой чертой?». Разбираем все это . Майкрософт. Архивировано из оригинала 12 июня 2010 г.Также доступно по адресу: http://archives.miloush.net/michkap/archive/2005/09/17/469941.html.
  8. ^ abcdefg «Таблицы кодов Unicode 6.2» (PDF) . Стандарт Юникод . Проверено 1 апреля 2013 г.
  9. ^ Битон, Барбара; Фрейтаг, Асмус; Янку, Лаурентиу; Сарджент, Мюррей (30 октября 2015 г.). «L2 / 15-268: Предложение представить вариант пустого набора с перечеркнутым нулем» (PDF) .
  10. ^ ab «Последовательности вариаций эмодзи UTS № 51» . Консорциум Юникод.
  11. ^ Эдберг, Питер (22 декабря 2011 г.). «L2/11-438: Последовательности вариаций эмодзи (редакция L2/11-429)» (PDF) .
  12. ^ Пурнадер, Рузбе (01 ноября 2015 г.). «L2/15-301: Предложение по 278 стандартизированным вариационным последовательностям для смайликов» (PDF) .
  13. ^ «UTR № 51: Эмодзи Unicode» . Консорциум Юникод. 05.09.2023.
  14. ^ «UCD: данные эмодзи для UTR № 51» . Консорциум Юникод. 01.02.2023.

Внешние ссылки

Послушайте эту статью ( 5 минут )
Разговорная иконка Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 8 ноября 2023 года и не отражает последующие изменения. ( 08.11.2023 )