stringtranslate.com

Кириллица в Юникоде

Начиная с версии Unicode 15.1, кириллица кодируется несколькими блоками :

Символы в диапазоне U+0400–U+045F — это, по сути, символы из ISO 8859-5 , сдвинутые вверх на 864 позиции. Следующие символы в блоке кириллицы в диапазоне U+0460–U+0489 — это исторические буквы, некоторые из которых до сих пор используются для церковнославянского языка . Символы в диапазоне U+048A–U+04FF и полный блок дополнения кириллицы (U+0500–U+052F) представляют собой дополнительные буквы для различных языков, написанные кириллицей . В блоке «Фонетические расширения» находятся два символа: U+1D2B КИРИЛЛИЧЕСКАЯ БУКВА СТРОЧНАЯ ЗАГЛАВНАЯ EL из уральского фонетического алфавита и U+1D78БУКВА-МОДИФИКАТОР КИРИЛЛИЦА EN для транскрипции носовых гласных.

Юникод включает в себя несколько заранее составленных букв кириллицы с диакритическими знаками; остальные можно объединить, добавив U + 0301 («сочетание острого ударения») после ударной гласной (например, е́ у́ э́); см. ниже.

В тексте на кириллице можно использовать несколько диакритических знаков, не характерных для кириллицы, в том числе:

В таблице ниже строчные буквы упорядочены в соответствии с их номерами в Юникоде; заглавные буквы ставятся непосредственно перед соответствующими строчными буквами. Включены стандартные имена Unicode и канонические разложения .

Таблица персонажей

Блоки

Блок кириллицы (U+0400 – U+04FF) был добавлен в стандарт Unicode в октябре 1991 года с выпуском версии 1.0:

Блок дополнения кириллицы (U+0500 – U+052F) был добавлен в стандарт Unicode в марте 2002 г. с выпуском версии 3.2:

Блоки Cyrillic Extended-A (U+2DE0 – U+2DFF) и Cyrillic Extended-B (U+A640 – U+A69F) были добавлены в стандарт Unicode в апреле 2008 г. с выпуском версии 5.1:

Блок Cyrillic Extended-C (U+1C80 – U+1C8F) был добавлен в стандарт Unicode в июне 2016 года с выпуском версии 9.0:

Блок Cyrillic Extended-D (U+1E030 – U+1E08F) был добавлен в стандарт Unicode в сентябре 2022 года с выпуском версии 15.0:

Смотрите также

Рекомендации