ISO/IEC 8859-5:1999 , Информационные технологии — 8-битные однобайтовые кодированные графические наборы символов — Часть 5: Латинский/кириллица , является частью серии стандартов ISO/IEC 8859 , основанных на ASCII , первое издание опубликовано в 1988 году. Неофициально называется Латинский/кириллица .
Он был разработан для языков, использующих кириллицу, таких как болгарский , белорусский , русский , сербский и македонский , но никогда не использовался широко. 8-битные кодировки KOI8-R и KOI8-U , IBM-866 , а также Windows-1251 используются гораздо чаще. В отличие от связи между Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесной связи с ISO 8859-5. Однако основной блок кириллицы в Unicode использует макет, основанный на ISO-8859-5.
ISO 8859-5 также мог бы использоваться для украинского языка в Советском Союзе с 1933 по 1990 год, но в нем отсутствует украинская буква ge , ґ, которая требовалась в украинской орфографии до и после, а также в течение этого периода за пределами Советской Украины . В результате IBM создала кодовую страницу 1124 .
ISO-8859-5 — это предпочитаемое IANA название набора символов для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429. Кодовая страница Windows для ISO-8859-5 — это кодовая страница 28595, также известная как Windows-28595 . [3] IBM назначила кодовую страницу 915 для ISO-8859-5, пока эта кодовая страница не была расширена.
Отличия от ISO 8859-1 показаны с помощью эквивалентной кодовой точки Unicode .
Стандарт ECMA-113 был эквивалентен ISO-8859-5 со времени его второго издания [4] , его первое издание ( ISO-IR-111 ) было расширением более раннего KOI-8 (определенного ГОСТ 19768-74), который размещает русские буквы так же, как их эквиваленты в ASCII Roman, где это возможно. Первоначальный проект ISO-8859-5 (DIS-8859-5:1987) следовал ISO-IR-111, но был пересмотрен [4] после того, как ГОСТ 19768-74 был заменен [5] новым ISO-IR-153 в 1987 году, который переставил русские буквы в алфавитном порядке (за исключением Ё). [5] [6] ISO-IR-153 содержит русские буквы, включая Ё, а также неразрывный пробел и мягкий дефис, тогда как полный кириллический набор ISO-8859-5 также называется ISO-IR-144. [7]
Возможно, вследствие этой путаницы, RFC 1345 ошибочно перечисляет еще одну кодовую страницу как «ISO-IR-111», объединяя порядок букв и регистров ISO-8859-5 с порядком строк ISO-IR-111 (и, следовательно, несовместимую ни с одной из них на практике, но частично совместимую [2] с Windows-1251 ). [8] [2]
Кодовая страница IBM 915 является расширением ISO/IEC 8859-5, добавляя некоторые полуграфические и другие символы в область C1 . Кодовая страница IBM 1124 в основном идентична ISO-8859-5, но заменяет ѓ на ґ для украинского использования.
ISO-IR-200 , "Uralic Supplementary Cyrillic Set", [9] был зарегистрирован в 1998 году Everson Gunn Teoranta (директором которой был Майкл Эверсон до основания Evertype в 2001 году), [10] и изменяет несколько нерусских букв для поддержки кильдино -саамского , коми и ненецкого языков, которые не поддерживаются самим ISO-8859-5. Майкл Эверсон также представил Mac OS Barents Cyrillic для тех же языков на классической Mac OS. FreeDOS называет его кодовой страницей 59283 . [11]
ISO-IR-201, «Volgaic Supplementary Cyrillic Set» [12] был также представлен Эверсоном Ганном Теорантой для поддержки чувашского , коми , марийского и удмуртского языков, на которых говорят в титульных республиках России . FreeDOS называет его кодовой страницей 58259. [ 13]