stringtranslate.com

ИСО/МЭК 8859-5

ISO/IEC 8859-5:1999 , Информационные технологии — 8-битные однобайтовые кодированные графические наборы символов — Часть 5: Латинский/кириллица , является частью серии стандартов ISO/IEC 8859 , основанных на ASCII , первое издание опубликовано в 1988 году. Неофициально называется Латинский/кириллица .

Он был разработан для языков, использующих кириллицу, таких как болгарский , белорусский , русский , сербский и македонский , но никогда не использовался широко. 8-битные кодировки KOI8-R и KOI8-U , IBM-866 , а также Windows-1251 используются гораздо чаще. В отличие от связи между Windows-1252 и ISO 8859-1 , Windows-1251 не имеет тесной связи с ISO 8859-5. Однако основной блок кириллицы в Unicode использует макет, основанный на ISO-8859-5.

ISO 8859-5 также мог бы использоваться для украинского языка в Советском Союзе с 1933 по 1990 год, но в нем отсутствует украинская буква ge , ґ, которая требовалась в украинской орфографии до и после, а также в течение этого периода за пределами Советской Украины . В результате IBM создала кодовую страницу 1124 .

ISO-8859-5 — это предпочитаемое IANA название набора символов для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429. Кодовая страница Windows для ISO-8859-5 — это кодовая страница 28595, также известная как Windows-28595 . [3] IBM назначила кодовую страницу 915 для ISO-8859-5, пока эта кодовая страница не была расширена.

Макет кодовой страницы

Отличия от ISO 8859-1 показаны с помощью эквивалентной кодовой точки Unicode .

История и связанные с ней кодовые страницы

Стандарт ECMA-113 был эквивалентен ISO-8859-5 со времени его второго издания [4] , его первое издание ( ISO-IR-111 ) было расширением более раннего KOI-8 (определенного ГОСТ 19768-74), который размещает русские буквы так же, как их эквиваленты в ASCII Roman, где это возможно. Первоначальный проект ISO-8859-5 (DIS-8859-5:1987) следовал ISO-IR-111, но был пересмотрен [4] после того, как ГОСТ 19768-74 был заменен [5] новым ISO-IR-153 в 1987 году, который переставил русские буквы в алфавитном порядке (за исключением Ё). [5] [6] ISO-IR-153 содержит русские буквы, включая Ё, а также неразрывный пробел и мягкий дефис, тогда как полный кириллический набор ISO-8859-5 также называется ISO-IR-144. [7]

Возможно, вследствие этой путаницы, RFC  1345 ошибочно перечисляет еще одну кодовую страницу как «ISO-IR-111», объединяя порядок букв и регистров ISO-8859-5 с порядком строк ISO-IR-111 (и, следовательно, несовместимую ни с одной из них на практике, но частично совместимую [2] с Windows-1251 ). [8] [2]

Кодовая страница IBM 915 является расширением ISO/IEC 8859-5, добавляя некоторые полуграфические и другие символы в область C1 . Кодовая страница IBM 1124 в основном идентична ISO-8859-5, но заменяет ѓ на ґ для украинского использования.

ISO-IR-200 , "Uralic Supplementary Cyrillic Set", [9] был зарегистрирован в 1998 году Everson Gunn Teoranta (директором которой был Майкл Эверсон до основания Evertype в 2001 году), [10] и изменяет несколько нерусских букв для поддержки кильдино -саамского , коми и ненецкого языков, которые не поддерживаются самим ISO-8859-5. Майкл Эверсон также представил Mac OS Barents Cyrillic для тех же языков на классической Mac OS. FreeDOS называет его кодовой страницей 59283 . [11]

ISO-IR-201, «Volgaic Supplementary Cyrillic Set» [12] был также представлен Эверсоном Ганном Теорантой для поддержки чувашского , коми , марийского и удмуртского языков, на которых говорят в титульных республиках России . FreeDOS называет его кодовой страницей 58259. [ 13]

Ссылки

  1. ^ Наборы символов, Управление по распределению адресов в Интернете (IANA), 2018-12-12.
  2. ^ abc Нечаев, Валентин (2013) [2001]. "Обзор вселенной 8-битных кириллических кодировок". Архивировано из оригинала 2016-12-05 . Получено 2016-12-05 .
  3. ^ «Идентификаторы кодовых страниц». 7 января 2021 г.
  4. ^ ab "ECMA-113 - Ecma International" (PDF) .
  5. ^ ab Czyborra, Roman (1998-11-30) [1998-05-25]. "The Cyrillic Charset Soup". Архивировано из оригинала 2016-12-03 . Получено 2016-12-03 .
  6. ^ "файл gost19768-87 TXT.GZ".
  7. ^ Европейская ассоциация производителей компьютеров (1 мая 1988 г.). Кириллическая часть латинского/кириллицического алфавита (PDF) . ITSCJ/ IPSJ . ISO-IR -144.
  8. ^ Соколов, Михаил (2003-04-05). "ECMA-cyrillic alias iso-ir-111 sore". IETF Charsets Mailing List (Mailing list).
  9. ^ ab Национальный орган по стандартизации Ирландии. Уральский дополнительный кириллический набор (PDF) . ITSCJ/ IPSJ . ISO-IR -200.
  10. ^ Ганн, Мэрион; Эверсон, Майкл (2001-09-20). "Everson Gunn Teoranta (EGT) & Everson Typography". Unicode Mail List (список рассылки).
  11. ^ "Cpi/CPIISO/Codepage.TXT на главном сервере · FDOS/Cpi". GitHub .
  12. ^ ab Национальный орган по стандартам Ирландии. Дополнительный набор кириллицы Волги (PDF) . ITSCJ/ IPSJ . ISO-IR -201.
  13. ^ "Cpi/CPIISO/Codepage.TXT на главном сервере · FDOS/Cpi". GitHub .

Внешние ссылки