stringtranslate.com

Кодовая страница 866

Кодовая страница 866 ( CCSID 866) [2] (CP 866, «DOS Cyrillic Russian») [3]кодовая страница , используемая в DOS и OS/2 [4] в России для написания кириллицы . [5] [6] Он основан на «альтернативной кодовой странице» ( русский : Альтернативная кодировка ), разработанной в 1984 году в ИХНА АН СССР и опубликованной в 1986 году исследовательской группой Академии наук СССР. [7] Кодовая страница широко использовалась в эпоху DOS, поскольку она сохраняет все псевдографические символы кодовой страницы 437 (в отличие от « Основной кодовой страницы » или кодовой страницы 855 ) и поддерживает алфавитный порядок (хотя и несмежный) кириллицы. буквы (в отличие от КОИ8-Р ). Изначально эта кодировка была доступна только в русской версии MS-DOS 4.01 (1990 г.), но с MS-DOS 6.22 она стала доступна в любой языковой версии.

Стандарт кодирования WHATWG , определяющий кодировки символов, разрешенные в HTML5 , которые должны поддерживать совместимые браузеры, [8] включает кодовую страницу 866. [9] Это единственная указанная однобайтовая кодировка, которая не названа частью ISO 8859 , Mac . Кодировка, специфичная для ОС , специфичная для Microsoft Windows кодировка ( Windows-874 или Windows-125x ) или вариант KOI-8 . [9] Авторам новых страниц и разработчикам новых протоколов рекомендуется использовать вместо этого UTF-8 . [10]

Две очень похожие, но не идентичные кодировки стандартизированы в ГОСТ Р 34.303-92 [11] как КОИ-8 Н1 и КОИ-8 Н2 (не путать с исходной КОИ-8 ).

Набор символов

Каждый символ, отличный от ASCII, отображается с его эквивалентной кодовой точкой Unicode . Первая половина (кодовые точки 0–127) этой таблицы такая же, как и у кодовой страницы 437 ( см. ).

  Символы и пунктуация

Варианты

Существовало несколько вариантов кодовой страницы, но различия заключались в основном в последних 16 кодовых точках (240–255).

Альтернативная кодовая страница

Исходная версия кодовой страницы Брябрина и др. (1986) [7] называется «Альтернативная кодовая страница» ( русский : Альтернативная кодировка ), чтобы отличить ее от «Основной кодовой страницы» ( русский : Основная кодировка ) тех же авторов. Он поддерживает только русский и болгарский языки . В основном это то же самое, что и кодовая страница 866, за исключением шестнадцатеричных кодов от F2 до шестнадцатеричных F7 ( кодовая страница 866 заменяется на украинские и белорусские буквы) и шестнадцатеричных кодов от F8 до шестнадцатеричных FB (где кодовая страница 866 вместо этого соответствует кодовой странице 437 ). Отличающаяся строка показана ниже.

  Символы позже изменены кодовой страницей 866.

Измененная кодовая страница 866

Неофициальный вариант с кодовыми точками 240–255, идентичный кодовой странице 437 . Однако буква Ёё обычно ставится на 240 и 241. [18] Эта версия поддерживает только русский и болгарский языки . Отличающаяся строка показана ниже.

  Отличается от соответствующей кодовой страницы 866 и соответствует OEM-US.

ГОСТ Р 34.303-92.

ГОСТ Р 34.303-92 определяет два варианта: КОИ-8 Н1 и КОИ-8 Н2. Их не следует путать с кодировкой КОИ-8 , которой они не придерживаются.

КОИ-8 Н2

KOI-8 N2 является более расширенным вариантом и соответствует кодовой странице 866 и альтернативной кодовой странице, за исключением последней строки или палочки . [c] Для этой последней строки он поддерживает буквы для белорусского и украинского языков в дополнение к русским, но в макете, не связанном с кодовой страницей 866 или 1125. В частности, русский Ё / ё (который не менялся между альтернативной кодовой страницей и кодовой страницей). 866) также находится в другом месте. Последняя палка KOI-8 N2 показана ниже. [11]

  Отличается от кодовой страницы 866 и альтернативной кодовой страницы.

КОИ-8 Н1

Другой вариант, КОИ-8 N1, представляет собой подмножество КОИ-8 N2, в котором отсутствуют нерусские кириллические буквы и смешанные одно- и двухстрочные символы для рисования прямоугольников , оставляя их пустыми для дальнейшей интернационализации (сравните с кодовой страницей 850 ). Пораженные палочки показаны ниже. [11]

Литовские варианты

КБЛ

Кодовая страница KBL , неофициально известная как кодовая страница 771, [19] является самой ранней кодировкой символов DOS для литовского языка. [20] В основном он соответствует кодовой странице 866 и альтернативной кодовой странице, но заменяет последнюю строку и некоторые блоковые символы буквами литовского алфавита , которые иначе не присутствуют в ASCII. Русский Ё / ё не поддерживается, [20] аналогично КОИ-7 .

Также существует модифицированная версия, кодовая страница 773 , в которой кириллические буквы заменяются латышскими и эстонскими буквами. [20]

  Отличается от кодовой страницы 866 и альтернативной кодовой страницы.

ЛСТ 1284

Литовский стандарт LST 1284:1993, известный как кодовая страница 1119 или неофициально как кодовая страница 772, [19] в основном соответствует «модифицированной» кодовой странице 866, за исключением добавления кавычек в последней строке и замены смешанного одинарного слова. -двойные символы с литовскими буквами (ср. кодовую страницу 850 ). В отличие от КБЛ, русская Ё / ё сохранена.

Он сопровождает LST 1283 ( кодовая страница 774/1118 ), который кодирует дополнительные литовские буквы в тех же местах, что и LST 1284, но вместо этого основан на кодовой странице 437 . Позже он был заменен LST 1590-1 ( Кодовая страница 775 ), [19] который кодирует эти литовские буквы в тех же местах, но не включает кириллические буквы, заменяя их латышскими и эстонскими буквами. [20]

  Отличается от «модифицированной» кодовой страницы 866.

Украинский и белорусский варианты

Украинский стандарт RST 2018-91 обозначен IBM как кодовая страница 1125 (CCSID 1125), [25] сокращенно CP1125, а также известен как CP866U, CP866NAV или RUSCII. [26] Он соответствует исходной альтернативной кодовой странице для всех точек, за исключением шестнадцатеричных кодов от F2 до F9 включительно, которые заменены украинскими буквами. [27] Кодовая страница/CCSID 1131 [28] [29] соответствует кодовой странице 866 для всех точек, за исключением шестнадцатеричных F8 , шестнадцатеричных F9 и шестнадцатеричных FC до шестнадцатеричных FE включительно, которые заменяются отсутствующими украинскими и белорусскими буквами в процесс перемещения символа маркера (∙) из шестнадцатеричного F9 в шестнадцатеричный FE . [30] [31] Ниже показаны разные строки.

  Кодовая страница 1125 отличается от альтернативной кодовой страницы.
  Кодовая страница 1131 отличается от кодовой страницы 866.

Также так называемая кодовая страница CP 866укр представляет собой модифицированную версию CP866 с заменой Ўў на Іі. В отличие от CP1125 сохраняет полную совместимость украинских букв с CP866, хотя Ґґ отсутствует. Она не входит в стандартные дистрибутивы Windows, но некоторые пользователи устанавливают самодельный патч [38] , позволяющий использовать эту кодировку для работы в программах командной строки (таких как FAR Manager ) с именами файлов, содержащими кириллицу Іі.

Обновления знака евро

Кодовая страница IBM/CCSID 808 является вариантом кодовой страницы/CCSID 866; со знаком евро (€, U+20AC) в позиции FD hex , заменяющим универсальный знак валюты (¤). [39] [40] [41]

Кодовая страница IBM/CCSID 848 — это вариант кодовой страницы/CCSID 1125 со знаком евро в шестнадцатеричном месте FD , заменяющим ¤. [42] [43] [44]

Кодовая страница IBM/CCSID 849 — это вариант кодовой страницы/CCSID 1131 со знаком евро в шестнадцатеричном месте FB , заменяющим ¤. [45] [46] [47]

Ленер – чешская модификация

Неофициальная модификация, используемая в программном обеспечении, разработанном Майклом Ленером и Питером Р. Чехом. Он заменяет три математических символа с каймами и знаком сечения , которые обычно используются в русском языке. (Ленер и Чехия также создали ряд альтернативных наборов символов для других европейских языков, в том числе один на основе CWI-2 для венгерского языка , набор Каменицкого для чешского и словацкого языков , мазовецкий вариант для польского языка и, казалось бы, уникальную кодировку для Литовский . Измененная строка показана ниже.

  Отличается от кодовой страницы 866

Латышский вариант

Латышский вариант, поддерживаемый принтерами Star и FreeDOS, имеет кодовую страницу 3012 . Эта кодировка получила название «РусЛат». [48]

  Отличается от кодовой страницы 866

FreeDOS

FreeDOS предоставляет дополнительные неофициальные расширения кодовой страницы 866 для различных неславянских языков: [49]

Кодовая страница 900

До того, как окончательная кодовая страница Microsoft для русской MS-DOS 4.01 была зарегистрирована в IBM Францем Рау из Microsoft как CP866 в январе 1990 года, ее черновые версии, разработанные Юрием Стариковым (Юрий Стариков) из Dialogue, внутри компании все еще назывались кодовой страницей 900. Хотя перед выпуском продукта документация была исправлена ​​с учетом нового названия, в 1990 году в российской прессе были опубликованы эскизы более ранних черновых версий с кодовой страницей 900 и без украинских и белорусских букв, добавленных осенью 1989 года. [50] Кодовая страница 900 просочилась в дистрибутив российского информационного файла кодовой страницы LCD.CPI MS-DOS 5.0 . [51]

Примечания

  1. ^ Включает явно украинские и русинские буквы Є и Ї , но не имеет І , отличного от латинского I , и реализует советскую орфографию, то есть опускает Ґ. Они добавлены в некоторых модификациях.
  2. ^ Включает исключительно белорусский Ў , но не І, отличный от латинского I (хотя это добавляется в некоторых модификациях).
  3. ^ т. е. коды от 240 до 255 или шестнадцатеричный от F0 до шестнадцатеричного FF.

Рекомендации

  1. ^ Наборы символов, Управление по присвоению номеров в Интернете (IANA), 12 декабря 2018 г.
  2. ^ «Информационный документ CCSID 866» . Архивировано из оригинала 27 марта 2016 г.
  3. ^ Аб Стил, Шон (24 апреля 1996 г.). «CP866.TXT: cp866_DOSCyrillicТаблица русского языка в Юникоде». Консорциум Юникод .
  4. ^ "ОС/2" (на русском языке). Архивировано из оригинала 13 августа 2016 г. Проверено 19 июня 2016 г.
  5. ^ ab «Информационный документ с кодовой страницей 866» . Архивировано из оригинала 16 марта 2016 г.
  6. ^ «Кодовые страницы, поддерживаемые Windows: кодовые страницы OEM» . Центр глобального развития Go . Майкрософт. Архивировано из оригинала 2 ноября 2011 г. Проверено 11 октября 2011 г.
  7. ^ ab (на русском языке) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для денежной ЭВМ // Микропроцессорные средства и системы. — 1986. — № 4. — С. 61–64.
  8. ^ «8.2.2.3. Кодировки символов» . HTML 5.1, 2-е издание . W3C . Пользовательские агенты должны поддерживать кодировки, определенные в стандарте кодирования WHATWG, включая, помимо прочего, […]
  9. ^ Аб ван Кестерен, Энн . «Устаревшие однобайтовые кодировки». Стандарт кодирования . ЧТОРГ .
  10. ^ ван Кестерен, Энн . «Имена и ярлыки». Стандарт кодирования . ЧТОРГ .
  11. ^ abc (на русском языке) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = 8-битные наборы кодированных символов. 8-битный код для обмена информацией.
  12. ^ "ОЕМ 866" . Центр глобального развития Go . Майкрософт. Архивировано из оригинала 4 февраля 2012 г. Проверено 17 октября 2011 г.
  13. ^ ван Кестерен, Энн (06 января 2018 г.). «Индекс index-ibm866». Стандарт кодирования . ЧТОРГ .
  14. ^ Кодовая страница CPGID 00866 (pdf) (PDF) , IBM
  15. ^ Кодовая страница CPGID 00866 (txt), IBM
  16. ^ Международные компоненты для Unicode (ICU), ibm-866_P100-1995.ucm, 3 декабря 2002 г.
  17. ^ (на русском языке) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для денежной ЭВМ // Микропроцессорные средства и системы. — 1986. — № 4. — С. 64.
  18. ^ Фигурнов В. Э. IBM PC для пользователя. — 2-е изд. — М.: 1992. — С. 279.
  19. ^ abc «Кодовые страницы: полный список». Айвосто.
  20. ^ abcd "Rašmenų koduotės". Lietuvių kalba Informationse technologijose (на литовском языке).
  21. ^ "771 коду лентеле" (на литовском языке). Ликит.
  22. ^ "771 код лентеле" . Lietuvių kalba Informationse technologijose – Rašmenų koduotės (на литовском языке).
  23. ^ "772 коду лентеле" (на литовском языке). Ликит.
  24. ^ "772 кода лентеле" . Lietuvių kalba Informationse technologijose – Rašmenų koduotės (на литовском языке).
  25. ^ «Информационный документ CCSID 1125» . Архивировано из оригинала 2 декабря 2014 г.
  26. ^ Нечаев, Валентин (2013) [2001]. «Обзор вселенной 8-битных кодировок кириллицы». Архивировано из оригинала 5 декабря 2016 г.
  27. ^ Кодовая страница ab CPGID 01125 (pdf) (PDF) , IBM
  28. ^ «Информационный документ CCSID 1131» . Архивировано из оригинала 27 марта 2016 г.
  29. ^ «Информационный документ с кодовой страницей 1131» . Архивировано из оригинала 17 марта 2016 г.
  30. ^ IBM. «Идентификаторы кодовой страницы: CP 01131». IBM Глобализация . Архивировано из оригинала 17 марта 2016 г.
  31. ^ IBM. «Кодовая страница 01131» (PDF) . Архивировано из оригинала (PDF) 8 июля 2015 г.
  32. ^ Кодовая страница CPGID 01125 (txt), IBM
  33. ^ Международные компоненты для Unicode (ICU), ibm-1125_P100-1997.ucm, 3 декабря 2002 г.
  34. ^ (на украинском языке) РСТ УРСР 2018-91. Система обмена информацией. Кодирование символов украинской валюты 8-битными кодами.
  35. ^ Кодовая страница CPGID 01131 (pdf) (PDF) , IBM
  36. ^ Кодовая страница CPGID 01131 (txt), IBM
  37. ^ Международные компоненты для Unicode (ICU), ibm-1131_P100-1997.ucm, 3 декабря 2002 г.
  38. ^ "Linux Wine + Far2l Украинский cp866" .
  39. ^ «Информационный документ CCSID 808» . Архивировано из оригинала 1 декабря 2014 г.
  40. ^ Кодовая страница CPGID 00808 (pdf) (PDF) , IBM
  41. ^ Кодовая страница CPGID 00808 (txt), IBM
  42. ^ «Информационный документ CCSID 848» . Архивировано из оригинала 1 декабря 2014 г.
  43. ^ Кодовая страница CPGID 00848 (pdf) (PDF) , IBM
  44. ^ Кодовая страница CPGID 00848 (txt), IBM
  45. ^ «Информационный документ CCSID 849» . Архивировано из оригинала 26 марта 2016 г.
  46. ^ Кодовая страница CPGID 00849 (pdf) (PDF) , IBM
  47. ^ Кодовая страница CPGID 00849 (txt), IBM
  48. ^ «Матричный принтер LC-8021, Руководство пользователя» (PDF) . Архивировано из оригинала (PDF) 29 сентября 2020 г. Проверено 13 мая 2020 г.
  49. ^ «CPIDOS — файлы CPX (информация о кодовой странице) Пакет v3.0 — кодовые страницы DOS» . Бесплатная DOS . Архивировано из оригинала 12 мая 2018 г. Проверено 30 января 2018 г.
  50. ^ Стариков, Юрий (11 апреля 2005 г.). «15-летию русской MS-DOS 4.01 посвящается» [15 лет русской MS-DOS 4.01] (на русском языке). Архивировано из оригинала 4 декабря 2016 г. Проверено 7 мая 2014 г.
  51. ^ Пол, Матиас Р. (10 июня 2001 г.) [1995]. «Обзор кодовых страниц DOS, OS/2 и Windows» (файл CODEPAGE.LST) (предварительная редакция 1.59). Архивировано из оригинала 20 апреля 2016 г. Проверено 20 августа 2016 г.

дальнейшее чтение