stringtranslate.com

Кодовая страница

В вычислительной технике кодовая страница — это кодировка символов и, как таковая, представляет собой специфическую ассоциацию набора печатных символов и управляющих символов с уникальными числами. Обычно каждое число представляет собой двоичное значение в одном байте. (В некоторых контекстах эти термины используются более точно; см. Кодирование символов § Терминология .)

Термин «кодовая страница» возник из мэйнфреймов IBM на базе EBCDIC [1] , но Microsoft , SAP , [2] и Oracle Corporation [3] входят в число поставщиков, которые используют этот термин. Большинство поставщиков идентифицируют свои собственные наборы символов по имени. В случае, когда существует множество наборов символов (как в IBM), идентификация наборов символов по числу является удобным способом их различения. Первоначально номера кодовых страниц относились к номерам страниц в руководстве по стандартному набору символов IBM, [4] [5] [6] — условие, которое не соблюдалось в течение длительного времени. Поставщики, использующие систему кодовых страниц, присваивают кодировке символов свой собственный номер кодовой страницы, даже если она более известна под другим именем; например, UTF-8 присвоены номера страниц 1208 в IBM, 65001 в Microsoft и 4110 в SAP.

Hewlett-Packard использует аналогичную концепцию в своей операционной системе HP-UX и протоколе языка команд принтера [7] (PCL) для принтеров (как для принтеров HP, так и для других). Терминология, однако, другая: то, что другие называют набором символов , HP называет набором символов , а то, что IBM или Microsoft называют кодовой страницей , HP называет кодом набора символов . HP разработала серию наборов символов, [8] [9], каждый из которых имеет соответствующий код набора символов, для кодирования как своих собственных наборов символов, так и наборов символов других поставщиков.

Множество наборов символов заставляет многих поставщиков рекомендовать Unicode .

Система нумерации кодовых страниц

IBM представила концепцию систематического присвоения небольшого, но глобально уникального 16-битного числа каждой кодировке символов, с которой может столкнуться компьютерная система или совокупность компьютерных систем. Происхождение схемы нумерации от IBM отражено в том факте, что наименьшие (первые) числа присвоены вариантам кодировки EBCDIC IBM, а немного большие числа относятся к вариантам расширенной кодировки ASCII IBM, используемой в аппаратном обеспечении ПК.

С выпуском PC DOS версии 3.3 (и почти идентичной MS-DOS 3.3) IBM представила систему нумерации кодовых страниц обычным пользователям ПК, поскольку номера кодовых страниц (и фраза «кодовая страница») использовались в новых командах для разрешить систематическую настройку кодировки символов, используемой всеми частями ОС. [10]

Номера кодовых страниц IBM (CPGID и CCSID), используемые для кодировок CJK. Использование Microsoft номеров кодовых страниц для кодировок CJK отличается и указано в скобках, где это применимо.

После того, как IBM и Microsoft прекратили сотрудничество в 1990-х годах, две компании сохранили список присвоенных номеров кодовых страниц независимо друг от друга, что привело к некоторым противоречивым назначениям. По крайней мере, один сторонний поставщик ( Oracle ) также имеет свой собственный список числовых присвоений. [3] Текущие назначения IBM перечислены в их репозитории CCSID , а назначения Microsoft документированы в MSDN . [11] Кроме того, список названий и приблизительных сокращений IANA ( Агентство по присвоению номеров в Интернете ) для установленных кодовых страниц на любом компьютере с Windows можно найти в реестре на этом компьютере (эта информация используется программами Microsoft, такими как Internet Исследователь ).

Большинство известных кодовых страниц, за исключением страниц для языков CJK и вьетнамского языка , помещают все свои кодовые точки в восемь бит и не включают в себя ничего, кроме сопоставления каждой кодовой точки с одним символом; кроме того, не используются такие методы, как комбинирование символов, сложные сценарии и т. д.

Текстовый режим стандартного ( VGA-совместимого ) графического оборудования ПК построен на использовании 8-битной кодовой страницы, хотя можно использовать две одновременно с некоторой жертвой глубины цвета, а в адаптере дисплея можно сохранить до восьми для легкого переключения. [12] Был набор сторонних шрифтов кодовой страницы, которые можно было загрузить в такое оборудование. Однако в настоящее время поставщики операционных систем обычно предоставляют свои собственные системы кодирования и рендеринга символов, которые работают в графическом режиме и полностью обходят это аппаратное ограничение. Однако система обращения к кодировкам символов по номеру кодовой страницы остается применимой в качестве эффективной альтернативы строковым идентификаторам, например, указанным IETF и IANA для использования в различных протоколах, таких как электронная почта и веб-страницы.

Связь с ASCII

Большинство используемых в настоящее время кодовых страниц представляют собой расширенные наборы ASCII , 7-битного кода, представляющего 128 управляющих кодов и печатных символов. В далеком прошлом 8-битные реализации кода ASCII устанавливали старший бит в ноль или использовали его в качестве бита четности при передаче данных по сети. Когда верхний бит был доступен для представления символьных данных, можно было представить в общей сложности 256 символов и управляющих кодов. Большинство поставщиков (включая IBM) использовали этот расширенный диапазон для кодирования символов, используемых в различных языках, и графических элементов, что позволяло имитировать примитивную графику на устройствах вывода только текста. Для этих «расширенных наборов символов ASCII» не существовало формального стандарта, и поставщики называли эти варианты кодовыми страницами, как IBM всегда делала для вариантов кодировок EBCDIC.

Связь с Юникодом

Unicode — это попытка включить все символы из всех ныне и исторически используемых человеческих языков в одно перечисление символов (по сути, в одну большую кодовую страницу), устраняя необходимость различать разные кодовые страницы при обработке текста, хранящегося в цифровом виде. Unicode пытается сохранить обратную совместимость со многими устаревшими кодовыми страницами, копируя некоторые кодовые страницы 1:1 в процессе проектирования. Явной целью разработки Unicode было обеспечение двустороннего преобразования между всеми распространенными устаревшими кодовыми страницами, хотя эта цель не всегда достигалась. Некоторые поставщики, а именно IBM и Microsoft, анахронично присваивают номера кодовых страниц кодировкам Unicode. Это соглашение позволяет использовать номера кодовых страниц в качестве метаданных для определения правильного алгоритма декодирования при обнаружении двоичных хранимых данных.

Кодовые страницы IBM

Кодовые страницы на основе EBCDIC

Эти кодовые страницы используются IBM в наборах символов EBCDIC для мэйнфреймов . [13]

Кодовые страницы DOS

Эти кодовые страницы используются IBM в своей операционной системе PC DOS . Эти кодовые страницы изначально были встроены непосредственно в аппаратное обеспечение текстового режима графических адаптеров, используемых с IBM PC и его клонами, включая оригинальные адаптеры MDA и CGA, наборы символов которых можно было изменить только путем физической замены микросхемы ПЗУ, содержащей шрифт. Интерфейс этих адаптеров (эмулируемый всеми более поздними адаптерами, такими как VGA) обычно ограничивался однобайтовыми наборами символов, содержащими только 256 символов в каждом шрифте/кодировке (хотя VGA добавлял частичную поддержку немного больших наборов символов).

При работе со старым оборудованием, протоколами и форматами файлов часто необходимо поддерживать эти кодовые страницы, но для новых проектов рекомендуется использовать более новые системы кодирования, в частности Unicode.

Кодовые страницы DOS обычно хранятся в файлах .CPI. [16] [17] [18] [19] [20]

Кодовые страницы IBM AIX

Эти кодовые страницы используются IBM в своей операционной системе AIX . Они эмулируют несколько наборов символов, а именно те, которые предназначены для использования в соответствии с ISO, например, в UNIX-подобных операционных системах.

Кодовая страница 819 идентична Latin-1, ISO/IEC 8859-1 и с немного измененными командами позволяет машинам MS-DOS использовать эту кодировку. Он использовался с миникомпьютерами IBM AS/400.

Кодовые страницы IBM OS/2

Эти кодовые страницы используются IBM в своей операционной системе OS/2 .

Кодовые страницы эмуляции Windows

Эти кодовые страницы используются IBM при эмуляции наборов символов Microsoft Windows . Большинство этих кодовых страниц имеют тот же номер, что и кодовые страницы Microsoft, хотя они не совсем идентичны. Однако некоторые кодовые страницы созданы IBM, а не разработаны Microsoft.

Кодовые страницы эмуляции Macintosh

Эти кодовые страницы используются IBM при эмуляции наборов символов Apple Macintosh .

Кодовые страницы эмуляции Adobe

Эти кодовые страницы используются IBM при эмуляции наборов символов Adobe .

Кодовые страницы эмуляции HP

Эти кодовые страницы используются IBM при эмуляции наборов символов HP .

Кодовые страницы эмуляции DEC

Эти кодовые страницы используются IBM при эмуляции наборов символов DEC .

Кодовые страницы IBM Unicode

Кодовые страницы Microsoft

Кодовые страницы Windows

Эти кодовые страницы используются Microsoft в собственной операционной системе Windows. Microsoft определила ряд кодовых страниц , известных как кодовые страницы ANSI (первая из них, 1252, была основана на апокрифическом проекте ANSI того, что стало ISO 8859-1 ). Кодовая страница 1252 построена на основе ISO 8859-1, но использует диапазон 0x80-0x9F для дополнительных печатаемых символов, а не управляющие коды C1 из ISO 6429 , упомянутые в ISO 8859-1. [24] Некоторые из остальных частично основаны на других частях ISO 8859 , но часто переработаны, чтобы приблизиться к 1252.

Microsoft рекомендует новым приложениям использовать UTF-8 или UCS-2/UTF-16 вместо этих кодовых страниц. [25]

Кодовые страницы DBCS

Эти кодовые страницы представляют кодировки символов DBCS для различных языков CJK. В операционных системах Microsoft они используются как кодовая страница «OEM» и «Windows» для соответствующей локали.

Кодовые страницы MS-DOS

Эти кодовые страницы используются Microsoft в своей операционной системе MS-DOS. Microsoft называет их кодовыми страницами OEM, поскольку они были определены производителями оригинального оборудования , которые лицензировали MS-DOS для распространения вместе с их оборудованием, а не Microsoft или организацией по стандартизации. Большинство этих кодовых страниц имеют тот же номер, что и эквивалентные кодовые страницы IBM, хотя некоторые из них не совсем идентичны. [26]

Кодовые страницы эмуляции Macintosh

Эти кодовые страницы используются Microsoft при эмуляции наборов символов Apple Macintosh .

Различные другие кодовые страницы Microsoft

Следующие номера кодовых страниц относятся к Microsoft Windows. IBM может использовать разные номера для этих кодовых страниц. Они эмулируют несколько наборов символов, а именно те, которые предназначены для использования в соответствии с ISO, [ необходимы пояснения ], такие как UNIX-подобные операционные системы.

Кодовые страницы Microsoft Unicode

Наборы символов HP

HP разработала серию наборов символов (каждый со своим соответствующим кодом набора символов) для кодирования либо своих собственных наборов символов, либо наборов символов других поставщиков. Обычно это 7-битные наборы символов, которые при перемещении в старшую часть и сопоставлении с набором символов ASCII образуют 8-битные наборы символов.

Собственные наборы символов HP

Наборы символов от других поставщиков

Кодовые страницы других производителей

Эти кодовые страницы являются независимыми назначениями сторонних поставщиков. Поскольку исходная кодовая страница IBM PC ( номер 437 ) на самом деле не была предназначена для международного использования, появилось несколько частично совместимых вариантов, специфичных для страны или региона.

Эти присвоения номеров кодовых страниц не являются официальными ни IBM, ни Microsoft, и почти ни один из них не упоминается IANA как используемый набор символов. Номера, присвоенные этим кодовым страницам, произвольны и могут противоречить зарегистрированным номерам, используемым IBM или Microsoft. Некоторые из них могут предшествовать переключению кодовых страниц, добавленному в DOS 3.3.

Список назначений кодовых страниц

Список известных назначений кодовых страниц (неполный):

Критика

Многие старые кодировки символов (в отличие от Unicode) страдают от ряда проблем. Некоторые поставщики недостаточно документируют значение всех значений кодовых точек в своих кодовых страницах, что снижает надежность последовательной обработки текстовых данных в различных компьютерных системах. Некоторые поставщики добавляют собственные расширения к установленным кодовым страницам, чтобы добавлять или изменять определенные значения кодовых точек: например, байт 0x5C в Shift JIS может представлять собой либо обратную косую черту , либо символ валюты иены в зависимости от платформы. Наконец, чтобы поддерживать несколько языков в программе, не использующей Unicode, необходимо сохранить кодовую страницу, используемую для каждой строки/документа.

Приложения также могут ошибочно помечать текст в Windows-1252 как ISO-8859-1 . Единственное различие между этими кодовыми страницами заключается в том, что значения кодовых точек в диапазоне 0x80–0x9F, используемые в ISO-8859-1 для управляющих символов, вместо этого используются в качестве дополнительных печатаемых символов в Windows-1252 – особенно для кавычек , евро. знак и символ товарного знака, среди прочего. Браузеры на платформах, отличных от Windows, обычно отображают пустые поля или вопросительные знаки для этих символов, что затрудняет чтение текста. Большинство браузеров исправили это, игнорируя набор символов и интерпретируя его как Windows-1252, чтобы он выглядел приемлемо. В HTML5 обработка ISO-8859-1 как Windows-1252 даже кодифицирована как стандарт W3C . [47] Хотя браузеры обычно были запрограммированы на такое поведение, это не всегда справедливо для другого программного обеспечения. Следовательно, при получении передачи файла из системы Windows платформы, отличные от Windows, будут либо игнорировать эти символы, либо рассматривать их как стандартные управляющие символы и пытаться соответствующим образом выполнить указанное управляющее действие.

Из-за обширной документации Unicode, обширного набора символов и политики стабильности символов перечисленные выше проблемы редко вызывают беспокойство Unicode. UTF-8 (который может кодировать более миллиона кодовых точек) заменил метод кодовой страницы с точки зрения популярности в Интернете. [48] ​​[49]

Частные кодовые страницы

Когда в начале истории персональных компьютеров пользователи не обнаруживали, что их требования к кодировке символов были выполнены, частные или локальные кодовые страницы создавались с помощью резидентных утилит или путем перепрограммирования BIOS EPROM . В некоторых случаях были изобретены неофициальные номера кодовых страниц (например, CP895).

Когда стала доступна более разнообразная поддержка наборов символов, большинство этих кодовых страниц вышли из употребления, за некоторыми исключениями, такими как кодировка Kamenický или KEYBCS2 для чешского и словацкого алфавитов. Другой набор символов — это стандарт кодирования Иранской системы , созданный корпорацией Иранской системы для поддержки персидского языка . Этот стандарт использовался в Иране в программах для DOS, и после введения кодовой страницы Microsoft 1256 этот стандарт устарел. Однако некоторые программы Windows и DOS, использующие эту кодировку, все еще используются, и существуют некоторые шрифты Windows с этой кодировкой.

Чтобы преодолеть такие проблемы, уровень 2 архитектуры представления символьных данных IBM специально резервирует диапазоны идентификаторов кодовых страниц для назначений, определяемых пользователем и для частного использования. Всякий раз, когда используются такие идентификаторы кодовых страниц, пользователь не должен предполагать, что та же функциональность и внешний вид могут быть воспроизведены в другой конфигурации системы или на другом устройстве или системе, если пользователь не позаботится об этом специально. Диапазон кодовых страниц 57344-61439 ( E000h - EFFFh ) официально зарезервирован для кодовых страниц, определяемых пользователем (или фактически CCSID в контексте IBM CDRA ), тогда как диапазон 65280-65533 ( FF00h - FFFDh ) зарезервирован для любых кодовых страниц, определяемых пользователем. определяемые назначения «частного использования». Например, незарегистрированный пользовательский вариант кодовой страницы 437 ( 1B5h ) или 28591 ( 6FAF ) может стать 57781 ( E1B5h ) или 61359 ( EFAFh ) соответственно, чтобы избежать потенциальных конфликтов с другими присвоениями и сохранить иногда существующие внутренние числовая логика в назначениях исходных кодовых страниц. Незарегистрированная частная кодовая страница, не основанная на существующей кодовой странице, кодовая страница, специфичная для устройства, такая как шрифт принтера, которой нужен только логический дескриптор, чтобы она стала адресуемой для системы, часто меняющийся шрифт загрузки или номер кодовой страницы с символическим то есть в локальной среде может иметь назначение в частном диапазоне, например 65280 ( FF00h ).

Идентификаторы кодовых страниц 0, 65534 ( FFFEh ) и 65535 ( FFFFh ) зарезервированы для внутреннего использования операционными системами, такими как DOS, и не должны назначаться каким-либо конкретным кодовым страницам.

Смотрите также

Рекомендации

  1. ^ «Содержание». www.ibm.com .
  2. ^ «Кодовая страница». SAP.com . Архивировано из оригинала 14 ноября 2009 г. Проверено 8 августа 2009 г.
  3. ^ ab «Глоссарий». oracle.com . Архивировано из оригинала 30 сентября 2011 г. Проверено 8 августа 2009 г.
  4. ^ «Информация о программисте видеотерминала VT510» . Корпорация цифрового оборудования (DEC). 7.1. Наборы символов — Обзор. Архивировано из оригинала 26 января 2016 г. Проверено 15 февраля 2017 г. В дополнение к традиционным наборам символов DEC и ISO , которые соответствуют структуре и правилам ISO 2022 , VT510 поддерживает ряд кодовых страниц IBM PC ( номера страниц в руководстве по стандартному набору символов IBM) в режиме PCTerm для эмуляции консольного терминала ПК отраслевого стандарта.
  5. ^ «7.1. Наборы символов — обзор» . Информация о программаторе видеотерминала VT520/VT525 (PDF) . Корпорация цифрового оборудования (DEC). Июль 1994 г. с. 7-1. ЭК-ВТ520-РМ. А01. Архивировано (PDF) из оригинала 15 февраля 2017 г. Проверено 15 февраля 2017 г. В дополнение к традиционным наборам символов DEC и ISO VT520 поддерживает ряд кодовых страниц IBM PC (которые относятся к номерам страниц в руководстве по стандартным наборам символов IBM) в режиме PCTerm для эмуляции консольного терминала ПК, соответствующих отраслевым стандартам.
  6. ^ abc Пол, Матиас Р. (10 июня 2001 г.) [1995]. «Обзор кодовых страниц DOS, OS/2 и Windows» (файл CODEPAGE.LST) (предварительная редакция 1.59). Архивировано из оригинала 20 апреля 2016 г. Проверено 20 августа 2016 г.
  7. ^ «Наборы символов языка команд принтера» . www.pclviewer.com . Архивировано из оригинала 31 июля 2020 г. Проверено 25 мая 2021 г.
  8. ^ «Наборы символов HP». pclhelp.com . Архивировано из оригинала 19 февраля 2015 г. Проверено 20 февраля 2017 г.
  9. ^ «Руководство по сравнению PCL5» (PDF) . Архивировано (PDF) из оригинала 21 февраля 2017 г. Проверено 20 февраля 2017 г.
  10. ^ Збиковски, Марк ; Аллен, Пол ; Балмер, Стив ; Борман, Рубен; Борман, Роб; Батлер, Джон; Кэрролл, Чак; Чемберлен, Марк; Челл, Дэвид; Коули, Майк; Кортни, Майк; Драйфус, Майк; Дункан, Рэйчел; Экхардт, Курт; Эванс, Эрик; Фермер, Рик; Гейтс, Билл ; Гири, Майкл; Гриффин, Боб; Хогарт, Дуг; Джонсон, Джеймс В.; Кермаани, Каамель; Король, Адриан; Кох, Рид; Ландовски, Джеймс; Ларсон, Крис; Леннон, Томас; Липки, Дэн; Макдональд, Марк ; МакКинни, Брюс; Мартин, Паскаль; Мазерс, Эстель; Мэтьюз, Боб; Мелин, Дэвид; Мергентайм, Чарльз; Невин, Рэнди; Ньюэлл, Дэн; Ньюэлл, Тани; Норрис, Дэвид; О'Лири, Майк; О'Рир, Боб ; Олссон, Майк; Остерман, Ларри; Остлинг, Ридж; Пай, Сунил; Патерсон, Тим ; Перес, Гэри; Питерс, Крис; Петцольд, Чарльз ; Поллок, Джон; Рейнольдс, Аарон ; Рубин, Дэррил; Райан, Ральф; Шульмейстерс, Карл; Шах, Раджен; Шоу, Барри; Коротко, Энтони; Сливка, Бен; Смирл, Джон; Стиллмейкер, Бетти; Стоддард, Джон; Тиллман, Деннис; Уиттен, Грег; Йонт, Натали; Зек, Стив (1988). «Технические консультанты». Энциклопедия MS-DOS: версии с 1.0 по 3.2 . Дункан, Рэй; Боствик, Стив; Бургойн, Кейт; Байерс, Роберт А.; Хоган, Том; Кайл, Джим; Летвин, Гордон ; Петцольд, Чарльз ; Рабиновиц, Чип; Томлин, Джим; Уилтон, Ричард; Вулвертон, Ван; Вонг, Уильям; Вудкок, Джоанн (Полностью переработанная ред.). Редмонд, Вашингтон, США: Microsoft Press . ISBN 1-55615-049-0. LCCN  87-21452. ОСЛК  16581341.[1] Архивировано 14 октября 2018 г. в Wayback Machine (xix+1570 страниц; 26 см) (Примечание. Это издание было опубликовано в 1988 г. после обширной переработки отозванного первого издания 1986 г. другой группой авторов.)
  11. ^ «Идентификаторы кодовых страниц». microsoft.com . Майкрософт . Архивировано из оригинала 27 октября 2014 г. Проверено 27 октября 2014 г.
  12. ^ «Программирование видео VGA/SVGA — работа в текстовом режиме VGA» . osdever.net . Архивировано из оригинала 1 сентября 2010 г. Проверено 23 сентября 2006 г.
  13. ^ «IBM и глобализация: кодовые страницы» . ИБМ. Архивировано из оригинала 16 июля 2012 г.
  14. ^ abcdef xlate - Транслитерированное содержание записей, IBM Corporation , 2010 [1986], заархивировано из оригинала 16 июня 2019 г. , получено 18 октября 2016 г.
  15. ^ «Кодовая страница CPGID 01093 (pdf)» (PDF) . Архивировано из оригинала (PDF) 8 июля 2015 г.
  16. ^ Пол, Матиас Р. (10 июня 2001 г.) [1995]. «Описание формата файлов .CPI DOS, OS/2 и Windows NT и Linux .CP» (файл CPI.LST) (изд. 1.30). Архивировано из оригинала 20 апреля 2016 г. Проверено 20 августа 2016 г.
  17. ^ Эллиотт, Джон К. (14 октября 2006 г.). «Формат файла CPI». Seasip.info . Архивировано из оригинала 22 сентября 2016 г. Проверено 22 сентября 2016 г.
  18. ^ Брауэр, Андрис Эверт (10 февраля 2001 г.). «CPI-шрифты». 0,2. Архивировано из оригинала 22 сентября 2016 г. Проверено 22 сентября 2016 г.
  19. ^ Хараламбус, Яннис (сентябрь 2007 г.). Шрифты и кодировки . Перевод Хорна, П. Скотта (1-е изд.). Севастополь, Калифорния, США: O'Reilly Media, Inc. , стр. 601–602, 611. ISBN. 978-0-596-10242-5.
  20. ^ Справочник программиста MS-DOS . Майкрософт Пресс . 1991. ISBN 1-55615-329-5.
  21. ^ «Кодовая страница 1004 — Windows Extended» . ИБМ . 2001. Архивировано из оригинала 13 мая 2018 г. Проверено 13 мая 2018 г.
  22. ^ «Архитектура представления символьных данных» . ИБМ . Архивировано из оригинала 23 июня 2019 г. Проверено 12 октября 2019 г.
  23. ^ abcdefghijkl «Идентификатор кодированного набора символов IBM (CCSID)» . ИБМ . Архивировано из оригинала 26 ноября 2009 г.
  24. ^ ИСО/МЭК 8859-1:1998(Е). ИСО . 15 апреля 1998 г. п. 1. Архивировано из оригинала 30 октября 2020 г. Проверено 30 октября 2020 г. Кодированные символы в этом наборе могут использоваться в сочетании с кодированными функциями управления, выбранными из ISO/IEC 6429.
  25. ^ «Кодовые страницы». microsoft.com . Майкрософт . Архивировано из оригинала 27 февраля 2011 г. Проверено 21 декабря 2010 г.
  26. ^ "пентахо/пентахо-репортаж" . Гитхаб . Архивировано из оригинала 16 июня 2019 г. Проверено 20 февраля 2017 г.
  27. ^ abcde «Идентификаторы кодовых страниц». Сеть разработчиков Microsoft . Майкрософт. 2014. Архивировано из оригинала 19 июня 2016 г. Проверено 19 июня 2016 г.
  28. ^ abcde «Веб-кодировки — Internet Explorer — Кодировки». WHATWG Wiki . 2012-10-23. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
  29. ^ Фоллер, Антонин (2014) [2011]. «Западноевропейская (IA5) кодировка — кодировки Windows». WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
  30. ^ Фоллер, Антонин (2014) [2011]. «Немецкая кодировка (IA5) — кодировки Windows». WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
  31. ^ Фоллер, Антонин (2014) [2011]. «Шведская (IA5) кодировка — кодировки Windows». WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
  32. ^ Фоллер, Антонин (2014) [2011]. «Норвежская (IA5) кодировка — кодировки Windows». WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
  33. ^ Фоллер, Антонин (2014) [2011]. «Кодировка US-ASCII — кодировки Windows». WUtils.com — Интернет-утилита и справка . Программное обеспечение Мотобит. Архивировано из оригинала 20 июня 2016 г. Проверено 20 июня 2016 г.
  34. ^ abcdefg Пол, Матиас Р. (05 сентября 2002 г.), Техническая информация о недокументированной информации о стране DOS для записей LCASE, ARAMODE и CCTORC, список разработчиков FreeDOS fd-dev в Topica, заархивировано из оригинала 27 мая 2016 г. , получено 26 мая 2016 г.
  35. ^ abcdefgh Браун, Ральф Д. (29 декабря 2002 г.). Список прерываний x86 . 61.
  36. ^ abcdefgh Пол, Матиас Р. (30 июля 1997 г.). NWDOS-TIPs — советы и подсказки для Novell DOS 7, с просмотром недокументированных подробностей, ошибок и обходных путей. MPDOSTIP (на немецком языке) (3-е изд.). Архивировано из оригинала 22 мая 2016 г. Проверено 11 января 2012 г.(Примечание. NWDOSTIP.TXT — это всеобъемлющая работа по Novell DOS 7 и OpenDOS 7.01 , включая описание многих недокументированных функций и внутренних устройств. Это часть еще более обширной авторской коллекции MPDOSTIP.ZIP, которая поддерживалась до 2001 года и распространялась на многих сайтах по адресу: время. Предоставленная ссылка указывает на более старую версию файла NWDOSTIP.TXT, преобразованную в HTML.)
  37. ^ abcdefgh Пол, Матиас Р. (9 апреля 2001 г.). NWDOS-TIPs — советы и подсказки для Novell DOS 7, с просмотром недокументированных подробностей, ошибок и обходных путей . MPDOSTIP (на немецком языке) (3-е изд.).
  38. ^ "770". Архивировано из оригинала 26 февраля 2017 г. Проверено 25 февраля 2017 г.От литовского Lika Software
  39. ^ abcdefgh "ЛИКИТ". www.likit.lt . Архивировано из оригинала 19 апреля 2017 г. Проверено 25 февраля 2017 г.
  40. ^ "771". Архивировано из оригинала 26 февраля 2017 г. Проверено 25 февраля 2017 г.От литовского Lika Software
  41. ^ "772". Архивировано из оригинала 26 февраля 2017 г. Проверено 25 февраля 2017 г.От литовского Lika Software
  42. ^ "774". Архивировано из оригинала 26 февраля 2017 г. Проверено 25 февраля 2017 г.От литовского Lika Software
  43. ^ abc "lietuvybė.lt - Rašmenų koduotės" [lietuvybė.lt - Кодировки символов] (на литовском языке). Архивировано из оригинала 28 августа 2019 г. Проверено 28 августа 2019 г.
  44. ^ Хоган, Том (1992). Die PC-Referenz für Programmierer (на немецком языке) (2-е изд.). Система Верлаг ГмбХ. ISBN 3-89390-272-4.(Примечание. Эта книга представляет собой немецкий перевод «Справочника по ПК для программистов», выпущенного Microsoft Press. В ней упоминается кодовая страница с идентификатором 854 для Испании.)
  45. ^ abcdefghijklmnopqrstu vwxyz «Руководство пользователя Star LC 8021» (PDF) . Архивировано (PDF) из оригинала 29 сентября 2020 г. Проверено 20 февраля 2017 г.
  46. ^ IBM. «Информационный документ о кодовой странице SBCS — CPGID 00437». Архивировано из оригинала 9 июня 2016 г. Проверено 4 июля 2014 г.
  47. ^ «Кодировка». ЧТОРГ . 27 января 2015 г. сек. 4.2 Имена и метки. Архивировано из оригинала 4 февраля 2015 г. Проверено 4 февраля 2015 г.
  48. ^ «Статистика использования кодировок символов на веб-сайтах (обновляется ежедневно)» . w3techs.com . Проверено 6 августа 2015 г.
  49. ^ «Статистика использования UTF-8» . Trends.builtwith.com . Архивировано из оригинала 24 марта 2011 г. Проверено 28 марта 2011 г.

Внешние ссылки