stringtranslate.com

Кодовая страница

В вычислительной технике кодовая страница — это кодировка символов , и как таковая она представляет собой определенную ассоциацию набора печатных символов и управляющих символов с уникальными числами. Обычно каждое число представляет двоичное значение в одном байте. (В некоторых контекстах эти термины используются более точно; см. Кодировка символов § Терминология .)

Термин «кодовая страница» возник из мэйнфреймовых систем IBM на основе EBCDIC [1], но Microsoft , SAP [ 2 ] и Oracle Corporation [ 3] входят в число поставщиков, которые используют этот термин. Большинство поставщиков идентифицируют свои собственные наборы символов по имени. В случае, когда существует множество наборов символов (как в IBM), идентификация наборов символов с помощью номера является удобным способом их различения. Первоначально номера кодовых страниц ссылались на номера страниц в руководстве по стандартным наборам символов IBM [4] [5] [6] условие, которое не соблюдалось в течение длительного времени. Поставщики, которые используют систему кодовых страниц, назначают свой собственный номер кодовой страницы кодировке символов, даже если она более известна под другим именем; например, UTF-8 были присвоены номера страниц 1208 в IBM, 65001 в Microsoft и 4110 в SAP.

Hewlett-Packard использует похожую концепцию в своей операционной системе HP-UX и своем протоколе Printer Command Language [7] (PCL) для принтеров (как для принтеров HP, так и нет). Однако терминология отличается: то, что другие называют набором символов , HP называет набором символов , а то, что IBM или Microsoft называют кодовой страницей , HP называет кодом набора символов . HP разработала серию наборов символов, [8] [9] каждый со связанным кодом набора символов, для кодирования как своих собственных наборов символов, так и наборов символов других поставщиков.

Множество наборов символов побуждает многих поставщиков рекомендовать Unicode .

Система нумерации кодовых страниц

IBM представила концепцию систематического назначения небольшого, но глобально уникального 16-битного числа каждой кодировке символов, с которой может столкнуться компьютерная система или набор компьютерных систем. Происхождение IBM этой схемы нумерации отражено в том факте, что наименьшие (первые) числа назначаются вариациям кодировки EBCDIC IBM, а немного большие числа относятся к вариациям расширенной кодировки ASCII IBM , используемой в оборудовании ПК.

С выпуском PC DOS версии 3.3 (и почти идентичной MS-DOS 3.3) IBM представила систему нумерации кодовых страниц обычным пользователям ПК, поскольку номера кодовых страниц (и фраза «кодовая страница») использовались в новых командах, чтобы позволить устанавливать кодировку символов, используемую всеми частями ОС, систематическим образом. [10]

Номера кодовых страниц IBM (CPGID и CCSID), используемые для кодировок CJK. Использование Microsoft номеров кодовых страниц для кодировок CJK отличается и указано в скобках, где это применимо.

После того, как IBM и Microsoft прекратили сотрудничество в 1990-х годах, обе компании вели список назначенных номеров кодовых страниц независимо друг от друга, что привело к некоторым конфликтующим назначениям. По крайней мере, один сторонний поставщик ( Oracle ) также имеет свой собственный список числовых назначений. [3] Текущие назначения IBM перечислены в их репозитории CCSID , в то время как назначения Microsoft задокументированы в MSDN . [11] Кроме того, список имен и приблизительных сокращений IANA ( Internet Assigned Numbers Authority ) для установленных кодовых страниц на любой конкретной машине Windows можно найти в реестре на этой машине (эта информация используется программами Microsoft, такими как Internet Explorer ).

Большинство известных кодовых страниц, за исключением страниц для языков CJK и вьетнамского языка , умещают все свои кодовые точки в восемь бит и не требуют ничего, кроме сопоставления каждой кодовой точки одному символу; более того, не используются такие методы, как комбинирование символов, сложные сценарии и т. д.

Текстовый режим стандартного ( совместимого с VGA ) графического оборудования ПК построен на использовании 8-битной кодовой страницы, хотя возможно использовать две одновременно с некоторой жертвой глубины цвета, и до восьми может храниться в адаптере дисплея для легкого переключения. [12] Существовал выбор шрифтов сторонних кодовых страниц, которые можно было загрузить в такое оборудование. Однако теперь для поставщиков операционных систем стало обычным делом предоставлять свои собственные системы кодирования и рендеринга символов, которые работают в графическом режиме и полностью обходят это аппаратное ограничение. Однако система ссылки на кодировки символов по номеру кодовой страницы остается применимой как эффективная альтернатива строковым идентификаторам, таким как те, которые указаны IETF и IANA для использования в различных протоколах, таких как электронная почта и веб-страницы.

Связь с ASCII

Большинство кодовых страниц, используемых в настоящее время, являются надмножествами ASCII , 7-битного кода, представляющего 128 управляющих кодов и печатных символов. В далеком прошлом 8-битные реализации кода ASCII устанавливали верхний бит в ноль или использовали его в качестве бита четности при передаче данных по сети. Когда верхний бит стал доступен для представления символьных данных, в общей сложности можно было представить 256 символов и управляющих кодов. Большинство поставщиков (включая IBM) использовали этот расширенный диапазон для кодирования символов, используемых различными языками и графическими элементами, что позволяло имитировать примитивную графику на устройствах вывода только текста. Для этих «расширенных наборов символов ASCII» не существовало формального стандарта, и поставщики называли варианты кодовыми страницами, как IBM всегда делала для вариантов кодировок EBCDIC.

Связь с Unicode

Unicode — это попытка включить все символы из всех ныне и исторически используемых человеческих языков в единый перечень символов (фактически одну большую единую кодовую страницу), устраняя необходимость различать разные кодовые страницы при обработке текста, хранящегося в цифровом виде. Unicode пытается сохранить обратную совместимость со многими устаревшими кодовыми страницами, копируя некоторые кодовые страницы 1:1 в процессе проектирования. Явной целью проектирования Unicode было обеспечение возможности преобразования в обе стороны между всеми распространенными устаревшими кодовыми страницами, хотя эта цель не всегда достигалась. Некоторые поставщики, а именно IBM и Microsoft, анахронично назначали номера кодовых страниц кодировкам Unicode. Это соглашение позволяет использовать номера кодовых страниц в качестве метаданных для определения правильного алгоритма декодирования при обнаружении двоичных хранимых данных.

Кодовые страницы IBM

Кодовые страницы на основе EBCDIC

Эти кодовые страницы используются IBM в наборах символов EBCDIC для мэйнфреймов . [13]

Кодовые страницы DOS

Эти кодовые страницы используются IBM в ее операционной системе PC DOS . Эти кодовые страницы изначально были встроены непосредственно в аппаратное обеспечение текстового режима графических адаптеров, используемых с IBM PC и его клонами, включая оригинальные адаптеры MDA и CGA, наборы символов которых можно было изменить только путем физической замены микросхемы ПЗУ, содержащей шрифт. Интерфейс этих адаптеров (эмулируемый всеми более поздними адаптерами, такими как VGA) обычно ограничивался однобайтовыми наборами символов всего с 256 символами в каждом шрифте/кодировке (хотя VGA добавил частичную поддержку для немного больших наборов символов).

При работе со старым оборудованием, протоколами и форматами файлов часто возникает необходимость в поддержке этих кодовых страниц, однако для новых проектов приветствуются более новые системы кодирования, в частности Unicode.

Кодовые страницы DOS обычно хранятся в файлах .CPI. [16] [17] [18] [19] [20]

Кодовые страницы IBM AIX

Эти кодовые страницы используются IBM в ее операционной системе AIX . Они эмулируют несколько наборов символов, а именно те, которые разработаны для использования в соответствии с ISO, например, UNIX-подобные операционные системы.

Кодовая страница 819 идентична Latin-1, ISO/IEC 8859-1 , и с немного измененными командами позволяет машинам MS-DOS использовать эту кодировку. Она использовалась с мини-компьютерами IBM AS/400.

Кодовые страницы IBM OS/2

Эти кодовые страницы используются IBM в ее операционной системе OS/2 .

Кодовые страницы эмуляции Windows

Эти кодовые страницы используются IBM при эмуляции наборов символов Microsoft Windows . Большинство этих кодовых страниц имеют тот же номер, что и кодовые страницы Microsoft, хотя они не совсем идентичны. Некоторые кодовые страницы, однако, являются новыми от IBM, а не разработаны Microsoft.

Кодовые страницы эмуляции Macintosh

Эти кодовые страницы используются IBM при эмуляции наборов символов Apple Macintosh .

Кодовые страницы эмуляции Adobe

Эти кодовые страницы используются IBM при эмуляции наборов символов Adobe .

Кодовые страницы эмуляции HP

Эти кодовые страницы используются IBM при эмуляции наборов символов HP .

Кодовые страницы эмуляции DEC

Эти кодовые страницы используются IBM при эмуляции наборов символов DEC .

Кодовые страницы IBM Unicode

Кодовые страницы Microsoft

Кодовые страницы Windows

Эти кодовые страницы используются корпорацией Microsoft в ее собственной операционной системе Windows. Корпорация Microsoft определила ряд кодовых страниц, известных как кодовые страницы ANSI (первая из них, 1252, была основана на апокрифическом проекте ANSI того, что стало ISO 8859-1 ). Кодовая страница 1252 основана на ISO 8859-1, но использует диапазон 0x80-0x9F для дополнительных печатных символов, а не управляющие коды C1 из ISO 6429, упомянутые в ISO 8859-1. [24] Некоторые из других частично основаны на других частях ISO 8859, но часто переставлены, чтобы приблизиться к 1252.

Microsoft рекомендует новым приложениям использовать UTF-8 или UCS-2/UTF-16 вместо этих кодовых страниц. [25]

Кодовые страницы DBCS

Эти кодовые страницы представляют кодировки символов DBCS для различных языков CJK. В операционных системах Microsoft они используются как кодовые страницы "OEM" и "Windows" для соответствующей локали.

Кодовые страницы MS-DOS

Эти кодовые страницы используются корпорацией Microsoft в ее операционной системе MS-DOS. Корпорация Microsoft называет их кодовыми страницами OEM, поскольку они были определены производителями оригинального оборудования , лицензировавшими MS-DOS для распространения со своим оборудованием, а не корпорацией Microsoft или организацией по стандартизации. Большинство этих кодовых страниц имеют тот же номер, что и эквивалентные кодовые страницы IBM, хотя некоторые из них не совсем идентичны. [26]

Кодовые страницы эмуляции Macintosh

Эти кодовые страницы используются Microsoft при эмуляции наборов символов Apple Macintosh .

Различные другие кодовые страницы Microsoft

Следующие номера кодовых страниц специфичны для Microsoft Windows. IBM может использовать другие номера для этих кодовых страниц. Они эмулируют несколько наборов символов, а именно те, которые разработаны для использования в соответствии с ISO, [ необходимо разъяснение ], например, UNIX-подобные операционные системы.

Кодовые страницы Microsoft Unicode

Наборы символов HP

HP разработала ряд наборов символов (каждый со своим связанным кодом набора символов) для кодирования либо своих собственных наборов символов, либо наборов символов других поставщиков. Обычно это 7-битные наборы символов, которые при перемещении в более высокую часть и связывании с набором символов ASCII составляют 8-битные наборы символов.

Собственные наборы символов HP

Наборы символов от других поставщиков

Кодовые страницы от других поставщиков

Эти кодовые страницы являются независимыми назначениями сторонних поставщиков. Поскольку исходная кодовая страница IBM PC ( номер 437 ) не была разработана для международного использования, появилось несколько частично совместимых вариантов, специфичных для страны или региона.

Эти кодовые страницы не являются официальными ни для IBM, ни для Microsoft, и почти ни одна из них не упоминается как используемый набор символов IANA. Номера, назначенные этим кодовым страницам, являются произвольными и могут конфликтовать с зарегистрированными номерами, используемыми IBM или Microsoft. Некоторые из них могут предшествовать переключению кодовых страниц, добавленному в DOS 3.3.

Список назначений кодовых страниц

Список известных назначений кодовых страниц (неполный):

Критика

Многие старые кодировки символов (в отличие от Unicode) страдают от нескольких проблем. Некоторые поставщики недостаточно документируют значение всех значений кодовых точек в своих кодовых страницах, что снижает надежность последовательной обработки текстовых данных через различные компьютерные системы. Некоторые поставщики добавляют собственные расширения к установленным кодовым страницам, чтобы добавлять или изменять определенные значения кодовых точек: например, байт 0x5C в Shift JIS может представлять как обратную косую черту , так и знак йены в зависимости от платформы. Наконец, для поддержки нескольких языков в программе, которая не использует Unicode, необходимо сохранить кодовую страницу, используемую для каждой строки/документа.

Приложения также могут неправильно маркировать текст в Windows-1252 как ISO-8859-1 . Единственное различие между этими кодовыми страницами заключается в том, что значения кодовых точек в диапазоне 0x80–0x9F, используемые ISO-8859-1 для управляющих символов, вместо этого используются как дополнительные печатные символы в Windows-1252 — в частности, для кавычек , знака евро и символа торговой марки среди прочих. Браузеры на платформах, отличных от Windows, имели тенденцию показывать пустые поля или вопросительные знаки для этих символов, что делало текст трудночитаемым. Большинство браузеров исправили это, игнорируя набор символов и интерпретируя как Windows-1252, чтобы он выглядел приемлемо. В HTML5 обработка ISO-8859-1 как Windows-1252 даже кодифицирована как стандарт W3C . [47] Хотя браузеры обычно были запрограммированы на то, чтобы справляться с таким поведением, это не всегда было верно для другого программного обеспечения. Следовательно, при получении передачи файла из системы Windows, платформы, отличные от Windows, либо проигнорируют эти символы, либо будут рассматривать их как стандартные управляющие символы и попытаются выполнить указанное управляющее действие соответствующим образом.

Благодаря обширной документации Unicode, обширному репертуару символов и политике стабильности символов, перечисленные выше проблемы редко являются проблемой для Unicode. UTF-8 (который может кодировать более миллиона кодовых точек) заменил метод кодовой страницы с точки зрения популярности в Интернете. [48] [49]

Частные кодовые страницы

Когда на заре истории персональных компьютеров пользователи не находили свои требования к кодировке символов удовлетворенными, были созданы частные или локальные кодовые страницы с использованием утилит terminate-and-stay-resident или путем перепрограммирования BIOS EPROM . В некоторых случаях были изобретены неофициальные номера кодовых страниц (например, CP895).

Когда стала доступна поддержка более разнообразных наборов символов, большинство этих кодовых страниц вышли из употребления, за некоторыми исключениями, такими как кодировка Kamenický или KEYBCS2 для чешского и словацкого алфавитов. Другой набор символов — стандарт кодировки Iran System , созданный корпорацией Iran System для поддержки персидского языка . Этот стандарт использовался в Иране в программах на базе DOS, и после введения кодовой страницы Microsoft 1256 этот стандарт устарел. Однако некоторые программы Windows и DOS, использующие эту кодировку, все еще используются, и существуют некоторые шрифты Windows с этой кодировкой.

Чтобы преодолеть такие проблемы, IBM Character Data Representation Architecture уровня 2 специально резервирует диапазоны идентификаторов кодовых страниц для определяемых пользователем и частных назначений. Всякий раз, когда используются такие идентификаторы кодовых страниц, пользователь не должен предполагать, что та же функциональность и внешний вид могут быть воспроизведены в другой конфигурации системы или на другом устройстве или системе, если пользователь не позаботится об этом специально. Диапазон кодовых страниц 57344-61439 ( E000h - EFFFh ) официально зарезервирован для определяемых пользователем кодовых страниц (или фактически CCSID в контексте IBM CDRA ), тогда как диапазон 65280-65533 ( FF00h - FFFDh ) зарезервирован для любых определяемых пользователем назначений "частного использования". Например, незарегистрированный пользовательский вариант кодовой страницы 437 ( 1B5h ) или 28591 ( 6FAF ) может стать 57781 ( E1B5h ) или 61359 ( EFAFh ) соответственно, чтобы избежать потенциальных конфликтов с другими назначениями и сохранить иногда существующую внутреннюю числовую логику в назначениях исходных кодовых страниц. Незарегистрированная частная кодовая страница, не основанная на существующей кодовой странице, специфичная для устройства кодовая страница, такая как шрифт принтера, которой просто нужен логический дескриптор, чтобы стать адресуемой для системы, часто меняющийся загружаемый шрифт или номер кодовой страницы с символическим значением в локальной среде, могут иметь назначение в частном диапазоне, например 65280 ( FF00h ).

Идентификаторы кодовых страниц 0, 65534 ( FFFEh ) и 65535 ( FFFFh ) зарезервированы для внутреннего использования операционными системами, такими как DOS, и не должны назначаться каким-либо конкретным кодовым страницам.

Смотрите также

Ссылки

  1. ^ "Содержание". www.ibm.com .
  2. ^ "Кодовая страница". sap.com . Архивировано из оригинала 2009-11-14 . Получено 2009-08-08 .
  3. ^ ab "Glossary". oracle.com . Архивировано из оригинала 2011-09-30 . Получено 2009-08-08 .
  4. ^ "Информация о программировании видеотерминала VT510". Digital Equipment Corporation (DEC). 7.1. Наборы символов - Обзор. Архивировано из оригинала 2016-01-26 . Получено 2017-02-15 . В дополнение к традиционным наборам символов DEC и ISO , которые соответствуют структуре и правилам ISO 2022 , VT510 поддерживает ряд кодовых страниц IBM PC ( номера страниц в руководстве по стандартным наборам символов IBM) в режиме PCTerm для эмуляции консольного терминала стандартных ПК.
  5. ^ "7.1. Наборы символов - Обзор". Информация о программировании видеотерминала VT520/VT525 (PDF) . Digital Equipment Corporation (DEC). Июль 1994 г. стр. 7-1. EK-VT520-RM. A01. Архивировано (PDF) из оригинала 2017-02-15 . Получено 2017-02-15 . В дополнение к традиционным наборам символов DEC и ISO VT520 поддерживает ряд кодовых страниц IBM PC (которые ссылаются на номера страниц в руководстве по стандартным наборам символов IBM) в режиме PCTerm для эмуляции консольного терминала стандартных ПК.
  6. ^ abc Paul, Matthias R. (2001-06-10) [1995]. "Обзор кодовых страниц DOS, OS/2 и Windows" (файл CODEPAGE.LST) (предварительная редакция 1.59). Архивировано из оригинала 2016-04-20 . Получено 2016-08-20 .
  7. ^ "Printer Command Language Symbol Sets". www.pclviewer.com . Архивировано из оригинала 2020-07-31 . Получено 2021-05-25 .
  8. ^ "HP Symbol Sets". pclhelp.com . Архивировано из оригинала 2015-02-19 . Получено 2017-02-20 .
  9. ^ "PCL5 Camparison Guide" (PDF) . Архивировано (PDF) из оригинала 2017-02-21 . Получено 2017-02-20 .
  10. ^ Збиковски, Марк ; Аллен, Пол ; Баллмер, Стив ; Борман, Рубен; Борман, Роб; Батлер, Джон; Кэрролл, Чак; Чемберлен, Марк; Челл, Дэвид; Коули, Майк; Кортни, Майк; Драйфус, Майк; Дункан, Рэйчел; Экхардт, Курт; Эванс, Эрик; Фармер, Рик; Гейтс, Билл ; Гири, Майкл; Гриффин, Боб; Хогарт, Дуг; Джонсон, Джеймс У.; Кермани, Камел; Кинг, Адриан; Кох, Рид; Ландовски, Джеймс; Ларсон, Крис; Леннон, Томас; Липки, Дэн; Макдональд, Марк ; Маккинни, Брюс; Мартин, Паскаль; Мазерс, Эстель; Мэтьюз, Боб; Мелин, Дэвид; Мергентайм, Чарльз; Невин, Рэнди; Ньюэлл, Дэн; Ньюэлл, Тани; Норрис, Дэвид; O'Leary, Mike; O'Rear, Bob ; Olsson, Mike; Osterman, Larry; Ostling, Ridge; Pai, Sunil; Paterson, Tim ; Perez, Gary; Peters, Chris; Petzold, Charles ; Pollock, John; Reynolds, Aaron ; Rubin, Darryl; Ryan, Ralph; Schulmeisters, Karl; Shah, Rajen; Shaw, Barry; Short, Anthony; Slivka, Ben; Smirl, Jon; Stillmaker, Betty; Stoddard, John; Tillman, Dennis; Whitten, Greg; Yount, Natalie; Zeck, Steve (1988). "Технические консультанты". Энциклопедия MS-DOS: версии с 1.0 по 3.2 . Автор: Duncan, Ray; Bostwick, Steve; Burgoyne, Keith; Byers, Robert A.; Hogan, Thom; Kyle, Jim; Летвин, Гордон ; Петцольд, Чарльз ; Рабинович, Чип; Томлин, Джим; Уилтон, Ричард; Вулвертон, Ван; Вонг, Уильям; Вудкок, Джоанн (полностью переработанное издание). Редмонд, Вашингтон, США: Microsoft Press . ISBN 1-55615-049-0. LCCN  87-21452. OCLC  16581341.[1] Архивировано 14 октября 2018 г. в Wayback Machine (xix+1570 страниц; 26 см) (Примечание. Это издание было опубликовано в 1988 г. после обширной переработки отозванного первого издания 1986 г. другой группой авторов.)
  11. ^ "Идентификаторы кодовых страниц". microsoft.com . Microsoft . Архивировано из оригинала 2014-10-27 . Получено 2014-10-27 .
  12. ^ "Программирование видео VGA/SVGA — работа в текстовом режиме VGA". osdever.net . Архивировано из оригинала 2010-09-01 . Получено 2006-09-23 .
  13. ^ "IBM i Globalization: Code Pages". IBM. Архивировано из оригинала 2012-07-16.
  14. ^ abcdef xlate - Транслитерация содержимого записей, IBM Corporation , 2010 [1986], архивировано из оригинала 2019-06-16 , извлечено 2016-10-18
  15. ^ "Кодовая страница CPGID 01093 (pdf)" (PDF) . Архивировано из оригинала (PDF) 2015-07-08.
  16. ^ Пол, Маттиас Р. (2001-06-10) [1995]. "Описание формата файлов DOS, OS/2, Windows NT .CPI и Linux .CP" (файл CPI.LST) (ред. 1.30). Архивировано из оригинала 2016-04-20 . Получено 2016-08-20 .
  17. ^ Эллиотт, Джон С. (2006-10-14). "Формат файла CPI". Seasip.info . Архивировано из оригинала 2016-09-22 . Получено 2016-09-22 .
  18. ^ Брауэр, Андрис Эверт (2001-02-10). "CPI fonts". 0.2. Архивировано из оригинала 2016-09-22 . Получено 2016-09-22 .
  19. ^ Haralambous, Yannis (сентябрь 2007 г.). Шрифты и кодировки . Перевод Хорна, П. Скотта (1-е изд.). Севастополь, Калифорния, США: O'Reilly Media, Inc. стр. 601–602, 611. ISBN 978-0-596-10242-5.
  20. ^ Справочник программиста MS-DOS . Microsoft Press . 1991. ISBN 1-55615-329-5.
  21. ^ "Кодовая страница 1004 - Windows Extended". IBM . 2001. Архивировано из оригинала 2018-05-13 . Получено 2018-05-13 .
  22. ^ "Архитектура представления символьных данных". IBM . Архивировано из оригинала 2019-06-23 . Получено 2019-10-12 .
  23. ^ abcdefghijkl "IBM Coded Character Set Identifier (CCSID)". IBM . Архивировано из оригинала 2009-11-26.
  24. ^ ISO/IEC 8859-1:1998(E). ISO . 1998-04-15. стр. 1. Архивировано из оригинала 2020-10-30 . Получено 2020-10-30 . Кодированные символы в этом наборе могут использоваться в сочетании с кодированными функциями управления, выбранными из ISO/IEC 6429.
  25. ^ "Code Pages". microsoft.com . Microsoft . Архивировано из оригинала 2011-02-27 . Получено 2010-12-21 .
  26. ^ "pentaho/pentaho-reporting". GitHub . Архивировано из оригинала 2019-06-16 . Получено 2017-02-20 .
  27. ^ abcde "Идентификаторы кодовых страниц". Microsoft Developer Network . Microsoft. 2014. Архивировано из оригинала 2016-06-19 . Получено 2016-06-19 .
  28. ^ abcde "Веб-кодировки - Internet Explorer - Кодировки". WHATWG Wiki . 2012-10-23. Архивировано из оригинала 2016-06-20 . Получено 2016-06-20 .
  29. ^ Foller, Antonin (2014) [2011]. "Западноевропейская (IA5) кодировка - наборы символов Windows". WUtils.com - Онлайновая веб-утилита и справка . Motobit Software. Архивировано из оригинала 20-06-2016 . Получено 20-06-2016 .
  30. ^ Фоллер, Антонин (2014) [2011]. "Немецкая (IA5) кодировка - Windows charsets". WUtils.com - Онлайновая веб-утилита и справка . Программное обеспечение Motobit. Архивировано из оригинала 20-06-2016 . Получено 20-06-2016 .
  31. ^ Foller, Antonin (2014) [2011]. "Шведская (IA5) кодировка - Windows charsets". WUtils.com - Онлайновая веб-утилита и справка . Motobit Software. Архивировано из оригинала 20-06-2016 . Получено 20-06-2016 .
  32. ^ Фоллер, Антонин (2014) [2011]. "Норвежская (IA5) кодировка - наборы символов Windows". WUtils.com - Онлайновая веб-утилита и справка . Программное обеспечение Motobit. Архивировано из оригинала 20-06-2016 . Получено 20-06-2016 .
  33. ^ Foller, Antonin (2014) [2011]. "US-ASCII кодировка - Windows charsets". WUtils.com - Онлайн веб-утилита и справка . Motobit Software. Архивировано из оригинала 20-06-2016 . Получено 20-06-2016 .
  34. ^ abcdefg Пол, Маттиас Р. (2002-09-05), Техническая информация о недокументированной информации о стране DOS для записей LCASE, ARAMODE и CCTORC, список разработчиков FreeDOS fd-dev на Topica, заархивировано из оригинала 2016-05-27 , извлечено 2016-05-26
  35. ^ abcdefgh Браун, Ральф Д. (29.12.2002). Список прерываний x86 . 61.
  36. ^ abcdefgh Пол, Матиас Р. (30 июля 1997 г.). NWDOS-TIPs — советы и подсказки для Novell DOS 7, с просмотром недокументированных подробностей, ошибок и обходных путей. MPDOSTIP (на немецком языке) (3-е изд.). Архивировано из оригинала 22 мая 2016 г. Проверено 11 января 2012 г.(Примечание. NWDOSTIP.TXT — это комплексная работа по Novell DOS 7 и OpenDOS 7.01 , включающая описание многих недокументированных функций и внутренних компонентов. Она является частью еще более обширной коллекции MPDOSTIP.ZIP автора, которая поддерживалась до 2001 года и распространялась на многих сайтах в то время. Приведенная ссылка указывает на более старую версию файла NWDOSTIP.TXT, преобразованную в HTML.)
  37. ^ abcdefgh Пол, Матиас Р. (9 апреля 2001 г.). NWDOS-TIPs — советы и подсказки для Novell DOS 7, с просмотром недокументированных подробностей, ошибок и обходных путей . MPDOSTIP (на немецком языке) (3-е изд.).
  38. ^ "770". Архивировано из оригинала 2017-02-26 . Получено 2017-02-25 .От литовской компании Lika Software
  39. ^ abcdefgh "LIKIT". www.likit.lt . Архивировано из оригинала 2017-04-19 . Получено 2017-02-25 .
  40. ^ "771". Архивировано из оригинала 2017-02-26 . Получено 2017-02-25 .От литовской компании Lika Software
  41. ^ "772". Архивировано из оригинала 2017-02-26 . Получено 2017-02-25 .От литовской компании Lika Software
  42. ^ "774". Архивировано из оригинала 2017-02-26 . Получено 2017-02-25 .От литовской компании Lika Software
  43. ^ abc "lietuvybė.lt - Rašmenų koduotės" [lietuvybė.lt - Кодировки символов] (на литовском языке). Архивировано из оригинала 28 августа 2019 г. Проверено 28 августа 2019 г.
  44. ^ Хоган, Том (1992). Die PC-Referenz für Programmierer (на немецком языке) (2-е изд.). Система Верлаг ГмбХ. ISBN 3-89390-272-4.(Примечание. Эта книга представляет собой немецкий перевод книги «The Programmer's PC Sourcebook» издательства Microsoft Press. В ней упоминается кодовая страница с идентификатором 854 для Испании.)
  45. ^ abcdefghijklmnopqrstu vwxyz "Star LC 8021 User's Manual" (PDF) . Архивировано (PDF) из оригинала 2020-09-29 . Получено 2017-02-20 .
  46. ^ IBM. "Информационный документ о кодовой странице SBCS - CPGID 00437". Архивировано из оригинала 2016-06-09 . Получено 2014-07-04 .
  47. ^ "Encoding". WHATWG . 2015-01-27. раздел 4.2 Имена и метки. Архивировано из оригинала 2015-02-04 . Получено 2015-02-04 .
  48. ^ "Статистика использования кодировок символов для веб-сайтов (обновляется ежедневно)". w3techs.com . Получено 2015-08-06 .
  49. ^ "Статистика использования UTF-8". trends.builtwith.com . Архивировано из оригинала 2011-03-24 . Получено 2011-03-28 .

Внешние ссылки