stringtranslate.com

ИСО/МЭК 8859-11

ISO/IEC 8859-11:2001 , Информационные технологии — 8-битные однобайтовые кодированные графические наборы символов — Часть 11: Латинский/тайский алфавит , является частью серии ISO/IEC 8859 стандартных кодировок символов на основе ASCII , первое издание опубликовано в 2001 году. Его неофициально называют Латинский/тайский . Он почти идентичен национальному тайскому стандарту TIS-620 (1990). Единственное отличие состоит в том, что ISO/IEC 8859-11 выделяет неразрывный пробел для кода 0xA0, тогда как TIS-620 оставляет его неопределенным. (На практике это небольшое различие обычно игнорируется.)

ISO-8859-11 не является основным зарегистрированным именем набора символов IANA, несмотря на то, что соответствует обычному шаблону для наборов символов IANA на основе серии ISO 8859. Однако он определен как псевдоним [1] близкого эквивалента TIS-620 (в котором отсутствует неразрывный пробел), и который без проблем может использоваться для ISO/IEC 8859-11, поскольку неразрывный пробел имеет код, который не был выделен в TIS-620. Microsoft назначила кодовую страницу 28601, также известную как Windows-28601, для ISO-8859-11 в Windows. [2] В черновике тайские буквы были в разных местах. [3]

Как и во всех разновидностях ISO/IEC 8859, нижние 128 кодов эквивалентны ASCII . Дополнительные символы, за исключением неразрывного пробела, находятся в Unicode в том же порядке, только смещены с 0xA1 на U+0E01 и т. д.

Кодовая страница Microsoft Windows 874, а также кодовая страница, используемая в тайской версии Apple Macintosh , MacThai , являются вариантами TIS-620, однако несовместимыми друг с другом.

Набор символов

Кодовые значения D1, D4-DA, E7-EE являются объединяющими символами .

Расширения поставщика

Кодовая страница 874 (IBM) / 9066

Кодовая страница IBM 874 ( CP874 , IBM-874 , x-IBM874 ), также известная как кодовая страница 9066 ( IBM-9066 ), [5] отличается от ISO/IEC 8859-11 только девятью символами, показанными в рамке в следующей таблице: [6] [7] [8]

  Отличия от ISO 8859-11

Код страницы 1161

Кодовая страница 1161 ( CP1161 , IBM-1161 ) — это вариант кодовой страницы IBM 874. Единственное отличие — знак евро (€) в позиции DE hex (222). [12] [13]

Кодовая страница 874 (Microsoft) / 1162

Кодовая страница Windows 874 ( windows-874 , MS874 , x-windows-874 ), известная как кодовая страница 1162 ( CP1162 , IBM-1162 ) от IBM, [14] [15] используется Microsoft Windows. Она отличается от ISO/IEC 8859-11 только добавлением девяти символов, показанных в следующей таблице:

  Отличия от ISO 8859-11

Mac OS тайский

Этот вариант используется в классической Mac OS .

  Отличия от ISO 8859-11

Смотрите также

Сноски

Ссылки

  1. ^ «Наборы символов IANA».
  2. ^ "js-codepage, Получение кодовых страниц". GitHub . 12 октября 2021 г.
  3. ^ Эверсон, Майкл. «Предложенный ISO 8859-11».
  4. ^ Уистлер, Кен (2002-10-07), ISO/IEC 8859-11:2001 для Unicode, Консорциум Unicode
  5. ^ IBM ; Unicode Consortium . "convrtrs.txt". Международные компоненты для Unicode . v. 59180.0.1. Да ibm-874 == ibm-9066. ibm-1161 имеет обновление для евро.
  6. ^ "Информационный документ о кодовой странице 874". Архивировано из оригинала 2017-01-16.
  7. ^ "Информационный документ CCSID 874". Архивировано из оригинала 2016-03-27.
  8. ^ "Информационный документ CCSID 9066". Архивировано из оригинала 27.03.2016.
  9. ^ IBM . "Кодовая страница CPGID 00874" (PDF) . РЕЕСТР: Наборы графических символов и кодовые страницы .
  10. ^ Кодовая страница CPGID 00874 (txt), IBM
  11. ^ "Converter Explorer: ibm-874_P100-1995". Международные компоненты для Unicode . Консорциум Unicode .
  12. ^ "Кодовая страница 01161" (PDF) .
  13. ^ "Информационный документ CCSID 1161". Архивировано из оригинала 27.03.2016.
  14. ^ "Информационный документ о кодовой странице 1162". Архивировано из оригинала 2016-03-17.
  15. ^ "Информационный документ CCSID 1162". Архивировано из оригинала 27.03.2016.
  16. ^ "Кодовая страница 01162" (PDF) .
  17. ^ Стил, Шон (1998-02-28). "cp874 в таблицу Unicode". Консорциум Unicode , Microsoft .
  18. ^ Кодовая страница CPGID 01162 (txt), IBM
  19. ^ Международные компоненты для Unicode (ICU), ibm-1162_P100-1999.ucm, 2002-12-03
  20. ^ Apple (2005-04-05). «Преобразование (внешняя версия) набора символов тайского языка Mac OS в Unicode 3.2 и более поздние версии». Консорциум Unicode .

Внешние ссылки