stringtranslate.com

ИСО/МЭК 8859-2

ISO/IEC 8859-2:1999 , Информационные технологии. 8-битные однобайтовые наборы графических символов. Часть 2. Латинский алфавит № 2 , является частью серии ISO/IEC 8859 стандартных кодировок символов на основе ASCII , сначала издание вышло в свет в 1987 году. Неофициально оно называется «Латиница-2». Обычно он предназначен для центральных [1] или «восточноевропейских» языков, написанных латиницей. Обратите внимание, что ISO/IEC 8859-2 сильно отличается от кодовой страницы 852 (MS-DOS Latin 2, PC Latin 2), которую также называют «Latin-2» в чешском и словацком регионах. [2] Кодовая страница 912 является расширением. Почти половина кодировки используется для польского языка, и это основная устаревшая кодировка для польского языка, хотя практически все ее использование было заменено на UTF-8 (в Интернете).

ISO-8859-2 — это предпочтительное имя кодировки IANA для этого стандарта, дополненное управляющими кодами C0 и C1 из ISO/IEC 6429 . По состоянию на октябрь 2022 года менее 0,04% всех веб-страниц используют ISO-8859-2. [3] [4] Microsoft присвоила кодовую страницу 28592, также известную как Windows-28592 , коду ISO-8859-2 в Windows. IBM присвоила кодовую страницу 1111 стандарту ISO 8859-2.

Windows-1250 похожа на ISO-8859-2 и содержит все печатные символы и многое другое. Однако некоторые из них переставлены (в отличие от Windows-1252 , в которой все печатные символы из ISO-8859-1 хранятся в одном и том же месте).

Языковой охват

Эти значения кода можно использовать для следующих языков:

  1. Отсутствующая буква Å официально является частью финского алфавита , однако она не имеет местного применения и ограничивается только иностранными именами.
  2. ^ В 2017 году Совет немецкой орфографии официально добавил заглавную букву ẞ , но на самом деле это не требуется, поскольку вместо нее можно использовать SS.
  3. ^ Этот набор символов объединяет ş и ş (S,T с запятыми ниже) с Ş и Ţ (S, T с седильями ), как и практически все другие наборы символов, включая Microsoft Windows-1250 и первую версию Unicode . Впоследствии Unicode их разъединил, однако в 2014 году Unicode отмечает, что разъединение букв с помощью запятой ниже было ошибкой, что привело к искажению румынских данных: ранее существовавшие данные и методы ввода по-прежнему содержали бы старые кодовые точки седиллы, что усложняло поиск текста .

Макет кодовой страницы

Отличия от ISO-8859-1 имеют номер кодовой точки Unicode внизу.

Смотрите также

Рекомендации

  1. ^ «Кодировка сообщений Microsoft Outlook» .
  2. ^ "Объяснение беспорядка с кодировкой чешских и словацких символов" . luki.sdf-eu.org . Проверено 27 февраля 2022 г.
  3. ^ «Статистика использования и рыночная доля ISO-8859-2 для веб-сайтов, октябрь 2022 г.» . w3techs.com . Проверено 23 октября 2022 г.
  4. ^ «Исторические тенденции в статистике использования кодировок символов для веб-сайтов, февраль 2022 г.» .

Внешние ссылки