stringtranslate.com

VSCII

VSCII ( вьетнамский стандартный код для обмена информацией ), также известный как TCVN 5712 , [2] ISO-IR -180 , [3] .VN , [4] ABC [4] или просто кодировки TCVN , [4] [5] — это набор из трех тесно связанных вьетнамских национальных стандартных кодировок символов для использования вьетнамского языка с компьютерами , разработанный Техническим комитетом TCVN по информационным технологиям (TCVN/TC1) и впервые принятый в 1993 году (как TCVN 5712:1993). [2]

Его не следует путать с неофициальной кодировкой VISCII с похожим названием , которая иногда использовалась зарубежными носителями вьетнамского языка. [4] VISCII также предназначалась для обозначения вьетнамского стандартного кода для обмена информацией , но не связана с VSCII. [6]

VSCII (TCVN) широко использовался на севере Вьетнама, в то время как VNI был популярен на юге. [4] Unicode и кодовая страница Windows-1258 в настоящее время используются практически для всех вьетнамских компьютерных данных, [ требуется ссылка ] но устаревшие файлы или архивные сообщения могут нуждаться в преобразовании.

Кодировки

Все три формы VSCII сохраняют 95 печатных символов ASCII без изменений.

VSCII-3 , также известный как TCVN 5712-3, VN3 или просто TCVN3, [7] включает наименьшее количество назначений. Это расширенный ASCII , поскольку он сохраняет все 128 кодов ASCII немодифицированными. Он не переназначает ни один из управляющих кодов C0 и C1 . По сравнению с ASCII , он добавляет 75 символов:

Тоновые обозначения заглавных гласных в TCVN3 достигаются путем переключения на полностью заглавный шрифт. [8]

VSCII-2 , также известный как TCVN 5712-2 и VN2, является надмножеством VSCII-3. Это расширенный ASCII , поскольку он сохраняет все 128 кодов ASCII немодифицированными. Он не переназначает ни один из управляющих кодов C0 и C1 , что делает его совместимым с ISO 2022 как 96-набор. [2] [3] По сравнению с VSCII-3, он добавляет (в общей сложности 96 не-ASCII символов):

VSCII-1 , также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и представляет собой модифицированный ASCII, поскольку он заменяет 12 из 33 управляющих символов на предкомпозитные символы. По сравнению с VSCII-2, он (всего 140 не-ASCII символов):

Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не являются необходимыми, но могут привести к получению файлов меньшего размера.

Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требует расширения некоторых предварительно составленных символов.

Набор символов

  ВСКII-3
  Дополнения для VSCII-2
  Дополнения для VSCII-1 [9]

Ссылки

  1. ^ Сивонен, Генри (2014-09-26). «Изменения кодировки символов в mc требуют действия cc». mozilla.dev.apps.thunderbird .
  2. ^ abcde "[новости] TCVN 5712:1993 (VSCII) -- Вьетнамский национальный стандарт". 1993-06-02. Архивировано из оригинала 2017-01-11.
  3. ^ ab TCVN (1993). ISO-IR-180: Правая часть таблицы кодов VSCII-2 (PDF) . ITSCJ/ IPSJ .
  4. ^ abcde Ngo, Hoc Dinh; Tran, TuBinh. "5. Зачем нужна конвертация вьетнамской кодировки (набор символов – кодировка)?". Некоторые специальные функции WinVNKey .
  5. ^ Нгуен, Минь Т. «Вьетнамские преобразования (Vietnet/VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)».
  6. ^ Лунде, Кен (13 января 2009 г.). "Глава 1: Обзор обработки информации CJKV (§ Идентичны ли VISCII и VSCII? Что насчет TCVN?)". Обработка информации CJKV (2-е изд.). стр. 17. ISBN 978-0-596-51447-1.
  7. ^ "Unicode и устаревшие вьетнамские кодировки символов". Часто задаваемые вопросы о вьетнамском Unicode .
  8. ^ "Unicode & Vietnamese Legacy Character Coders". Часто задаваемые вопросы о вьетнамском Unicode . TCVN3 не является двухбайтовым, но из-за особенностей его кодировки заглавные буквы (гласные) отображаются в отдельный заглавный шрифт, который похож на обычный строчный.
  9. ^ Лунде, Кен (13 января 2009 г.). "Приложение L: Вьетнамские наборы символов" (PDF) . Обработка информации CJKV (2-е изд.). ISBN 978-0-596-51447-1.

Внешние ссылки