stringtranslate.com

Метод ввода Цанцзе

Метод ввода Цанцзе ( метод ввода Цан-цзе , иногда называемый Чанцзе , Цан Цзе , Чанцжей [1] или Чункит ) — система ввода китайских иероглифов в компьютер с помощью стандартной компьютерной клавиатуры . В именах файлов и других местах имя Цанцзе иногда сокращается до cj.

Метод ввода был изобретен в 1976 году Чу Бонг-Фу и назван в честь Цанцзе (Цан-цзе), мифологического изобретателя китайской письменности, по предложению Цзян Вэй-куо , бывшего министра обороны Тайваня . Чу Бонг-Фу выдал патент на Цанцзе в 1982 году, так как считал, что этот метод должен принадлежать китайскому культурному наследию . [2] Таким образом, Cangjie стал программным обеспечением с открытым исходным кодом и присутствует в каждой компьютерной системе, поддерживающей традиционные китайские иероглифы , и был расширен, чтобы Cangjie был совместим с упрощенным набором китайских символов.

Китайская клавиатура в здании муниципальных служб Шек Тонг Цуй в Гонконге с подсказками Цанцзе, напечатанными в нижних левых углах клавиш. (В правом нижнем и правом верхнем углах напечатаны подсказки Дайи и символы Чжуинь соответственно.)

Цанцзе — первый китайский способ ввода с использованием QWERTY- клавиатуры. Чу увидел, что клавиатура QWERTY стала международным стандартом, и поэтому считал, что ввод на китайском языке должен быть основан на ней. [3] В других, более ранних методах используются большие клавиатуры с количеством клавиш от 40 до 2400, за исключением метода четырех углов , в котором используются только цифровые клавиши.

В отличие от метода ввода Пиньинь , Цанцзе основан на графологическом аспекте символов: каждая графическая единица, называемая « радикалом » (не путать с радикалами Канси ), повторно порождается базовым символьным компонентом, всего 24, каждая из них сопоставлена ​​с определенной буквенной клавишей на стандартной QWERTY- клавиатуре. Дополнительная функция «сложного персонажа» сопоставлена ​​с клавишей X. Клавиши разделены на четыре группы для облегчения обучения и запоминания. Присвоение кодов китайским иероглифам осуществляется путем разделения составляющих «радикалов» иероглифов.

Обзор

Ключи и «радикалы»

Основные компоненты символов в Цанцзе называются «радикалами» (字根) или «буквами» (字母). Есть 24 радикала, но 26 ключей; 24 радикала ( основные формы 基本字形) связаны примерно с 76 вспомогательными формами (輔助字形), которые во многих случаях представляют собой либо повернутые, либо транспонированные версии компонентов основных форм. Например, буква А () может обозначать либо саму себя, либо немного более широкую, либо поворот самой себя на 90°. (Более полное описание 76 с лишним транспозиций и вращений, чем перечисленные ниже, см. в статье о записи Цанцзе в китайских Викибуках.)

24 клавиши распределены по четырем группам:

Вспомогательные формы каждого радикала Цанцзе немного изменились в разных версиях метода Цанцзе. Таким образом, это одна из причин того, что разные версии метода Цанцзе не полностью совместимы.

Чу Бонг-Фу дал альтернативные названия некоторым буквам в соответствии с их характеристиками. Например, H () еще называют, что означает наклон. Названия образуют рифму, помогающую учащимся запомнить буквы, причем каждая группа расположена в строке (звуки последних символов указаны в скобках):

日月 金木水火土; ты
交叉縱橫; гоу
人心 ; ку
; бо

Раскладка клавиатуры

Типичная раскладка клавиатуры для метода Цанцзе, основанная на раскладке клавиатуры США . Обратите внимание на нестандартное использование Z в качестве ключа столкновения.

Основные правила

Машинистка должна быть знакома с несколькими правилами декомпозиции (拆字規則), которые определяют, как анализировать символ, чтобы получить код Цанцзе.

Правила подчиняются различным принципам:

Примеры

Ввод текста на китайском языке с помощью метода ввода Цанцзе версии 5
Ввод китайского языка с помощью метода ввода Цанцзе на устройстве Android

Исключения

Некоторые формы всегда декомпозируются одним и тем же способом, независимо от того, предписывают ли правила, что они должны быть декомпозированы таким образом или нет. Число таких исключений невелико:

Некоторые формы невозможно разложить. Они обозначаются буквой X — клавишейна клавиатуре Цанцзе. [4]

Ранняя разработка

Изначально метод ввода Цанцзе не предназначался для создания символа в каком-либо наборе символов . Вместо этого он был частью интегрированной системы, состоящей из правил ввода Цанцзе и платы контроллера Цанцзе . Эта плата контроллера содержит прошивку генератора символов , которая динамически генерирует китайские символы из кодов Цанцзе при выводе символов , используя графический режим высокого разрешения компьютера Apple II . В предисловии к руководству пользователя Cangjie Чу Бонг-Фу написал в 1982 году:

[в переводе]
С точки зрения вывода: Выход и ввод, по сути, [образуют] единое целое; нет никаких причин, по которым [их следует] догматически разделять на два разных учреждения… Это действительно необходимо…

В этой ранней системе, когда пользователь вводит «yk», например, чтобы получить китайский иероглиф, коды Цанцзе не преобразуются в какую-либо кодировку символов, а фактическая строка «yk» сохраняется. Код Цанцзе для каждого символа (строка из 1–5 строчных букв плюс пробел) представлял собой кодировку этого конкретного символа.

Демонстрация возможности генератора символов Mingzhu генерировать символы в соответствии с кодами. Первый иероглиф — 𮨻 (⿰飠它), который обозначает разновидность супа в кухне Сюйчжоу .

Особой «особенностью» этой ранней системы является то, что если в нее отправить случайные слова в нижнем регистре, генератор символов попытается создать китайские иероглифы в соответствии с правилами разложения Цанцзе, что иногда приводит к появлению странных, неизвестных символов. Эта непреднамеренная функция «автоматическое создание символов» описана в руководстве и отвечает за создание более 10 000 из 15 000 символов, которые может обработать система. Имя Цанцзе, напоминающее о создании новых персонажей, действительно подходило для этой ранней версии Цанцзе.

Наличие встроенного генератора символов также объясняет историческую необходимость существования ключа «X», который используется для устранения неоднозначности коллизий декомпозиции: поскольку символы «выбираются», когда коды «выводятся», каждый символ, который может отображаемое на самом деле должно иметь уникальное разложение Цанцзе. Для системы не имело бы смысла и не было бы практично предоставлять выбор символов-кандидатов при отображении случайного текстового файла, поскольку пользователь не знал бы, какой из кандидатов правильный.

Проблемы

Cangjie была разработана как простая в использовании система, помогающая продвигать использование китайских компьютеров. Однако многие пользователи считают, что Цанцзе сложно изучить и использовать, поскольку многие трудности вызваны плохим обучением. [ нужна цитата ]

Воспринимаемые трудности

При достаточной практике пользователи смогут преодолеть вышеуказанные проблемы. Типичные машинистки вслепую могут печатать на китайском языке со скоростью 25 символов в минуту (имп./мин) или лучше, используя Цанцзе, несмотря на то, что им трудно запомнить список вспомогательных форм или правила декомпозиции. Сообщается, что опытные машинистки Цанцзе могут достичь скорости набора текста от 60 до более 200 ударов в минуту.

По словам Чэнь Миньчжэна, его опыта преподавания в начальной школе Лунтянь в Тайдуне в 1990 году, средняя скорость набора текста детьми составляла 90 слов в минуту, а некоторые дети даже достигали более 130 слов в минуту. [5]

Ограничения в реализации

Разложение персонажа зависит от заранее определенного набора «стандартных форм» (標準字形). Однако, поскольку в разных странах существует множество вариаций Цанцзе, стандартная форма определенного символа в Цанцзе не всегда та, которую пользователь выучил раньше. Изучение Цанцзе влечет за собой изучение не только самого Цанцзе, но и незнакомых стандартных форм некоторых персонажей. Редактор метода ввода Cangjie (IME) не обрабатывает ошибки при декомпозиции, кроме как информируя пользователя (обычно подавая звуковой сигнал) о том, что произошла ошибка. Однако изначально Цанцзе предназначен для присвоения разных кодов разным вариантам персонажа. Например, в Cangjie, представленном в Windows, код— YHHQM, что соответствует не форме этого символа, а другому варианту —. Это проблема, возникающая из-за реализации Cangjie в Windows. В оригинальном Цанцзедолжно быть YKMHM (первая часть —), а— YHHQM (первая часть —).

Знаки препинания не разлагаются геометрически, а представляют собой заранее определенные коды, которые начинаются с ZX, за которым следует строка из трех букв, связанная с порядком символов в коде Big5 . (Этот набор кодов был добавлен в Cangjie в традиционной китайской версии Windows 95. В Windows 3.1 в Cangjie не было набора кодов для знаков препинания.) Таким образом, ввод знаков препинания в Cangjie становится утомительным упражнением, требующим либо запоминания, либо выбора. -и-клевать. Однако в современных системах это решается путем доступа к виртуальной клавиатуре на экране (в Windows это активируется нажатием клавиш Ctrl + Alt + запятая).

К типичным ошибкам относятся не считающиеся альтернативными коды. Например, если не разложитьсверху вниз на YHS, а вместо этого ввести YSH в соответствии с порядком штрихов, Цанцзе не вернет символв качестве выбора.

Поскольку Цанцзе требуются все 26 клавиш QWERTY- клавиатуры, ее нельзя использовать для ввода китайских иероглифов на обычных телефонах, которые имеют только 12-клавишную клавиатуру . Вместо этого используются альтернативные методы ввода, такие как Zhuyin , 5-тактный (или 9-тактный от Motorola ) и метод ввода Q9 .

Версии

Обычно говорят, что метод ввода Цанцзе прошел пять поколений (обычно называемых «версиями» на английском языке), каждое из которых немного несовместимо с другими. В настоящее время версия 3 (第三代倉頡) является наиболее распространенной и изначально поддерживается Microsoft Windows . Версия 5 (第五代倉頡), поддерживаемая Free Cangjie IME и ранее единственная Cangjie, поддерживаемая SCIM , представляет собой метод значительного меньшинства и поддерживается iOS .

Ранней системой Cangjie, поддерживаемой картой Zero One на Apple II, была версия 2; Версия 1 так и не была выпущена.

Метод ввода Цанцзе, поддерживаемый классической Mac OS, похож как на версию 3, так и на версию 5.

Версия 5, как и оригинальный метод ввода Цанцзе, была создана непосредственно Чу. Он надеялся, что выпуск версии 5, первоначально запланированной как версия 6, положит конец «более чем десяти версиям метода ввода Цанцзе» (слегка несовместимым версиям, созданным разными поставщиками).

Версия 6 еще не опубликована, но используется для создания базы данных, которая сможет точно хранить все исторические китайские тексты.

Варианты

Большинство современных реализаций редакторов методов ввода Cangjie (IME) предоставляют различные удобные функции:

Помимо подстановочного ключа, многие из этих функций удобны для обычных пользователей, но непригодны для машинистов, печатающих вслепую, поскольку делают Cangjie IME непредсказуемым.

Также предпринимались различные попытки так или иначе «упростить» Цанцзе:

Приложения

Многие исследователи обсуждали способы разложения китайских иероглифов на их основные компоненты и пытались создавать приложения на основе системы разложения. Идею можно назвать изучением генов китайских иероглифов  [чж] . Кодексы Цанцзе создают основу для таких усилий. Аналогичные проекты имеют также Academia Sinica на Тайване [6] и Университет Цзяотун в Шанхае [7] .

Одним из прямых применений использования разложенных иероглифов является возможность вычисления сходства между различными китайскими иероглифами. [8] Метод ввода Цанцзе предлагает хорошую отправную точку для такого рода приложений. Уменьшив ограничение на пять кодов для каждого китайского иероглифа и приняв более подробные коды Цанцзе, можно найти визуально похожие символы путем вычислений. Интеграция этих данных с информацией о произношении позволяет изучать китайские иероглифы с помощью компьютера. [9]

Смотрите также

Примечания

Рекомендации

  1. ^ Написание, используемое в качестве имени файла в китайской системе ETen .
  2. Чу, Чий-Хва (朱麒華) (1 февраля 2012 г.). «教育科技的專利與普及». Электронный информационный бюллетень Национальной академии образовательных исследований (на китайском языке). Архивировано из оригинала 25 августа 2022 года . Проверено 14 декабря 2022 г.
  3. ^ Чу Бонг Фу (朱邦復). «智慧之旅».開放文學(на традиционном китайском языке). Архивировано из оригинала 19 октября 2017 года . Проверено 8 июня 2017 г.
  4. ^ "倉頡取碼規則及方法" [правила и методы получения кода Цанцзе]. Друзья Цанцзе (на китайском языке). 1997–2002 гг. Архивировано из оригинала 1 января 2019 года . Проверено 2 октября 2020 г. .
  5. ^ https://www.chinesecj.com/forum/forum.php?mod=attachment&aid=MTIwNnw1MjMxNmQwMXwxNjg2OTYyNTE4fDB8MTUwMjQ%3D, стр. 58
  6. ^ "漢字構形資料庫" [База данных конфигурации китайских символов]. Китайская лаборатория обработки документов (на китайском языке). 2013. Архивировано из оригинала 27 июля 2020 года . Проверено 2 октября 2020 г. .
  7. ^ 上海交通大學漢字編碼組,上海漢語拼音文字研究組編著。漢字信息字典。北京市科學出版1988 год.
  8. ^ 宋柔,林民,葛詩利。漢字字形計算及其在校對系統中的應用,小型微型計算機系統,第29卷第10期,第1964–1968–2008 гг.
  9. ^ Лю, Чао-Лин; Лай, Минь-Хуа; Тянь, Кан-Вэнь; Чуан, И-Сюань; Ву, Ши-Хун; Ли, Цзя-Ин (2011). «Визуально и фонологически похожие иероглифы в неправильных китайских словах: анализ, идентификация и применение». Транзакции ACM по обработке информации на азиатском языке . 10 (2): 1–39. дои : 10.1145/1967293.1967297. S2CID  7288710.

Внешние ссылки