Метод ввода Цанцзе ( метод ввода Цан-цзе , иногда называемый Чанцзе , Цан Цзе , Чанцзей [1] или Чонгкит ) — это система ввода китайских иероглифов в компьютер с помощью стандартной компьютерной клавиатуры . В именах файлов и в других местах название Цанцзе иногда сокращается до cj.
Метод ввода был изобретен в 1976 году Чу Бонг-Фу и назван в честь Цанцзе (Tsang-chieh), мифологического изобретателя китайской письменности, по предложению Цзян Вэй-куо , бывшего министра обороны Тайваня . Чу Бонг-Фу выпустил патент на Цанцзе в 1982 году, так как он считал, что метод должен принадлежать китайскому культурному наследию . [2] Поэтому Цанцзе стал программным обеспечением с открытым исходным кодом и находится на каждой компьютерной системе, которая поддерживает традиционные китайские иероглифы , и был расширен таким образом, чтобы Цанцзе был совместим с упрощенным набором китайских символов.
Цанцзе — первый китайский метод ввода, использующий клавиатуру QWERTY . Чу увидел, что клавиатура QWERTY стала международным стандартом, и поэтому считал, что ввод на китайском языке должен основываться на ней. [3] Другие, более ранние методы используют большие клавиатуры с 40–2400 клавишами, за исключением метода «четыре угла» , который использует только цифровые клавиши.
В отличие от метода ввода пиньинь , Cangjie основан на графологическом аспекте символов: каждая графическая единица, называемая « радикалом » (не путать с радикалами Канси ), переродительствуется базовым компонентом символа, всего их 24, каждый из которых сопоставлен с определенной буквенной клавишей на стандартной клавиатуре QWERTY . Дополнительная функция «сложный символ» сопоставлена клавише X. Клавиши разделены на четыре группы для облегчения обучения и запоминания. Назначение кодов китайским иероглифам осуществляется путем разделения составляющих «радикалов» символов.
Основные компоненты символов в Cangjie называются «радикалами» (字根) или «буквами» (字母). Существует 24 радикала, но 26 ключей; 24 радикала ( основные формы 基本字形) связаны примерно с 76 вспомогательными формами (輔助字形), которые во многих случаях являются либо повернутыми, либо транспонированными версиями компонентов основных форм. Например, буква A (日) может представлять либо саму себя, либо немного более широкий曰, либо поворот на 90° самой себя. (Более полный отчет о 76 с лишним транспозициях и поворотах, чем те, что перечислены ниже, см. в статье о записи Cangjie в китайских Викиучебниках.)
24 клавиши разделены на четыре группы:
Вспомогательные формы каждого радикала Цанцзе немного изменились в разных версиях метода Цанцзе. Таким образом, это одна из причин того, что разные версии метода Цанцзе не полностью совместимы.
Чу Бонг-Фу дал альтернативные названия для некоторых букв в соответствии с их характеристиками. Например, H (竹) также называется斜, что означает наклон. Названия образуют рифму, чтобы помочь учащимся запомнить буквы, каждая группа находится в строке (звуки конечных символов указаны в скобках):
Машинистка должна быть знакома с несколькими правилами декомпозиции (拆字規則), которые определяют, как анализировать символ, чтобы получить код Цанцзе.
Правила подчиняются различным принципам:
Некоторые формы всегда разлагаются одинаково, независимо от того, говорят ли правила, что их следует разлагать таким образом или нет. Число таких исключений невелико:
Некоторые формы не могут быть разложены. Они представлены X, что является клавишей難на клавиатуре Цанцзе. [4]
Первоначально метод ввода Cangjie не предназначался для создания символа в каком-либо наборе символов . Вместо этого он был частью интегрированной системы, состоящей из правил ввода Cangjie и платы контроллера Cangjie . Эта плата контроллера содержит прошивку генератора символов , которая динамически генерирует китайские символы из кодов Cangjie при выводе символов , используя режим графики высокого разрешения Apple II . В предисловии к руководству пользователя Cangjie Чу Бонг-Фу написал в 1982 году:
[в переводе]
Что касается вывода: вывод и ввод, по сути, [образуют] единое целое; нет никаких причин, по которым [они должны] быть догматически разделены на два разных объекта.… Это на самом деле необходимо.…
В этой ранней системе, когда пользователь вводил "yk", например, чтобы получить китайский иероглиф文, коды Cangjie не конвертировались в какую-либо кодировку символов, и сохранялась фактическая строка "yk". Код Cangjie для каждого символа (строка от 1 до 5 строчных букв плюс пробел) был кодировкой этого конкретного символа.
Особая «особенность» этой ранней системы заключается в том, что если отправить ей случайные строчные слова, генератор символов попытается построить китайские иероглифы в соответствии с правилами декомпозиции Цанцзе, иногда вызывая появление странных, неизвестных символов. Эта непреднамеренная функция, «автоматическая генерация символов», описана в руководстве и отвечает за создание более 10 000 из 15 000 символов, которые может обработать система. Название Цанцзе, вызывающее ассоциации с созданием новых символов, действительно подходило для этой ранней версии Цанцзе.
Наличие встроенного генератора символов также объясняет историческую необходимость существования клавиши "X", которая используется для устранения неоднозначности коллизий декомпозиции: поскольку символы "выбираются", когда коды "выводятся", каждый символ, который может быть отображен, должен фактически иметь уникальное разложение Цанцзе. Было бы бессмысленно — и непрактично — чтобы система предоставляла выбор кандидатов на символы при отображении случайного текстового файла, поскольку пользователь не будет знать, какой из кандидатов правильный.
Cangjie был разработан как простая в использовании система, помогающая продвигать использование китайской вычислительной техники. Однако многие пользователи считают, что Cangjie сложен в изучении и использовании, а многие трудности вызваны плохим обучением. [ необходима цитата ]
При достаточной практике пользователи могут преодолеть вышеуказанные проблемы. Типичные слепые машинисты могут печатать китайский язык со скоростью 25 символов в минуту (cpm) или лучше, используя Cangjie, несмотря на трудности с запоминанием списка вспомогательных фигур или правил разложения. Опытные машинисты Cangjie, как сообщается, могут достичь скорости печати от 60 cpm до более 200 cpm. [ необходима цитата ]
По словам Чэнь Миньчжэна, преподававшего в начальной школе Лунтянь в Тайдуне в 1990 году, средняя скорость печати детей составляла 90 слов в минуту, а некоторые дети даже достигали скорости более 130 слов в минуту. [5] [ нужен лучший источник ]
Разложение символа зависит от предопределенного набора «стандартных форм» (標準字形). Однако, поскольку в разных странах существует множество вариаций Цанцзе, стандартная форма определенного символа в Цанцзе не всегда та, которую пользователь изучил ранее. Изучение Цанцзе затем влечет за собой изучение не только самого Цанцзе, но и незнакомых стандартных форм для некоторых символов. Редактор метода ввода Цанцзе (IME) не обрабатывает ошибки в разложении, за исключением информирования пользователя (обычно звуковым сигналом) о том, что есть ошибка. Однако Цанцзе изначально разработан для назначения разных кодов разным вариантам символа. Например, в Цанцзе, предоставляемом в Windows, код для產— YHHQM, что соответствует не форме этого символа, а другому варианту,産. Это проблема, возникшая в результате реализации Цанцзе в Windows. В оригинальном Цанцзе產должно быть YKMHM (первая часть —文), а産— YHHQM (первая часть —产).
Знаки препинания не геометрически разлагаются, а скорее задаются предопределенными кодами, которые начинаются с ZX, за которыми следует строка из трех букв, связанных с порядком символов в коде Big5 . (Этот набор кодов был добавлен в Cangjie в традиционной китайской версии Windows 95. В Windows 3.1 в Cangjie не было набора кодов для знаков препинания.) Таким образом, ввод знаков препинания в Cangjie становится утомительным упражнением, требующим либо запоминания, либо подбора и нажатия. Однако в современных системах это решается путем доступа к виртуальной клавиатуре на экране (в Windows это активируется нажатием клавиш Ctrl + Alt + запятая).
Часто встречающиеся ошибки включают нерассмотренные альтернативные коды. Например, если не разложить方сверху вниз на YHS, а вместо этого ввести YSH в соответствии с порядком черт, Цанцзе не вернет символ方в качестве выбора.
Поскольку Cangjie требует все 26 клавиш QWERTY- клавиатуры, его нельзя использовать для ввода китайских иероглифов на обычных телефонах, которые имеют только 12-клавишную клавиатуру . Вместо этого используются альтернативные методы ввода, такие как Zhuyin , 5-тактный (или 9-тактный у Motorola ) и метод ввода Q9 .
Обычно говорят, что метод ввода Cangjie прошел через пять поколений (обычно называемых «версиями» на английском языке), каждое из которых немного несовместимо с другими. В настоящее время версия 3 (第三代倉頡) является наиболее распространенной и изначально поддерживается Microsoft Windows . Версия 5 (第五代倉頡), поддерживаемая Free Cangjie IME и ранее единственная Cangjie, поддерживаемая SCIM , представляет собой значительный метод меньшинства и поддерживается iOS .
Ранняя система Цанцзе, поддерживаемая картой Zero One на Apple II, имела версию 2; версия 1 так и не была выпущена.
Метод ввода Цанцзе, поддерживаемый классической Mac OS, напоминает как версию 3, так и версию 5.
Версия 5, как и оригинальный метод ввода Cangjie, была создана непосредственно Чу. Он надеялся, что выпуск версии 5, изначально запланированной как версия 6, положит конец «более чем десяти версиям метода ввода Cangjie» (слегка несовместимым версиям, созданным разными поставщиками).
Версия 6 пока не выпущена для широкой публики, но используется для создания базы данных, которая может точно хранить все исторические китайские тексты.
Большинство современных реализаций редакторов методов ввода Цанцзе (IME) предоставляют различные удобные функции:
Помимо подстановочной клавиши, многие из этих функций удобны для обычных пользователей, но не подходят для тех, кто печатает вслепую, поскольку они делают Cangjie IME непредсказуемым.
Также были предприняты различные попытки «упростить» Цанцзе тем или иным способом:
Многие исследователи обсуждали способы разложения китайских иероглифов на их основные компоненты и пытались создать приложения на основе системы разложения. Эту идею можно назвать изучением генов китайских иероглифов Academia Sinica на Тайване [6] и Университет Цзяотун в Шанхае [7] также имеют похожие проекты.
. Коды Cangjie предлагают основу для таких усилий.Одним из прямых применений использования разложенных символов является возможность вычисления сходств между различными китайскими иероглифами. [8] Метод ввода Cangjie предлагает хорошую отправную точку для такого рода приложений. Ослабляя ограничение в пять кодов для каждого китайского иероглифа и принимая более подробные коды Cangjie, визуально похожие символы могут быть найдены путем вычисления. Интеграция этого с информацией о произношении позволяет компьютерно-ассистируемое изучение китайских иероглифов. [9]
[Перевод]
Это не проблема; есть также вспомогательные формы, восполняющие недостатки радикалов. Вспомогательные формы являются вариациями формы радикалов, [и поэтому] легко запоминаются.
[Перевод]
Словарь, прилагаемый [к этой книге], основан на 4800 стандартных, общеупотребительных иероглифах, провозглашенных Министерством образования. Если к этому добавить автоматически генерируемые иероглифы, то число иероглифов составит около 15 000 (используя словарь Канси в качестве основы).