Несколько методов ввода позволяют использовать китайские иероглифы с компьютерами. Большинство из них позволяют выбирать иероглифы на основе их произношения или графической формы. Фонетические методы ввода легче изучить, но они менее эффективны, в то время как графические методы позволяют вводить быстрее, но имеют крутую кривую обучения .
Другие методы позволяют пользователям вводить символы непосредственно с помощью сенсорных экранов , например, тех, что имеются на мобильных телефонах и планшетных компьютерах.
Китайские методы ввода существовали до появления компьютера. Одной из ранних попыток была электромеханическая китайская пишущая машинка Ming kwai ( китайский :明快; пиньинь : míngkuài ; Уэйд-Джайлс : ming-k'uai ), которую изобрел Линь Юйтан , известный китайский писатель, в 1940-х годах. Она назначала тридцать базовых форм или штрихов различным клавишам и принимала новый способ категоризации китайских иероглифов. Но пишущая машинка не производилась в коммерческих целях, и Линь вскоре оказался по уши в долгах. [2]
До 1980-х годов китайские издатели нанимали команды рабочих и выбирали несколько тысяч шрифтов из огромного набора китайских символов. Китайские правительственные учреждения вводили символы, используя длинный и сложный список китайских телеграфных кодов , которые присваивали каждому символу разные номера. В раннюю компьютерную эру китайские символы классифицировались по их радикалам или латинизации пиньинь, но результаты были неудовлетворительными.
В 1970-1980-х годах для ввода китайского языка использовались большие клавиатуры с тысячами клавиш. Каждая клавиша была сопоставлена нескольким китайским иероглифам. Чтобы набрать иероглиф, нужно было нажать клавишу символа, а затем клавишу выбора. [3] Также существовали экспериментальные «радикальные клавиатуры» с десятками или несколькими сотнями клавиш. Китайские иероглифы были разложены на «радикалы», каждый из которых был представлен клавишей. [1] [4] [5] Громоздкие и сложные в использовании, эти клавиатуры устарели после введения метода ввода Цанцзе, первого метода, который использовал только стандартную клавиатуру и сделал возможным слепой набор текста на китайском языке . [5]
В 1976 году Чу Бонг-Фу изобрел общий метод ввода с его методом ввода Цанцзе , который назначает разные «корни» каждой клавише на стандартной компьютерной клавиатуре. С помощью этого метода, например, символ日назначается клавише A, а 月 назначается клавише B. Ввод их вместе приведет к символу明(«яркий»).
Несмотря на более крутую кривую обучения, этот метод остается популярным в китайских общинах, использующих традиционные китайские иероглифы , таких как Гонконг и Тайвань ; метод обеспечивает очень точный ввод, тем самым позволяя пользователям печатать более эффективно и быстро, при условии, что они знакомы с довольно сложными правилами метода. Это был первый метод, который позволял пользователям вводить более ста китайских иероглифов в минуту. Его популярности также способствует его повсеместное присутствие в традиционных китайских компьютерных системах, поскольку Chu отказался от своего патента в 1982 году, заявив, что он должен быть частью культурного достояния. Разработчики китайских систем могут свободно его использовать, и пользователи не испытывают хлопот из-за его отсутствия на устройствах с поддержкой китайского языка. [6] [7] Были разработаны программы ввода Cangjie, поддерживающие большой набор символов CJK . [8] [9] [10]
Все методы имеют свои сильные и слабые стороны. Метод пиньинь можно изучить быстро, но его максимальная скорость ввода ограничена. Метод Wubi требует больше времени для изучения, но опытные машинистки могут вводить текст с его помощью гораздо быстрее, чем с помощью фонетических методов. Однако Wubi является запатентованным, и его версия стала свободно доступной только после того, как его изобретатель проиграл патентный иск в 1997 году. [11]
Из-за этих сложностей не существует «стандартного» метода.
В материковом Китае наиболее популярны методы пиньинь, такие как Sogou Pinyin и Google Pinyin. На Тайване преобладают Cangjie , Dayi , Boshiamy и bopomofo ; а в Гонконге и Макао в школах чаще всего преподают Cangjie , в то время как в нескольких школах преподают китайскую систему ввода CKC . [12]
Другие методы включают распознавание рукописного ввода , OCR и распознавание речи . Сам компьютер должен быть сначала «обучен» перед использованием первого или второго из этих методов; то есть новый пользователь входит в систему в специальном «режиме обучения», чтобы система могла научиться распознавать его почерк или речевые модели. Последние два метода используются реже, чем методы ввода на основе клавиатуры, и страдают от относительно высокого уровня ошибок, особенно при использовании без надлежащего «обучения», хотя более высокий уровень ошибок является приемлемым компромиссом для многих пользователей.
Пользователь вводит произношения, которые преобразуются в соответствующие китайские иероглифы. Пользователь должен выбрать нужный иероглиф из омофонов, которые распространены в китайском языке. Современные системы, такие как Sogou Pinyin и Google Pinyin , предсказывают нужные иероглифы на основе контекста и предпочтений пользователя. Например, если ввести звуки jicheng , программное обеспечение наберет繼承(наследовать), но если ввести jichengche , появится計程車(такси).
Различные китайские диалекты усложняют систему. Фонетические методы в основном основаны на стандартном пиньине , чжуинь /бопомофо и ютпине в Китае, Тайване и Гонконге соответственно. Существуют также методы ввода, основанные на других вариантах китайского языка , таких как хакка или миннань .
Хотя фонетическую систему легко выучить, выбор подходящих китайских иероглифов замедляет скорость печати. Большинство пользователей сообщают о скорости печати в пятьдесят символов в минуту, хотя некоторые достигают более ста в минуту. [13] С некоторыми фонетическими редакторами методов ввода (IME ), в дополнение к предиктивному вводу на основе предыдущих преобразований, пользователи могут создавать собственные словарные записи для часто используемых символов и фраз, потенциально уменьшая количество символов, необходимых для их вызова.
Shuangpin (双拼;雙拼), буквально двойное написание, является стенографическим фонетическим методом ввода, основанным на ханьюй пиньинь, который сокращает количество нажатий клавиш для одного китайского иероглифа до двух, распределяя каждую гласную и согласную, состоящую из более чем одной буквы, на определенную клавишу. В большинстве схем раскладки Shuangpin, таких как Xiaohe, Microsoft 2003 и Ziranma, наиболее часто используемые гласные помещаются в средний слой, что снижает риск повторяющегося растяжения .
Shuangpin поддерживается большим количеством программного обеспечения для ввода пиньинь, включая QQ, Microsoft Bing Pinyin, Sogou Pinyin и Google Pinyin .