Метод ввода Wubizixing ( упрощенный китайский :五笔字型输入法; традиционный китайский :五筆字型輸入法; пиньинь : wǔbǐ zìxíng shūrùfǎ ; букв. «метод ввода пятичертательной модели символов»), часто сокращаемый до просто Wubi или Wubi Xing , [1] — это метод ввода китайских иероглифов, в первую очередь предназначенный для ввода упрощенного китайского и традиционного китайского текста на компьютере. Wubi не следует путать с методом Wubihua (五笔画) , который представляет собой другой метод ввода, разделяющий категоризацию на пять типов штрихов.
Метод также известен как Ван Ма ( упрощенный китайский :王码; традиционный китайский :王碼; пиньинь : Wáng mǎ ; букв. «код Ван»), названный в честь изобретателя Ван Юнмина (王永民). Существует четыре версии Wubi, которые считаются стандартными: Wubi 86, Wubi 98, Wubi 18030 и Wubi New-century (версия 3-го поколения). Последние три также можно использовать для ввода традиционного китайского текста, хотя и более ограниченным образом. Wubi 86 является наиболее широко известным и используемым методом ввода на основе фигур для полнобуквенных клавиатур в материковом Китае . Если часто требуется вводить и традиционные китайские иероглифы, другие методы ввода, такие как Cangjie или Zhengma, могут лучше подойти для этой задачи, и их также гораздо легче найти на компьютере, который нужно использовать.
Метод Wubi основан на структуре символов, а не на их произношении, что позволяет вводить символы, даже если пользователь не знает произношения, а также не слишком тесно связан с какой-либо конкретной разговорной разновидностью китайского языка . Он также чрезвычайно эффективен: почти каждый символ можно написать максимум четырьмя нажатиями клавиш. На практике большинство символов можно написать меньшим количеством. Есть сообщения об опытных машинистках, достигающих скорости 160 символов в минуту с помощью Wubi. [2] То, что это означает в контексте китайского языка, не совсем то же самое, что и для английского языка, но верно то, что Wubi чрезвычайно быстр, когда используется опытной машинисткой. Основная причина этого заключается в том, что, в отличие от традиционных фонетических методов ввода, не нужно тратить время на выбор нужного символа из списка омофонических возможностей: практически все символы имеют уникальное представление.
Как следует из названия, клавиатура разделена на пять областей. Китайский иероглиф 笔 (bǐ), используемый в контексте написания китайских иероглифов, относится к мазкам кисти, используемым в китайской каллиграфии. Каждой области соответствует определенный тип штриха.
Главным недостатком изучения Wubi является его более крутая кривая обучения, поскольку, как более сложная система, она требует больше времени для приобретения навыка. Запоминание и практика являются ключевыми факторами для умелого использования.
Для использования Wubi доступны несколько методов ввода, включая Google Input Tools (используется Google Translate) и варианты клавиатуры на устройствах Mac. Последовательности Wubi можно искать для определенных символов с помощью онлайн-словарей.
В этой статье будут использоваться следующие соглашения: символ всегда будет означать китайский иероглиф, тогда как буква , клавиша и сочетание клавиш всегда будут относиться к клавишам на клавиатуре.
По сути, символ разбивается на компоненты, которые обычно (но не всегда) совпадают с радикалами . Они набираются в том порядке, в котором они были бы написаны вручную . Чтобы гарантировать, что чрезвычайно сложные символы не требуют чрезмерного количества нажатий клавиш, любой символ, содержащий более 4 компонентов, вводится путем ввода первых 3 написанных компонентов, а затем последнего. Таким образом, данные каждого символа можно ввести не более чем 4 нажатиями клавиш.
Wubi распределяет свои символы очень равномерно, и поэтому подавляющее большинство символов однозначно определяются 4 нажатиями клавиш, описанными выше. Затем нажимается пробел, чтобы переместить символ из буфера ввода на экран. В случае, если 4-буквенное представление символа не уникально , нажимается цифра, чтобы выбрать соответствующий символ (например, если два символа имеют одинаковое представление, ввод 1 выберет первый, а 2 — второй). В большинстве реализаций пробел всегда может быть нажат и просто означает 1 в неоднозначной настройке. Интеллектуальное программное обеспечение попытается убедиться, что символ в позиции по умолчанию является желаемым.
Многие символы имеют более одного представления. Иногда это делается для удобства использования, в случае, если существует более одного очевидного способа разбить символ. Однако чаще это происходит потому, что некоторые символы имеют короткое представление, которое меньше 4 букв, а также «полное» представление.
Для символов с менее чем 4 компонентами, не имеющих краткого представления, нужно набрать каждый компонент, а затем «заполнить» представление (то есть набрать достаточно дополнительных нажатий клавиш, чтобы сделать представление 4 нажатиями клавиш), вручную набрав штрихи последнего компонента в том порядке, в котором они будут написаны. Если штрихов слишком много, нужно написать как можно больше, но последний штрих поставить последним (это отражает правило компонентов для символов с более чем 4 компонентами, описанное выше).
Как только алгоритм понятен, можно набрать практически любой символ с небольшой практикой, даже если вы никогда не печатали его раньше. Мышечная память гарантирует, что часто печатающим, использующим этот метод, не придется думать о том, как на самом деле строятся символы, так же как подавляющее большинство английских машинисток не слишком задумываются о написании слов, когда они пишут.
Многие реализации используют дальнейшие оптимизации нескольких слов. Обычно часто используемый диграф (двухсимвольное слово), в котором оба символа имеют краткую форму двухклавишных представлений, можно объединить в одно четырехклавишное представление, которое генерирует два символа, а не один. Существует также несколько трехсимвольных сокращений , и даже одно довольно длинное, политически мотивированное. [ необходимо разъяснение ] Некоторые примеры приведены в разделе примеров ниже.
Другой распространенной особенностью является использование клавиши «z» в качестве подстановочного знака. Метод Wubi был фактически разработан с учетом этой особенности; вот почему клавише z не назначены компоненты. По сути, можно ввести az, когда не уверен, какой компонент должен быть, и метод ввода поможет его завершить. Если, например, кто-то знает, что символ должен начинаться с «kt», но не уверен, какой должен быть следующий компонент, ввод «ktz» выдаст список всех символов, начинающихся с «kt». Однако на практике многие движки методов ввода используют метод табличного поиска для всех систем ввода на основе таблиц, включая Wubi. Это означает, что у них просто есть большая таблица в памяти, связывающая различные символы с их соответствующими представлениями. Затем метод ввода просто становится поиском по таблице. В такой реализации клавиша z нарушает парадигму и, как таковая, не встречается во многих обобщенных программах (хотя метод ввода Wubi, обычно встречающийся в китайских Windows, реализует эту функцию). По этой же причине оптимизация нескольких символов, описанная в предыдущем абзаце, также встречается сравнительно редко.
Некоторые методы ввода, такие как xcin (встречающийся во многих UNIX-подобных системах), предоставляют общую функциональность подстановочных знаков, которая может использоваться во всех табличных системах ввода, включая пиньинь и практически все остальное. Xcin использует '*' для автозаполнения и '?' только для одной буквы, следуя соглашениям, впервые введенным в подстановке файлов UNIX. Другие реализации имеют свои собственные соглашения.
Клавиатура Wubi предполагает раскладку типа QWERTY , поэтому пользователям клавиатур, реализующих национализированную или альтернативную раскладку (например, Dvorak или французскую AZERTY ), вероятно, придется выполнить некоторую переназначение, чтобы сделать систему разумной. Wubi не размещает свои компоненты произвольно: их слишком много, и только с введением логической методологии система становится простой для изучения.
По сути, клавиатура разделена на 5 зон, каждая из которых представляет собой штрих. Эти пять штрихов — падающий влево, падающий вправо, горизонтальный, вертикальный и крюк, а зоны, которые их представляют, — это QWERT, YUIOP, ASDFG, HJKLM и XCVBN соответственно. Все эти зоны расположены горизонтально, за исключением M, которая не совпадает с остальными буквами в своей зоне.
В общем, клавиатуру можно представить как разделенную по центру на T и Y, G и H, N и M. Клавиши в каждой зоне нумеруются по мере удаления от этой разделительной линии: так что на самом деле следует сказать, что в зоне QWERT T — первая буква, R — вторая, а E — третья; в зоне YUIOP Y — первая, U — вторая, I — третья и т. д. Для XCVBN N — первая и т. д. В HJKLM считайте M последней в ряду, даже если она не лежит на одной линии.
Это важно, поскольку компоненты в первой позиции будут иметь одно повторение рассматриваемого штриха (штриха, назначенного зоне, к которой они принадлежат), те, что во второй позиции, — два, те, что в третьей позиции, — три. Те компоненты, которые нелегко классифицировать с помощью этой парадигмы, будут помещены на последнюю букву.
Поэтому можно было бы ожидать, что 一 будет расположен на G, а 二 на F, а 三 на D, и действительно, это так. Аналогично можно было бы ожидать, что 丨 будет расположен на H, 刂 будет на J, а 川 будет на K. Эта закономерность справедлива для всех зон. Более того, она распространяется на большинство радикалов, которые выглядят так, как будто они состоят из трех таких черт, даже если на самом деле это может быть не так. Примером этого является 中 на K: хотя у него нет трех нисходящих черт (только две), похоже, что у него их три. Более того, он написан вручную, сначала написав радикал рта 口, а затем разделив его пополам вертикальной нисходящей чертой. Радикал рта лежит на «K», поэтому это делает назначение вдвойне логичным. А романизация пиньинь 口, kou3, начинается с k, еще одного средства запоминания, закодированного в клавиатуре уби.
Более того, каждая буква каждой зоны имеет один компонент, связанный с ней, ее "главный компонент". Обычно это полноценный символ (за исключением X) сам по себе. Всегда можно набрать этот главный компонент, набрав букву, на которой он расположен, четыре раза. Так, например, главный компонент H - 目, и поэтому его можно набрать, набрав "hhhh".
Каждая буква также имеет связанный с ней символ быстрого доступа. В некоторых случаях этот символ совпадает с компонентом, связанным с рассматриваемой клавишей, а иногда нет. Этот символ быстрого доступа — это символ, который получается, когда набираешь только букву и ничего больше; все это чрезвычайно распространенные символы, используемые при наборе китайского языка.
Вполне возможно, что ряд компонентов не перечислены ниже либо по недосмотру, либо потому, что они редко используются, либо потому, что для компонента не существует простого представления в Unicode.
Основной компонент клавиши Q — 金, а ее сокращенный символ — 我. Он связан со следующими компонентами: 金, 钅, 勹, 儿, 夕, а также с крючком в верхней части 饣 и 角, радикалом 犭без нижнего левого штриха (поэтому символы с этим радикалом начинаются с «qt», а не просто с «q»), крестом (например, в центре 区), верхом 鱼 (т. е. без горизонтального штриха внизу) и тремя (почти вертикальными) «ногами» в нижнем правом углу 流.
Основной компонент и символ быстрого доступа клавиши W — 人. Он связан со следующими компонентами: 人, 亻, 八 и верхней частью 癸. Хотя 人 означает человека, он часто используется Wubi для построения радикала крыши, например, в 会, «wfc». 入 не управляется W, несмотря на то, что выглядит похоже, и хотя у 餐 есть верхняя часть, которая смутно похожа на верхнюю часть 癸, эти две буквы не одинаковы (действительно, чтобы набрать 餐, нужно физически набрать каждый компонент сверху).
Основной компонент клавиши E — 月, а ее сокращенный символ — 有. Он связан со следующими компонентами: 月, 用, 彡, 乃, нижняя часть 衣 (т. е. без 亠), верхняя часть 孚 (т. е. без 子), 豕 (кабан), нижняя часть 良 (т. е. без 白) и нижняя часть 舟 (т. е. без маленькой точки наверху). В этом случае сокращенный символ E даже не начинается с падающей влево черты, а просто заметно изображает компонент, принадлежащий E. 彡 присутствует в этом символе, так как это третий символ в зоне (считая от T, см. выше). Особое искажение, которое часто встречается, — это использование E в 且 и в символах, содержащих его: Уби думает об этом компоненте как о 月 + 一.
Основной компонент клавиши R — 白, а ее сокращенный символ — 的. Он связан со следующими компонентами: 白, 手, 扌, 斤 (как с T, так и без нее), 牛 ( без вертикальной нисходящей черты) и, конечно, двумя левосторонними чертами 𰀪, которые можно было бы ожидать от второй клавиши в зоне (см. выше для объяснения). Остерегайтесь разновидностей 手, где центральный нисходящий крюк заменен левосторонним чертой, например, в 看.
Основной компонент клавиши T — 禾, а ее сокращенный символ — 和. Он связан со следующими компонентами: 禾, 竹, 夂, 攵, 彳 и верхней частью 乞 (т. е. без 乙). 竹 также может быть найден в своей сокращенной форме (⺮). 丿 также находится на этой клавише, потому что T — первая клавиша в зоне (см. выше). Это означает, что если кто-то набирает компонент или символ штрих за штрихом, он (как правило) будет использовать T для обозначения левого падающего штриха. См. раздел о штрихах устранения неоднозначности для получения дополнительной информации об исключениях из этого правила.
Эту зону также можно назвать зоной точек, потому что ее узор Y: 讠 U: 冫 I: 氵 и O: 灬 на самом деле не обязательно состоит из падающих вправо штрихов. Фактически, можно утверждать, что первый штрих в 灬 на самом деле падает влево . Она называется падающей правой зоной, потому что все ключи в этой зоне, когда используются для построения символа по штриху (а не по компоненту), представляют собой падающие вправо штрихи для некоторой конфигурации символа (см. раздел о штрихах устранения неоднозначности для получения дополнительной информации).
Основной компонент клавиши Y — 言, а ее символ быстрого доступа — 主. Он связан со следующими компонентами: 言, 讠, 亠, 亠 с 口 под ним, 广, 文, 方 и 丶. Все эти компоненты начинаются с правого падающего штриха. Как правило, точки в китайских иероглифах на самом деле являются левыми падающими штрихами, поэтому в большинстве случаев использование T более уместно, чем Y. Конечно, если кто-то может писать китайские иероглифы вручную, он должен уметь определять, какой из них выбрать, вспоминая, как он пишется.
Основной компонент клавиши U — 立, а ее сокращенный символ — 产. Он связан со следующими компонентами: 立, 六, 辛, 门, 疒, 丬, 冫, «антеннами» в верхней части 单 (всего две черты: 丷) и антеннами плюс горизонтальная черта, как в верхней части 兹. Большинство из них имеют две короткие диагональные черты (门 — очевидное исключение). Это согласуется с местом U как второй буквы в зоне (см. выше для объяснения).
Основной компонент клавиши I — 水, а ее сокращенный символ — 不. Он связан со следующими компонентами: 水, 氵, 小, три черточки сверху 学 и три черточки сверху 当. Кроме того, с этим символом связан компонент, который можно описать как два 冫, расположенных спина к спине.
Основной компонент клавиши O — 火, а ее сокращенный символ — 为. Он связан со следующими компонентами: 火, 米, 灬 и 业без нижнего горизонтального штриха — это позволяет создавать символы, такие как 严. Это 4-я клавиша в падающей правой зоне: отсюда и включение 灬.
Основной компонент клавиши P — 之, а ее сокращенный символ — 这. Он связан со следующими компонентами: 之, 辶, 廴, 冖, 宀 и 礻. Поскольку компоненты Wubi набираются в том порядке, в котором их нужно было бы писать вручную, компоненты 辶 и 廴 обычно набираются последними .
Клавиатура разделена на 5 зон
Пример 1: 请 Состоит из трёх компонентов: y (讠, радикал №10), g (王*, радикал 89), e (月, радикал 118) → 请
Пример 2: 遗
Состоит из пяти компонентов: k (口), h (丨), g (一), m (贝), p (辶) → khgp → 遗 (m вводить не обязательно)
Пример 3a: 文: Сначала вы нажимаете клавишу с символом на ней, который оказывается «Y». Затем вы нажимаете первый компонент, который также является «Y» для штриха 点, затем «G» для штриха 横,и поскольку теперь у вас уже есть три штриха, вы нажимаете последний штрих, который также оказывается «捺», получая код клавиши «YYGY» для полного символа.
Пример 3b: 一: Код этого символа — «GGLL». Как и прежде, сначала вы вводите клавишу для символа, то есть «G», затем первую черту этого символа, которая также является «G». Поскольку это вся необходимая информация, L используется в качестве заполнителя, пока вы не достигнете 4 букв. [2] Обратите внимание, что «一» также является сокращенным символом для «G» (что делает его одним штрихом на практике).
Пример 3c: 广: Код этого символа — «YYGT». Сначала вы набираете клавишу, на которой расположен этот символ, то есть «Y». Затем вы набираете штрих 点, который также находится на «Y». Следующим будет штрих 横 на «G», а последним — 捺 на «T».
Пример 4: 等
Состоит из трех компонентов: t (竹), f (土), f (寸),
Штрихи для устранения неоднозначности: последний штрих — 丶, иероглиф имеет структуру сверху вниз (42,u) → 等
Стихотворение было создано в качестве мнемоники для клавиатуры Wubi, связывающей несколько символов с каждой клавишей. Первый символ — это соответствующий основной компонент клавиши, а следующие — компоненты или связанные символы.
Модель G11, модель
F12, модель
D13, модель
S14, модель
A15,
модель H21.具上止卜虎皮
J22日早两竖与虫依
K23口与川,字根Например
, L24, M25
, M25,
T31 .竹一撇双人立,反文条头共三一
R32白手看头三二斤
E 33
人 和 八, 登祭头
Q35乃用家衣底W34金勺缺点无尾鱼,犬旁留义儿一点夕,氏无七
Y41言文方广在四一,高头一捺谁人去
U42立辛两点六门疒(病)
I43 兴头小倒立
O44火业头,四点米
P45之宝盖,摘示衣
N51已半巳满不出己,左框折尸心Модель
B52, модель
V53, модель
C54, модель X55, модель
X55, модель X55.
G11 王旁青头五夫一
F12 土干十寸未甘雨, 不要忘了革字底
D13 大犬戊其古石厂
S14 Защитный кожух
A15 工戈草头右框七
H21 目上卜止虎具头
J22 日早两竖与虫依
K23口流川, 码元稀
L24 Двигатель
M25, двигатель
T31, двигатель
R32, двигатель
E33月用力豸毛衣臼
W34 人八登头单人几
Q35 金夕鸟儿犭边鱼
Y41 言文方点谁人去
U42立辛六羊病门里
I43 Защитный кожух
O44 业广鹿四点米
P45 之字宝盖补示衣
N51 已类左框心尸羽
B52
Модельный ряд V53, модельный ряд
C54, модельный ряд X55, модельный ряд X55
.
G11 крепление
F12 крепление
D13 крепление
S14 крепление
A15工戈草头右框七
H21 目止具头卜虎皮
J22 日曰两竖与虫依
K23 口中两川三个竖
L24田框四车甲单底
M25 Автомобильный двигатель
T31 Автомобильный двигатель R32 Автомобильный двигатель
E33 Автомобильный
двигатель
W34人八登祭风头几
Q35 金夕犭儿包头鱼
Y41 言文方点在四一
U42 立带两点病门里
I43水边一族三点小
O44
Блок питания P45, блок управления N51
, блок управления
B52, блок управления
V53
Защитный кожух для C54, для двигателя X55, для защитного кожуха X55
.
В 2020 году история Wubi была представлена в эпизоде Radiolab под названием «Эффект Wubi» [3] .