Китайские иероглифы могут иметь несколько вариантных форм — визуально различных глифов , которые представляют одно и то же основное значение и произношение. Варианты данного иероглифа являются аллографами друг друга, и многие из них напрямую аналогичны аллографам, присутствующим в английском алфавите , например, двухэтажный ⟨a⟩ и одноэтажный ⟨ɑ⟩ варианты буквы A, причем последний чаще встречается в рукописном написании . Некоторые контексты требуют использования определенных вариантов.
До 20 века вариации в форме символов были повсеместны, и эта динамика продолжилась после изобретения ксилографии . Например, до династии Цинь (221–206 гг. до н. э.) иероглиф, означающий «яркий», писался как明или朙— с日«Солнце» или囧«окно» слева, с компонентом月«Луна» справа. Ли Сы ( ум. 208 г. до н. э. ), канцлер Цинь, попытался универсализировать письмо малой печати Цинь по всему Китаю после войн , которые впервые политически объединили страну. Ли предписал форму朙слова для «яркий», но некоторые писцы проигнорировали это и продолжили писать иероглиф как明. Однако, более частое использование朙сопровождалось распространением третьего варианта:眀, с目'глаз' слева — вероятно, полученного как сокращение朙. В конечном итоге,明стало стандартной формой иероглифа. [1]
Новые варианты также являются результатом более крупных сдвигов в системе письма в целом, таких как процесс ливийского и лидинга , который привел к появлению канцелярского письма . По словам палеографа Цю Сигуя, самой широкой тенденцией в эволюции китайских иероглифов на протяжении их истории было упрощение, как в графической форме (字形; zìxíng ), «внешнем виде отдельных графов», так и в графической форме (字体;字體; zìtǐ ), «общих изменениях в отличительных чертах графической формы и каллиграфического стиля, [...] в большинстве случаев относящихся к довольно очевидным и довольно существенным изменениям». [2] Ливийский язык часто включал в себя значительные пропуски, добавления или преобразования форм, используемых малым письмом печати Цинь, в то время как лидинг является прямой регуляризацией и линеаризацией форм для преобразования их в канцелярские формы с сохранением их первоначальной структуры. Например, иероглиф «год» подвергся лидингу в церковную форму письма秊, в то время как тот же иероглиф после лидинга привел к православной форме年. Аналогично, ливийский и лидинг создали два отдельных символа虎и乕для «тигра».
Существуют варианты, возникающие из-за использования разных радикалов для указания конкретных определений полисемичного персонажа. Например, персонаж雕может означать как 'вид ястреба', так и 'вырезать'. Варианты, использующие разные радикалы для указания, таким образом развивались:鵰с радикалом ⿃ 'ПТИЦА' и琱с радикалом ⽟ 'ЖАДЕ' .
В редких случаях два иероглифа в древнекитайском языке со схожими значениями путались и объединялись, когда их современные китайские прочтения сливались, например,飢и饑оба читаются как jī и означают «голод», взаимозаменяемо используемые в современном языке, хотя飢изначально означало «недостаточное количество пищи для насыщения», а饑означало «голод» в древнекитайском . Ранее эти два иероглифа принадлежали к двум разным древнекитайским группам рифм ( группы脂и微соответственно) и, таким образом, указывали, что тогда у них было разное произношение. Подобная ситуация ответственна за существование вариантов частицы於'in', которая имела древнюю форму于, теперь используемую в качестве ее упрощенной формы. В каждом из приведенных выше случаев варианты были объединены в одну упрощенную форму.
Формы символов, которые являются наиболее ортодоксальными, известны как ортодоксальные варианты (正字; zhèngzì ), что иногда понимается как формы, представленные в словаре Канси (康熙字典體; Kāngxī zìdiǎn tǐ ), которые обычно представляют собой ортодоксальные формы, используемые в позднем императорском Китае. Неортодоксальные формы известны как народные варианты (俗字; súzì ; пересмотренная романизация : sokja ; Хепберн : zokuji ). Некоторые народные варианты являются давними сокращениями или каллиграфическими формами и позже стали основой для упрощенных форм, принятых на материке. Например,痴— это народный вариант, соответствующий ортодоксальной форме癡«глупый». Эти формы различаются по своему фонетическому компоненту, при этом народный вариант использует иероглиф с «достаточно близким» произношением, но имеющий гораздо меньше черт и, следовательно, более быстрый для написания. В материковом Китае упрощенные формы называются xin zixing , как правило, контрастируют с jiu zixing , которые обычно являются формой Kangxi .
Православные и вульгарные формы могут различаться только длиной или расположением отдельных штрихов, пересечением определенных штрихов или наличием или отсутствием второстепенных штрихов (точек). Часто их не считают отдельными вариантами. Например,述— это новая форма иероглифа с традиционной орфографией述«пересказывать», «описывать». В качестве другого примера, фамилия 吴, также название древнего государства , является «новой формой иероглифа» традиционно написанного иероглифа吳.
Варианты символов существуют в каждой системе письма, использующей китайские иероглифы, включая письменный китайский , японский и корейский . Несколько правительств стран, говорящих на этих языках, стандартизировали свои системы письма, указав определенные варианты в качестве стандартной формы. Выбор вариантов для использования привел к некоторому раздвоению письменного китайского языка между упрощенными и традиционными формами . Стандартизация упрощенных форм в Японии отличалась от процесса в материковом Китае.
Стандартные формы символов, предписанные правительством каждого региона, описаны в:
Однако следует отметить, что традиционная печатная орфография (обычно известная как цзю цзысин ) является фактическим стандартом, используемым традиционными китайскими общинами за пределами образовательных целей [3] [4] .
Unicode обрабатывает вариантные символы сложным образом в результате процесса объединения Хань . В объединении Хань некоторые варианты, которые почти идентичны между китайско-, японо- и корейскоязычными регионами, кодируются в одной и той же кодовой точке и могут быть различимы только с помощью разных шрифтов . Другие варианты, которые более расходятся, кодируются в разных кодовых точках. На веб-страницах отображение правильных вариантов для предполагаемого языка зависит от установленных на компьютере шрифтов, конфигурации веб-браузера и языковых тегов веб-страниц. Системы, которые готовы отображать правильные варианты, редки, поскольку у многих пользователей компьютеров не установлены стандартные шрифты, а самые популярные веб-браузеры не настроены на отображение правильных вариантов по умолчанию. Ниже приведены некоторые примеры вариантных форм китайских иероглифов с разными кодовыми точками и языковыми тегами.
В следующих примерах используются те же кодовые точки, но разные языковые теги. Однако языковые теги редко работают правильно, чтобы получить ожидаемые формы от текстовых рендереров (например, в таблице ниже, где все визуализированные глифы могут выглядеть одинаково).
Вместо этого стандарт Unicode позволяет кодировать эти варианты как последовательности вариантов [ 5] путем добавления селектора вариантов (безглифного непробельного знака) к стандартному унифицированному идеограмме CJK (он также работает непосредственно внутри обычного текста, без необходимости использования какого-либо расширенного текстового формата для выбора соответствующего языка или письменности, и обеспечивает более простой и избирательный контроль, когда для одной и той же комбинации языка/письма требуется несколько вариантов). Список допустимых последовательностей вариаций стандартизирован Unicode, определен в базе данных идеографических вариаций (IVD), [6] [7] части базы данных символов Unicode (UCD), [8] и может быть расширен без перекодирования новых кодовых точек в UCS (и с тех пор, как версии Unicode, в которых селекторы вариаций были закодированы, и был установлен IVD, больше не требуется кодировать какие-либо новые идеограммы совместимости для их отображения; два блока CJK Compatibility Ideographs в BMP и CJK Compatibility Ideographs Supplement в SIP теперь заморожены с Unicode 4.1, за исключением исправления нескольких прошлых ошибок, которые были забыты в процессе унификации Хань для обзора нормативных источников). [9]