stringtranslate.com

Варианты китайских иероглифов

Дорожные знаки «Кай Так» в Сунь По Конг, Гонконг 異體字(啟–啓) (обрезано).jpg
Дорожные знаки «Кай Так» в Сунь По Конг, Гонконг 異體字(啟–啓) (обрезано).jpg
Два дорожных знака в Сан-По-Конге , Гонконг, указывающие на одно и то же название Кай-Так с разными вариантами (и) иероглифа «Кай».

Китайские иероглифы могут иметь несколько вариантных форм — визуально различных глифов , которые представляют одно и то же основное значение и произношение. Варианты данного иероглифа являются аллографами друг друга, и многие из них напрямую аналогичны аллографам, присутствующим в английском алфавите , например, двухэтажный ⟨a⟩ и одноэтажный ⟨ɑ⟩ варианты буквы A, причем последний чаще встречается в рукописном написании . Некоторые контексты требуют использования определенных вариантов.

Природа вариантов

До 20 века вариации в форме символов были повсеместны, и эта динамика продолжилась после изобретения ксилографии . Например, до династии Цинь (221–206 гг. до н. э.) иероглиф, означающий «яркий», писался какили— с«Солнце» или«окно» слева, с компонентом«Луна» справа. Ли Сы ( ум.  208 г. до н. э. ), канцлер Цинь, попытался универсализировать письмо малой печати Цинь по всему Китаю после войн , которые впервые политически объединили страну. Ли предписал формуслова для «яркий», но некоторые писцы проигнорировали это и продолжили писать иероглиф как. Однако, более частое использованиесопровождалось распространением третьего варианта:, с'глаз' слева — вероятно, полученного как сокращение. В конечном итоге,стало стандартной формой иероглифа. [1]

Новые варианты также являются результатом более крупных сдвигов в системе письма в целом, таких как процесс ливийского и лидинга , который привел к появлению канцелярского письма . По словам палеографа Цю Сигуя, самой широкой тенденцией в эволюции китайских иероглифов на протяжении их истории было упрощение, как в графической форме (字形; zìxíng ), «внешнем виде отдельных графов», так и в графической форме (字体;字體; zìtǐ ), «общих изменениях в отличительных чертах графической формы и каллиграфического стиля, [...] в большинстве случаев относящихся к довольно очевидным и довольно существенным изменениям». [2] Ливийский язык часто включал в себя значительные пропуски, добавления или преобразования форм, используемых малым письмом печати Цинь, в то время как лидинг является прямой регуляризацией и линеаризацией форм для преобразования их в канцелярские формы с сохранением их первоначальной структуры. Например, иероглиф «год» подвергся лидингу в церковную форму письма, в то время как тот же иероглиф после лидинга привел к православной форме. Аналогично, ливийский и лидинг создали два отдельных символаидля «тигра».

Существуют варианты, возникающие из-за использования разных радикалов для указания конкретных определений полисемичного персонажа. Например, персонажможет означать как 'вид ястреба', так и 'вырезать'. Варианты, использующие разные радикалы для указания, таким образом развивались:с радикалом 'ПТИЦА' ис радикалом 'ЖАДЕ' .

В редких случаях два иероглифа в древнекитайском языке со схожими значениями путались и объединялись, когда их современные китайские прочтения сливались, например,иоба читаются как и означают «голод», взаимозаменяемо используемые в современном языке, хотяизначально означало «недостаточное количество пищи для насыщения», аозначало «голод» в древнекитайском . Ранее эти два иероглифа принадлежали к двум разным древнекитайским группам рифм ( группыисоответственно) и, таким образом, указывали, что тогда у них было разное произношение. Подобная ситуация ответственна за существование вариантов частицы'in', которая имела древнюю форму, теперь используемую в качестве ее упрощенной формы. В каждом из приведенных выше случаев варианты были объединены в одну упрощенную форму.

Православие

Формы символов, которые являются наиболее ортодоксальными, известны как ортодоксальные варианты (正字; zhèngzì ), что иногда понимается как формы, представленные в словаре Канси (康熙字典體; Kāngxī zìdiǎn tǐ ), которые обычно представляют собой ортодоксальные формы, используемые в позднем императорском Китае. Неортодоксальные формы известны как народные варианты (俗字; súzì ; пересмотренная романизация : sokja ; Хепберн : zokuji ). Некоторые народные варианты являются давними сокращениями или каллиграфическими формами и позже стали основой для упрощенных форм, принятых на материке. Например,— это народный вариант, соответствующий ортодоксальной форме«глупый». Эти формы различаются по своему фонетическому компоненту, при этом народный вариант использует иероглиф с «достаточно близким» произношением, но имеющий гораздо меньше черт и, следовательно, более быстрый для написания. В материковом Китае упрощенные формы называются xin zixing , как правило, контрастируют с jiu zixing , которые обычно являются формой Kangxi .

Православные и вульгарные формы могут различаться только длиной или расположением отдельных штрихов, пересечением определенных штрихов или наличием или отсутствием второстепенных штрихов (точек). Часто их не считают отдельными вариантами. Например,— это новая форма иероглифа с традиционной орфографией«пересказывать», «описывать». В качестве другого примера, фамилия , также название древнего государства , является «новой формой иероглифа» традиционно написанного иероглифа.

Региональные стандарты

Справа налево: формы словаря Канси, стандарты в материковом Китае, Гонконге, Тайване и Японии. Значительные различия выделены желтым цветом. [a]

Варианты символов существуют в каждой системе письма, использующей китайские иероглифы, включая письменный китайский , японский и корейский . Несколько правительств стран, говорящих на этих языках, стандартизировали свои системы письма, указав определенные варианты в качестве стандартной формы. Выбор вариантов для использования привел к некоторому раздвоению письменного китайского языка между упрощенными и традиционными формами . Стандартизация упрощенных форм в Японии отличалась от процесса в материковом Китае.

Стандартные формы символов, предписанные правительством каждого региона, описаны в:

Однако следует отметить, что традиционная печатная орфография (обычно известная как цзю цзысин ) является фактическим стандартом, используемым традиционными китайскими общинами за пределами образовательных целей [3] [4] .

Использование в вычислениях

Двенадцать вариантов иероглифа jiàn «меч» , которые различаются как используемыми компонентами, так и конкретными аллографами , используемыми для этих компонентов:
  • С левой стороны,и qiān являются аллографами одного и того же фонетического компонента.
  • С правой стороны « НОЖ » , «ЗОЛОТО» и  « лезвие лезвия» это отдельные значимые компоненты, используемые в разных вариантах. «НОЖ» — это аллограф «НОЖ» .

Unicode обрабатывает вариантные символы сложным образом в результате процесса объединения Хань . В объединении Хань некоторые варианты, которые почти идентичны между китайско-, японо- и корейскоязычными регионами, кодируются в одной и той же кодовой точке и могут быть различимы только с помощью разных шрифтов . Другие варианты, которые более расходятся, кодируются в разных кодовых точках. На веб-страницах отображение правильных вариантов для предполагаемого языка зависит от установленных на компьютере шрифтов, конфигурации веб-браузера и языковых тегов веб-страниц. Системы, которые готовы отображать правильные варианты, редки, поскольку у многих пользователей компьютеров не установлены стандартные шрифты, а самые популярные веб-браузеры не настроены на отображение правильных вариантов по умолчанию. Ниже приведены некоторые примеры вариантных форм китайских иероглифов с разными кодовыми точками и языковыми тегами.

В следующих примерах используются те же кодовые точки, но разные языковые теги. Однако языковые теги редко работают правильно, чтобы получить ожидаемые формы от текстовых рендереров (например, в таблице ниже, где все визуализированные глифы могут выглядеть одинаково).

Вместо этого стандарт Unicode позволяет кодировать эти варианты как последовательности вариантов [ 5] путем добавления селектора вариантов (безглифного непробельного знака) к стандартному унифицированному идеограмме CJK (он также работает непосредственно внутри обычного текста, без необходимости использования какого-либо расширенного текстового формата для выбора соответствующего языка или письменности, и обеспечивает более простой и избирательный контроль, когда для одной и той же комбинации языка/письма требуется несколько вариантов). Список допустимых последовательностей вариаций стандартизирован Unicode, определен в базе данных идеографических вариаций (IVD), [6] [7] части базы данных символов Unicode (UCD), [8] и может быть расширен без перекодирования новых кодовых точек в UCS (и с тех пор, как версии Unicode, в которых селекторы вариаций были закодированы, и был установлен IVD, больше не требуется кодировать какие-либо новые идеограммы совместимости для их отображения; два блока CJK Compatibility Ideographs в BMP и CJK Compatibility Ideographs Supplement в SIP теперь заморожены с Unicode 4.1, за исключением исправления нескольких прошлых ошибок, которые были забыты в процессе унификации Хань для обзора нормативных источников). [9]

Смотрите также

  • Рякудзи  – форма стенографии для написания кандзи
  • Z-вариант  – глифы с незначительными типографскими различиями
  • Вариант формы (Юникод)  – Альтернативный глиф для символа в Юникоде.
  • Рационализация китайских иероглифов
  • Примечания

    1. ^ не полностью написано в словаре Канси из-за табу на наречение, запрещающего написание иероглифов имени императора., а также все составные слова, использующие его в качестве компонента, не имеют конечной точки. Конечная вертикальная черта втакже опущена.

    Ссылки

    Цитаты

    1. ^ Бёксет 2006, стр. 19.
    2. Цю 2000, стр. 44–45.
    3. ^ "Орфография, используемая для Plex Sans TC · Выпуск № 346 · IBM/plex". GitHub .
    4. ^ «請還原Традиционный китайский的眞正Традиция寫法 · Проблема №6 · Adobe-fonts/source-han-sans» . Гитхаб .
    5. ^ "Вариационные последовательности; FAQ". Консорциум Unicode.
    6. ^ «База данных идеографических вариаций». Консорциум Unicode.
    7. ^ "UTS #37, База данных идеографических вариаций Unicode". Консорциум Unicode.
    8. ^ "База данных символов Unicode, стандартное приложение № 44". Консорциум Unicode.Объясняет различные свойства персонажа.
    9. ^ «Приложение № 45 к стандарту Unicode®, идеограф U-Source». Консорциум Unicode.

    Цитируемые работы