stringtranslate.com

символы CJK

Перевод фразы «Этому старику 72 года» на вьетнамский , кантонский , мандаринский ( упрощенными и традиционными иероглифами ), японский и корейский языки .

В интернационализации символы CJK являются собирательным термином для графем, используемых в китайской , японской и корейской письменностях , каждая из которых включает китайские иероглифы . Термин CJKV также включает в себя чу-ном , логографическое письмо китайского происхождения, ранее использовавшееся для вьетнамского языка .

Репертуар персонажей

Стандартный мандаринский китайский и стандартный кантонский диалекты пишутся почти исключительно китайскими иероглифами. Для общей грамотности требуется более 3000 иероглифов , а для достаточно полного охвата — до 40 000 иероглифов. В японском языке используется меньше иероглифов — общая грамотность в японском языке может быть достигнута при 2136 иероглифах. Использование китайских иероглифов в Корее становится все более редким, хотя идиосинкразическое использование китайских иероглифов в именах собственных требует знания (и, следовательно, наличия) гораздо большего количества иероглифов. Однако даже сегодня южнокорейские студенты изучают 1800 иероглифов .

Другие письменности, используемые для этих языков, такие как бопомофо и пиньинь на основе латиницы для китайского языка, хирагана и катакана для японского языка и хангыль для корейского языка, не являются строго «символами CJK», хотя наборы символов CJK почти всегда включают их по мере необходимости для полного охвата целевых языков.

Синолог Карл Лебан (1971) провел ранний обзор систем кодирования CJK.

До начала 20-го века классический китайский был письменным языком правительства и науки во Вьетнаме. Популярная литература на вьетнамском языке была написана с помощью письменности чу-ном , состоящей из китайских иероглифов со многими иероглифами, созданными на месте. С 1920-х годов письменностью, используемой для записи литературы, был вьетнамский алфавит на основе латиницы . [1] [2]

Кодирование

Количество символов, необходимое для полного покрытия потребностей всех этих языков, не может поместиться в 256-символьном кодовом пространстве 8-битных кодировок символов , требуя по крайней мере 16-битной фиксированной ширины кодировки или многобайтовых кодировок переменной длины. 16-битные фиксированные ширины кодировки, такие как те, что от Unicode до версии 2.0 включительно, в настоящее время устарели из-за требования кодировать больше символов, чем может вместить 16-битная кодировка — Unicode 5.0 содержит около 70 000 символов хань — и требования китайского правительства, чтобы программное обеспечение в Китае поддерживало набор символов GB 18030 .

Хотя кодировки CJK имеют общие наборы символов, кодировки, часто используемые для их представления, были разработаны отдельно различными правительствами Восточной Азии и компаниями-разработчиками программного обеспечения и являются взаимно несовместимыми. Unicode попытался, с некоторыми противоречиями, унифицировать наборы символов в процессе, известном как унификация Хань .

Кодировки символов CJK должны состоять как минимум из символов хань, а также фонетических систем, специфичных для данного языка, таких как пиньинь , бопомофо , хирагана, катакана и хангыль. [3]

Кодировки символов CJK включают в себя:

Наборы символов CJK занимают большую часть выделенного пространства кода Unicode . Среди японских экспертов по китайским иероглифам существует много споров о желательности и технических достоинствах процесса унификации Хань, используемого для преобразования нескольких китайских и японских наборов символов в один набор унифицированных символов. [ необходима цитата ]

На всех трех языках можно писать как слева направо, так и сверху вниз (в древних документах — справа налево и сверху вниз), но при обсуждении вопросов кодирования их обычно рассматривают как языки с написанием слева направо.

Правовой статус

Библиотеки сотрудничали по стандартам кодирования для символов JACKPHY ​​в начале 1980-х годов. По словам Кена Ланде , аббревиатура «CJK» была зарегистрированной торговой маркой Research Libraries Group [ 4] (которая объединилась с OCLC в 2006 году). Срок действия торговой марки, принадлежавшей OCLC с 1987 по 2009 год, истек. [5]

Смотрите также

Ссылки

  1. ^ Коулмас (1991), стр. 113–115.
  2. ^ ДеФрэнсис (1977).
  3. ^ Статья основана на материале, взятом из CJK в Free On-line Dictionary of Computing до 1 ноября 2008 года и включенном в соответствии с условиями «перелицензирования» GFDL версии 1.3 или более поздней.
  4. ^ Кен Ланде, 1996
  5. ^ Список Justia

Цитируемые работы

Источники

Внешние ссылки