Китайский ( упрощенный китайский :汉语; традиционный китайский :漢語; пиньинь : Hànyǔ ; букв. « язык хань » или中文; Zhōngwén ; «китайская письменность») — группа языков [d], на которых говорят этническое большинство китайцев хань и многие этнические меньшинства в Китае . Около 1,35 миллиарда человек, или 17% населения мира, говорят на различных вариантах китайского языка как на своем родном языке . [3]
Китайские языки образуют синитскую ветвь китайско -тибетской языковой семьи. Разговорные варианты китайского языка обычно рассматриваются носителями языка как диалекты одного языка. Однако отсутствие у них взаимопонимания означает, что иногда их считают отдельными языками в семье . [e] Исследование исторических связей между вариантами китайского языка продолжается. В настоящее время большинство классификаций выделяют от 7 до 13 основных региональных групп, основанных на фонетических изменениях от среднекитайского , из которых наиболее распространенным на сегодняшний день является мандаринский с 66%, или около 800 миллионов носителей, за которым следуют минь (75 миллионов, например, южноминь ), у (74 миллиона, например, шанхайский ) и юэ (68 миллионов, например, кантонский ). [5] Эти ветви непонятны друг другу, и многие из их подгрупп непонятны другим вариантам в пределах той же ветви (например, южноминь). Однако существуют переходные области, где разновидности из разных ветвей имеют достаточно общих черт для некоторой ограниченной понятности, включая новый сян с юго-западным мандаринским , китайский сюаньчжоуский у с нижнеянцзыским мандаринским , цзинь с центрально-равнинным мандаринским и некоторые расходящиеся диалекты хакка с гань . Все разновидности китайского языка являются тональными, по крайней мере, в некоторой степени, и в значительной степени аналитическими .
Самый ранний письменный китайский язык, засвидетельствованный письменностью, состоит из надписей на гадательных костях , созданных во времена династии Шан около 1250 г. до н. э . Фонетические категории древнекитайского языка можно реконструировать из рифм древней поэзии. В течение Северного и Южного периодов среднекитайский язык претерпел несколько звуковых изменений и разделился на несколько разновидностей после длительного географического и политического разделения. Qieyun , словарь рифм , записал компромисс между произношением разных регионов. Королевские дворы династий Мин и ранней Цин работали, используя язык койнэ, известный как гуаньхуа , основанный на нанкинский диалекте мандаринского наречия.
Стандартный китайский язык является официальным языком как Китайской Народной Республики , так и Китайской Республики (Тайвань), одним из четырех официальных языков Сингапура и одним из шести официальных языков Организации Объединенных Наций . Стандартный китайский язык основан на пекинском диалекте мандаринского наречия и был впервые официально принят в 1930-х годах. Язык пишется в основном с использованием логографии китайских иероглифов , в значительной степени разделяемой читателями, которые в противном случае могли бы говорить на взаимно непонятных диалектах. С 1950-х годов использование упрощенных иероглифов поощрялось правительством Китайской Народной Республики, а Сингапур официально принял их в 1976 году. Традиционные иероглифы используются на Тайване, в Гонконге, Макао и среди китайскоязычных общин за рубежом .
Лингвисты классифицируют все разновидности китайского языка как часть китайско-тибетской языковой семьи , вместе с бирманским , тибетским и многими другими языками, на которых говорят в Гималаях и Юго-Восточной Азии . [6] Хотя эта связь была впервые предложена в начале 19 века и в настоящее время широко принята, реконструкция китайско-тибетского языка гораздо менее развита, чем реконструкция таких семей, как индоевропейская или австроазиатская . Трудности включают большое разнообразие языков, отсутствие склонения во многих из них и последствия языкового контакта. Кроме того, многие из малых языков используются в горных районах, которые труднодоступны и часто также являются чувствительными пограничными зонами. [7] Без надежной реконструкции прото-китайско-тибетского языка структура семьи на более высоком уровне остается неясной. [8] Часто предполагается разветвление на китайский и тибето-бирманские языки на верхнем уровне , но оно не было убедительно продемонстрировано. [9]
Первые письменные записи появились более 3000 лет назад во времена династии Шан . По мере развития языка в этот период различные местные варианты стали взаимно непонятными. В ответ на это центральные правительства неоднократно пытались ввести единый стандарт. [10]
Самые ранние примеры древнекитайского языка — это гадательные надписи на костях оракула, датируемые примерно 1250 г. до н. э. , во время позднего Шан . [11] Следующий засвидетельствованный этап произошел из надписей на бронзовых артефактах, датируемых периодом Западного Чжоу (1046–771 гг. до н. э.), «Классикой поэзии» и частями « Книги документов» и «И Цзин» . [12] Ученые попытались реконструировать фонологию древнекитайского языка , сравнивая более поздние разновидности китайского языка с практикой рифмования «Классики поэзии» и фонетическими элементами, обнаруженными в большинстве китайских иероглифов. [13] Хотя многие из более тонких деталей остаются неясными, большинство ученых сходятся во мнении, что древнекитайский язык отличается от среднекитайского отсутствием ретрофлексных и палатальных шумных, но наличием начальных согласных определенного рода, а также наличием глухих носовых и плавных. [14] Самые последние реконструкции также описывают атональный язык с согласными кластерами в конце слога, развивающимися в тональные различия в среднекитайском языке. [15] Также было выявлено несколько деривационных аффиксов , но в языке отсутствует словоизменение , и указаны грамматические отношения с использованием порядка слов и грамматических частиц . [16]
Средний китайский язык использовался во времена Северной и Южной династий , а также династий Суй , Тан и Сун (VI–X вв. н. э.). Его можно разделить на ранний период, отраженный в словаре рифм Qieyun (601 г. н. э.), и поздний период в X веке, отраженный в таблицах рифм, таких как Yunjing, составленных древнекитайскими филологами в качестве руководства к системе Qieyun . [17] Эти работы определяют фонологические категории, но с небольшим намеком на то, какие звуки они представляют. [18] Лингвисты идентифицировали эти звуки, сравнивая категории с произношением в современных вариантах китайского языка , заимствованными китайскими словами в японском, вьетнамском и корейском языках, а также с данными транскрипции. [19] Полученная система очень сложная, с большим количеством согласных и гласных, но они, вероятно, не все различаются в каком-либо одном диалекте. Большинство лингвистов в настоящее время полагают, что это представляет собой диасистему, охватывающую северные и южные стандарты чтения классических произведений VI века. [20]
Сложная взаимосвязь между устным и письменным китайским языком является примером диглоссии : в устной речи китайские варианты развивались с разной скоростью, в то время как письменный язык, используемый по всему Китаю, изменился сравнительно мало, кристаллизовавшись в престижную форму, известную как классический или литературный китайский язык . Литература, написанная отчетливо в классической форме, начала появляться в период Весны и Осени . Его использование в письменной форме оставалось почти универсальным до конца 19 века, достигнув кульминации с широким принятием письменного разговорного китайского языка с началом Движения четвертого мая в 1919 году.
После падения династии Северная Сун и последующего правления династий Чжурчжэнь Цзинь и Монгольской Юань в Северном Китае на основе диалектов Северо-Китайской равнины вокруг столицы развилась общая речь (теперь называемая старым мандаринским наречием ). [21] Словарь 1324 года Чжунъюань Иньюнь был словарем, кодифицировавшим правила рифмовки новой стихотворной формы саньцюй в этом языке. [22] Вместе с немного более поздним словарем Мэнгу Цзыюнь этот словарь описывает язык со многими чертами, характерными для современных диалектов мандаринского наречия. [23]
Вплоть до начала 20-го века большинство китайцев говорили только на своем местном диалекте. [24] Таким образом, в качестве практической меры, чиновники династий Мин и Цин осуществляли управление империей, используя общий язык, основанный на разновидностях мандаринского диалекта , известный как官话;官話; Guānhuà ; «язык чиновников». [25] Большую часть этого периода этот язык был койне, основанным на диалектах, на которых говорили в районе Нанкина , хотя и не идентичным ни одному отдельному диалекту. [26] К середине 19-го века пекинский диалект стал доминирующим и был необходим для любого бизнеса с императорским двором. [27]
В 1930-х годах был принят стандартный национальный язык (国语;國語; Guóyǔ ). После долгих споров между сторонниками северных и южных диалектов и неудачной попытки искусственного произношения Национальная комиссия по унификации языка наконец остановилась на пекинском диалекте в 1932 году. Народная Республика, основанная в 1949 году, сохранила этот стандарт, но переименовала его в普通话;普通話; pǔtōnghuà ; «общая речь». [28] В настоящее время национальный язык используется в образовании, средствах массовой информации и официальных ситуациях как в материковом Китае, так и на Тайване. [29]
В Гонконге и Макао кантонский диалект является доминирующим разговорным языком из-за культурного влияния иммигрантов из Гуандуна и политики колониальной эпохи и используется в образовании, средствах массовой информации, официальной речи и повседневной жизни, хотя в школах все чаще преподают мандаринский диалект из-за растущего влияния материка. [30]
Исторически китайский язык распространялся среди соседей различными способами. Северный Вьетнам был включен в династию Хань (202 г. до н. э. — 220 г. н. э.) в 111 г. до н. э., что ознаменовало начало периода китайского контроля , который длился почти непрерывно в течение тысячелетия. Четыре командования Хань были созданы в Северной Корее в I веке до н. э., но распались в последующие столетия. [31] Китайский буддизм распространился по Восточной Азии между II и V веками н. э., а вместе с ним и изучение писаний и литературы на литературном китайском языке. [32] Позднее в Корее, Японии и Вьетнаме были созданы сильные центральные правительства, смоделированные по китайским образцам, причем литературный китайский язык служил языком администрации и науки, и это положение он сохранял до конца XIX века в Корее и (в меньшей степени) в Японии, а также до начала XX века во Вьетнаме. [33] Ученые из разных стран могли общаться, хотя и только письменно, используя литературный китайский язык. [34]
Хотя они использовали китайский язык исключительно для письменного общения, в каждой стране была своя собственная традиция чтения текстов вслух, используя то, что известно как сино-ксеническое произношение . Китайские слова с таким произношением также были широко импортированы в корейский , японский и вьетнамский языки и сегодня составляют более половины их словарного запаса. [35] Этот массовый приток привел к изменениям в фонологической структуре языков, способствуя развитию мораической структуры в японском языке [36] и нарушению гармонии гласных в корейском языке. [37]
Заимствованные китайские морфемы широко использовались во всех этих языках для создания сложных слов для новых концепций, подобно использованию латинских и древнегреческих корней в европейских языках. [38] Многие новые соединения или новые значения для старых фраз были созданы в конце 19-го и начале 20-го веков для обозначения западных концепций и артефактов. Эти фразы, написанные общими китайскими иероглифами, затем свободно заимствовались между языками. Они даже были приняты в китайский язык, язык, обычно устойчивый к заимствованиям, потому что их иностранное происхождение было скрыто их письменной формой. Часто различные соединения для одного и того же понятия находились в обращении в течение некоторого времени, прежде чем появлялся победитель, и иногда окончательный выбор различался между странами. [39] Таким образом, доля словаря китайского происхождения, как правило, больше в техническом, абстрактном или формальном языке. Например, в Японии китайско-японские слова составляют около 35% слов в развлекательных журналах, более половины слов в газетах и 60% слов в научных журналах. [40]
Вьетнам, Корея и Япония разработали системы письма для своих собственных языков, изначально основанные на китайских иероглифах , но позже замененные алфавитом хангыль для корейского языка и дополненные слоговым письмом кана для японского языка, в то время как вьетнамский язык продолжал писать сложным письмом чу-ном . Однако они были ограничены популярной литературой до конца 19 века. Сегодня японский язык пишется составным письмом, использующим как китайские иероглифы, называемые кандзи , так и кану. Корейский язык пишется исключительно с помощью хангыля в Северной Корее, хотя знание дополнительных китайских иероглифов, называемых ханджа, по-прежнему требуется, а ханджа все реже используется в Южной Корее. В результате исторической колонизации Францией вьетнамцы теперь используют вьетнамский алфавит на основе латиницы .
Английские слова китайского происхождения включают чай из хоккиена 茶( tê ), димсам из кантонского點心( dim2 sam1 ) и кумкват из кантонского金橘( gam1 gwat1 ).
Синолог Джерри Норман подсчитал, что существуют сотни взаимно непонятных разновидностей китайского языка. [41] Эти разновидности образуют диалектный континуум , в котором различия в речи обычно становятся более выраженными по мере увеличения расстояния, хотя скорость изменений сильно различается. Как правило, горный Южный Китай демонстрирует большее языковое разнообразие, чем Северо-Китайская равнина . До конца 20-го века китайские эмигранты в Юго-Восточную Азию и Северную Америку приезжали из юго-восточных прибрежных районов, где говорили на диалектах минь, хакка и юэ. В частности, большинство китайских иммигрантов в Северную Америку до середины 20-го века говорили на тайшаньском языке , разновидности юэ из небольшой прибрежной области вокруг Тайшаня, Гуандун . [42]
В некоторых частях Южного Китая диалект крупного города может быть лишь частично понятен его соседям. Например, Учжоу и Тайшань расположены примерно в 260 км (160 миль) и 190 км (120 миль) от Гуанчжоу соответственно, но диалект юэ, на котором говорят в Учжоу, больше похож на диалект Гуанчжоу, чем на тайшаньский. Учжоу расположен прямо вверх по течению от Гуанчжоу на Жемчужной реке , тогда как Тайшань находится на юго-западе Гуанчжоу, причем два города разделены несколькими речными долинами. [43] В некоторых частях Фуцзяни речь некоторых соседних уездов или деревень взаимно непонятна. [44]
Местные варианты китайского языка условно подразделяются на семь диалектных групп, в значительной степени основанных на различной эволюции среднекитайских звонких инициалей: [46] [47]
Классификация Ли Жуна , которая используется в Атласе языков Китая (1987), выделяет еще три группы: [45] [48]
Некоторые разновидности остаются неклассифицированными, включая диалект даньчжоу на острове Хайнань , васянхуа, на котором говорят в западной провинции Хунань , и шаочжоу тухуа, на котором говорят в северной провинции Гуандун . [49]
Стандартный китайский язык — это стандартный язык Китая (где он называется普通话; pǔtōnghuà ) и Тайваня, а также один из четырёх официальных языков Сингапура (где он называется华语;華語; Huáyǔ или汉语;漢語; Hànyǔ ). Стандартный китайский язык основан на пекинском диалекте мандаринского языка. Правительства Китая и Тайваня намерены, чтобы носители всех разновидностей китайской речи использовали его в качестве общего языка общения. Поэтому он используется в государственных учреждениях, в средствах массовой информации и в качестве языка обучения в школах.
Диглоссия распространена среди носителей китайского языка. Например, житель Шанхая может говорить как на стандартном китайском, так и на шанхайском ; если он вырос в другом месте, он также, вероятно, свободно владеет диалектом своего родного региона. Помимо стандартного китайского, большинство тайваньцев также говорят на тайваньском хоккиен (также называемом台語; «тайваньский» [50] [51] ), хакка или австронезийском языке . [52] Носитель языка на Тайване может смешивать произношение и словарный запас стандартного китайского и других языков Тайваня в повседневной речи. [53] Отчасти из-за традиционных культурных связей с Гуандуном , кантонский диалект используется в качестве повседневного языка в Гонконге и Макао .
Обозначение различных китайских ветвей остается спорным. Некоторые лингвисты и большинство простых китайцев считают все разговорные разновидности одним языком, поскольку носители разделяют общую национальную идентичность и общую письменную форму. [54] Другие вместо этого утверждают, что неуместно называть основные ветви китайского языка, такие как мандаринский, у и т. д., «диалектами», поскольку взаимная непонятность между ними слишком велика. [55] [56] Однако называть основные китайские ветви «языками» также было бы неправильно по тому же критерию, поскольку такая ветвь, как у, сама по себе содержит множество взаимно непонятных разновидностей и не может быть правильно названа единым языком. [41]
Существуют также точки зрения, указывающие на то, что лингвисты часто игнорируют взаимопонимание, когда варианты разделяют взаимопонимание с центральным вариантом (т. е. престижным вариантом, таким как стандартный мандаринский диалект), поскольку этот вопрос требует осторожного обращения, когда взаимопонимание несовместимо с языковой идентичностью. [57]
Официальное обозначение китайского правительства для основных ветвей китайского языка —方言; fāngyán ; «региональная речь», в то время как более тесно связанные между собой разновидности внутри них называются地点方言;地點方言; dìdiǎn fāngyán ; «местная речь». [58]
Из-за трудностей, связанных с определением разницы между языком и диалектом, были предложены другие термины. К ним относятся тополект , [59] лект , [60] просторечие , [61] региональный , [58] и вариант . [62] [63]
Слоги в китайских языках имеют некоторые уникальные характеристики. Они тесно связаны с морфологией , а также с иероглифами письменной системы, и фонологически они структурированы в соответствии с фиксированными правилами.
Структура каждого слога состоит из ядра , в котором есть гласный (который может быть монофтонгом , дифтонгом или даже трифтонгом в некоторых вариантах), которому предшествует приступ (отдельный согласный или согласный + глайд ; также возможен нулевой приступ), а за ним (необязательно) следует согласный коды; слог также несет тон . В некоторых случаях гласный не используется в качестве ядра. Примером этого является кантонский диалект, где носовые сонорные согласные /m/ и /ŋ/ могут стоять отдельно как свой собственный слог.
В мандаринском языке, гораздо чаще, чем в других разговорных вариантах, большинство слогов, как правило, открытые слоги, то есть у них нет кода (предполагая, что конечный глайд не анализируется как код), но слоги, у которых есть код, ограничены носовыми /m/ , /n/ , /ŋ/ , ретрофлексным аппроксимантом /ɻ/ и глухими взрывными /p/ , /t/ , /k/ или /ʔ/ . Некоторые варианты допускают большинство из этих код, тогда как другие, такие как стандартный китайский, ограничиваются только /n/ , /ŋ/ и /ɻ/ .
Число звуков в различных разговорных диалектах различается, но в целом наблюдается тенденция к сокращению звуков по сравнению со среднекитайским. В частности, мандаринские диалекты испытали резкое сокращение звуков и поэтому имеют гораздо больше многосложных слов, чем большинство других разговорных вариантов. Таким образом, общее число слогов в некоторых вариантах составляет всего около тысячи, включая тональные вариации, что составляет всего лишь одну восьмую от числа слогов в английском языке. [f]
Все разновидности разговорного китайского языка используют тоны для различения слов. [64] Несколько диалектов северного Китая могут иметь всего три тона, в то время как некоторые диалекты южного Китая имеют до 6 или 12 тонов, в зависимости от того, как считать. Исключением из этого является шанхайский язык, который сократил набор тонов до двухтоновой системы акцента, во многом похожей на современный японский.
Очень распространенным примером, используемым для иллюстрации использования тонов в китайском языке, является применение четырех тонов стандартного китайского языка вместе с нейтральным тоном к слогу ma . Тоны иллюстрируются следующими пятью китайскими словами:
Напротив, в стандартном кантонском диалекте шесть тонов. Исторически финали, которые заканчиваются на смычный согласный, считались « контролируемыми тонами » и, таким образом, подсчитывались отдельно, в общей сложности девять тонов. Однако в современной лингвистике они считаются дубликатами и больше не считаются таковыми: [65]
Китайский язык часто описывают как «односложный». Однако это верно лишь отчасти. Это в значительной степени верно при описании древне- и среднекитайского; в классическом китайском языке около 90% слов состоят из одного иероглифа, который соответствует один к одному морфеме , наименьшей единице значения в языке. В современных вариантах обычно остается тот факт, что морфемы односложны — в отличие от этого, в английском языке много многосложных морфем, как связанных, так и свободных , таких как «семь», «слон», «пара-» и «-able». Некоторые из более консервативных современных вариантов, обычно встречающихся на юге, имеют в основном односложные слова , особенно с базовым словарным запасом. Однако большинство существительных, прилагательных и глаголов в современном китайском двусложны. Значительной причиной этого является фонетическая эрозия : звуковые изменения с течением времени неуклонно сокращали количество возможных слогов в инвентаре языка. В современном мандаринском языке существует всего около 1200 возможных слогов, включая тональные различия, по сравнению с примерно 5000 во вьетнамском языке (все еще в значительной степени односложном языке) и более 8000 в английском языке. [f]
Большинство современных вариантов склонны образовывать новые слова посредством многосложных соединений . В некоторых случаях односложные слова стали двусложными, образованными из разных символов без использования словосложения, как в窟窿; kūlong из孔; kǒng ; это особенно распространено в вариантах Цзинь. Этот фонологический коллапс привел к соответствующему увеличению числа омофонов . В качестве примера небольшой карманный китайский словарь Langenscheidt [66] перечисляет шесть слов, которые обычно произносятся как shí в стандартном китайском языке:
Однако в современном разговорном мандаринском языке возникла бы огромная двусмысленность, если бы все эти слова можно было использовать как есть. Стихотворение Юэн Жэнь Чао XX века «Поэт, поедающий льва в каменном логове» использует это, состоящее из 92 иероглифов, все из которых произносятся как ши . Таким образом, большинство этих слов были заменены в устной речи, если не в письменной, менее двуслоговыми соединениями. Только первое из них,十, обычно появляется в односложной форме в разговорном мандаринском языке; остальные обычно используются в многосложных формах
соответственно. В каждом случае неоднозначность омофона устранялась добавлением другой морфемы, обычно либо почти синонима, либо какого-то родового слова (например, «голова», «вещь»), цель которого — указать, какое из возможных значений другого, омофонического слога конкретно подразумевается.
Однако, когда одно из вышеперечисленных слов является частью сложного слова, разрешающий слог обычно опускается, и полученное слово по-прежнему двусложное. Например,石; shí отдельно, а не石头;石頭; shítou , появляется в сложных словах как значение «камень», таких как石膏; shígāo ; «штукатурка»,石灰; shíhuī ; «известь»,石窟; shíkū ; «грот»,石英; «кварц» и石油; shíyóu ; «нефть». Хотя многие односложные морфемы (字; zì ) могут стоять отдельно как отдельные слова, они чаще всего образуют многосложные соединения, известные как词;詞; cí , что больше напоминает традиционное западное понятие слова. Китайское cí может состоять из более чем одного символа-морфемы, обычно из двух, но может быть и три и более.
Примеры китайских слов, состоящих более чем из двух слогов, включают汉堡包;漢堡包; ханбообао ; 'гамбургер',守门员;守門員; сюменюань ; «вратарь» и电子邮件;電子郵件; дианцзёйоуцзян ; 'электронная почта'.
Все разновидности современного китайского языка являются аналитическими языками : они зависят от синтаксиса (порядка слов и структуры предложения), а не от флективной морфологии (изменений формы слова), чтобы указать функцию слова в предложении. [67] Другими словами, в китайском языке очень мало грамматических флексий — в нем нет времен , залогов , грамматических чисел , [h] и только несколько артиклей . [i] Они активно используют грамматические частицы для указания вида и наклонения . В мандаринском диалекте это включает использование таких частиц, как了; le ; ' PFV ',还;還; hái ; 'еще' и已经;已經; yǐjīng ; 'уже'.
В китайском языке порядок слов «субъект-глагол-объект» и, как и во многих других языках Восточной Азии, часто используется конструкция «тема-комментарий» для формирования предложений. В китайском языке также имеется обширная система классификаторов и счетных слов , еще одна черта, общая для соседних языков, таких как японский и корейский. Другие заметные грамматические особенности, общие для всех разговорных вариантов китайского языка, включают использование серийной глагольной конструкции , опускание местоимений и связанное с этим опускание подлежащего . Хотя грамматики разговорных вариантов имеют много общих черт, у них есть различия.
Весь корпус китайских иероглифов с древности включает в себя более 50 000 символов, из которых только около 10 000 используются и только около 3 000 часто используются в китайских СМИ и газетах. [68] Однако китайские иероглифы не следует путать с китайскими словами. Поскольку большинство китайских слов состоят из двух или более иероглифов, китайских слов намного больше, чем иероглифов. Более точным эквивалентом китайского иероглифа является морфема, поскольку иероглифы представляют собой наименьшие грамматические единицы с индивидуальными значениями в китайском языке.
Оценки общего числа китайских слов и лексикализованных фраз сильно различаются. Hanyu Da Zidian , сборник китайских иероглифов, включает 54 678 заголовочных статей для иероглифов, включая версии с гадательной костью. Zhonghua Zihai (1994) содержит 85 568 заголовочных статей для определений иероглифов и является крупнейшим справочным трудом, основанным исключительно на иероглифе и его литературных вариантах. Проект CC-CEDICT (2010) содержит 97 404 современных статей, включая идиомы, технологические термины и названия политических деятелей, предприятий и продуктов. Версия 2009 года электронного китайского словаря Вебстера (WDCD), [69] основанная на CC-CEDICT, содержит более 84 000 статей.
Самый полный чисто лингвистический словарь китайского языка, 12-томный Hanyu Da Cidian , содержит более 23 000 заглавных китайских иероглифов и дает более 370 000 определений. Пересмотренный в 1999 году Cihai , многотомный энциклопедический словарь-справочник, дает 122 836 определений словарных статей по 19 485 китайским иероглифам, включая собственные имена, фразы и общие зоологические, географические, социологические, научные и технические термины.
Издание 2016 года «Сяньдай Ханьюй Цидян» , авторитетного однотомного словаря современного стандартного китайского языка, используемого в материковом Китае, содержит 13 000 заглавных иероглифов и дает определения 70 000 слов.
Как и многие другие языки, китайский язык вобрал в себя значительное количество заимствований из других культур. Большинство китайских слов образованы из исконно китайских морфем, включая слова, описывающие импортированные объекты и идеи. Однако прямое фонетическое заимствование иностранных слов происходило с древних времен.
Были предложены некоторые ранние индоевропейские заимствованные слова в китайском языке, в частности «мед» (蜜; mì ), «лев» (狮;獅; shī ) и, возможно, «лошадь» (马;馬; mώ ), «свинья» (猪;豬; чжу ), «собака» (犬; quώn ) и «гусь» (鹅;鵝; é ). [70] Древние слова, заимствованные вдоль Шелкового пути в древнекитайский период, включают «виноград» (葡萄; pútáo ), «гранат» (石榴; shíliú ) и «лев» (狮子;獅子; shīzi ). Некоторые слова были заимствованы из буддийских писаний, в том числе «Будда» (佛; Fó ) и «бодхисаттва» (菩萨;菩薩; Púsà ). Другие слова пришли от кочевых народов с севера, например, « хутун » (胡同). Заимствованные слова от народов вдоль Шелкового пути, такие как «виноград» (葡萄), как правило, имеют персидскую этимологию. Буддийская терминология, как правило, происходит от санскрита или пали , литургических языков северной Индии. Слова, заимствованные у кочевых племен Гоби , монгольского или северо-восточные регионы, как правило, имеют алтайскую этимологию, например,琵琶( pípá ), китайская лютня или «сыр или йогурт» (酪; lào ), но не всегда ясно, из какого именно источника они происходят. [71]
Современные неологизмы в основном переводятся на китайский язык одним из трех способов: свободный перевод ( кальки ), фонетический перевод (по звуку) или комбинация этих двух . Сегодня гораздо более распространено использование существующих китайских морфем для создания новых слов, представляющих импортированные концепции, такие как технические выражения и международная научная лексика , в которых латинские и греческие компоненты обычно преобразуются один к одному в соответствующие китайские иероглифы. Слово «телефон» изначально было заимствовано фонетически как德律风;德律風( délǜfēng ; шанхайский télífon [təlɪfoŋ] ) — это слово широко использовалось в Шанхае в 1920-х годах, но позднее电话;電話( diànhuà ; 'электрическая речь'), построенное из исконно китайских морфем, стало преобладающим. Другие примеры включают
Иногда принимаются компромиссы между подходами к транслитерации и переводу, например汉堡包;漢堡包( hànbǎobāo ; 'гамбургер') от汉堡; «Гамбург» +包(«булочка»). Иногда переводы разрабатываются так, чтобы они звучали как оригинал, но при этом включают китайские морфемы ( фоносемантическое соответствие ), такие как马利奥;馬利奧( MƎlì'ào ) для персонажа видеоигры « Марио ». Это часто делается в коммерческих целях, например奔腾;奔騰( bēnténg ; 'лихой-прыгающий') для Pentium и赛百味;賽百味( Sàibǎiwèi ; 'лучше, чем сто вкусов') для Subway .
Иностранные слова, в основном имена собственные , продолжают проникать в китайский язык посредством транскрипции в соответствии с их произношением. Это делается путем использования китайских иероглифов с похожим произношением. Например, «Израиль» становится以色列( Yǐsèliè ), а «Париж» становится巴黎( Bālí ). Довольно небольшое количество прямых транслитераций сохранилось как общие слова, в том числе沙发;沙發( шафа ; «диван»),马达;馬達( mǎdá ; «мотор»),幽默( yōumò ; «юмор»),逻辑;邏輯( luóji, luójí «логика»),时髦; ;時髦( shímáo ; «умный (модный)») и歇斯底里( xiēsīdǐlǐ ; «истерика»). Основная часть этих слов изначально была придумана в Шанхае в начале 20-го века и позже заимствована оттуда в мандаринский, поэтому их произношение на мандаринском языке иногда сильно отличается от английского. Например, в шанхайском沙发;沙發( диван ) и马达;馬達( мотор ) звучат больше как их английские аналоги. Кантонский диалект отличается от мандаринского некоторыми транслитерациями, такими как梳化( so1 faa3,2 ; ' диван ') и摩打( mo1 daa2 ; ' мотор ').
Западные иностранные слова, представляющие западные концепции, оказали влияние на китайский язык с 20-го века посредством транскрипции. Из французского языка芭蕾( bālěi ) и香槟;香檳( xiāngbīn ) были заимствованы для 'ballet' и 'champagne' соответственно;咖啡( kāfēi ) было заимствовано из итальянского caffè 'coffee'. Влияние английского языка особенно выражено: с начала 20-го века многие английские слова были заимствованы в шанхайский язык, такие как高尔夫;高爾夫( gāo'ěrfū ; 'golf') и вышеупомянутые沙发;沙發( shāfā ; 'sofa'). Позже американская мягкая сила породила迪斯科( dísīkē ; «дискотека»),可乐;可樂( kělè ; «кола») и mínϐ («мини-юбка»). В современном разговорном кантонском диалекте есть отдельные заимствованные слова из английского языка, такие как卡通( kaa1 tung1 ; «мультфильм»),基佬( gei1 lou2 ; «геи»),的士( dik1 si6,2 ; «такси») и巴士( baa1 si6,2 ; «автобус»). С ростом популярности Интернета в Китае сейчас модно придумывать английские транслитерации, например,粉丝;粉絲( fěnsī ; «фанаты»),黑客( hēikè ; «хакер») и博客( bókè ; «блог»). На Тайване некоторые из этих транслитераций различаются, например,駭客( hàikè ; «хакер») и部落格( bùluògé ; «взаимосвязанные племена») для слова «блог».
Другим результатом английского влияния на китайский язык стало появление так называемых字母词;字母詞( zìmǔcí ; 'буквенные слова'), которые пишутся буквами английского алфавита. Они появились в разговорной речи, а также в журналах и газетах, на веб-сайтах и телевидении:
Начиная с 20-го века, еще одним источником слов были кандзи: Япония переделала европейские концепции и изобретения в和製漢語, васэй-канго , «сделанный в Японии китайский», и многие из этих слов были повторно заимствованы в современный китайский язык. Другие термины были придуманы японцами, придавая новые смыслы существующим китайским терминам или ссылаясь на выражения, используемые в классической китайской литературе. Например,经济;經濟; jīngjì ;経済, кэйдзай на японском языке, что в оригинальном китайском означало «работа государства», суженное до «экономики» на японском языке; это суженное определение затем было повторно импортировано в китайский язык. В результате эти термины практически неотличимы от исконно китайских слов: действительно, существуют некоторые споры относительно некоторых из этих терминов относительно того, кто придумал их первым — японцы или китайцы. В результате этого заимствования китайский, корейский, японский и вьетнамский языки имеют общий корпус лингвистических терминов, описывающих современную терминологию, что соответствует аналогичному корпусу терминов, созданному на основе греко-латинского языка и распространенному в европейских языках.
Китайская орфография основана на китайских иероглифах , которые пишутся внутри воображаемых квадратных блоков, традиционно расположенных в вертикальных столбцах, читаются сверху вниз по столбцу и справа налево по столбцам, несмотря на альтернативное расположение рядов символов слева направо внутри ряда и сверху вниз по рядам (как в английском и других западных системах письма), которые стали более популярными с 20-го века. [72] Китайские иероглифы обозначают морфемы, не зависящие от фонетических вариаций в разных языках. Так, иероглиф一('один') произносится как yī в стандартном китайском, yat1 в кантонском и it в хоккиенском, форме мин.
Большинство современных письменных китайских языков имеют форму письменного разговорного китайского языка , основанного на разговорном стандартном китайском языке, независимо от диалектного фона. Письменный разговорный китайский язык в значительной степени заменил литературный китайский язык в начале 20-го века в качестве стандартного письменного языка страны. [73] Однако, словарный запас из разных китайскоязычных регионов разошелся, и это расхождение можно наблюдать в письменном китайском языке. [74] [ требуется лучший источник ]
Из-за расхождения вариантов некоторые уникальные морфемы не встречаются в стандартном китайском языке. Символы, редко используемые в стандартном китайском языке, также были созданы или унаследованы от архаичных литературных стандартов для представления этих уникальных морфем. Например, такие символы, как冇и係, активно используются в кантонском и хакка, будучи архаичными или неиспользуемыми в стандартном письменном китайском языке. Наиболее ярким примером нестандартной китайской орфографии является письменный кантонский диалект , который используется в таблоидах и в Интернете среди носителей кантонского языка в Гонконге и других местах. [75] [ требуется лучший источник ]
В китайском языке не было единой системы фонетической транскрипции до середины 20-го века, хотя образцы произношения были записаны в ранних книгах и словарях. Ранние индийские переводчики, работавшие на санскрите и пали , были первыми, кто попытался описать звуки и образцы произношения китайского языка на иностранном языке. После 15-го века усилия иезуитов и западных придворных миссионеров привели к появлению некоторых систем транскрипции/письма латинских иероглифов, основанных на различных вариантах китайских языков. Некоторые из этих систем, основанных на латинских иероглифах, все еще используются для записи различных вариантов китайского языка в современную эпоху. [76]
В провинции Хунань женщины в некоторых районах пишут на своем местном китайском языке на языке нюшу , слоговом письме, произошедшем от китайских иероглифов. Дунганский язык , который многие считают диалектом мандаринского, в настоящее время пишется кириллицей , а ранее использовал арабскую графику . Дунгане в основном мусульмане и проживают в основном в Казахстане, Кыргызстане и России; многие хуэйцы , проживающие в основном в Китае, также говорят на этом языке.
Каждый китайский иероглиф представляет собой односложное китайское слово или морфему. В 100 году н. э. знаменитый ученый династии Хань Сюй Шэнь классифицировал иероглифы по шести категориям: пиктограммы , простые идеограммы , составные идеограммы, фонетические заимствования, фонетические соединения и производные иероглифы. Только 4% были отнесены к категории пиктограмм, включая многие из самых простых иероглифов, таких как人( rén ; 'человек'),日( rì ; 'Солнце'),山( shān ; 'гора') и水( shuǐ ; 'вода'). От 80% до 90% были классифицированы как фонетические соединения, такие как沖( chōng ; 'лить'), объединяющие фонетический компонент中( zhōng ) с семантическим компонентом радикала氵 , сокращенной формы水; 'вода'. Почти все созданные с тех пор символы были созданы с использованием этого формата. Словарь Канси 18-го века классифицировал символы под ныне общепринятым набором из 214 радикалов.
Современные иероглифы стилизованы под обычный шрифт . В китайской каллиграфии также используются различные другие стили письма , включая шрифт печати , курсив и канцелярский шрифт . Художники-каллиграфы могут писать традиционными и упрощенными иероглифами, но для традиционного искусства они, как правило, используют традиционные иероглифы.
В настоящее время существует две системы китайских иероглифов. Традиционные иероглифы , используемые в Гонконге, Тайване, Макао и многих зарубежных китайскоязычных общинах, в значительной степени берут свою форму из принятых форм иероглифов, восходящих к поздней династии Хань и стандартизированных во время Мин. Упрощенные иероглифы , введенные Китайской Народной Республикой (КНР) в 1954 году для содействия массовой грамотности, упрощают большинство сложных традиционных глифов до меньшего количества черт, особенно путем принятия общих вариантов курсивной стенографии и объединения иероглифов с похожим произношением с тем, у которого меньше всего черт, среди других методов. Сингапур, в котором проживает большая китайская община, был второй страной, официально принявшей упрощенные иероглифы — сначала создав свои собственные упрощенные иероглифы , а затем полностью приняв упрощенные иероглифы КНР. Они также стали фактическим стандартом для молодых этнических китайцев в Малайзии.
Интернет предоставляет возможность попрактиковаться в чтении каждой из этих систем, и большинство китайских читателей способны, хотя и не обязательно чувствуют себя комфортно, читать альтернативную систему с помощью опыта и догадок. [77]
Сегодня хорошо образованный китайский читатель распознает приблизительно от 4000 до 6000 иероглифов; для чтения газеты с материка требуется приблизительно 3000 иероглифов . КНР определяет грамотность среди рабочих как знание 2000 иероглифов, хотя это будет только функциональная грамотность. Школьники обычно изучают около 2000 иероглифов, тогда как ученые могут запоминать до 10000. [78] Большой несокращенный словарь, такой как словарь Канси , содержит более 40000 иероглифов, включая малоизвестные, вариантные, редкие и архаичные иероглифы; менее четверти этих иероглифов в настоящее время широко используются.
Романизация — это процесс транскрипции языка в латинский алфавит . Существует множество систем романизации для китайских диалектов, поскольку до недавнего времени не существовало родной фонетической транскрипции. Известно, что китайский язык впервые был записан латинскими буквами западными христианскими миссионерами в XVI веке.
Сегодня наиболее распространенной латинизацией для стандартного китайского языка является Hanyu Pinyin , введенная в 1956 году КНР и позднее принятая Сингапуром и Тайванем. Пиньинь в настоящее время почти повсеместно используется для обучения стандартному разговорному китайскому языку в школах и университетах по всей Америке, Австралии и Европе. Китайские родители также используют пиньинь, чтобы научить своих детей звукам и тонам новых слов. В школьных учебниках, в которых преподают китайский язык, латинизация пиньинь часто показана под изображением того, что представляет слово, с китайским иероглифом рядом.
Вторая по распространенности система романизации, система Уэйда-Джайлса , была изобретена Томасом Уэйдом в 1859 году и модифицирована Гербертом Джайлсом в 1892 году. Поскольку эта система приближает фонологию мандаринского китайского к английским согласным и гласным — это в значительной степени англицизация , она может быть особенно полезна для начинающих китайских носителей английского языка. Система Уэйда-Джайлса использовалась в академических целях в Соединенных Штатах, особенно до 1980-х годов, и широко использовалась на Тайване до 2009 года.
При использовании в европейских текстах транскрипции тонов как в пиньинь, так и в системе Уэйда-Джайлза часто опускаются для простоты; широкое использование апострофов Уэйдом-Джайлзом также обычно опускается. Таким образом, большинство западных читателей будут гораздо лучше знакомы с Пекином , чем с Běijīng (пиньинь), и с Тайбэем, чем с T'ai 2 -pei 3 (Уэйд-Джайлз). Это упрощение представляет слоги как омофоны, которые таковыми не являются, и, следовательно, преувеличивает количество омофонов почти в четыре раза.
Для сравнения:
Другие системы включают Gwoyeu Romatzyh , французскую EFEO , Йельскую систему (изобретенную для использования войсками США во время Второй мировой войны), а также отдельные системы, соответствующие фонетическим требованиям кантонского, миньнаньского, хакка и других диалектов.
Китайские варианты были фонетически транскрибированы во многие другие системы письма на протяжении столетий. Например, письмо 'Phags-pa было очень полезным для реконструкции произношений досовременных форм китайского языка. Bopomofo (или zhuyin ) — это полуслоговая азбука , которая до сих пор широко используется на Тайване для помощи в стандартном произношении. Существует также по крайней мере две системы кириллизации для китайского языка. Наиболее распространенной является система Палладия .
С ростом значимости и влияния экономики Китая в мире стандартное обучение китайскому языку приобретает популярность в школах по всей Восточной Азии, Юго-Восточной Азии и западному миру. [79]
Помимо мандаринского диалекта, кантонский диалект является единственным другим китайским языком, который широко преподается как иностранный, во многом благодаря экономическому и культурному влиянию Гонконга и его широкому использованию среди значительных зарубежных китайских общин. [80]
В 1991 году 2000 иностранных студентов сдавали официальный китайский экзамен на знание китайского языка, который называется Hanyu Shuiping Kaoshi (HSK), сопоставимый с английским Кембриджским сертификатом , но к 2005 году число кандидатов резко возросло до 117 660 [81] , а в 2010 году — до 750 000 [82] .
Лингвисты в Китае часто используют формулировку, введенную Фу Маоцзи в «Китайской энциклопедии» : 《汉语在语言系属分类中相当于一个语族的地位。》 ; «В классификации языков китайский язык имеет статус, эквивалентный языковой семье». [4]
Древнекитайский словарь уже содержал много слов, обычно не встречающихся в других сино-тибетских языках. Слова для обозначения «меда» и «льва», а также, вероятно, «лошади», «собаки» и «гуся» связаны с индоевропейскими и были приобретены через торговлю и ранние контакты. (Ближайшими известными индоевропейскими языками были тохарский и согдийский, среднеиранский язык.) Некоторые слова имеют австроазиатские когнаты и указывают на ранние контакты с предковым языком мыонг-вьетнамского и мон-кхмерского.