В лингвистике агглютинация — это морфологический процесс, при котором слова образуются путём соединения морфем , каждая из которых соответствует одному синтаксическому признаку. Языки, широко использующие агглютинацию , называются агглютинативными языками . Например, в агглютинативном языке турецком слово evlerinizden («из ваших домов») состоит из морфем ev-ler-in-iz-den . Агглютинативные языки часто противопоставляются изолирующим языкам , в которых слова являются мономорфными, и фузионным языкам , в которых слова могут быть сложными, но морфемы могут соответствовать нескольким признакам.
Хотя агглютинация характерна для некоторых языковых семей, это не означает, что когда несколько языков в определенной географической области все агглютинативны, они обязательно связаны филогенетически. В прошлом это предположение привело лингвистов к предложению так называемой урало-алтайской языковой семьи , которая включала уральские и тюркские языки, а также монгольский, корейский и японский. Современная лингвистика рассматривает это предложение как спорное, [1] и некоторые из них вместо этого называют это языковой конвергенцией .
Еще одно соображение при оценке вышеизложенного предложения заключается в том, что некоторые языки, которые развились из агглютинативных протоязыков, утратили свои агглютинативные черты. Например, современный эстонский язык сместился в сторону фузионного типа. [2] (Он также утратил другие черты, типичные для уральских семей, такие как гармония гласных .)
Примерами агглютинативных языков являются уральские языки , такие как финский , эстонский и венгерский . Они имеют сильно агглютинированные выражения в повседневном использовании, и большинство слов двусложные или длиннее. Грамматическая информация, выраженная прилагательными в западных индоевропейских языках , обычно находится в суффиксах.
Венгерский язык использует обширную агглютинацию почти в каждой своей части. Суффиксы следуют друг за другом в особом порядке, основанном на роли суффикса, и многие из них могут нагромождаться друг на друга, в результате чего слова передают сложные значения в сжатых формах. Примером является fiaiéi, где корень "fi(ú)-" означает "сын", последующие четыре гласных являются отдельными суффиксами, а все слово означает "[множественные свойства] принадлежат его/ее сыновьям". Вложенная притяжательная структура и выражение множественного числа весьма примечательны (обратите внимание, что в венгерском языке нет родов).
Персидский язык имеет некоторые особенности агглютинации, использующие префиксы и суффиксы, прикрепленные к основам глаголов и существительных, что делает его скорее синтетическим, чем аналитическим языком. Персидский язык является языком SOV, поэтому имеет структуру фразы с заглавной частью. [3] Персидский язык использует синтаксис корня существительного + суффикса множественного числа + суффикса падежа + суффикса послелога, похожий на турецкий. Например, фраза "mashinashuno nega mikardam" означает "Я смотрел на их машины" дословно "(машины их на) (смотреть) (я делал)". Разбивка первого слова:
машина(автомобиль)+а(суффикс множественного числа)+шун(притяжательный суффикс)+о(послепозиционный суффикс)
Мы можем видеть его агглютинативный характер и тот факт, что персидский язык способен присоединять определенное количество зависимых морфем к корневой морфеме (в данном примере к car).
Почти все австронезийские языки , такие как малайский и большинство филиппинских языков , также относятся к этой категории, что позволяет им образовывать новые слова из простых базовых форм. Индонезийское и малайское слово mempertanggungjawabkan образуется путем добавления аффиксов действительного залога, каузатива и благотворителя к составному глаголу tanggung jawab , что означает «отчитываться». В тагальском языке (и его стандартизированном регистре, филиппинском ), nakakapágpabagabag («то, что расстраивает/беспокоит») образуется от корня bagabag («расстраивающий» или «тревожащий»).
В Восточной Азии корейский язык является агглютинирующим. Использование им ' 조사 ', ' 접사 ' и '어미' [ нужен перевод ] делает корейский язык агглюлинированным. Они представляют время , время , число , случайность, почтительные формы.
Японский также является агглютинирующим языком, как и корейский , добавляя такую информацию, как отрицание , пассивный залог , прошедшее время , почетную степень и причинность в форме глагола. Распространенными примерами могут быть хатаракасэретара (働かせられたら) , который сочетает в себе причинное, пассивное или потенциальное и условное спряжение, чтобы получить два значения в зависимости от контекста: «если (субъект) был вынужден работать...» и «если (субъект)» мог заставить (объект) работать» и tabetakunakatta (食べたくなかった) , который сочетает в себе желание, отрицание и спряжения прошедшего времени, означающие «Я/он/она/они не хотели есть».
Турецкий , наряду со всеми другими тюркскими языками , является еще одним агглютинирующим языком: как крайний пример, выражение Muvaffakiyetsizleştiriveremeyebileceklerimizdenmişsinizcesine произносится как одно слово на турецком языке, но его можно перевести на английский как «как если бы вы были из тех, кого мы не смогли бы превратить в создателя неудачных». «-siniz» относится к форме множественного числа от you, а «-sin» является формой единственного числа, точно так же, как «-im» означает «я» («-im» означает «мой», а не «я». Первоначальный редактор, должно быть, ошибочно принял его за «-yim». Этот второй суффикс используется как таковой «Oraya gideyim», что означает «Могу ли я пойти туда» или «Когда я доберусь туда»), а «-imiz» делает его «мы». Аналогично, этот суффикс означает «наш», а не «мы».
Тамильский язык является агглютинативным. Например, в тамильском языке слово " அதைப்பண்ணமுடியாதவர்களுக்காக " ( ataippaṇṇamuṭiyātavarkaḷukkāka ) означает "ради тех, кто не может этого сделать", буквально "чтобы сделать невозможно он [маркер множественного числа] [маркер дательного падежа] стать". Другой пример - спряжение глаголов. Во всех дравидийских языках глагольные маркеры используются для передачи времени, лица и наклонения. Например, на тамильском языке « சாப்பிடுகிறேன் » ( cāppiṭukiṟēṉ , «я ем») образовано от корня глагола சாப்பிடு- ( cāppiṭu- , съесть") + маркер настоящего времени -கிற்- ( -kiṟ- ) + суффикс первого лица единственного числа -ஏன் ( -ēṉ ).
Агглютинация также является примечательной особенностью баскского языка . Например, спряжение глаголов осуществляется путем добавления различных префиксов или суффиксов к корню глагола: dakartzat , что означает «я приношу их», образуется с помощью da (указывает на настоящее время), kar (корень глагола ekarri → приносить), tza (указывает на множественное число) и t (указывает на подлежащее, в данном случае «я»). Другим примером может служить склонение: Etxean = «В доме», где etxe = дом.
Агглютинация очень широко используется в большинстве языков коренных американцев , таких как языки инуитов , науатль , мапудунгун , кечуа , цутухиль , какчикель , чапалачи и киче , где одно слово может содержать достаточно морфем, чтобы передать значение того, что было бы сложным предложением в других языках. Напротив, навахо содержит аффиксы для некоторых целей, но накладывает их таким непредсказуемым и неразделимым образом, что его часто называют языком слияния. [ требуется цитата ]
Как отмечалось выше, типичной чертой агглютинативных языков является то, что существует однозначное соответствие между суффиксами и синтаксическими категориями. Например, существительное может иметь отдельные маркеры для числа, падежа, притяжательного или союзного использования и т. д. Порядок этих аффиксов фиксирован; [примечание 1] поэтому мы можем рассматривать любое данное существительное или глагол как основу, за которой следует несколько словоизменительных и деривационных «слотов», т. е. позиций, в которых могут встречаться определенные суффиксы, и/или которой предшествуют несколько «слотов» для префиксов. Часто бывает так, что наиболее распространенный случай данной грамматической категории не отмечен, т. е. соответствующий аффикс пуст.
Число слотов для данной части речи может быть на удивление большим. Например, конечный корейский глагол имеет семь слотов (внутренние круглые скобки указывают на части морфем, которые могут быть опущены в некоторых фонологических средах): [4]
Более того, пассивные и каузативные глагольные формы могут быть получены путем добавления суффиксов к основе, которую можно рассматривать как нулевой слот.
Хотя некоторые комбинации суффиксов невозможны (например, только один из слотов аспекта может быть заполнен непустым суффиксом), более 400 глагольных форм могут быть образованы от одной основы. Вот несколько примеров, образованных от корня слова ga 'идти'; числа указывают, какие слоты содержат непустые суффиксы:
Хотя большинство агглютинативных языков в Европе и Азии преимущественно суффиксирующие, языки банту восточной и южной Африки известны весьма сложной смесью префиксов, суффиксов и редупликации. Типичной чертой этой языковой семьи является то, что существительные делятся на классы существительных. Для каждого класса существительных существуют определенные префиксы единственного и множественного числа, которые также служат маркерами согласования между подлежащим и глаголом. Более того, существительное определяет префиксы всех слов, которые его модифицируют, а подлежащее определяет префиксы других элементов в той же глагольной фразе.
Например, существительные в суахили -toto («ребенок») и -tu («человек») попадают в класс 1 с префиксом единственного числа m- и префиксом множественного числа wa- . Существительное -tabu («книга») попадает в класс 7 с префиксом единственного числа ki- и префиксом множественного числа vi- . [5] Могут быть образованы следующие предложения:
ю-ле
1SG -это
пн-вт
1SG -человек
м-моха
1SG -один
м-рефу
1SG -высокий
а-ли
1SG -он-прошлое
вы
7SG - REL -it
ки-сома
7SG -читать
ки-ле
7SG -это
ки-табу
7SG -книга
ки-рефу
7SG - длинный
«Тот высокий человек, который прочитал длинную книгу».
ва-ле
1PL -это
ва-ту
1PL -человек
ва-вили
1ПЛ -два
ва-рефу
1PL -высокий
ва-ли
1PL -он-прошлое
(б)-о
7PL - REL -ит
ви-сома
7PL -читать
ви-ле
7PL -это
ви-табу
7PL -книга
ви-рефу
7PL -длинный
«Эти два высоких человека, которые читают длинные книги».
Американский лингвист Джозеф Гарольд Гринберг в своей статье 1960 года предложил использовать так называемый агглютинативный индекс для вычисления числового значения, которое позволило бы исследователю сравнивать «степень агглютативности» различных языков. [6] Для Гринберга агглютинация означает, что морфы соединяются только с небольшими изменениями или без них. [7] Морфема называется автоматической , если она либо принимает одну поверхностную форму (морф), либо если ее поверхностная форма определяется фонологическими правилами, которые действуют во всех подобных случаях в этом языке. [8] Морфологическое соединение — позиция в слове, где встречаются два морфа — считается агглютинативным, когда обе включенные морфемы являются автоматическими. Индекс агглютинации равен среднему отношению числа агглютинативных соединений к числу морфовых соединений. Языки с высокими значениями индекса агглютинативности являются агглютинативными, а с низкими значениями индекса агглютинативности — фузионными.
В той же статье Гринберг предложил несколько других индексов, многие из которых оказались релевантными для изучения агглютинации. Синтетический индекс — это среднее количество морфем в слове, при этом наименьшее возможное значение равно 1 для изолирующих (аналитических) языков , а реальные значения редко превышают 3. Индекс словосложения равен среднему количеству корневых морфем в слове (в отличие от деривационных и флективных морфем). Деривационные, флективные, префиксальные и суффиксальные индексы соответствуют соответственно среднему количеству деривационных и флективных морфем, префиксов и суффиксов.
Вот таблица образцов значений: [9]
Однозначное отношение между аффиксом и его грамматической функцией может быть несколько осложнено фонологическими процессами, действующими в данном языке. Например, следующие два фонологических явления появляются во многих уральских и тюркских языках :
Несколько примеров из финского языка проиллюстрируют, как эти два правила и другие фонологические процессы приводят к отклонениям от основного взаимно однозначного отношения между морфами и их синтаксической и семантической функцией. В склонении talo 'дом' фонологическое правило не применяется. Однако второй пример иллюстрирует несколько видов фонологических явлений. [10] [11]
Можно искусственно сконструировать крайние примеры агглютинации, которые не имеют реального применения, но иллюстрируют теоретическую способность грамматики к агглютинации. Это не вопрос «длинных слов», потому что некоторые языки допускают неограниченные комбинации со сложными словами, отрицательными клитиками и т. п., которые могут быть (и выражаются) аналитической структурой в реальном использовании.
Английский язык способен агглютинировать морфемы исключительно исконных ( германских ) корней, как un-whole-some-ness , но, как правило, самые длинные слова собираются из форм латинского или древнегреческого происхождения. Классический пример — антидисистеблишментарианство . Агглютинативные языки часто имеют более сложную деривационную агглютинацию, чем изолирующие языки, поэтому они могут делать то же самое в гораздо большей степени. Например, в венгерском языке такое слово, как elnemzetietleníthetetlenségnek , что означает «для [целей] ненационализируемости», может найти фактическое применение. [12] Точно так же есть слова, которые имеют значение, но, вероятно, никогда не используются, такие как legeslegmegszentségteleníttethetetlenebbjeitekként , что означает «как большинство из самых недескратабельных из вас», но его трудно расшифровать даже носителям языка. Используя флективную агглютинацию, их можно удлинять. Например, официальный мировой рекорд Гиннесса - финское epäjärjestelmällistyttämättömyydellänsäkäänköhän "Интересно, если - даже с его/ее качеством не быть сделанным несистематизированным". Оно имеет производное слово epäjärjestelmällistyttämättömyys в качестве корня и удлиняется с помощью флективных окончаний -llänsäkäänköhän . Однако это слово грамматически необычно, потому что -kään "также" используется только в отрицательных предложениях, а -kö (вопрос) - только в вопросительных предложениях.
Очень популярной турецкой агглютинацией является Çekoslovakyalılaştıramadıklarımızdanmışsınız , что означает «(По-видимому / я слышал это) Вы один из тех, кого мы не смогли превратить в чехословаков». Эта историческая ссылка используется в качестве шутки для людей, которых трудно изменить, или тех, кто выделяется в группе.
С другой стороны, Afyonkarahisarlılaştırabildiklerimizdenmişsinizcesine — более длинное слово, которое не удивляет людей и означает «Как будто ты один из тех, кого мы смогли сделать похожими на людей из Афьонкарахисара ». Недавнее дополнение к утверждениям пришло с введением следующего слова в турецком языке muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine , которое означает что-то вроде «(ты говоришь) так, как будто ты один из тех, кого мы не смогли превратить в создателя неудачников» (того, кто лишает людей образования, чтобы сделать их неудачниками).
Грузинский также является языком с высокой агглютинативностью. Например, слово gadmosakontrrevolucieleblebisnairebisatvisaco ( გადმოსაკონტრრევოლუციელებლებისნ აირებისათვისაცო ) будет означать «(кто-то не указан) сказал, что это также для тех, кто похож на тех, кому нужно снова / назад контрреволюционизировать».
В комедии Аристофана «Женщины собрания» есть греческое слово λοπαδοτεμαχοσελαχογαλεοκρανιολειψανοδριμυποτριμματοσιλφιοκαραβομελιτοκατακεχυμενοκιχλ επικοσσυφοφαττοπεριστεραλεκτρυονοπτοκεφαλλιοκιγκλοπελειολαγῳοσιραιοβαφητραγανοπτερύγων , вымышленное блюдо, названное словом, которое перечисляет его ингредиенты. Оно было создано, чтобы высмеять тенденцию к длинным соединениям в аттическом греческом языке в то время. [ необходима цитата ]
Славянские языки не считаются агглютинативными, а фузионными . Однако существуют крайние производные, похожие на те, что встречаются в типичных агглютинативных языках. Известным примером является болгарское слово непротивоконституциослователствувайте , что означает не выступать против конституции и, во-вторых, не действовать против конституции . Оно состоит всего из трех корней: против против , конституция конституция , заимствованное слово и, следовательно, лишенное своего внутреннего состава, и слово слово . Остальные являются связанными морфемами для отрицания ( не , проклитика, иначе пишется отдельно в глаголах), усилителя существительного ( -ателств ), преобразования существительного в глагол ( -ува ), повелительного наклонения второго лица множественного числа ( -йте ). Это довольно необычно, но находит некоторое применение, например, заголовки газет от 13 июля 1991 года, на следующий день после того, как была принята действующая болгарская конституция с большим количеством споров и дебатов, и даже скандалов.
Слова агглютинация и агглютинативный происходят от латинского слова agglutinare , что означает «склеивать». В лингвистике эти слова вошли в употребление с 1836 года, когда Вильгельм фон Гумбольдт посмертно опубликовал работу Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung des Menschengeschlechts [букв.: О различиях построения человеческого языка и его влиянии. на умственное развитие человечества] ввел деление языков на изолирующие , флективные , агглютинативные и инкорпорирующие . [13]
Особенно в некоторой старой литературе агглютинативный иногда используется как синоним синтетического . В этом случае он охватывает то, что мы называем агглютинативными и флективными языками, и является антонимом аналитического или изолирующего . Помимо ясной этимологической мотивации (в конце концов, флективные окончания также «приклеиваются» к основам), это более общее использование оправдано тем фактом, что различие между агглютинативными и флективными языками не является резким, как мы уже видели.
Во второй половине XIX века многие лингвисты считали, что существует естественный цикл эволюции языка: функциональные слова изолирующего типа склеиваются со своими головными словами, так что язык становится агглютинативным; более поздние морфы объединяются посредством фонологических процессов, и получается флективный язык; наконец, флективные окончания часто опускаются в быстрой речи, флексия опускается, и язык возвращается к изолирующему типу. [14]
Следующий отрывок из Лорда (1960) наглядно демонстрирует весь спектр значений, которые может иметь слово «агглютинация» .
( Агглютинация ...) заключается в соединении двух или более терминов, постоянно встречающихся в виде синтагматической группы, в единое целое, анализ которого впоследствии становится либо трудным, либо невозможным.
Агглютинация принимает различные формы. Во французском языке welding становится complete fusion. Латинское hanc horam 'в этот час' является французской адвербиальной единицей encore . Старофранцузское tous jours становится toujours , а dès jà ('с тех пор') déjà ('уже'). В английском языке, с другой стороны, за исключением редких сочетаний, таких как good-bye from God be with you , nuts from Wales nut , window from wind-eye (ON vindauga ), единицы, составляющие агглютинированные формы, сохраняют свою идентичность. Такие слова, как blackbird и beefeater, — это совсем другая ситуация; они сохраняют свои единицы, но их окончательное значение не полностью выводится из этих единиц. (...)
Соссюр предпочитал различать сложные слова и действительно синтезированные или агглютинированные комбинации. [15]
При обработке естественного языка языки с богатой морфологией создают проблемы совершенно иного рода, чем изолирующие языки. В случае агглютинативных языков основное препятствие заключается в большом количестве словоформ, которые могут быть получены из одного корня. Как мы уже видели, генерация этих словоформ несколько осложняется фонологическими процессами конкретного языка. Хотя базовая связь «один к одному» между формой и синтаксической функцией в финском языке не нарушена, авторитетное учреждение Институт языков Финляндии ( Kotus ) перечисляет 51 тип склонения для финских существительных, прилагательных, местоимений и числительных.
Еще больше проблем возникает с распознаванием словоформ. Современные лингвистические методы в значительной степени основаны на эксплуатации корпусов; однако, когда число возможных словоформ велико, любой корпус обязательно будет содержать лишь малую их часть. Хаджич (2010) утверждает, что компьютерное пространство и мощность в настоящее время настолько дешевы, что все возможные словоформы могут быть сгенерированы заранее и сохранены в виде лексикона, перечисляющего все возможные интерпретации любой данной словоформы. (Структура данных лексикона должна быть оптимизирована, чтобы поиск был быстрым и эффективным.) По словам Хаджича, именно устранение неоднозначности этих словоформ является трудным (в большей степени для флективных языков, где неоднозначность высока, чем для агглютинативных языков). [16]
Другие авторы не разделяют точку зрения Хаджича о том, что пространство не является проблемой, и вместо того, чтобы перечислять все возможные словоформы в лексиконе, анализ словоформ реализуется модулями, которые пытаются разбить поверхностную форму на последовательность морфем, встречающихся в порядке, допустимом языком. Проблема такого анализа заключается в большом количестве границ морфем, типичных для агглютинативных языков. Слово флективного языка имеет только одно окончание, и поэтому количество возможных делений слова на основу и окончание линейно зависит только от длины слова. В агглютинативном языке, где несколько суффиксов присоединяются в конце слова, количество различных делений, которые необходимо проверить на согласованность, велико. Такой подход использовался, например, при разработке системы для арабского языка, где агглютинация происходит, когда артикли, предлоги и союзы присоединяются к последующему слову, а местоимения присоединяются к предыдущему слову. Подробнее см. в Grefenstette et al. (2005).
Например, тюркская языковая семья является устоявшейся языковой семьей, как и каждая из уральских, монгольских и тунгусских семей. Однако спорным является то, связаны ли эти отдельные семьи как члены еще более крупной семьи. Возможность существования алтайской семьи, включающей тюркские, монгольские и тунгусские языки, довольно широко принята, и некоторые ученые выступают за увеличение размера этой семьи путем добавления некоторых или всех уральских, корейских и японских языков.
Например, исследование универсалий порядка слов Гринбергом («Некоторые универсалии грамматики с особым упором на порядок значимых элементов», в JH Greenberg (ed.): Universals of language , MIT Press, Cambridge, Mass, 1963, pp. 73–112) показало, что если в языке есть порядок слов в конце глагола (т. е. если 'the man saw the woman' буквально выражается как 'the man the woman seen'), то весьма вероятно, что в нем также будут послелоги, а не предлоги (т. е. 'in the house' будет выражаться как 'the house in'), и что в нем будут родительные падежи перед существительным (т. е. модель 'cat's house', а не 'house of cat'). Таким образом, если мы находим два языка, которые случайно разделяют черты: порядок слов в конце глагола, послелоги, предименные родительные падежи, то совместное появление этих черт не является доказательством генетического родства. Многие более ранние попытки установления широкомасштабных генетических связей страдали именно от неспособности принять во внимание это свойство типологических моделей. Таким образом, тот факт, что тюркские языки, монгольские языки, тунгусские языки, корейский и японский языки разделяют все эти черты, не является доказательством их генетического родства (хотя, конечно, могут быть и другие сходства, не связанные с повторяющимися типологическими моделями, которые устанавливают генетическое родство).
Гибкий тип является нестандартной застежкой в стойку. Предполагается, что конгруэнция недостаточна для посесивных суфиксов, включает омонимии и синонимы и только альтернативные варианты, которые могут привести к разным отклонениям. Концовки, в том числе фонологические редукции, также имеют слабую самостатность.
Однако головную боль вызывает не сама морфология (даже для флективных или агглютинативных языков) — при сегодняшнем дефиците места и мощности достаточно просто перечислить все мыслимые формы в соответствующим образом хешированном списке, — а проблема разрешения неоднозначности, которая, по-видимому, сложнее для таких морфологически богатых языков (возможно, что удивительно, в большей степени для флективных, чем для агглютинативных), чем для аналитических.