Агглютинация

Средний знак на венгерском языке , который сильно агглютинирует. (Верхний и нижний знаки на румынском и немецком языках соответственно, оба языка флективные .) Английский перевод: «Министерство продовольствия и сельского хозяйства: Главное управление продовольствия и сельского хозяйства округа Сату-Маре ».

В лингвистике агглютинация — это морфологический процесс, при котором слова образуются путём соединения морфем , каждая из которых соответствует одному синтаксическому признаку. Языки, широко использующие агглютинацию , называются агглютинативными языками . Например, в агглютинативном языке турецком слово evlerinizden («из ваших домов») состоит из морфем ev-ler-in-iz-den . Агглютинативные языки часто противопоставляются изолирующим языкам , в которых слова являются мономорфными, и фузионным языкам , в которых слова могут быть сложными, но морфемы могут соответствовать нескольким признакам.

Примеры агглютинативных языков

Хотя агглютинация характерна для некоторых языковых семей, это не означает, что когда несколько языков в определенной географической области все агглютинативны, они обязательно связаны филогенетически. В прошлом это предположение привело лингвистов к предложению так называемой урало-алтайской языковой семьи , которая включала уральские и тюркские языки, а также монгольский, корейский и японский. Современная лингвистика рассматривает это предложение как спорное, ^[1] и некоторые из них вместо этого называют это языковой конвергенцией .

Еще одно соображение при оценке вышеизложенного предложения заключается в том, что некоторые языки, которые развились из агглютинативных протоязыков, утратили свои агглютинативные черты. Например, современный эстонский язык сместился в сторону фузионного типа. ^[2] (Он также утратил другие черты, типичные для уральских семей, такие как гармония гласных .)

Евразия и Океания

Примерами агглютинативных языков являются уральские языки , такие как финский , эстонский и венгерский . Они имеют сильно агглютинированные выражения в повседневном использовании, и большинство слов двусложные или длиннее. Грамматическая информация, выраженная прилагательными в западных индоевропейских языках , обычно находится в суффиксах.

Венгерский язык использует обширную агглютинацию почти в каждой своей части. Суффиксы следуют друг за другом в особом порядке, основанном на роли суффикса, и многие из них могут нагромождаться друг на друга, в результате чего слова передают сложные значения в сжатых формах. Примером является fiaiéi, где корень "fi(ú)-" означает "сын", последующие четыре гласных являются отдельными суффиксами, а все слово означает "[множественные свойства] принадлежат его/ее сыновьям". Вложенная притяжательная структура и выражение множественного числа весьма примечательны (обратите внимание, что в венгерском языке нет родов).

Персидский язык имеет некоторые особенности агглютинации, использующие префиксы и суффиксы, прикрепленные к основам глаголов и существительных, что делает его скорее синтетическим, чем аналитическим языком. Персидский язык является языком SOV, поэтому имеет структуру фразы с заглавной частью. ^[3] Персидский язык использует синтаксис корня существительного + суффикса множественного числа + суффикса падежа + суффикса послелога, похожий на турецкий. Например, фраза "mashinashuno nega mikardam" означает "Я смотрел на их машины" дословно "(машины их на) (смотреть) (я делал)". Разбивка первого слова:

машина(автомобиль)+а(суффикс множественного числа)+шун(притяжательный суффикс)+о(послепозиционный суффикс)

Мы можем видеть его агглютинативный характер и тот факт, что персидский язык способен присоединять определенное количество зависимых морфем к корневой морфеме (в данном примере к car).

Почти все австронезийские языки , такие как малайский и большинство филиппинских языков , также относятся к этой категории, что позволяет им образовывать новые слова из простых базовых форм. Индонезийское и малайское слово mempertanggungjawabkan образуется путем добавления аффиксов действительного залога, каузатива и благотворителя к составному глаголу tanggung jawab , что означает «отчитываться». В тагальском языке (и его стандартизированном регистре, филиппинском ), nakakapágpabagabag («то, что расстраивает/беспокоит») образуется от корня bagabag («расстраивающий» или «тревожащий»).

В Восточной Азии корейский язык является агглютинирующим. Использование им ' 조사 ', ' 접사 ' и '어미' ^{[ нужен перевод ]} делает корейский язык агглюлинированным. Они представляют время , время , число , случайность, почтительные формы.

Японский также является агглютинирующим языком, как и корейский , добавляя такую информацию, как отрицание , пассивный залог , прошедшее время , почетную степень и причинность в форме глагола. Распространенными примерами могут быть хатаракасэретара (働かせられたら) , который сочетает в себе причинное, пассивное или потенциальное и условное спряжение, чтобы получить два значения в зависимости от контекста: «если (субъект) был вынужден работать...» и «если (субъект)» мог заставить (объект) работать» и tabetakunakatta (食べたくなかった) , который сочетает в себе желание, отрицание и спряжения прошедшего времени, означающие «Я/он/она/они не хотели есть».

таберу («(субъект) съест (его)»)
табетай («(субъект) хочет (его) съесть»)
табетакунай («(субъект) не хочет (это) есть»)
tabetakunakatta («(субъект) не хотел (это) есть»)

Турецкий , наряду со всеми другими тюркскими языками , является еще одним агглютинирующим языком: как крайний пример, выражение Muvaffakiyetsizleştiriveremeyebileceklerimizdenmişsinizcesine произносится как одно слово на турецком языке, но его можно перевести на английский как «как если бы вы были из тех, кого мы не смогли бы превратить в создателя неудачных». «-siniz» относится к форме множественного числа от you, а «-sin» является формой единственного числа, точно так же, как «-im» означает «я» («-im» означает «мой», а не «я». Первоначальный редактор, должно быть, ошибочно принял его за «-yim». Этот второй суффикс используется как таковой «Oraya gideyim», что означает «Могу ли я пойти туда» или «Когда я доберусь туда»), а «-imiz» делает его «мы». Аналогично, этот суффикс означает «наш», а не «мы».

Тамильский язык является агглютинативным. Например, в тамильском языке слово " அதைப்பண்ணமுடியாதவர்களுக்காக " ( ataippaṇṇamuṭiyātavarkaḷukkāka ) означает "ради тех, кто не может этого сделать", буквально "чтобы сделать невозможно он [маркер множественного числа] [маркер дательного падежа] стать". Другой пример - спряжение глаголов. Во всех дравидийских языках глагольные маркеры используются для передачи времени, лица и наклонения. Например, на тамильском языке « சாப்பிடுகிறேன் » ( cāppiṭukiṟēṉ , «я ем») образовано от корня глагола சாப்பிடு- ( cāppiṭu- , съесть") + маркер настоящего времени -கிற்- ( -kiṟ- ) + суффикс первого лица единственного числа -ஏன் ( -ēṉ ).

Агглютинация также является примечательной особенностью баскского языка . Например, спряжение глаголов осуществляется путем добавления различных префиксов или суффиксов к корню глагола: dakartzat , что означает «я приношу их», образуется с помощью da (указывает на настоящее время), kar (корень глагола ekarri → приносить), tza (указывает на множественное число) и t (указывает на подлежащее, в данном случае «я»). Другим примером может служить склонение: Etxean = «В доме», где etxe = дом.

Америка

Вывеска на испанском, английском и кечуа (агглютинативном языке).

Агглютинация очень широко используется в большинстве языков коренных американцев , таких как языки инуитов , науатль , мапудунгун , кечуа , цутухиль , какчикель , чапалачи и киче , где одно слово может содержать достаточно морфем, чтобы передать значение того, что было бы сложным предложением в других языках. Напротив, навахо содержит аффиксы для некоторых целей, но накладывает их таким непредсказуемым и неразделимым образом, что его часто называют языком слияния. ^[^{требуется цитата}^]

Слоты

Как отмечалось выше, типичной чертой агглютинативных языков является то, что существует однозначное соответствие между суффиксами и синтаксическими категориями. Например, существительное может иметь отдельные маркеры для числа, падежа, притяжательного или союзного использования и т. д. Порядок этих аффиксов фиксирован; ^{[примечание 1]} поэтому мы можем рассматривать любое данное существительное или глагол как основу, за которой следует несколько словоизменительных и деривационных «слотов», т. е. позиций, в которых могут встречаться определенные суффиксы, и/или которой предшествуют несколько «слотов» для префиксов. Часто бывает так, что наиболее распространенный случай данной грамматической категории не отмечен, т. е. соответствующий аффикс пуст.

Число слотов для данной части речи может быть на удивление большим. Например, конечный корейский глагол имеет семь слотов (внутренние круглые скобки указывают на части морфем, которые могут быть опущены в некоторых фонологических средах): ^[4]

почтительная степень: -(eu)si ((으)시) используется, когда говорящий оказывает почтение субъекту предложения
время: -(eo)ss (었) для завершенного (прошедшего) действия или состояния; если этот слот пуст, время интерпретируется как настоящее («ss» произносится как «t», если стоит после согласной. Например, -었어(eoss-eo) произносится как (eosseo), но -었다(eoss-ta) произносится как (eotta). Обратите внимание, что это же правило применяется ко всем случаям окончания «ss».)
опытно-контрастный аспект: -(eo)ss (었) удвоение маркера прошедшего времени означает «субъект имел опыт, описанный глаголом»
модальный: -gess (겠) используется с подлежащими первого лица только для определенного будущего, а с подлежащими второго или третьего лица также для вероятного настоящего или прошлого
формально: -(eu)pni ((으)ㅂ니) выражает вежливость к слушающему
ретроспективный аспект: -deo ; (더) указывает на то, что говорящий вспоминает то, что он наблюдал в прошлом, и сообщает об этом в настоящей ситуации.
наклонение: -da (다) для повествовательного наклонения, -kka (까) для вопросительного наклонения, -ra/-la (라) для повелительного наклонения, -ja (자) для утвердительного наклонения, -yo (요) для вежливого повествовательного наклонения и большое количество других возможных маркеров наклонения

Более того, пассивные и каузативные глагольные формы могут быть получены путем добавления суффиксов к основе, которую можно рассматривать как нулевой слот.

Хотя некоторые комбинации суффиксов невозможны (например, только один из слотов аспекта может быть заполнен непустым суффиксом), более 400 глагольных форм могут быть образованы от одной основы. Вот несколько примеров, образованных от корня слова ga 'идти'; числа указывают, какие слоты содержат непустые суффиксы:

7 (маркер повелительного наклонения): суффикс повелительного наклонения -ра (라) соединяется с корнем га- (가), чтобы выразить повелительное наклонение:
га-ра (가라) «Вперёд!»
7 (маркер положительного наклонения): если мы хотим выразить предложение, а не команду, используется маркер положительного наклонения: -ja (자) вместо -ra (라):
ga-ja (가자) «Пошли!»
5 и 7: Если говорящий хочет проявить уважение к слушающему, он использует показатель вежливости -(eu)pni ((으)ㅂ니) (в слоте 5); одновременно могут использоваться различные показатели наклонения (в слоте 7, то есть после показателя вежливости):
гэп-ни-да (갑니다) «Он идет».
гэп-никка? (갑니까) «Он уходит?»
6: ретроспективный аспект:
Jon-i jib-e ga-deo-ra (존이 집에 가더라) «Я заметил, что Джон собирался домой, и теперь сообщаю об этом вам».
7: простое указательное:
seon-saeng-nim-i jib-e gan-da (선생님이 집에 간다) «Учитель идет домой. (не выражая уважения или вежливости)'
5 и 7: вежливость по отношению к слушателю:
сеон-сэн-ним-и джиб-е гэп-ни-да (선생님이 집에 갑니다) или сеон-сэн-ним-и джиб-е га-йо (선생님이 집에 가요) «Учитель идет домой. ',
1 и 7: уважение к субъекту:
seon-saeng-nim-i jib-e ga-sin-da (선생님이 집에 가신다) «(Уважаемый) учитель идет домой».
1, 5 и 7: два вида вежливости в одном предложении:
сон-сэн-ним-и джиб-е га-сё-йо (선생님이 집에 가셔요) или сон-сэн-ним-и джиб-э га-сип-ни-да (선생님이 집에 가십니다) ' Учитель идет домой. (выражая уважение как к слушающему, так и к учителю)'
2, 3 и 7: прошедшие формы:
Jon-i hak-gyo-e ga-ss-da/gat-ta (존이 학교에 갔다) «Джон пошел в школу (и сейчас там)».
Jon-i hak-gyo-e gass-eoss-da/gass-eot-ta (존이 학교에 갔었다) «Джон был в школе (и вернулся)».
4 и 7: модальное предложение первого лица:
наэ-га наэ-ил га-гесс-да/га-гет-та (내가 내일 가겠다) «Я пойду завтра».
4 и 7: модальное третье лицо:
Jon-i nae-il ga-gess-da/ga-get-ta (존이 내일 가겠다) «Полагаю, Джон уйдет завтра».
Jon-i eo-je gass-gess-da/gat-get-ta (존이 어제 갔겠다) «Полагаю, Джон ушел вчера».

Суффикс или префикс

Хотя большинство агглютинативных языков в Европе и Азии преимущественно суффиксирующие, языки банту восточной и южной Африки известны весьма сложной смесью префиксов, суффиксов и редупликации. Типичной чертой этой языковой семьи является то, что существительные делятся на классы существительных. Для каждого класса существительных существуют определенные префиксы единственного и множественного числа, которые также служат маркерами согласования между подлежащим и глаголом. Более того, существительное определяет префиксы всех слов, которые его модифицируют, а подлежащее определяет префиксы других элементов в той же глагольной фразе.

Например, существительные в суахили -toto («ребенок») и -tu («человек») попадают в класс 1 с префиксом единственного числа m- и префиксом множественного числа wa- . Существительное -tabu («книга») попадает в класс 7 с префиксом единственного числа ki- и префиксом множественного числа vi- . ^[5] Могут быть образованы следующие предложения:

ю-ле

1SG -это

пн-вт

1SG -человек

м-моха

1SG -один

м-рефу

1SG -высокий

а-ли

1SG -он-прошлое

вы

7SG - REL -it

ки-сома

7SG -читать

ки-ле

7SG -это

ки-табу

7SG -книга

ки-рефу

7SG - длинный

«Тот высокий человек, который прочитал длинную книгу».

ва-ле

1PL -это

ва-ту

1PL -человек

ва-вили

1ПЛ -два

ва-рефу

1PL -высокий

ва-ли

1PL -он-прошлое

(б)-о

7PL - REL -ит

ви-сома

7PL -читать

ви-ле

7PL -это

ви-табу

7PL -книга

ви-рефу

7PL -длинный

«Эти два высоких человека, которые читают длинные книги».

В контексте количественной лингвистики

Американский лингвист Джозеф Гарольд Гринберг в своей статье 1960 года предложил использовать так называемый агглютинативный индекс для вычисления числового значения, которое позволило бы исследователю сравнивать «степень агглютативности» различных языков. ^[6] Для Гринберга агглютинация означает, что морфы соединяются только с небольшими изменениями или без них. [7] Морфема называется автоматической ^, если она либо принимает одну поверхностную форму (морф), либо если ее поверхностная форма определяется фонологическими правилами, которые действуют во всех подобных случаях в этом языке. ^[8] Морфологическое соединение — позиция в слове, где встречаются два морфа — считается агглютинативным, когда обе включенные морфемы являются автоматическими. Индекс агглютинации равен среднему отношению числа агглютинативных соединений к числу морфовых соединений. Языки с высокими значениями индекса агглютинативности являются агглютинативными, а с низкими значениями индекса агглютинативности — фузионными.

В той же статье Гринберг предложил несколько других индексов, многие из которых оказались релевантными для изучения агглютинации. Синтетический индекс — это среднее количество морфем в слове, при этом наименьшее возможное значение равно 1 для изолирующих (аналитических) языков , а реальные значения редко превышают 3. Индекс словосложения равен среднему количеству корневых морфем в слове (в отличие от деривационных и флективных морфем). Деривационные, флективные, префиксальные и суффиксальные индексы соответствуют соответственно среднему количеству деривационных и флективных морфем, префиксов и суффиксов.

Вот таблица образцов значений: ^[9]

Фонетика и агглютинация

Однозначное отношение между аффиксом и его грамматической функцией может быть несколько осложнено фонологическими процессами, действующими в данном языке. Например, следующие два фонологических явления появляются во многих уральских и тюркских языках :

градация согласных , означающая, что существует чередование между определенными парами согласных кластеров таким образом, что один член пары появляется в начале открытого слога , а другой — в начале закрытого слога ; (в уральских языках)
ассимиляция оглушения согласного: аналогичный, но отличный от описанного выше процесс, ассимилирование оглушения конечного глухого согласного корня; (в некоторых тюркских языках)
гармония гласных , означающая, что в несложном слове сосуществуют только определенные подклассы гласных.

Несколько примеров из финского языка проиллюстрируют, как эти два правила и другие фонологические процессы приводят к отклонениям от основного взаимно однозначного отношения между морфами и их синтаксической и семантической функцией. В склонении talo 'дом' фонологическое правило не применяется. Однако второй пример иллюстрирует несколько видов фонологических явлений. ^[10]^[11]

Крайности

Можно искусственно сконструировать крайние примеры агглютинации, которые не имеют реального применения, но иллюстрируют теоретическую способность грамматики к агглютинации. Это не вопрос «длинных слов», потому что некоторые языки допускают неограниченные комбинации со сложными словами, отрицательными клитиками и т. п., которые могут быть (и выражаются) аналитической структурой в реальном использовании.

Английский язык способен агглютинировать морфемы исключительно исконных ( германских ) корней, как un-whole-some-ness , но, как правило, самые длинные слова собираются из форм латинского или древнегреческого происхождения. Классический пример — антидисистеблишментарианство . Агглютинативные языки часто имеют более сложную деривационную агглютинацию, чем изолирующие языки, поэтому они могут делать то же самое в гораздо большей степени. Например, в венгерском языке такое слово, как elnemzetietleníthetetlenségnek , что означает «для [целей] ненационализируемости», может найти фактическое применение. ^[12] Точно так же есть слова, которые имеют значение, но, вероятно, никогда не используются, такие как legeslegmegszentségteleníttethetetlenebbjeitekként , что означает «как большинство из самых недескратабельных из вас», но его трудно расшифровать даже носителям языка. Используя флективную агглютинацию, их можно удлинять. Например, официальный мировой рекорд Гиннесса - финское epäjärjestelmällistyttämättömyydellänsäkäänköhän "Интересно, если - даже с его/ее качеством не быть сделанным несистематизированным". Оно имеет производное слово epäjärjestelmällistyttämättömyys в качестве корня и удлиняется с помощью флективных окончаний -llänsäkäänköhän . Однако это слово грамматически необычно, потому что -kään "также" используется только в отрицательных предложениях, а -kö (вопрос) - только в вопросительных предложениях.

Очень популярной турецкой агглютинацией является Çekoslovakyalılaştıramadıklarımızdanmışsınız , что означает «(По-видимому / я слышал это) Вы один из тех, кого мы не смогли превратить в чехословаков». Эта историческая ссылка используется в качестве шутки для людей, которых трудно изменить, или тех, кто выделяется в группе.

С другой стороны, Afyonkarahisarlılaştırabildiklerimizdenmişsinizcesine — более длинное слово, которое не удивляет людей и означает «Как будто ты один из тех, кого мы смогли сделать похожими на людей из Афьонкарахисара ». Недавнее дополнение к утверждениям пришло с введением следующего слова в турецком языке muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine , которое означает что-то вроде «(ты говоришь) так, как будто ты один из тех, кого мы не смогли превратить в создателя неудачников» (того, кто лишает людей образования, чтобы сделать их неудачниками).

Грузинский также является языком с высокой агглютинативностью. Например, слово gadmosakontrrevolucieleblebisnairebisatvisaco ( გადმოსაკონტრრევოლუციელებლებისნ აირებისათვისაცო ) будет означать «(кто-то не указан) сказал, что это также для тех, кто похож на тех, кому нужно снова / назад контрреволюционизировать».

В комедии Аристофана «Женщины собрания» есть греческое слово λοπαδοτεμαχοσελαχογαλεοκρανιολειψανοδριμυποτριμματοσιλφιοκαραβομελιτοκατακεχυμενοκιχλ επικοσσυφοφαττοπεριστεραλεκτρυονοπτοκεφαλλιοκιγκλοπελειολαγῳοσιραιοβαφητραγανοπτερύγων , вымышленное блюдо, названное словом, которое перечисляет его ингредиенты. Оно было создано, чтобы высмеять тенденцию к длинным соединениям в аттическом греческом языке в то время. [ необходима цитата ^]

Славянские языки не считаются агглютинативными, а фузионными . Однако существуют крайние производные, похожие на те, что встречаются в типичных агглютинативных языках. Известным примером является болгарское слово непротивоконституциослователствувайте , что означает не выступать против конституции и, во-вторых, не действовать против конституции . Оно состоит всего из трех корней: против против , конституция конституция , заимствованное слово и, следовательно, лишенное своего внутреннего состава, и слово слово . Остальные являются связанными морфемами для отрицания ( не , проклитика, иначе пишется отдельно в глаголах), усилителя существительного ( -ателств ), преобразования существительного в глагол ( -ува ), повелительного наклонения второго лица множественного числа ( -йте ). Это довольно необычно, но находит некоторое применение, например, заголовки газет от 13 июля 1991 года, на следующий день после того, как была принята действующая болгарская конституция с большим количеством споров и дебатов, и даже скандалов.

Другие варианты использования словагглютинацияиагглютинативный

Слова агглютинация и агглютинативный происходят от латинского слова agglutinare , что означает «склеивать». В лингвистике эти слова вошли в употребление с 1836 года, когда Вильгельм фон Гумбольдт посмертно опубликовал работу Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung des Menschengeschlechts [букв.: О различиях построения человеческого языка и его влиянии. на умственное развитие человечества] ввел деление языков на изолирующие , флективные , агглютинативные и инкорпорирующие . ^[13]

Особенно в некоторой старой литературе агглютинативный иногда используется как синоним синтетического . В этом случае он охватывает то, что мы называем агглютинативными и флективными языками, и является антонимом аналитического или изолирующего . Помимо ясной этимологической мотивации (в конце концов, флективные окончания также «приклеиваются» к основам), это более общее использование оправдано тем фактом, что различие между агглютинативными и флективными языками не является резким, как мы уже видели.

Во второй половине XIX века многие лингвисты считали, что существует естественный цикл эволюции языка: функциональные слова изолирующего типа склеиваются со своими головными словами, так что язык становится агглютинативным; более поздние морфы объединяются посредством фонологических процессов, и получается флективный язык; наконец, флективные окончания часто опускаются в быстрой речи, флексия опускается, и язык возвращается к изолирующему типу. ^[14]

Следующий отрывок из Лорда (1960) наглядно демонстрирует весь спектр значений, которые может иметь слово «агглютинация» .

( Агглютинация ...) заключается в соединении двух или более терминов, постоянно встречающихся в виде синтагматической группы, в единое целое, анализ которого впоследствии становится либо трудным, либо невозможным.
Агглютинация принимает различные формы. Во французском языке welding становится complete fusion. Латинское hanc horam 'в этот час' является французской адвербиальной единицей encore . Старофранцузское tous jours становится toujours , а dès jà ('с тех пор') déjà ('уже'). В английском языке, с другой стороны, за исключением редких сочетаний, таких как good-bye from God be with you , nuts from Wales nut , window from wind-eye (ON vindauga ), единицы, составляющие агглютинированные формы, сохраняют свою идентичность. Такие слова, как blackbird и beefeater, — это совсем другая ситуация; они сохраняют свои единицы, но их окончательное значение не полностью выводится из этих единиц. (...)
Соссюр предпочитал различать сложные слова и действительно синтезированные или агглютинированные комбинации. ^[15]

Агглютинативные языки в обработке естественного языка

При обработке естественного языка языки с богатой морфологией создают проблемы совершенно иного рода, чем изолирующие языки. В случае агглютинативных языков основное препятствие заключается в большом количестве словоформ, которые могут быть получены из одного корня. Как мы уже видели, генерация этих словоформ несколько осложняется фонологическими процессами конкретного языка. Хотя базовая связь «один к одному» между формой и синтаксической функцией в финском языке не нарушена, авторитетное учреждение Институт языков Финляндии ( Kotus ) перечисляет 51 тип склонения для финских существительных, прилагательных, местоимений и числительных.

Еще больше проблем возникает с распознаванием словоформ. Современные лингвистические методы в значительной степени основаны на эксплуатации корпусов; однако, когда число возможных словоформ велико, любой корпус обязательно будет содержать лишь малую их часть. Хаджич (2010) утверждает, что компьютерное пространство и мощность в настоящее время настолько дешевы, что все возможные словоформы могут быть сгенерированы заранее и сохранены в виде лексикона, перечисляющего все возможные интерпретации любой данной словоформы. (Структура данных лексикона должна быть оптимизирована, чтобы поиск был быстрым и эффективным.) По словам Хаджича, именно устранение неоднозначности этих словоформ является трудным (в большей степени для флективных языков, где неоднозначность высока, чем для агглютинативных языков). ^[16]

Другие авторы не разделяют точку зрения Хаджича о том, что пространство не является проблемой, и вместо того, чтобы перечислять все возможные словоформы в лексиконе, анализ словоформ реализуется модулями, которые пытаются разбить поверхностную форму на последовательность морфем, встречающихся в порядке, допустимом языком. Проблема такого анализа заключается в большом количестве границ морфем, типичных для агглютинативных языков. Слово флективного языка имеет только одно окончание, и поэтому количество возможных делений слова на основу и окончание линейно зависит только от длины слова. В агглютинативном языке, где несколько суффиксов присоединяются в конце слова, количество различных делений, которые необходимо проверить на согласованность, велико. Такой подход использовался, например, при разработке системы для арабского языка, где агглютинация происходит, когда артикли, предлоги и союзы присоединяются к последующему слову, а местоимения присоединяются к предыдущему слову. Подробнее см. в Grefenstette et al. (2005).

Смотрите также

Примечания

^ В языке могут существовать исключения, требующие размещения некоторых аффиксов в неожиданных слотах.

Ссылки

↑ Бернард Комри: «Введение», стр. 7 и 9 в Comrie (1990).
Например, тюркская языковая семья является устоявшейся языковой семьей, как и каждая из уральских, монгольских и тунгусских семей. Однако спорным является то, связаны ли эти отдельные семьи как члены еще более крупной семьи. Возможность существования алтайской семьи, включающей тюркские, монгольские и тунгусские языки, довольно широко принята, и некоторые ученые выступают за увеличение размера этой семьи путем добавления некоторых или всех уральских, корейских и японских языков.
Например, исследование универсалий порядка слов Гринбергом («Некоторые универсалии грамматики с особым упором на порядок значимых элементов», в JH Greenberg (ed.): Universals of language , MIT Press, Cambridge, Mass, 1963, pp. 73–112) показало, что если в языке есть порядок слов в конце глагола (т. е. если 'the man saw the woman' буквально выражается как 'the man the woman seen'), то весьма вероятно, что в нем также будут послелоги, а не предлоги (т. е. 'in the house' будет выражаться как 'the house in'), и что в нем будут родительные падежи перед существительным (т. е. модель 'cat's house', а не 'house of cat'). Таким образом, если мы находим два языка, которые случайно разделяют черты: порядок слов в конце глагола, послелоги, предименные родительные падежи, то совместное появление этих черт не является доказательством генетического родства. Многие более ранние попытки установления широкомасштабных генетических связей страдали именно от неспособности принять во внимание это свойство типологических моделей. Таким образом, тот факт, что тюркские языки, монгольские языки, тунгусские языки, корейский и японский языки разделяют все эти черты, не является доказательством их генетического родства (хотя, конечно, могут быть и другие сходства, не связанные с повторяющимися типологическими моделями, которые устанавливают генетическое родство).
^ Лехечкова (1983), стр. 17:
Гибкий тип является нестандартной застежкой в стойку. Предполагается, что конгруэнция недостаточна для посесивных суфиксов, включает омонимии и синонимы и только альтернативные варианты, которые могут привести к разным отклонениям. Концовки, в том числе фонологические редукции, также имеют слабую самостатность.
^ Mouche, Ryan; Renfro, Ashley; Lance, Marshall (15 мая 2019 г.). «Персидский синтаксис». Scholars Week .
↑ Нам-Кил Ким: Корейский , стр. 890–897 в Comrie (1990).
^ Первые двенадцать примеров взяты из Fromkin et al. (2007) стр. 110, со следующими изменениями: я изменил предложения, которые изначально были в настоящем совершенном времени (с маркером -me- ), на предложения в прошедшем простом времени ( -li ); я также изменил подлежащее последних четырех предложений с -kapu 'корзина' на tabu 'книга', которое попадает в тот же класс. Последние два примера взяты из Benji Wald: Swahili and the Bantu Languages , стр. 1002 в Comrie (1990). Для префиксов класса 7 см. Mwana Simba Архивировано 4 мая 2011 года на Wayback Machine , Глава 16 Архивировано 26 марта 2011 года на Wayback Machine . О прошедшем времени см. Главу 32, архивированную 7 апреля 2011 г. на Wayback Machine , и генератор глаголов, архивированную 21 июля 2011 г. на Wayback Machine .
^ Гринберг, Джозеф Х. (1960). «Количественный подход к морфологической типологии языка». Международный журнал американской лингвистики . 26 (3): 178–194. doi :10.1086/464575. JSTOR 1264155.
^ Деннинг и др. (1990), стр. 12.
^ Удивительно, но Гринберг не считает английскую морфему множественного числа -s автоматической. Действительно, чередование фонетических реализаций -s , -z и -ez является автоматическим, но есть и другие, хотя и редкие, случаи, когда морфемой множественного числа является -en , -∅ и т. д. См. Denning et al. (1990), стр. 20.
^ Гринберг рассчитал индексы только из одного отрывка из 100 слов для каждого языка. Значения в таблице взяты из Luschützky (2003), стр. 43; они составлены из Greenberg (1954) и из Warren Crawford Cowgill: A Search for Universals in Indo-European Diachronic Morphology , Universals of Language, MIT Press, Cambridge (Massachusetts), 1963, стр. 91–113.
^ Примеры можно проверить с помощью финского морфологического анализатора.
^ Обратите внимание, что в финском языке нет артикля, поэтому использование a/the в переводах на английский язык является произвольным.
^ Используется, например, в книге доктора Йожефа Вегвари: « És mégsem mozog ...»
↑ Разделение приписывается Гумбольдту в Luschützky (2003), стр. 17. Датировка взята из работы Михаэля Лозонского (ред.): Вильгельм фон Гумбольдт: о языке, стр. xxxvi (доступно через GoogleBooks).
^ Вандриес (1925), стр. 349, уже упоминает эту гипотезу как устаревшую, излагая более современную точку зрения, что все три вида процессов присутствуют одновременно. Согласно Вандриесу, сторонниками этой гипотезы были бы A. Hovelacque: La linguistique , Париж 1888; F. Misteli: Charakteristik der hauptsächlichsten Typen des Sprachbaus , Берлин 1893; и, наконец, AH Sayce: Introduction to the Science of Language , 2 Vols., 3rd edition London 1890. Сравните также Lehečková (2003), стр. 18–19, отрывок, который гораздо ближе к первоначальной концепции отдельных стадий.
↑ Лорд (1960), стр. 160.
^ Хаджич (2010), Аннотация:
Однако головную боль вызывает не сама морфология (даже для флективных или агглютинативных языков) — при сегодняшнем дефиците места и мощности достаточно просто перечислить все мыслимые формы в соответствующим образом хешированном списке, — а проблема разрешения неоднозначности, которая, по-видимому, сложнее для таких морфологически богатых языков (возможно, что удивительно, в большей степени для флективных, чем для агглютинативных), чем для аналитических.

Библиография

Киммо Коскенниеми и Lingsoft Oy: финский морфологический анализатор, Lingsoft Language Solutions, 1995–2011.
Бернард Комри (редактор): Основные языки мира, Oxford University Press, Нью-Йорк – Оксфорд, 1990.
Кит Деннинг, Сюзанна Кеммер (ред.): О языке: избранные труды Джозефа Х. Гринберга , Stanford University Press, 1990. Отдельные части доступны на GoogleBooks.
Виктория Фромкин, Роберт Родман, Нина Хайамс: Введение в язык , Томпсон Уодсворт, 2007.
Джозеф Х. Гринберг: Количественный подход к морфологической типологии языка , 1960. Доступно через JSTOR и в Denning et al. (1990), стр. 3–25. Также есть хорошее краткое резюме.
Грегори Грефенстет , Насредин Семмар, Фаиза Элкатеб-Гара: Модификация системы обработки естественного языка для европейских языков для обработки арабского языка в приложениях обработки и поиска информации , Вычислительные подходы к семитским языкам – Труды семинара, Мичиганский университет, 2005 г., стр. 31–38. Доступно по адресу [1].
Ян Хаич: Возрождение истории: истоки статистического машинного перевода и языков с богатой морфологией , IceTAL'10 Труды 7-й международной конференции «Достижения в обработке естественного языка», Springer-Verlag Berlin, Гейдельберг, 2010. Аннотация доступна по адресу [2].
Хелена Легечкова: Úvod do ugrofinistiky, Státní pedagogické nakladatelství, Прага, 1983.
Роберт Лорд: Самостоятельное изучение сравнительного языкознания, The English Universities Press Ltd., St Paul's House, Лондон, 1967 (первое издание 1966).
Ганс Христиан Лущуцкий: Uvedení do typologie jazyků , Filozofická fakulta Karlovy University, Praha, 2003.
J. Vendryes: Язык – Лингвистическое введение в историю, Kegan Paul, Trench, Trubner Co., Ltd., Лондон, 1925 (перевод Пола Радина)

Внешние ссылки

Мвана Симба, веб-страница, посвященная грамматике суахили.