Модель дерева

В исторической лингвистике древовидная модель (также модель Штаммбаума , генетическая или кладистическая модель ) — это модель эволюции языков, аналогичная концепции генеалогического древа , в частности филогенетического древа в биологической эволюции видов . Как и в случае с видами, предполагается, что каждый язык произошел от одного родительского или «материнского» языка, при этом языки, имеющие общего предка, принадлежат к одной языковой семье .

Популяризированная немецким лингвистом Августом Шлейхером в 1853 году, ^[1]^[2] модель дерева всегда была распространенным методом описания генетических отношений между языками с момента первых попыток сделать это. Она занимает центральное место в области сравнительной лингвистики , которая включает использование доказательств из известных языков и наблюдаемых правил эволюции языковых признаков для выявления и описания гипотетических протоязыков, являющихся предками каждой языковой семьи, таких как протоиндоевропейские и индоевропейские языки . Однако это в значительной степени теоретический, качественный поиск, и лингвисты всегда подчеркивали неотъемлемые ограничения модели дерева из-за большой роли, которую играет горизонтальная передача в эволюции языка, начиная от заимствованных слов и заканчивая креольскими языками , имеющими несколько материнских языков. ^[1] Волновая модель была разработана в 1872 году учеником Шлейхера Иоганнесом Шмидтом в качестве альтернативы модели дерева, которая включает горизонтальную передачу. ^[3]

Древовидная модель также имеет те же ограничения, что и биологическая таксономия в отношении проблемы видов квантования непрерывного явления, которое включает исключения, такие как кольцевые виды в биологии и диалектные континуумы в языке. Концепция связи была разработана в ответ и относится к группе языков, которые произошли от диалектного континуума, а не от лингвистически изолированных дочерних языков одного языка. ^[2]

История

Ветхий Завет и Святой Августин

Августин из Гиппона предположил, что каждый из потомков Ноя основал нацию и что каждой нации был дан свой собственный язык: ассирийский для Ассура , еврейский для Хебера и так далее. ^[4] Всего он выделил 72 нации, основателей племен и языков. Смешение и рассеивание произошло во времена Фалека , сына Хевера, сына Сима , сына Ноя. ^[5]^[6] Августин выдвинул гипотезу , не отличающуюся от гипотез более поздних исторических лингвистов, что семья Хевера «сохранила тот язык, который не без оснований считался общим языком расы ... с тех пор названным ивритом». Большинство из 72 языков, однако, датируются многими поколениями после Хевера. Святой Августин решает эту первую проблему, предполагая, что Хебер, проживший 430 лет, был все еще жив, когда Бог назначил 72. ^[7]^{: 123}

Ursprache, язык рая

Гипотеза святого Августина оставалась без серьезных сомнений более тысячи лет. Затем, в серии трактатов, опубликованных в 1684 году, выражая скептицизм относительно различных верований, особенно библейских, сэр Томас Браун написал: ^[8]

«Хотя земля была широко заселена до потопа... однако, можно сомнительно, что после обширного расселения и на протяжении шестнадцати столетий люди сохранили столь единообразный язык во всех частях...».

К тому времени открытие Нового Света и исследование Дальнего Востока принесли знания о количестве новых языков, намного превосходящем 72, подсчитанных Святым Августином. Ссылаясь на индейские языки, Браун предполагает, что «смешение языков сначала коснулось только тех, кто присутствовал в Синааре при работе Вавилона...». Для тех, «у подножия холмов, где покоился ковчег... их первобытный язык мог со временем разветвиться на несколько частей Европы и Азии...» ^[9] Это намек на дерево. По мнению Брауна, упрощение более крупного аборигенного языка, чем иврит, могло бы объяснить различия в языке. Он предполагает древнекитайский, от которого другие произошли путем «смешения, примеси и искажения». ^[10] Позже он ссылается на «смешение и изменение». ^[11]

Браун сообщает о ряде реконструктивных действий ученых того времени: ^[12]

«Ученый Казобон полагает, что диалог можно составить на саксонском языке, используя только те слова, которые можно вывести из греческого... Верстеган не сомневался, что он сможет составить письмо, которое будет понятно англичанам, голландцам и жителям Восточной Фрисландии... И если, как утверждает ученый Буксхорн , скифский язык как родной язык распространен среди всех народов Европы и даже до Персии, то общность многих слов среди стольких народов имеет более разумный перевод и скорее выводится из общего языка, распространенного среди них всех, чем из какого-либо конкретного народа, который также заимствовал и использует его только из вторых рук».

Таким образом, путаница в Вавилонской башне была устранена как препятствие путем ее отстранения. Попытки найти сходства во всех языках привели к постепенному раскрытию древнего языка-основателя, от которого произошли все остальные языки. Браун, несомненно, писал и думал задолго до 1684 года. В том же революционном веке в Британии Джеймс Хауэлл опубликовал том II Epistolae Ho-Elianae , квазивымышленные письма различным важным лицам в королевстве, содержащие достоверную историческую информацию. В письме LVIII метафора дерева языков представляется полностью разработанной, не будучи взглядом профессионального лингвиста: ^[13]

«Теперь я подниму паруса в Нидерланды, чей язык является тем же диалектом, что и английский, и был таковым с самого начала, поскольку оба они произошли от высокогорного голландского [здесь Хауэлл ошибается]: датский также является лишь ветвью того же дерева... Итак, высокий голландский или тевтонский язык является одним из основных и самых распространенных материнских языков Европы... он был языком готов и вандалов и до сих пор является языком большей части Польши и Венгрии , у которых есть свой диалект для их простонародного языка... Некоторые из ее писателей хотели бы заставить этот мир поверить, что это был язык, на котором говорили в раю».

Поиск «языка рая» шёл среди всех лингвистов Европы. Те, кто писал на латыни, называли его lingua prima , lingua primaeva или lingua primigenia. На английском это был язык Адама; на немецком — Ursprache или hebräische Ursprache, если кто-то считал, что это был иврит. Этот таинственный язык имел ауру чистоты и непорочности, и эти качества были стандартами, используемыми для отбора кандидатов. Эта концепция Ursprache вошла в обиход задолго до того, как неодграмматики приняли её для своих протоязыков. Разрыв между сильно расходящимися семьями языков оставался незакрытым. ^{[ необходима цитата ]}

Индоевропейская модель

2 февраля 1786 года сэр Уильям Джонс выступил с третьей годовщиной доклада перед Азиатским обществом в качестве его президента по теме индусов . В нем он применил логику древовидной модели к трем языкам: греческому, латинскому и санскриту, но впервые в истории на чисто лингвистических основаниях, отметив «более сильное родство, как в корнях глаголов, так и в формах грамматики, чем могло бы быть получено случайно; ...». Он продолжил постулировать, что они произошли от «какого-то общего источника, которого, возможно, больше не существует». К ним он добавил готский, кельтский и персидский как «одну семью». ^[14]

Джонс не назвал свой «общий источник» и не развил эту идею дальше, но она была подхвачена лингвистами того времени. В (лондонском) Quarterly Review конца 1813–1814 годов Томас Янг опубликовал рецензию на книгу Иоганна Кристофа Аделунга « Митридат, или всеобщая история языков», том I которой вышел в 1806 году, а тома II и III, 1809–1812 годов , продолжил Иоганн Северин Фатер. В своей работе Аделунг описал около 500 «языков и диалектов» и выдвинул гипотезу об их всеобщем происхождении от языка рая, расположенного в Кашмире , в центре всего ареала этих 500 языков. Янг начинает с указания на то, что Аделунг обязан своим творчеством труду Конрада Геснера « Митридат, de Differentiis Linguarum» 1555 года и другим последующим каталогам языков и алфавитов. ^[15]

Кашмир (красный), местонахождение Эдема в Аделунге

Юнг берется представить классификацию Аделунга. Односложный тип является самым древним и примитивным, на нем говорят в Азии, к востоку от Эдема, в направлении выхода Адама из Эдема. Затем следует группа Джонса, все еще без названия, но приписываемая Джонсу: «Другой древний и обширный класс языков, объединенных большим числом сходств, чем может быть совершенно случайным». Для этого класса он предлагает название ^[16] «индоевропейский», первое известное лингвистическое использование слова, но не первое известное его использование. Британская Ост-Индская компания использовала «индоевропейскую коммерцию» для обозначения торговли товарами между Индией и Европой. ^[17] Все доказательства, которые Янг приводит для предковой группы, — это наиболее похожие слова: мать, отец и т. д.

Дополнительные классы Аделунга были татарскими (которые позже стали известны как спорная семья алтайских языков ), африканскими и американскими, которые зависят от географии и предполагаемого происхождения из Эдема. Янг не разделяет энтузиазма Аделунга по поводу языка рая и называет его в основном спекулятивным. ^{[ необходима цитата ]}

Обозначение Янга, успешное на английском языке, было лишь одним из нескольких кандидатов, предложенных между 1810 и 1867 годами: индо-германский ( Конрад Мальте-Брун , 1810), япетиск ( Расмус Кристиан Раск , 1815), индо-германский ( Юлиус Клапрот , 1823), индийско-немецкий (Ф. Шмиттеннер, 1826), санскритский ( Вильгельм фон Гумбольдт , 1827), индокельтский (А. Ф. Потт, 1840), ариоевропейский ( Грациадио Исайя Асколи , 1854), арийский ( Макс Мюллер , 1861) и арьякский (Х. Шаве) , 1867). Все эти люди были полиглотами и вундеркиндами в языках. (Клапрот, например, автор успешного немецкоязычного кандидата, Indo-Germanisch, критиковавший Джонса за его некритический метод, знал китайский, японский, тибетский и ряд других языков с их письменностями.) Концепция библейского Ursprache апеллировал к их воображению. Поскольку надежда найти его постепенно угасла, они вернулись к растущей концепции общего индоевропейского языка, на котором говорили кочевые племена на равнинах Евразии, и хотя они привели веские доводы в пользу того, что этот язык может быть выведен методы сравнительной лингвистики, на самом деле, это не то, как они его получили. Это был единственный случай, когда их усилия найти Ursprache увенчались успехом. ^{[ необходима цитата ]}

Модель младограмматизма

Модель обязана своей наиболее строгой формулировкой младограмматикам . Модель опирается на более ранние концепции Уильяма Джонса , Франца Боппа и Августа Шлейхера , добавляя безисключительность звуковых законов и регулярность процесса. Лингвистом, возможно, наиболее ответственным за установление связи с дарвинизмом, был Август Шлейхер.

То, что он сравнивал свой Stammbaum , или генеалогическое древо языков, с представлением Дарвина об эволюции вскоре после этого представления, доказывается открытым письмом, которое он написал в 1863 году Эрнсту Геккелю , опубликованным, однако, посмертно. В 1869 году Геккель предложил ему прочитать «Происхождение видов» . ^{[ требуется ссылка ]}

Прочитав его, Шлейхер написал Die Darwinische Theorie und die Sprachwissenschaft , «Дарвинизм, проверенный наукой языка». ^[18] В сценарии, напоминающем тот, что был между Дарвином и Уоллесом по поводу открытия эволюции (оба открыли ее независимо), Шлейхер одобрил презентацию Дарвина, но раскритиковал ее за то, что она не вставила ни одного вида. Затем он представил Stammbaum языков, который, однако, был не первым из опубликованных им. ^{[ необходима цитата ]}

Эволюция языков не была источником теории эволюции Дарвина. Он основывал ее на изменчивости видов, например, на той, которую он наблюдал у вьюрков на Галапагосских островах , которые, по-видимому, были модификациями общего предка. Отбор домашних видов для создания новой разновидности также сыграл свою роль в его выводах. Первое издание « Происхождения видов» в 1859 году обсуждает языковое дерево как бы de novo в рамках темы классификации. Дарвин критикует синхронный метод, разработанный Линнеем , предлагая заменить его «естественным расположением», основанным на эволюции. ^{[ требуется ссылка ]} Он говорит: ^[19]

«Возможно, стоит проиллюстрировать этот взгляд на классификацию, взяв случай с языками. Если бы мы обладали идеальной родословной человечества, генеалогическое расположение человеческих рас дало бы наилучшую классификацию различных языков, на которых сейчас говорят во всем мире; и если бы все вымершие языки и все промежуточные и медленно меняющиеся диалекты должны были быть включены, такое расположение было бы, я думаю, единственно возможным. Однако могло бы быть так, что какой-то очень древний язык изменился мало и дал начало нескольким новым языкам, в то время как другие (из-за распространения и последующей изоляции и состояний цивилизации нескольких рас, произошедших от общей расы) изменились сильно и дали начало многим новым языкам и диалектам. Различные степени различия в языках одного и того же корня должны были бы быть выражены группами, подчиненными группам; но правильное или даже единственно возможное расположение все еще было бы генеалогическим; и это было бы строго естественно, поскольку оно связывало бы вместе все языки, вымершие и современные, посредством теснейшего родства и давало бы родство и происхождение каждого язык."

Шлейхер никогда не слышал о Дарвине, пока Геккель не привлек его внимание. Он опубликовал свою собственную работу о Stammbaum в статье 1853 года, за шесть лет до первого издания Origin of Species в 1859 году. Концепция происхождения языков была отнюдь не новой. Томас Джефферсон , сам преданный лингвист, предположил, что постоянная необходимость в неологизмах подразумевает, что языки должны «прогрессировать» или «продвигаться». ^[20] Эти идеи предвещают эволюцию как биологических видов, так и языков, но после контакта Шлейхера с идеями Дарвина, и, возможно, контакта Дарвина с историческими лингвистами, эволюция и изменение языка были неразрывно связаны и стали основой для классификации. Сейчас, как и тогда, основными проблемами будут доказательство конкретных линий происхождения и определение точек ветвления. ^{[ необходима цитата ]}

Филогенетическое дерево

Старая метафора получила совершенно новое значение под старым названием от Джозефа Гарольда Гринберга в серии эссе, начавшихся примерно в 1950 году. С тех пор как лингвисты приняли метафору генеалогического древа, концепция эволюции была предложена Чарльзом Дарвином и была общепринятой в биологии. Таксономия , классификация живых существ, была изобретена уже Карлом Линнеем . Она использовала биномиальную номенклатуру для присвоения названия вида и названия рода каждому известному живому организму. Они были организованы в биологическую иерархию под несколькими филюмами , или наиболее общими группами, в конечном итоге разветвляющимися на различные виды. Основой для этой биологической классификации были наблюдаемые общие физические черты видов. ^{[ необходима цитата ]}

Дарвин, однако, возрождая другую древнюю метафору, древо жизни , выдвинул гипотезу, что группы классификации Линнея (сегодняшние таксоны ) с течением времени спускались в древовидной структуре от самых простых к самым сложным. Иерархическое древо Линнея было синхронным; Дарвин представлял себе диахронический процесс общего происхождения . Там, где Линней задумал ранги , которые соответствовали великой цепи бытия, принятой рационалистами , Дарвин задумал родословные . Спустя десятилетия после Дарвина стало ясно, что ранги иерархии Линнея не соответствуют в точности родословным. Главной целью таксономии стало обнаружение родословных и изменение классификации для их отражения, что она и сделала под общим руководством Номенклатурных кодексов , сводов правил, которые ведутся международными организациями для авторизации и публикации предложений по переклассификации видов и других таксонов. Новый подход был назван филогенией , «поколением филумов», который разработал новую метафору дерева, филогенетическое дерево . Одна единица в дереве и все ее дочерние единицы были кладой , а открытие клад было кладистикой . ^{[ требуется цитата ]}

Гринберг начал писать в то время, когда филогенетическая систематика не имела инструментов, доступных ей позже: компьютера (вычислительная систематика) и секвенирования ДНК ( молекулярная систематика ). Чтобы обнаружить кладистические отношения, исследователи опирались на как можно большее количество морфологических сходств между видами, которые можно было определить и свести в таблицу. Статистически, чем больше число сходств, тем более вероятно, что виды будут в одной кладе. Этот подход понравился Гринбергу, который был заинтересован в обнаружении лингвистических универсалий . Изменив модель дерева, чтобы сделать генеалогическое дерево филогенетическим, он сказал: ^[21]

«Любой язык состоит из тысяч форм, имеющих как звучание, так и значение... любой звук может выражать любое значение. Поэтому, если два языка совпадают в значительном количестве таких элементов... мы обязательно делаем вывод об общем историческом происхождении. Такие генетические классификации не являются произвольными... аналогия с биологической классификацией здесь чрезвычайно близка... так же, как в биологии мы классифицируем виды в одном роде или высшей единице, потому что сходство таково, что предполагает гипотезу общего происхождения, то же самое касается и генетических гипотез в языке».

В этой аналогии языковая семья подобна кладе , языки подобны видам , протоязык подобен предковому таксону , языковое дерево подобно филогенетическому дереву , а языки и диалекты подобны видам и разновидностям. Гринберг сформулировал большие таблицы характеристик до сих пор забытых языков Африки, Америки, Индонезии и северной Евразии и типировал их в соответствии с их сходствами. Он назвал этот подход « типологической классификацией», достигнутой скорее описательной лингвистикой , чем сравнительной лингвистикой . ^[22]

Даты и глоттохронология

Сравнительный метод использовался историческими лингвистами для составления древовидных моделей с использованием дискретных лексических, морфологических и фонологических данных. Хронологию можно найти, но нет абсолютных оценок дат с использованием этой системы.

Глоттохронология позволяет оценивать абсолютные даты. Общие когнаты (когнаты, означающие общее историческое происхождение) вычисляют время расхождения. Однако позже было обнаружено, что этот метод дискредитирован из-за ненадежности данных. Из-за этого у исторических лингвистов возникают проблемы с точной оценкой возраста при определении возраста индоевропейской языковой семьи. Он может варьироваться от 4000 до 40 000 лет до н. э. или где-то между этими датами, согласно Диксону, полученному из подъема и падения языка (Cambridge University Press). ^[23] Как видно из статьи здесь. ^[24]

Возможные решения для глоттохронологии появляются благодаря вычислительным филогенетическим методам. Такие методы, как использование моделей эволюции, повышают точность длины и топологии ветвей дерева. Поэтому, используя вычислительные филогенетические методы, вычислительные методы позволяют исследователям анализировать лингвистические данные из эволюционной биологии. Это дополнительно помогает в проверке теорий друг против друга, таких как теория Кургана и теория Анатолии, обе из которых утверждают происхождение инфоевропейских языков. ^[24]

Вычислительная филогенетика в исторической лингвистике

Сравнительный метод сравнивает особенности различных языков, чтобы оценить, насколько один язык похож на другой. Результаты такой оценки ориентированы на данные; то есть результаты зависят от количества особенностей и количества сравниваемых языков. До появления компьютера в исторической лингвистике числа в обоих случаях были обязательно небольшими. Эффект заключался в попытке изобразить фотографию с помощью небольшого количества больших пикселей или единиц изображения. Ограничения модели дерева были слишком болезненно очевидны, что привело к жалобам со стороны основных исторических лингвистов. ^{[ необходима цитата ]}

В конце 20 века лингвисты начали использовать программное обеспечение, предназначенное для биологической классификации, для классификации языков. Программы и методы становились все более сложными. В начале 21 века проект Computational Philogenetics in Historical Linguistics (CPHL), консорциум исторических лингвистов, получил финансирование от Национального научного фонда для изучения филогений. ^[25] Индоевропейская семья является основной темой исследования. По состоянию на январь 2012 года они собрали и закодировали «отобранную» базу данных из «22 фонологических символов, 13 морфологических символов и 259 лексических символов», а также неотобранную базу данных из большего количества. Включены списки слов 24 индоевропейских языков. Большее количество признаков и языков увеличивает точность, при условии, что они соответствуют определенным критериям. Используя специализированное компьютерное программное обеспечение, они проверяют различные филогенетические гипотезы на их способность объяснять символы генетическим происхождением. ^{[ необходима цитата ]}

Ограничения модели

Одним из эндемичных ограничений модели дерева является само основополагающее предположение, на котором она основана: она требует классификации, основанной на языках или, в более общем смысле, на языковых разновидностях . Поскольку разновидность представляет собой абстракцию от совокупности языковых признаков , существует вероятность потери информации при переводе данных (с карты изоглосс ) в дерево. Например, существует проблема диалектных континуумов . Они предоставляют разновидности, которые не являются однозначно тем или иным языком, но содержат черты, характерные для более чем одного. Вопрос о том, как их следует классифицировать, аналогичен вопросу, представленному кольцевыми видами концепции классификации видов в биологии. ^{[ необходима цитата ]}

Ограничения модели дерева, в частности, ее неспособность обрабатывать недискретное распределение общих инноваций в диалектных континуумах , были устранены путем разработки некладистических (не основанных на дереве) методологий. Они включают модель Wave ; и совсем недавно, концепцию связи . ^[3]

Дополнительное ограничение модели дерева включает смешанные и гибридные языки, а также смешение языков в целом, поскольку модель дерева допускает только расхождения. Например, согласно Цукерманну (2009:63), ^[26] «израильский», его термин для современного иврита , который он рассматривает как семито-европейский гибрид, «демонстрирует, что реальность лингвистического генезиса гораздо сложнее, чем позволяет простая система генеалогического древа. «Возрожденные» языки вряд ли имеют одного родителя».

Идеальные филогении

Целью филогенетического программного обеспечения является создание кладограмм , особого вида дерева, в котором связи только разветвляются; то есть в любом узле в одном направлении предлагаются только две ветви. Входные данные представляют собой набор символов, которым могут быть назначены состояния в разных языках, например, присутствует (1) или отсутствует (0). Таким образом, язык может быть описан уникальным набором координат, состоящим из значений состояний для всех рассматриваемых символов. Эти координаты могут быть похожи друг на друга или менее похожи. Языки, которые разделяют больше всего состояний, наиболее похожи друг на друга. ^{[ необходима цитата ]}

Программное обеспечение обрабатывает все состояния всех символов всех языков одним из нескольких математических методов, чтобы выполнить попарное сравнение каждого языка со всеми остальными. Затем оно строит кладограмму на основе степеней сходства; например, гипотетические языки a и b, которые являются наиболее близкими только друг к другу, предположительно имеют общего предка ab. Следующий ближайший язык c, предположительно имеет общего предка с ab, и так далее. Результатом является спроецированная серия исторических путей, ведущих от общего общего предка (корня) к языкам (листьям). Каждый путь уникален. Между путями нет связей. Каждый лист и узел имеют одного и только одного предка. Все состояния учитываются путем происхождения от других состояний. Кладограмма, которая соответствует этим требованиям, является идеальной филогенией. ^[27]

Сначала казалось, что в испытаниях, в которых факторы, предположительно, имели значение, было мало согласованности результатов. В результате любого изменения получалась новая кладограмма, которая предполагала, что метод не улавливал глубинную эволюцию языков, а только отражал импровизированные суждения исследователей. Чтобы найти факторы, которые действительно имели отношение к филогении, исследователям нужно было иметь некоторую меру точности своих результатов; т. е. результаты нужно было откалибровать по известным филогениям. Они провели эксперимент, используя различные предположения, ища те, которые давали бы самые близкие совпадения с наиболее надежными индоевропейскими филогениями. Эти предположения можно было бы использовать в проблемных областях индоевропейской филогении с большей уверенностью. ^{[ необходима цитата ]}

Чтобы получить достаточно обоснованную филогению, исследователи обнаружили, что им необходимо ввести в качестве входных данных все три типа символов: фонологические, лексические и морфологические, которые все требовались для представления картины, достаточно подробной для расчета филогении. Только качественные символы давали значимые результаты. Повторяющиеся состояния были слишком неоднозначными, чтобы быть правильно интерпретированными программным обеспечением; поэтому символы, которые подвергались обратному формированию и параллельному развитию, которые возвращали символ в предыдущее состояние или принимали состояние, которое эволюционировало в другом символе, соответственно, были отсеяны из входного набора данных. ^[28]

Идеальные филогенетические сети

Несмотря на их заботу о кодировании лучших качественных признаков в достаточном количестве, исследователи не смогли получить идеальных филогений для некоторых групп, таких как германские и албанские в пределах индоевропейских. Они рассуждали, что значительное количество признаков, которые не могли быть объяснены генетическим происхождением от вычисленного предка группы, были заимствованы. Предположительно, если бы волновая модель , которая объясняла заимствование, была полным объяснением признаков группы, для нее вообще не могло бы быть найдено никакой филогении. Если бы обе модели были частично эффективны, то дерево существовало бы, но его нужно было бы дополнить негенетическими объяснениями. Поэтому исследователи модифицировали программное обеспечение и метод, чтобы включить возможность заимствования. ^[29]

Исследователи ввели в эксперимент концепцию интерфейса или разрешенной границы, по которой будут протекать состояния символов. Односторонний интерфейс или ребро существовало между родителем и потомком. Если бы только односторонних ребер было достаточно для объяснения наличия всех состояний в языке, то не было бы необходимости выходить за рамки идеальной филогении. Если нет, то к филогении можно было бы добавить одно или несколько контактных ребер или двунаправленных интерфейсов. Таким образом, язык может иметь более одного источника состояний: родительский или контактный язык. ^{[ необходима цитата ]}

Дерево, измененное таким образом, уже не было деревом как таковым: могло быть более одного пути от корня к листу. Исследователи назвали такое расположение сетью. Состояния символа все еще развивались по уникальному пути от корня к листу, но его источником мог быть как рассматриваемый корень, так и язык контакта. Если все состояния эксперимента могли быть учтены сетью, ее называли идеальной филогенетической сетью. ^[30]

Совместимость и осуществимость

Генерация сетей потребовала двух фаз. На первой фазе исследователи разработали ряд филогений, называемых деревьями-кандидатами, для проверки на совместимость. Характер совместим, когда его происхождение объясняется сгенерированной филогенией. ^[31] В идеальной филогении все характеры совместимы, и совместимость дерева составляет 100%. По принципу экономии, или бритвы Оккама , никакие сети не гарантируются. Деревья-кандидаты были получены путем первого запуска программного обеспечения для генерации филогении с использованием индоевропейского набора данных (строки состояний характеров) в качестве входных данных, а затем изменения полученного дерева в другие гипотезы для проверки. ^{[ необходима цитата ]}

Ни одно из исходных деревьев-кандидатов не было идеальным филогением, хотя некоторые из поддеревьев в них были. Следующим этапом было создание сетей из деревьев с наивысшими оценками совместимости путем добавления интерфейсов по одному за раз, выбирая интерфейс с наивысшей совместимостью, пока не будет получена достаточность; то есть совместимость сети не будет наивысшей. Как оказалось, количество созданных совместимых сетей может варьироваться от нуля до более чем дюжины. Однако не все возможные интерфейсы были исторически осуществимы. Интерфейсы между некоторыми языками были географически и хронологически не очень вероятны. Проверяя результаты, исследователи исключали невозможные интерфейсы, пока не оставался список только возможных сетей, которые можно было бы расположить в порядке оценки совместимости. ^{[ необходима цитата ]}

Наиболее вероятная сеть для индоевропейских

Исследователи начали с пяти деревьев-кандидатов для индоевропейского языка, обозначенных буквами AE, одно из которых было создано с помощью филогенетического программного обеспечения, две его модификации и два, предложенные Крейгом Мелчертом , историческим лингвистом и индоевропеистом. Деревья различались в основном размещением самой неоднозначной группы, германских языков и албанского, у которого не было достаточно отличительных символов, чтобы разместить ее точно. Дерево A содержало 14 несовместимых символов; B — 19; C — 17; D — 21; E — 18. Деревья A и C имели самые высокие баллы совместимости. Все несовместимости были лексическими, и A были подмножеством C. ^[32]

Последующее поколение сетей показало, что все несовместимости могут быть разрешены с минимум тремя контактными ребрами, за исключением дерева E. Поскольку оно не имело высокой совместимости, оно было исключено. Дерево A имело 16 возможных сетей, которые проверка осуществимости сократила до трех. Дерево C имело одну сеть, но поскольку оно требовало интерфейса с балтийским, а не славянским языком, это было невыполнимо. ^[33]

Древо А, наиболее совместимое и правдоподобное древо, выдвигает гипотезу о семи группах, отделившихся от протоиндоевропейской в период примерно с 4000 г. до н.э. по 2250 г. до н.э., как следует ниже. ^[34]

Первой отделилась Анатолия, около 4000 г. до н.э.
Примерно в 3500 году до н.э. появился тохарский язык.
Вскоре после этого, около 3250 г. до н. э., протоитало-кельтский (западный индоевропейский) язык разделился, став протоиталийским и протокельтским примерно в 2500 г. до н. э.
Около 3000 года протоалбано-германский язык разделился, став албанским и протогерманским примерно в 2000 году.
Около 3000 года протогреко-армянский (южный индоевропейский) язык разделился, став протогреческим и протоармянским примерно в 1800 году.
Балто-славянский язык появился около 2500 г. н. э., разделившись на протобалтийский и протославянский около 1000 г. н. э.
Наконец, около 2250 года протоиндоевропейский язык стал протоиндоиранским (восточноиндоевропейским).

Древа B и E предлагают альтернативу прагермано-балто-славянской (северной индоевропейской), что делает албанский независимой ветвью. Единственная дата, за которую ручаются авторы, это последняя, основанная на преемственности культуры Ямна , андроновской культуры и известных индоарийских говорящих культур. Все остальные описываются как «счисление мертвых». ^[35]

Учитывая филогению наилучшей совместимости, A, для завершения совместимости требуются три контактных ребра. Это группа ребер с наименьшим количеством событий заимствования: ^[35]

Во-первых, граница между протоиталийским и протогерманским языками, которая, согласно приведенной схеме датировки, должна была начаться после 2000 года.
Вторая граница контакта существовала между протоиталийским и протогрекоармянским языками и, по всей видимости, началась после 2500 г.
Третий контактный край проходит между протогерманскими и протобалтийскими языками и должен был начаться после 1000 г.

Дерево А с описанными выше ребрами авторы называют «нашей лучшей ППН». ^[36] Во всех ППН ясно, что хотя первоначальные дочерние языки стали обособленными в относительной изоляции, последующую эволюцию групп можно объяснить только эволюцией в непосредственной близости от других языков, с которыми происходит обмен по волновой модели.

Смотрите также

Примечания

^ ab Лист, Иоганн-Маттис; Нельсон-Сати, Шиджулал; Гейслер, Ханс; Мартин, Уильям (2014). «Сети лексических заимствований и латерального переноса генов в эволюции языка и генома». BioEssays . 36 (2): 141–150. doi :10.1002/bies.201300096. ISSN 0265-9247. PMC 3910147 . PMID 24375688.
^ ab François (2014).
^ ab См. Bloomfield 1933, стр. 311; Heggarty et al. (2010); François (2014).
↑ Святой Августин (1948). «XVI: 9–11». Град Божий .
^ Бытие 10:25
^ 1 Паралипоменон 1:19.
↑ Святой Августин (епископ Гиппонский) (1871). Труды Аврелия Августина: Новый перевод. Т. и Т. Кларк – через Google Books .
↑ Браун 1684, стр. 223–241.
↑ Браун 1684, стр. 224.
↑ Браун 1684, стр. 225.
↑ Браун 1684, стр. 228.
↑ Браун 1684, стр. 226–228.
^ Хауэлл, Джеймс (1688) [1645]. «Письмо LVIII достопочтенному графу Р.». Epistolae Ho-Elianae, Familiar Letters, Domestic and Forren, Divided to Four Books, Partly Historical, Political, Philosophical, Upon Emergent Occasions . Vol. II (6th ed.). London: Thomas Guy. p. 356.
↑ Джонс, Уильям (1807) [1786], «Третья годовщина, рассуждение об индусах», в книге Лорда Тейгнмута (ред.), Труды сэра Уильяма Джонса с описанием жизни автора, в тринадцати томах , т. III, Лондон: Джон Стокдейл и Джон Уокер, стр. 34
↑ Янг 1813, стр. 251
↑ Янг 1813, стр. 255
↑ Грант, Роберт (1813). Очерк истории Ост-Индской компании с момента ее первого образования до принятия Регламентирующего акта 1773 года; с кратким обзором изменений, произошедших с того периода во внутреннем управлении Британской Индией . Лондон: Black, Parry, and Co. [и т. д.] стр. xxxiv–xxxv.
^ Уильямс, Д.М.; Эбах, Мальте К.; Нельсон, Гарет Дж. (2008). Основы систематики и биогеографии . Нью-Йорк, Нью-Йорк: Springer. стр. 45. ISBN 9780387727288.
^ Дарвин, Чарльз (1860). О происхождении видов путем естественного отбора, или Сохранение благоприятствуемых рас в борьбе за жизнь. Лондон: Дж. Мюррей. С. 422. Возможно, стоит проиллюстрировать этот взгляд на классификацию на примере языков Дарвина.
^ Пост, Дэвид Г. (2009). В поисках лося Джефферсона: заметки о состоянии киберпространства . Оксфорд; Нью-Йорк: Oxford University Press . стр. 125. ISBN 978-0-19-534289-5.
^ Гринберг, Джозеф Х. (1990) [1954], «Количественный подход к типологической морфологии языка», в Деннинг, Кит М.; Кеммер, Сюзанна (ред.), О языке: избранные труды Джозефа Х. Гринберга , Стэнфорд: Stanford University Press , стр. 3–4
^ Гринберг, Джозеф Гарольд (1971). Язык, культура и коммуникация . Стэнфорд: Stanford University Press . стр. 113. ISBN 9780804707817.
^ Диксон, РМВ (1997). Взлет и падение языков РМВ Диксона. Cambridge Core. doi :10.1017/CBO9780511612060. ISBN 9780511612060. Получено 26.09.2017 .
^ ab Gray, Russell D.; Atkinson, Quentin D. (2003-11-27). «Времена расхождения языкового дерева подтверждают анатолийскую теорию индоевропейского происхождения». Nature . 426 (6965). Nature Publishing Group: 435–9. Bibcode :2003Natur.426..435G. doi :10.1038/nature02029. PMID 14647380. S2CID 42340 – через Google Books .
^ «CPHL: Вычислительная филогенетика в исторической лингвистике». 2004–2012.
^ Цукерманн, Гилад. 2009. «Гибридность против возрождаемости: множественная причинность, формы и модели». Журнал языковых контактов , Varia 2:40–67.
^ Нахлех 2005, стр. 383.
^ Нахле 2005, стр. 384–385.
^ Технические подробности используемых алгоритмов изложены в Nakhleh 2005, Приложение A. Подробности набора данных изложены в Приложении B.
^ Нахле 2005, стр. 388–391.
^ Нахлех 2005, стр. 387.
^ Нахлех 2005, стр. 396.
^ Нахлех 2005, стр. 400.
^ Нахлех 2005, стр. 398.
^ ab Nakhleh 2005, стр. 401.
^ Нахлех 2005, стр. 407.

Библиография

Блумфилд, Леонард (1984) [1933]. Язык . Чикаго и Лондон: Издательство Чикагского университета .
Браун, Томас (1852) [1684], «Сборники трактатов; Сборники; Трактат 8, О языках и в особенности о саксонском языке», в Тенисон, Томас (ред.), Труды сэра Томаса Брауна , Библиотека антиквариата Бона, т. III, Поля Линкольнс-Инн: Кокс (братья) и Уайман, стр. 223–241.
Франсуа, Александр (2014), «Деревья, волны и связи: модели языковой диверсификации» (PDF) , в Боуэрн, Клэр; Эванс, Бетвин (ред.), The Routledge Handbook of Historical Linguistics , Лондон: Routledge , стр. 161–189, ISBN 978-0-41552-789-7.
Хеггарти, Пол; Магуайр, Уоррен; Макмахон, Апрель (2010). «Расщепления или волны? Деревья или сети? Как меры расхождения и сетевой анализ могут раскрыть историю языка». Philosophical Transactions of the Royal Society B . 365 (1559): 3829–3843. doi :10.1098/rstb.2010.0099. PMC 2981917 . PMID 21041208.
Nakhleh, Luay; Ringe, Don; Warnow, Tandy (2005). «Идеальные филогенетические сети: новая методология реконструкции эволюционной истории естественных языков» (PDF) . Язык . 81 (2): 382–420. CiteSeerX 10.1.1.65.1791 . doi :10.1353/lan.2005.0078. S2CID 162958.
Янг, Томас (октябрь 1813 г.). «Общая история языков Адлунга». The Quarterly Review . X (XIX Статья XII). Лондон: Джон Мюррей: 250–292.

Внешние ссылки

На Викискладе есть медиафайлы по теме «Языковые диаграммы и деревья» .

Лабов, Уильям (2010). "15. Распространение языка от места к месту". Принципы языковых изменений . Том 3: Познание и культурные факторы. Великобритания: Wiley-Blackwell – через Scribd.^{[ постоянная мертвая ссылка ]}
Санторини, Беатрис; Крох, Энтони (2007). «Узловые отношения». Синтаксис естественного языка: онлайн-введение с использованием программы Trees . Университет Пенсильвании .