Часть лексикостатистики
Глоттохронология (от аттического греческого γλῶττα — язык, язык и χρόνος — время ) — раздел лексикостатистики , который включает в себя сравнительное языкознание и изучает хронологические отношения между языками. [1] : 131
Идея была развита Моррисом Сводешем в 1950-х годах в его статье о внутренних связях языка салиш. [2] Он разработал идею, исходя из двух предположений: действительно существует относительно стабильный базовый словарь (называемый списками Сводеша ) во всех языках мира; и любые замены происходят аналогично радиоактивному распаду в постоянном процентном соотношении за прошедшее время. Используя математику и статистику, Сводеш разработал уравнение для определения того, когда языки разделились, и дал приблизительное время, когда произошло разделение. Его методы были направлены на помощь лингвистическим антропологам, предоставив им окончательный способ определения даты разделения двух языков. Формула дает приблизительное количество столетий с тех пор, как два языка, как предполагалось, разделились от единственного общего предка. Его методы также подразумевали предоставление информации о том, когда могли существовать древние языки. [3]
Несмотря на многочисленные исследования и литературу, содержащую информацию о глоттохронологии, она сегодня широко не используется и окружена противоречиями. [3] Глоттохронология отслеживает разделение языков с тысяч лет назад, но многие лингвисты скептически относятся к этой концепции, потому что это скорее «вероятность», чем «уверенность». С другой стороны, некоторые лингвисты могут сказать, что глоттохронология набирает популярность из-за ее связи с археологическими датами. Глоттохронология не так точна, как археологические данные, но некоторые лингвисты все еще считают, что она может дать надежную оценку. [4]
Со временем появилось много различных расширений метода Сводеша; однако оригинальный метод Сводеша настолько известен, что с ним обычно ассоциируется «глоттохронология». [1] : 133 [5]
Методология
Список слов
Первоначальный метод глоттохронологии предполагал, что основной словарный запас языка заменяется с постоянной (или постоянной средней) скоростью во всех языках и культурах и поэтому может использоваться для измерения течения времени. Процесс использует список лексических терминов и морфем, которые похожи на несколько языков.
Списки были составлены Моррисом Сводешем и предположительно устойчивы к заимствованиям (первоначально разработанные в 1952 году как список из 200 пунктов, но уточненный список из 100 слов в Сводеше (1955) [6] гораздо более распространен среди современных лингвистов). Основной словарь был разработан, чтобы охватить понятия, общие для каждого человеческого языка, такие как личные местоимения, части тела, небесные тела и живые существа, глаголы основных действий, числительные, основные прилагательные, термины родства и природные явления и события. [7] С помощью основного списка слов устраняются понятия, которые являются специфичными для определенной культуры или периода времени. Было обнаружено путем дифференциации списков слов, что идеал на самом деле невозможен и что набор значений, возможно, должен быть адаптирован к сравниваемым языкам. Списки слов не являются однородными на протяжении исследований, и они часто изменяются и разрабатываются так, чтобы соответствовать обоим изучаемым языкам. Лингвисты обнаружили, что трудно найти список слов, в котором все используемые слова были бы культурно беспристрастными. [8] Многие альтернативные списки слов были составлены другими лингвистами и часто используют меньшее количество смысловых слотов.
Затем измеряется процент когнатов (слов с общим происхождением) в списках слов. Чем больше процент когнатов, тем позже предполагается, что два сравниваемых языка разделились.
Ниже приведен пример базового списка слов, составленного из основных турецких слов и их английских переводов. [9]
Глоттохронологическая константа
Определение списков слов зависит от распада морфем или изменения в словарном запасе. Распад морфем должен оставаться на постоянной скорости для того, чтобы глоттохронология была применима к языку. Это приводит к критике глоттохронологической формулы, поскольку некоторые лингвисты утверждают, что скорость распада морфем не гарантирует, что она останется одинаковой на протяжении всей истории. [8]
Американский лингвист Роберт Лис получил значение «глоттохронологической константы» ( r ) слов, рассмотрев известные изменения в 13 парах языков, используя список из 200 слов. Он получил значение 0,805 ± 0,0176 с 90% уверенностью. Для своего списка из 100 слов Сводеш получил значение 0,86, более высокое значение отражает исключение семантически нестабильных слов. Константа связана с уровнем сохранения слов следующей формулой:
L — скорость замещения, ln — натуральный логарифм , а r — глоттохронологическая константа.
Время расхождения
Основная формула глоттохронологии в ее кратком виде такова:
t = определенный период времени от одной стадии развития языка до другой (измеряется в тысячелетиях), [10] c = доля элементов словаря, сохранившихся к концу этого периода, и L = скорость замены для этого списка слов.
Поэтому можно также сформулировать:
Проверяя исторически проверяемые случаи, в которых t известно из нелингвистических данных (например, приблизительное расстояние от классической латыни до современных романских языков), Сводеш пришел к эмпирическому значению приблизительно 0,14 для L , что означает, что скорость замены составляет около 14 слов из списка из 100 слов за тысячелетие. Это представлено в таблице ниже.
Результаты
Было обнаружено, что глоттохронология работает в случае индоевропейцев, составляя 87% дисперсии. Также постулируется, что она работает для афро-азиатов (Флеминг, 1973), китайцев (Мунро, 1978) и америндов (Старк, 1973; Баумхофф и Олмстед, 1963). Для америндов корреляции были получены с помощью радиоуглеродного датирования и групп крови [ сомнительно – обсудите ] , а также археологии. [ требуется цитата ]
Подход Грея и Аткинсона [11] , как они утверждают, не имеет ничего общего с «глоттохронологией».
Обсуждение
Концепция изменения языка стара, и ее история рассмотрена в Hymes (1973) и Wells (1973). В некотором смысле глоттохронология является реконструкцией истории и часто может быть тесно связана с археологией. Многие лингвистические исследования обнаруживают, что успех глоттохронологии можно найти рядом с археологическими данными. [4] Сама глоттохронология восходит к середине 20-го века. [6] [12] [7] Введение в предмет дано в Embleton (1986) [13] и в McMahon и McMahon (2005). [14]
С тех пор глоттохронология вызывает споры, отчасти из-за проблем с точностью, но также из-за вопроса о том, является ли ее основа надежной (например, Bergsland 1958; Bergsland и Vogt 1962; Fodor 1961; Chrétien 1962; Guy 1980). Эти опасения были рассмотрены Dobson et al. (1972), Dyen (1973) [15] и Kruskal, Dyen и Black (1973). [16] Предположение о частоте замены одного слова может исказить оценку времени расхождения, когда включаются заимствованные слова (Thomason и Kaufman 1988).
Презентации варьируются от "Почему лингвисты не датируют" до той, которую обсудил выше Старостин . [ необходимо разъяснение ]
С момента своего возникновения глоттохронология была отвергнута многими лингвистами, в основном индоевропейцами школы традиционного сравнительного метода . Критика была отвечена, в частности, вокруг трех пунктов обсуждения:
- Критика, направленная против более высокой стабильности лексем в списках Сводеша (Haarmann 1990), не достигает цели, поскольку определенное количество потерь только позволяет производить вычисления (Sankoff 1970). Неоднородность списков слов часто приводит к отсутствию взаимопонимания между лингвистами. Лингвисты также испытывают трудности с поиском полностью беспристрастного списка основных культурных слов. Лингвистам может потребоваться много времени, чтобы найти жизнеспособный список слов, и может потребоваться несколько тестовых списков, чтобы найти пригодный для использования список. [8]
- Традиционная глоттохронология предполагает, что язык меняется со стабильной скоростью.
- Так, в работе Бергсланд и Фогт (1962) авторы убедительно продемонстрировали на основе фактических языковых данных, поддающихся проверке с помощью экстралингвистических источников, что «скорость изменений» для исландского языка составила около 4% за тысячелетие, а для тесно связанного с ним риксмала (литературного норвежского языка) она достигала 20% (предложенная Сводешем «постоянная скорость» должна была составлять около 14% за тысячелетие).
- Этот и несколько других подобных примеров эффективно доказали, что формула Сводеша не будет работать на всех доступных материалах, что является серьезным обвинением, поскольку доказательства, которые можно использовать для «калибровки» значения L (истории языка, зафиксированной в течение длительных периодов времени), изначально не так уж и велики.
- Весьма вероятно, что вероятность замены различна для каждого слова или признака («каждое слово имеет свою историю», среди сотен других источников: [17] ).
- Это глобальное предположение было изменено и понижено до отдельных слов, даже на отдельных языках, во многих новых попытках (см. ниже).
- Существует недостаток понимания математических/статистических методов Сводеша. Некоторые лингвисты полностью отвергают эти методы, потому что статистика приводит к «вероятностям», тогда как лингвисты больше доверяют «определенностям». [8]
- Серьёзным аргументом является то, что изменение языка возникает в результате социально-исторических событий, которые, конечно же, непредсказуемы и, следовательно, неисчислимы.
- Новые методы, разработанные Греем и Аткинсоном, как утверждается, позволяют избежать этих проблем, но они по-прежнему считаются спорными, прежде всего потому, что они часто дают результаты, несовместимые с известными данными, а также из-за дополнительных методологических проблем.
Модификации
Где-то между изначальной концепцией Сводеша и отказом от глоттохронологии в целом лежит идея о том, что глоттохронология как формальный метод лингвистического анализа становится валидной с помощью нескольких важных модификаций. Так, неоднородности в скорости замены были рассмотрены Ван дер Мерве (1966) [8] путем разбиения списка слов на классы, каждый со своей скоростью, в то время как Дайен, Джеймс и Коул (1967) [18] позволили каждому значению иметь свою скорость. Одновременная оценка времени расхождения и скорости замены была изучена Крускалом, Дайеном и Блэком. [16]
Брейнард (1970) допускал случайное родство, а эффекты дрейфа были введены Глисоном (1959). Санкофф (1973) предложил ввести параметр заимствования и допустил синонимы.
Сочетание различных улучшений дано в работе Санкоффа «Полностью параметризованная лексикостатистика». В 1972 году Санкофф в биологическом контексте разработал модель генетической дивергенции популяций. Эмблтон (1981) выводит упрощенную версию этой модели в лингвистическом контексте. Она проводит ряд симуляций, используя ее, которые, как показано, дают хорошие результаты.
Улучшения в статистической методологии, связанные с совершенно другой отраслью науки, филогенетикой ; изучение изменений в ДНК с течением времени вызвало недавний возобновленный интерес. Новые методы более надежны, чем предыдущие, поскольку они калибруют точки на дереве с известными историческими событиями и сглаживают скорости изменений по ним. Таким образом, они больше не требуют предположения о постоянной скорости изменений (Gray & Atkinson 2003).
Метод Старостина
Еще одна попытка ввести подобные изменения была предпринята российским лингвистом Сергеем Старостиным , который предложил следующее:
- Систематические заимствования , заимствованные из одного языка в другой, являются деструктивным фактором и должны быть исключены из расчетов; единственное, что действительно имеет значение, — это «исконная» замена элементов элементами из того же языка. Неспособность заметить этот фактор была основной причиной первоначальной оценки Сводешем скорости замены менее 14 слов из списка из 100 слов за тысячелетие, но реальная скорость намного ниже (около 5 или 6). Введение этой поправки фактически отменяет аргумент «Бергсланда и Фогта», поскольку тщательный анализ данных Riksmal показывает, что его базовый список слов включает около 15–16 заимствований из других германских языков (в основном датского ), и исключение этих элементов из расчетов снижает скорость до ожидаемой скорости 5–6 «исконных» замен за тысячелетие.
- Скорость изменения на самом деле не постоянна, а зависит от времени существования слова в языке (вероятность замены лексемы X на лексему Y увеличивается прямо пропорционально прошедшему времени, так называемое «старение слов» эмпирически понимается как постепенное «размывание» первичного значения слова под тяжестью приобретенных вторичных значений).
- Отдельные элементы списка из 100 слов имеют разные показатели стабильности (например, слово «I» обычно имеет гораздо меньшую вероятность замены, чем слово «yellow»).
Итоговая формула, учитывающая как временную зависимость, так и индивидуальные коэффициенты устойчивости, выглядит следующим образом:
В этой формуле − Lc отражает постепенное замедление процесса замены из-за различных индивидуальных скоростей, поскольку наименее стабильные элементы заменяются первыми и быстрее всего, а квадратный корень представляет обратную тенденцию, ускорение замены по мере того, как элементы в исходном списке слов «стареют» и становятся более склонными к изменению своего значения. Эта формула, очевидно, сложнее исходной формулы Сводеша, но, как показал Старостин, она дает более достоверные результаты, чем первая, и более или менее согласуется со всеми случаями разделения языков, которые могут быть подтверждены историческими знаниями. С другой стороны, она показывает, что глоттохронология действительно может использоваться только как серьезный научный инструмент для языковых семей, историческая фонология которых была тщательно разработана (по крайней мере, до такой степени, чтобы можно было четко различать родственные и заимствованные слова).
Оценка глубины времени
Институт Макдональда провел конференцию по вопросу оценки глубины времени в 2000 году. Опубликованные статьи [19] дают представление о взглядах на глоттохронологию в то время. Они варьируются от «Почему лингвисты не делают дат» до той, которую обсудил выше Старостин. Обратите внимание, что в упомянутой статье Грея и Аткинсона они утверждают, что их методы нельзя назвать «глоттохронологией», ограничивая этот термин его исходным методом.
Смотрите также
Ссылки
- ^ ab Sheila Embleton (1992). Историческая лингвистика: Математические концепции. В W. Bright (ред.), Международная энциклопедия лингвистики
- ^ Сводеш, Моррис (октябрь 1950 г.). «Внутренние отношения сэлиш». Международный журнал американской лингвистики . 16 : 157–167. doi :10.1086/464084. JSTOR 1262898. S2CID 145122561.
- ^ ab Ottenheimer, Harriet Joseph (2006). Антропология языка . Belmont, CA: Wadsworth, Cengage Learning. стр. 292–293. ISBN 978-0-495-50884-7.
- ^ ab Brown, Cecil H. (сентябрь 2006 г.). «Доисторическая хронология фасоли обыкновенной в Новом Свете: лингвистические свидетельства». American Anthropologist . 108 (3): 507–516. doi :10.1525/aa.2006.108.3.507. JSTOR 3804627.
- ^ Холм, Ханс Дж. (2007). Новый дендрарий индоевропейских «деревьев»; могут ли новые алгоритмы раскрыть филогению и даже предысторию IE?. Журнал количественной лингвистики 14-2:167–214
- ^ ab Swadesh, Morris. (1955). К большей точности в лексикостатистическом датировании. International Journal of American Linguistics , 21 , 121–137
- ^ ab Lees, Robert. (1953). Основы глоттохронологии. Язык , 29 (2), 113–127.
- ^ abcde van der Merwe, NJ 1966 «Новая математика для глоттохронологии», Current Anthropology 7: 485–500
- ^ Пирс, Джо Э. (февраль 1996 г.). «Глоттохронология и турецкий базовый словарь». Американский антрополог . 68 (1): 137–143. doi : 10.1525/aa.1966.68.1.02a00150 . JSTOR 668071.
- ^ МакМахон, Апрель; МакМахон, Роберт (2005). Классификация языков по числам . OUP Oxford. стр. 180. ISBN 9780191535369.
- ^ Время расхождения языкового древа подтверждает анатолийскую теорию индоевропейского происхождения, Рассел Д. Грей и Квентин Д. Аткинсон, Nature 426, 435–439 2003
- ^ Сводеш, Моррис (1972). Что такое глоттохронология? В М. Сводеш, Происхождение и диверсификация языков (стр. 271–284). Лондон: Routledge & Kegan Paul.
- ^ Эмблтон, Шейла М. (1986). Статистика в исторической лингвистике [Количественная лингвистика, т. 30]. Бохум: Brockmeyer. ISBN 3-88339-537-4 . – Состояние дел на тот момент.
- ^ Макмахон, Эйприл и Макмахон, Роберт (2005) Классификация языков по числам . Оксфорд: Oxford University Press (в частности, стр. 95)
- ^ Dyen, Isidore, ed. (1973). Лексикостатистика в генетической лингвистике: Труды Йельской конференции, 3–4 апреля 1971 г. La Haye: Mouton.
- ^ ab Некоторые результаты словарного метода реконструкции языковых деревьев, Джозеф Б. Крускал, Исидор Дайен и Пол Блэк, Лексикостатистика в генетической лингвистике, Исидор Дайен (редактор), Мутон, Гаага, 1973, стр. 30–55
- ^ Кирк Дж. М., Сент-Андерсон и Дж. Д. А. Виддоусон, 1985 Исследования по лингвистической географии: Диалекты английского языка в Британии и Ирландии. Лондон: Крум Хелм
- ^ Дайен, И., Джеймс, А.Т. и Дж.У.Л. Коул 1967 «Языковая дивергенция и предполагаемая скорость сохранения слов», <Язык 43: 150–171
- ^ Ренфрю, К., Макмахон, А. и Л. Траск, ред. (2000). Глубина времени в исторической лингвистике . Кембридж, Англия: Институт археологических исследований Макдональда.
Библиография
- Арндт, Вальтер В. (1959). Эффективность глоттохронологии в германских языках. Язык , 35 , 180–192.
- Бергсланд, Кнут ; и Фогт, Ганс. (1962). О достоверности глоттохронологии. Current Anthropology , 3 , 115–153.
- Брейнерд, Баррон (1970). Стохастический процесс, связанный с изменением языка. Журнал прикладной вероятности 7, 69–78.
- Каллаган, Кэтрин А. (1991). Ютиан и список Сводеша. В JE Redden (ред.), Доклады для конференции по языку американских индейцев, состоявшейся в Калифорнийском университете, Санта-Крус, июль и август 1991 г. (стр. 218–237). Отдельные доклады по лингвистике (№ 16). Карбондейл: Отдел лингвистики, Университет Южного Иллинойса.
- Кэмпбелл, Лайл. (1998). Историческая лингвистика; Введение [Глава 6.5]. Эдинбург: Издательство Эдинбургского университета. ISBN 0-7486-0775-7 .
- Кретьен, Дуглас (1962). Математические модели глоттохронологии. Язык 38, 11–37.
- Кроули, Терри (1997). Введение в историческую лингвистику. 3-е изд. Окленд: Oxford Univ. Press. С. 171–193.
- Дайен, Исидор (1965). «Лексикостатистическая классификация австронезийских языков». Международный журнал американской лингвистики , Мемуары 19.
- Грей, Р. Д. и Аткинсон, К. Д. (2003): «Время расхождения языкового древа подтверждает анатолийскую теорию индоевропейского происхождения». Nature 426–435–439.
- Гудшинский, Сара. (1956). Азбука лексикостатистики (глоттохронологии). Слово , 12 , 175–210.
- Хаарманн, Харальд. (1990). «Базовый словарный запас и языковые контакты; разочарование в глоттохронологии. Indogermanische Forschungen 95:7ff.
- Хокетт, Чарльз Ф. (1958). Курс современной лингвистики (гл. 6). Нью-Йорк: Macmillan.
- Хойер, Гарри. (1956). Лексикостатистика: Критика. Язык , 32 , 49–60.
- Holm, Hans J. (2003). Ловушка пропорциональности. Или: Что не так с лексикостатистической подгруппировкой Архивировано 2019-06-02 в Wayback Machine . Indogermanische Forschungen , 108 , 38–46 .
- Холм, Ханс Дж. (2005). Генеалогическое управление. Кап. 45 по количественной лингвистике; ein Internationales Handbuch. Herausgegeben von R.Köhler, G. Altmann, R. Piotrowski , Берлин: Вальтер де Грюйтер.
- Holm, Hans J. (2007). Новый дендрарий индоевропейских «деревьев»; Могут ли новые алгоритмы раскрыть филогению и даже предысторию IE?. Журнал количественной лингвистики 14-2:167–214
- Хаймс, Делл Х. (1960). Лексикостатистика до сих пор. Current Anthropology , 1 (1), 3–44.
- Маквортер, Джон . (2001). Сила Вавилона . Нью-Йорк: Freeman. ISBN 978-0-7167-4473-3 .
- Неттл, Дэниел. (1999). Языковое разнообразие Америки можно примирить с недавней колонизацией. в PNAS 96(6):3325–9.
- Санкофф, Дэвид (1970). «О скорости замены отношений между словом и значением». Язык 46.564–569.
- Сьоберг, Андре; и Сьоберг, Гидеон. (1956). Проблемы глоттохронологии. Американский антрополог , 58 (2), 296–308.
- Старостин, Сергей. Методология долгосрочных сравнений. 2002. pdf
- Томасон, Сара Грей и Кауфман, Терренс. (1988). Языковой контакт, креолизация и генетическая лингвистика . Беркли: Издательство Калифорнийского университета.
- Тишлер, Иоганн, 1973. Glottochronologie und Lexikostatistik [Innsbrucker Beiträge zur Sprachwissenschaft 11]; Инсбрук.
- Виттманн, Анри (1969). «Лексико-статистическое исследование диахронии хеттского языка». Indogermanische Forschungen 74.1–10.[1]
- Виттман, Анри (1973). «Лексикостатистическая классификация креольских языков на основе французского». Лексикостатистика в генетической лингвистике: Труды Йельской конференции, 3–4 апреля 1971 г. , реж. Исидор Дьен, 89–99. La Haye: Mouton.[2]
- Ципф, Джордж К. (1965). Психобиология языка: введение в динамическую филологию. Кембридж, Массачусетс: MITPress.
Внешние ссылки
- Список Сводеша в Викисловаре.
- Обсуждение с некоторыми статистическими данными
- Упрощенное объяснение разницы между глоттохронологией и лексикостатистикой.
- Эксперимент с запросами: количественная оценка генетической близости между 110 языками с деревьями и обсуждением