Составление концепций, в первую очередь, для целей лексикостатистики
Список Сводеша ( ) — это сборник условно универсальных понятий для целей лексикостатистики . То есть список Сводеша — это список форм и понятий, для которых во всех языках без исключения есть термины, такие как звезда, рука, вода, убить, сон и т. д. Число таких терминов невелико — максимум несколько сотен, а возможно, и меньше сотни; включение или исключение многих терминов является предметом споров среди лингвистов, поэтому существует несколько различных списков, и некоторые авторы могут ссылаться на «списки Сводеша». Список Сводеша назван в честь лингвиста Морриса Сводеша .
Переводы списка Сводеша на набор языков позволяют исследователям количественно оценить взаимосвязь этих языков. Списки Сводеша используются в лексикостатистике (количественная оценка генеалогического родства языков) и глоттохронологии (датирование расхождения языков). Например, термины в списке Сводеша можно сравнивать между двумя языками (поскольку они будут в обоих языках), чтобы увидеть, связаны ли они и насколько тесно, тем самым предоставляя полезную информацию, которую можно в дальнейшем применять для сравнения языков. (Фактическая лексикостатистика довольно сложна, и обычно сравниваются наборы языков.)
Версии и авторы
Моррис Сводеш создал несколько версий своего списка. Он начал [1] со списка из 215 значений (ложно представленного как список из 225 значений в статье из-за орфографической ошибки [2] ), который он сократил до 165 слов для языка салиш-спокейн-калиспела . В 1952 году он опубликовал список из 215 значений, [3] из которых он предложил удалить 16 из-за их неясности или неуниверсальности , добавив одно, чтобы получить 200 слов. В 1955 году [4] он написал: «Единственным решением, по-видимому, является радикальное вычищение списка, в осознании того, что качество по крайней мере так же важно, как и количество. Даже новый список имеет дефекты, но они относительно незначительны и немногочисленны». После небольших исправлений окончательный список из 100 слов был опубликован посмертно в 1971 [5] и 1972 годах.
Другие версии списков лексикостатистических тестов были опубликованы, например, Робертом Лизом (1953), Джоном А. Ри (1958:145f), Деллом Хаймсом (1960:6), Э. Кроссом (1964 с 241 понятием), У. Дж. Самариным (1967:220f), Д. Уилсоном (1969 с 57 значениями), Лайонелом Бендером (1969), Р. Л. Освальдом (1971), Уинфредом П. Леманном (1984:35f), Д. Ринге (1992, в разных вариантах), Сергеем Старостиным (1984, в разных вариантах), Уильямом С. Ю. Вангом (1994), М. Лором (2000, 128 значений на 18 языках). Б. Кесслером (2002) и многими другими. Concepticon [6] , проект, размещенный в проекте Cross-Linguistic Linked Data (CLLD), собирает различные списки концепций (включая классические списки Сводеша) по разным языковым областям и временам, в настоящее время перечисляя 240 различных списков концепций. [7]
Часто используемая и широко доступная в Интернете версия Исидора Дайена (1992, 200 значений 95 языковых вариантов). С 2010 года команда Майкла Данна пыталась обновить и улучшить этот список. [8]
Принцип
По своему происхождению слова в списках Сводеша были выбраны с учетом их универсальной, культурно независимой доступности в максимально возможном количестве языков, независимо от их стабильности (насколько слово подвержено изменениям, поскольку все слова со временем изменяются в большей или меньшей степени, что может включать заимствования из другого языка).
Однако стабильность может быть важна. Стабильность терминов в списке Сводеша при изменении языка и потенциальное использование этого факта для целей глоттохронологии (изучение того, как языки развиваются и разделяются с течением времени) были проанализированы многочисленными авторами, включая Марису Лор 1999, 2000. [9]
Список Сводеша был составлен Моррисом Сводешем на основе его интуиции. Похожие более поздние списки, такие как список Долгопольского (1964) или список Лейпциг-Джакарта (2009), основаны на систематических данных из многих разных языков, но они пока не так широко известны и не так широко используются, как список Сводеша.
Использование в лексикостатистике и глоттохронологии
Списки лексикостатистических тестов используются в лексикостатистике для определения подгрупп языков, а в глоттохронологии — для «указания дат точек ветвления в дереве». [10] Задача определения (и подсчета количества) родственных слов в списке далеко не тривиальна и часто является предметом споров, поскольку родственные слова не обязательно выглядят одинаково, а распознавание родственных слов предполагает знание звуковых законов соответствующих языков.
Оригинальный окончательный список Swadesh 100
Окончательный список Сводеша, опубликованный в 1971 году, [5] содержит 100 терминов. Объяснения терминов можно найти в Swadesh 1952 [3] или, если они отмечены крестиком ( † ), в Swadesh 1955. Обратите внимание, что только эта исходная последовательность проясняет правильное значение, которое теряется в алфавитном порядке, например, в случае «27. bark» (первоначально без добавленной здесь спецификации).
- Я (местоимение первого лица единственного числа)
- you (местоимение второго лица единственного числа; 1952 thou & ye)
- мы (1955: включительно )
- этот
- что
- кто ? («?» не 1971)
- что ? («?» не 1971)
- нет
- все (из числа)
- много
- один
- два
- большой
- длинный (не широкий)
- маленький
- женщина
- мужчина (взрослый мужчина)
- человек (отдельный человек)
- рыба (существительное)
- птица
- собака
- вошь
- дерево (не бревно)
- семя (существительное)
- лист (ботаника)
- корень (ботаника)
- кора (дерева)
- кожа (1952: человека)
- плоть (1952 мясо, плоть)
- кровь
- кость
- смазка (1952: жир, органическое вещество)
- яйцо
- рог (бычий и т.п., не 1952) †
- хвост
- перо (большое, не пуховое)
- волосы (на голове человека)
- голова (анатомическая)
- ухо
- глаз
- нос
- рот
- зуб (передний, а не коренной)
- язык (анатомический)
- коготь (не в 1952) † 1
- ступня (не нога)
- колено (не 1952) †
- рука
- живот (нижняя часть тела, живот)
- шея (не затылок)
- грудь (женская; грудь 1955 года) †
- сердце
- печень
- пить (глагол)
- есть (глагол)
- укусить (глагол)
- видеть (глагол)
- слышать (глагол)
- знать (факты)
- спать (глагол)
- умереть (глагол)
- убить (глагол)
- плавать (глагол)
- летать (глагол)
- ходить (глагол)
- прийти (глагол)
- лежать (на боку, полулежать)
- сидеть (глагол)
- стоять (глагол)
- дать (глагол)
- сказать (глагол) †
- солнце
- луна (не 1952) †
- звезда
- вода (существительное)
- дождь (существительное, глагол 1952 г.)
- камень
- песок
- земля (почва)
- облако (не туман)
- дым (существительное, огня)
- огонь
- ясень (ы)
- гореть (непереходный глагол)
- тропа (дорога 1952 года, тропа; не улица)
- гора (не холм)
- красный (цвет)
- зеленый (цвет)
- желтый (цвет)
- белый (цвет)
- черный (цвет)
- ночь
- горячий (прилагательное; 1952 теплый, о погоде)
- холод (о погоде)
- полный †
- новый
- хороший
- круглый (не 1952) †
- сухое (вещество)
- имя
^ «Коготь» был добавлен только в 1955 году, но снова заменен многими известными специалистами на (finger)nail , поскольку выражения для «коготь» отсутствуют во многих старых, вымерших или малоизвестных языках.
Список Глобальной лексикостатистической базы данных , состоящий из 110 пунктов , использует оригинальный список Сводеша из 100 пунктов, а также 10 других слов из списка Сводеша–Яхонтова. [11]
Список Сводеша 207
Наиболее часто используемый в настоящее время список — это список Сводеша из 207 слов, адаптированный из Сводеша 1952 года. [3]
В Викисловаре («Списки Сводеша по языкам»), Panlex [12] [13] и в «Списке слов Сводеша индоевропейских языков» Палисто [14] можно найти сотни списков Сводеша в такой форме.
Более короткие списки
Список Сводеша –Яхонтова — это подмножество из 35 слов списка Сводеша, которое российский лингвист Сергей Яхонтов считал особенно стабильным примерно в 1960-х годах, хотя список был официально опубликован только в 1991 году. [15] Он использовался в лексикостатистике такими лингвистами, как Сергей Старостин . С их числами Сводеша они: [16]
- я
- вы (единственное число)
- этот
- ВОЗ
- что
- один
- два
- рыба
- собака
- вошь
- кровь
- кость
- яйцо
- рог
- хвост
- ухо
- глаз
- нос
- зуб
- язык
- рука
- знать
- умереть
- давать
- солнце
- луна
- вода
- соль
- камень
- ветер
- огонь
- год
- полный
- новый
- имя
Холман и др. (2008) обнаружили, что при определении связей между китайскими диалектами список Сводеша–Яхонтова был менее точным, чем исходный список Сводеша-100. Кроме того, они обнаружили, что другой (40-словный) список (также известный как список ASJP ) был таким же точным, как и список Сводеша-100. Однако они вычислили относительную стабильность слов, сравнив сохранение между языками в устоявшихся языковых семьях. Они не обнаружили статистически значимой разницы в корреляциях в семьях Старого и Нового Света.
Ниже представлен ранжированный список Сводеша-100 с числами Сводеша и относительной стабильностью (Холман и др., Приложение. Слова, отмеченные звездочкой, появляются в списке из 40 слов):
- 22 *вошь (42,8)
- 12 *два (39,8)
- 75 *вода (37,4)
- 39 *ухо (37.2)
- 61 *умереть (36,3)
- 1 *Я (35,9)
- 53 *печень (35,7)
- 40 *глаз (35,4)
- 48 *рука (34,9)
- 58 *слышать (33,8)
- 23 *дерево (33,6)
- 19 *рыба (33,4)
- 100 *имя (32.4)
- 77 *стоун (32,1)
- 43 *зуб (30,7)
- 51 *грудь (30,7)
- 2 *ты (30,6)
- 85 *путь (30.2)
- 31 *кость (30,1)
- 44 *язык (30.1)
- 28 *кожа (29,6)
- 92 *ночь (29,6)
- 25 *лист (29,4)
- 76 дождь (29.3)
- 62 убийства (29,2)
- 30 *кровь (29,0)
- 34 *рог (28,8)
- 18 *человек (28,7)
- 47 *колено (28,0)
- 11 *один (27,4)
- 41 *нос (27,3)
- 95 *полный (26,9)
- 66 *прийти (26.8)
- 74 *звезда (26.6)
- 86 *гора (26.2)
- 82 *огонь (25,7)
- 3 *мы (25.4)
- 54 *напиток (25.0)
- 57 *см. (24.7)
- 27 кора (24,5)
- 96 *новый (24.3)
- 21 *собака (24.2)
- 72 *солнце (24.2)
- 64 муха (24.1)
- 32 смазка (23,4)
- 73 луна (23.4)
- 70 дают (23.3)
- 52 сердце (23.2)
- 36 перьев (23,1)
- 90 белых (22,7)
- 89 желтый (22,5)
- 20 птиц (21,8)
- 38 голов (21,7)
- 79 земля (21,7)
- 46 футов (21,6)
- 91 черный (21,6)
- 42 рта (21,5)
- 88 зеленых (21.1)
- 60 сон (21,0)
- 7 что (20.7)
- 26 корень (20,5)
- 45 когтей (20,5)
- 56 укус (20,5)
- 83 золы (20,3)
- 87 красный (20.2)
- 55 едят (20.0)
- 33 яйца (19,8)
- 6 кто (19.0)
- 99 сухой (18,9)
- 37 волос (18,6)
- 81 дым (18,5)
- 8 нет (18.3)
- 4 это (18.2)
- 24 семени (18.2)
- 16 женщина (17,9)
- 98 раунд (17,9)
- 14 длинных (17,4)
- 69 стенд (17.1)
- 97 хорошо (16.9)
- 17 человек (16,7)
- 94 холодный (16.6)
- 29 плоть (16,4)
- 50 шея (16.0)
- 71 говорят (16.0)
- 84 ожога (15,5)
- 35 хвост (14,9)
- 78 песочный (14.9)
- 5 что (14.7)
- 65 ходьбы (14,4)
- 68 сидеть (14.3)
- 10 много (14.2)
- 9 всего (14.1)
- 59 знаю (14.1)
- 80 облаков (13,9)
- 63 плавание (13,6)
- 49 живот (13,5)
- 13 больших (13,4)
- 93 горячо (11.6)
- 67 ложь (11.2)
- 15 маленьких (6,3)
Языки жестов
Изучая жестовые языки Вьетнама и Таиланда , лингвист Джеймс Вудворд отметил, что традиционный список Сводеша, применяемый к разговорным языкам, не подходит для жестовых языков . Список Сводеша приводит к переоценке отношений между жестовыми языками из-за индексальных знаков, таких как местоимения и части тела. Модифицированный список выглядит следующим образом, в основном в алфавитном порядке: [17]
- все
- животное
- плохой
- потому что
- птица
- черный
- кровь
- ребенок
- считать
- день
- умереть
- грязный
- собака
- сухой
- тупой
- пыль
- земля
- яйцо
- смазка
- отец
- перо
- огонь
- рыба
- цветок
- хороший
- трава
- зеленый
- тяжелый
- как
- охота
- муж
- лед
- если
- убийство
- смех
- лист
- ложь
- жить
- длинный
- вошь
- мужчина
- мясо
- мать
- гора
- имя
- узкий
- новый
- ночь
- нет
- старый
- другой
- человек
- играть
- дождь
- красный
- правильный
- река
- веревка
- соль
- море
- острый
- короткий
- петь
- сидеть
- гладкий
- змея
- снег
- стоять
- звезда
- камень
- солнце
- хвост
- тонкий
- дерево
- рвота
- теплый
- вода
- влажный
- что
- когда
- где
- белый
- ВОЗ
- широкий
- жена
- ветер
- с
- женщина
- древесина
- червь
- год
- желтый
- полный
- луна
- брат
- кот
- танец
- свинья
- сестра
- работа
Смотрите также
- Другие списки
- Общий список английских слов — около 2000 наиболее употребительных английских слов.
- Список Долгопольского — 15 слов, которые меньше всего меняются по мере развития языков
- Список Лейпциг-Джакарта — 100 слов, устойчивых к заимствованию, используется для оценки хронологического разделения языков, призван улучшить список Сводеша.
- Приложение к спискам Сводеша в Викисловаре
- Проекты и базы данных
- Лингвистические концепции и области
- Когнат — слово, образованное от того же слова, что и другое
- Историческая лингвистика — изучение изменений языка с течением времени.
- Индоевропеистика — изучение индоевропейских языков и их гипотетического общего предка — праиндоевропейского языка.
- Праязык — предполагаемый предковый язык, от которого, как предполагается, произошла семья языков.
- Методы реконструкции языка
- Другой
- Списки Сводеша различных языков в Викисловаре
Примечания
- ↑ Сводеш 1950: 161
- ^ Лист, Ж.-М. (2018): К истории составления списков концептов в исторической лингвистике. История и философия языковых наук 5.10. URL
- ^ abc Swadesh 1952: 456–7 PDF
- ↑ Сводеш 1955: 125
- ^ ab Swadesh 1971: 283
- ^ Концептикон. дои : 10.5281/zenodo.19782
- ^ Лист, Ж.-М., М. Цису и Р. Форкель (2016): Concepticon. Ресурс для связывания списков концепций. В: Труды Десятой международной конференции по языковым ресурсам и оценке . 2393-2400. PDF
- ^ "IELex :: IELex". GitHub . Март 2022 г.
- ^ Мариса Лор (2000), «Новые подходы к лексикостатистике и глоттохронологии» в C. Renfrew, A. McMahon и L. Trask, ред. Time Depth in Historical Linguistics , том 1, стр. 209–223
- ^ Шейла Эмблтон (1992), в W. Bright, ред., Международная энциклопедия лингвистики , Oxford University Press, стр. 131
- ^ Старостин, Джордж (ред.) 2011-2019. Глобальная лексикостатистическая база данных . Москва: Высшая школа экономики , и Санта-Фе: Институт Санта-Фе . Доступ 2020-12-26.
- ^ Джонатан Пул (2016), Списки Сводеша Panlex PDF
- ^ Дэвид Камхольц, Джонатан Пул, Сьюзан Коловик (2014), PanLex: создание ресурса для панлингвального лексического перевода PDF
- ^ Палисто (2013), Список слов Сводеша индоевропейских языков .
- ^ Список концепций Яхонтов 1991 100. Concepticon . Доступ 2020-12-30.
- ^ Старостин 1991
- ^ Карен Эммори ; Харлан Л. Лейн (2000). Возвращение к знакам языка: антология в честь Урсулы Беллуджи и Эдварда Климы. Психология Пресс. стр. 20–21. ISBN 978-0-8058-3246-4. Получено 26 сентября 2011 г.
Ссылки
- Кэмпбелл, Лайл. (1998). Историческая лингвистика: Введение . Эдинбург: Издательство Эдинбургского университета. ISBN 0-262-53267-0 .
- Эмблтон, Шейла (1995). Обзор индоевропейской классификации: лексикостатистический эксперимент Исидора Дайена, Дж. Б. Крускала и П. Блэка. Монография TAPS 82–5, Филадельфия. в Diachronica Vol. 12, no. 2, 263–68.
- Гудщински, Сара. (1956). «Азбука лексикостатистики (глоттохронология)». Word , т. 12, 175–210.
- Хойер, Гарри. (1956). «Лексикостатистика: Критика». Язык , т. 32, 49–60.
- Холм, Ханс Дж. (2007). «Новый дендрарий индоевропейских «деревьев»: могут ли новые алгоритмы раскрыть филогению и даже предысторию индоевропейских языков?» Журнал количественной лингвистики , т. 14, 167–214.
- Холман, Эрик В., Сорен Вихманн, Сесил Х. Браун, Вивека Велупилаи, Андре Мюллер, Дик Баккер (2008). «Исследования в области автоматизированной классификации языков». Folia Linguistica , Vol. 42, нет. 2, 331–354
- Санкофф, Дэвид (1970). «О скорости замены отношений между словом и значением». Язык , т. 46, 564–569.
- Старостин, Сергей (1991). Алтайская проблема и происхождение японского языка. М.: Наука.
- Сводеш, Моррис. (1950). «Внутренние отношения салиш». Международный журнал американской лингвистики , т. 16, 157–167.
- Сводеш, Моррис. (1952). «Лексикостатистическое датирование доисторических этнических контактов». Труды Американского философского общества , т. 96, 452–463.
- Сводеш, Моррис. (1955). «К большей точности лексикостатистического датирования». Международный журнал американской лингвистики , т. 21, 121–137.
- Сводеш, Моррис. (1971). Происхождение и диверсификация языка . Ред. посмертно Джоэла Шерцера. Чикаго: Aldine. ISBN 0-202-01001-5 . Содержит окончательный список из 100 слов на стр. 283.
- Сводеш, Моррис и др. (1972). «Что такое глоттохронология?» в Моррисе Сводеше и Джоэле Шерцере, ред., Происхождение и диверсификация языка, стр. 271–284. Лондон: Routledge & Kegan Paul. ISBN 0-202-30841-3 .
- Виттман, Анри (1973). «Лексикостатистическая классификация креольских языков на основе французского». Лексикостатистика в генетической лингвистике: Труды Йельской конференции, 3–4 апреля 1971 г. , реж. Исидор Дайен, 89–99. La Haye: Mouton.[1]
Внешние ссылки
Найдите Приложение:Списки Сводеша в Викисловаре, бесплатном словаре.
- Лексико-семантические универсалии: критический обзор
- Проект Розетта
- Списки Сводеша языков коренных народов Бразилии
- Иллюстрированный блог по лингвистике и этимологии Стефана Штайнбаха