Compilation of concepts primarily for the purposes of lexicostatistics
Список Сводеша ( ) представляет собой компиляцию условно универсальных понятий для целей лексикостатистики . Переводы списка Сводеша на ряд языков позволяют исследователям количественно оценить взаимосвязь этих языков. Список Сводеша назван в честь лингвиста Морриса Сводеша . Используется в лексикостатистике (количественная оценка генеалогического родства языков) и глоттохронологии (датировка языковых расхождений). Поскольку существует несколько разных списков, некоторые авторы также называют «списки Сводеша».
Версии и авторы
Моррис Сводеш создал несколько версий своего списка. Он начал [1] со списка из 215 значений (ложно представленного в статье как список из 225 значений из-за орфографической ошибки [2] ), который он сократил до 165 слов для языка Салиш-Спокан-Калиспель . В 1952 году он опубликовал список из 215 значений, [3] из которых он предложил удалить 16 как неясные или неуниверсальные и добавить одно, чтобы получить 200 слов. В 1955 году [4] он писал: «Единственным решением кажется радикальное исключение из списка, при осознании того, что качество, по крайней мере, так же важно, как и количество. Даже новый список имеет недостатки, но они относительно незначительны и малочисленны». После незначительных исправлений окончательный список из 100 слов был опубликован посмертно в 1971 [5] и 1972 годах.
Другие версии списков лексикостатистических тестов были опубликованы, например, Робертом Лисом (1953), Джоном А. Ри (1958:145f), Деллом Хаймсом (1960:6), Э. Кроссом (1964 с 241 понятием), У.Дж. Самарином (1967:220f). ), Д. Уилсон (1969, 57 значений), Лайонел Бендер (1969), Р. Л. Освальд (1971), Уинфред П. Леманн (1984:35f), Д. Ринге (1992, пассим, разные версии), Сергей Старостин (1984). , passim, разные версии), Уильям С.Ю. Ван (1994), М. Лор (2000, 128 значений в 18 языках). Б. Кесслер (2002) и многие другие. Concepticon , [6] проект, размещенный в рамках проекта Cross-Linguistic Linked Data (CLLD), собирает различные списки понятий (включая классические списки Сводеша) в разных лингвистических областях и в разные эпохи, в настоящее время насчитывая 240 различных списков понятий. [7]
Часто используемая и широко доступная в Интернете версия Исидора Дьена (1992, 200 значений 95 языковых вариантов). С 2010 года команда Майкла Данна пытается обновить и расширить этот список. [8]
Принцип
Изначально слова в списках Сводеша были выбраны из-за их универсальной, культурно независимой доступности на максимально возможном количестве языков, независимо от их «стабильности». Тем не менее, стабильность полученного списка «универсальной» лексики при изменении языка и потенциальное использование этого факта для целей глоттохронологии анализировались многими авторами, в том числе Марисой Лор 1999, 2000. [9]
Список Сводеша составил Моррис Сводеш на основе своей интуиции. Подобные более поздние списки, такие как список Долгопольского (1964 г.) или список Лейпцига-Джакарты (2009 г.), основаны на систематических данных со многих разных языков, но они еще не так широко известны и не так широко используются, как список Сводеша.
Использование в лексикостатистике и глоттохронологии.
Списки лексикостатистических тестов используются в лексикостатистике для определения подгрупп языков, а также в глоттохронологии для «указания дат точек ветвления в дереве». [10] Задача определения (и подсчета количества) родственных слов в списке далеко не тривиальна и часто является предметом споров, поскольку родственные слова не обязательно выглядят одинаково, а распознавание родственных слов предполагает знание законов звучания . соответствующие языки.
Первоначальный окончательный список Swadesh 100
Окончательный список Сводеша, опубликованный в 1971 году [5] , содержит 100 терминов. Пояснения терминов можно найти в Swadesh 1952 [3] или, где отмечено крестиком ( † ), в Swadesh 1955. Обратите внимание, что только эта исходная последовательность проясняет правильное значение, которое теряется в алфавитном порядке, например, в корпус "27. кора" (изначально без добавленной здесь спецификации).
- Я (местоимение первого лица единственного числа)
- ты (местоимение второго лица единственного числа; 1952 ты и ты)
- мы (1955: включительно )
- этот
- что
- ВОЗ ? («?» не 1971 год)
- что ? («?» не 1971 год)
- нет
- все (из числа)
- много
- один
- два
- большой
- длинный (не широкий)
- маленький
- женщина
- мужчина (взрослый мужчина)
- человек (отдельный человек)
- рыба (существительное)
- птица
- собака
- вошь
- дерево (не бревно)
- семя (существительное)
- лист (ботаника)
- корень (ботаника)
- кора (дерева)
- кожа (1952: человека)
- плоть (1952 мясо, плоть)
- кровь
- кость
- жир (1952: жир, органическое вещество)
- яйцо
- рог (быка и т. д., не 1952 г.) †
- хвост
- перо (большое, не пуховое)
- волосы (на голове человека)
- голова (анатомическая)
- ухо
- глаз
- нос
- рот
- зуб (передний, а не коренной)
- язык (анатомический)
- коготь (не в 1952 г.) † 1
- нога (не нога)
- колено (не 1952 г.) †
- рука
- живот (нижняя часть тела, живот)
- шея (не затылок)
- грудь (женщина; грудь 1955 г.) †
- сердце
- печень
- пить (глагол)
- есть (глагол)
- укусить (глагол)
- видеть (глагол)
- услышать (глагол)
- знать (факты)
- спать (глагол)
- умереть (глагол)
- убить (глагол)
- плавать (глагол)
- летать (глагол)
- ходить (глагол)
- прийти (глагол)
- лежать (на боку, откинуться)
- сидеть (глагол)
- стоять (глагол)
- дать (глагол)
- сказать (глагол) †
- солнце
- луна (не 1952 г.) †
- звезда
- вода (существительное)
- дождь (существительное, глагол 1952 г.)
- камень
- песок
- земля (почва)
- облако (не туман)
- дым (существительное, огня)
- огонь
- ясень (а)
- сжечь (глагол непереходный)
- путь (1952 дорога, тропа; не улица)
- гора (не холм)
- красный цвет)
- зеленого цвета)
- желтого цвета)
- белый цвет)
- черный цвет)
- ночь
- горячий (прилагательное; 1952 теплый, о погоде)
- холодно (о погоде)
- полный †
- новый
- хороший
- раунд (не 1952 г.) †
- сухой (вещество)
- имя
^ «Коготь» был добавлен только в 1955 году, но снова заменен многими известными специалистами на (пальцевый) ноготь , поскольку выражения для «коготь» недоступны во многих старых, вымерших или менее известных языках.
В списке Глобальной лексикостатистической базы данных из 110 элементов используется исходный список Сводеша из 100 элементов в дополнение к 10 другим словам из списка Сводеша-Яхонтова. [11]
Список Сводеша 207
В настоящее время наиболее часто используемым списком является список Сводеша из 207 слов, адаптированный из Сводеша 1952 года. [3]
В Викисловаре («Списки Сводеша по языкам»), Panlex [12] [13] и в «Списке слов Сводеша индоевропейских языков» Палисто [14] можно найти сотни списков Сводеша в этой форме.
Shorter lists
The Swadesh–Yakhontov list is a 35-word subset of the Swadesh list posited as especially stable by Russian linguist Sergei Yakhontov around the 1960s, although the list was only officially published in 1991.[15] It has been used in lexicostatistics by linguists such as Sergei Starostin. With their Swadesh numbers, they are:[16]
- I
- you (singular)
- this
- who
- what
- one
- two
- fish
- dog
- louse
- blood
- bone
- egg
- horn
- tail
- ear
- eye
- nose
- tooth
- tongue
- hand
- know
- die
- give
- sun
- moon
- water
- salt
- stone
- wind
- fire
- year
- full
- new
- name
Holman et al. (2008) found that in identifying the relationships between Chinese dialects the Swadesh–Yakhontov list was less accurate than the original Swadesh-100 list. Further they found that a different (40-word) list (also known as the ASJP list) was just as accurate as the Swadesh-100 list. However, they calculated the relative stability of the words by comparing retentions between languages in established language families. They found no statistically significant difference in the correlations in the families of the Old versus the New World.
The ranked Swadesh-100 list, with Swadesh numbers and relative stability, is as follows (Holman et al., Appendix. Asterisked words appear on the 40-word list):
- 22 *louse (42.8)
- 12 *two (39.8)
- 75 *water (37.4)
- 39 *ear (37.2)
- 61 *die (36.3)
- 1 *I (35.9)
- 53 *liver (35.7)
- 40 *eye (35.4)
- 48 *hand (34.9)
- 58 *hear (33.8)
- 23 *tree (33.6)
- 19 *fish (33.4)
- 100 *name (32.4)
- 77 *stone (32.1)
- 43 *tooth (30.7)
- 51 *breasts (30.7)
- 2 *you (30.6)
- 85 *path (30.2)
- 31 *bone (30.1)
- 44 *tongue (30.1)
- 28 *skin (29.6)
- 92 *night (29.6)
- 25 *leaf (29.4)
- 76 rain (29.3)
- 62 kill (29.2)
- 30 *blood (29.0)
- 34 *horn (28.8)
- 18 *person (28.7)
- 47 *knee (28.0)
- 11 *one (27.4)
- 41 *nose (27.3)
- 95 *full (26.9)
- 66 *come (26.8)
- 74 *star (26.6)
- 86 *mountain (26.2)
- 82 *fire (25.7)
- 3 *we (25.4)
- 54 *drink (25.0)
- 57 *see (24.7)
- 27 bark (24.5)
- 96 *new (24.3)
- 21 *dog (24.2)
- 72 *sun (24.2)
- 64 fly (24.1)
- 32 grease (23.4)
- 73 moon (23.4)
- 70 give (23.3)
- 52 heart (23.2)
- 36 feather (23.1)
- 90 white (22.7)
- 89 yellow (22.5)
- 20 bird (21.8)
- 38 head (21.7)
- 79 earth (21.7)
- 46 foot (21.6)
- 91 black (21.6)
- 42 mouth (21.5)
- 88 green (21.1)
- 60 sleep (21.0)
- 7 what (20.7)
- 26 root (20.5)
- 45 claw (20.5)
- 56 bite (20.5)
- 83 ash (20.3)
- 87 red (20.2)
- 55 eat (20.0)
- 33 egg (19.8)
- 6 who (19.0)
- 99 dry (18.9)
- 37 hair (18.6)
- 81 smoke (18.5)
- 8 not (18.3)
- 4 this (18.2)
- 24 seed (18.2)
- 16 woman (17.9)
- 98 round (17.9)
- 14 long (17.4)
- 69 stand (17.1)
- 97 good (16.9)
- 17 man (16.7)
- 94 cold (16.6)
- 29 flesh (16.4)
- 50 neck (16.0)
- 71 say (16.0)
- 84 burn (15.5)
- 35 tail (14.9)
- 78 sand (14.9)
- 5 that (14.7)
- 65 walk (14.4)
- 68 sit (14.3)
- 10 many (14.2)
- 9 all (14.1)
- 59 know (14.1)
- 80 cloud (13.9)
- 63 swim (13.6)
- 49 belly (13.5)
- 13 big (13.4)
- 93 hot (11.6)
- 67 lie (11.2)
- 15 small (6.3)
Sign languages
In studying the sign languages of Vietnam and Thailand, linguist James Woodward noted that the traditional Swadesh list applied to spoken languages was unsuited for sign languages. The Swadesh list results in overestimation of the relationships between sign languages, due to indexical signs such as pronouns and parts of the body. The modified list is as follows, in largely alphabetical order:[17]
- all
- animal
- bad
- because
- bird
- black
- blood
- child
- count
- day
- die
- dirty
- dog
- dry
- dull
- dust
- earth
- egg
- grease
- father
- feather
- fire
- fish
- flower
- good
- grass
- green
- heavy
- how
- hunt
- husband
- ice
- if
- kill
- laugh
- leaf
- lie
- live
- long
- louse
- man
- meat
- mother
- mountain
- name
- narrow
- new
- night
- not
- old
- other
- person
- play
- rain
- red
- correct
- river
- rope
- salt
- sea
- sharp
- short
- sing
- sit
- smooth
- snake
- snow
- stand
- star
- stone
- sun
- tail
- thin
- tree
- vomit
- warm
- water
- wet
- what
- when
- where
- white
- who
- wide
- wife
- wind
- with
- woman
- wood
- worm
- year
- yellow
- full
- moon
- brother
- cat
- dance
- pig
- sister
- work
See also
- Other lists
- Projects and databases
- Linguistic concepts and fields
- Cognate — a word derived from the same word as another
- Historical linguistics — the study of language change over time
- Indo-European studies — the study of Indo-European languages and their hypothetical common ancestor, Proto-Indo-European
- Proto-language — a postulated ancestral language from which a family of languages is presumed to have evolved
- Methods of language reconstruction
- Comparative method — feature-by-feature comparison of related languages to reconstruct their development and common ancestor
- Mass lexical comparison — a controversial method, seen as a rival to the comparative method, to determine the relatedness of languages
- Internal reconstruction — reconstruction of an earlier state of a language without comparing it to other languages
- Other
- Basic English — a simplified form of English for communication and learning
- Swadesh lists of various languages on wiktionary
Notes
- ^ Swadesh 1950: 161
- ^ List, J.-M. (2018): Towards a history of concept list compilation in historical linguistics. History and Philosophy of the Language Sciences 5.10. URL
- ^ a b c Swadesh 1952: 456–7 PDF
- ^ Swadesh 1955: 125
- ^ a b Swadesh 1971: 283
- ^ Concepticon. doi:10.5281/zenodo.19782
- ^ List, J.-M., M. Cysouw, and R. Forkel (2016): Concepticon. A resource for the linking of concept lists. In: Proceedings of the Tenth International Conference on Language Resources and Evaluation. 2393-2400. PDF
- ^ "IELex :: IELex". GitHub. March 2022.
- ^ Marisa Lohr (2000), "New Approaches to Lexicostatistics and Glottochronology" in C. Renfrew, A. McMahon and L. Trask, ed. Time Depth in Historical Linguistics, Vol. 1, pp. 209–223
- ^ Sheila Embleton (1992), in W. Bright, ed., International Encyclopaedia of Linguistics, Oxford University Press, p. 131
- ^ Starostin, George (ed.) 2011-2019. The Global Lexicostatistical Database. Moscow: Higher School of Economics, & Santa Fe: Santa Fe Institute. Accessed on 2020-12-26.
- ^ Jonathan Pool (2016), Panlex Swadesh Lists PDF
- ^ David Kamholz, Jonathan Pool, Susan Colowick (2014), PanLex: Building a Resource for Panlingual Lexical Translation PDF
- ^ Palisto (2013), Swadesh Word List of Indo-European languages .
- ^ Concept list Yakhontov 1991 100. Concepticon. Accessed 2020-12-30.
- ^ Starostin 1991
- ^ Karen Emmorey; Harlan L. Lane (2000). The Signs of Language Revisited: An Anthology to Honor Ursula Bellugi and Edward Klima. Psychology Press. pp. 20–21. ISBN 978-0-8058-3246-4. Retrieved 26 September 2011.
References
- Campbell, Lyle. (1998). Historical Linguistics: An Introduction. Edinburgh: Edinburgh University Press. ISBN 0-262-53267-0.
- Embleton, Sheila (1995). Review of An Indo-European Classification: A Lexicostatistical Experiment by Isidore Dyen, J.B. Kruskal and P.Black. TAPS Monograph 82–5, Philadelphia. in Diachronica Vol. 12, no. 2, 263–68.
- Gudschinsky, Sarah. (1956). "The ABCs of Lexicostatistics (Glottochronology)." Word, Vol. 12, 175–210.
- Hoijer, Harry. (1956). "Lexicostatistics: A Critique." Language, Vol. 32, 49–60.
- Holm, Hans J. (2007). "The New Arboretum of Indo-European 'Trees': Can New Algorithms Reveal the Phylogeny and Even Prehistory of Indo-European?" Journal of Quantitative Linguistics, Vol. 14, 167–214.
- Holman, Eric W., Søren Wichmann, Cecil H. Brown, Viveka Velupillai, André Müller, Dik Bakker (2008). "Explorations in Automated Language Classification". Folia Linguistica, Vol. 42, no. 2, 331–354
- Sankoff, David (1970). "On the Rate of Replacement of Word-Meaning Relationships." Language, Vol. 46, 564–569.
- Starostin, Sergei (1991). Altajskaja Problema i Proisxozhdenie Japonskogo Jazyka [The Altaic Problem and the Origin of the Japanese Language]. Moscow: Nauka
- Swadesh, Morris. (1950). "Salish Internal Relationships." International Journal of American Linguistics, Vol. 16, 157–167.
- Swadesh, Morris. (1952). "Lexicostatistic Dating of Prehistoric Ethnic Contacts." Proceedings of the American Philosophical Society, Vol. 96, 452–463.
- Swadesh, Morris. (1955). "Towards Greater Accuracy in Lexicostatistic Dating." International Journal of American Linguistics, Vol. 21, 121–137.
- Swadesh, Morris. (1971). The Origin and Diversification of Language. Ed. post mortem by Joel Sherzer. Chicago: Aldine. ISBN 0-202-01001-5. Contains final 100-word list on p. 283.
- Swadesh, Morris, et al. (1972). "What is Glottochronology?" in Morris Swadesh and Joel Sherzer, ed., The Origin and Diversification of Language, pp. 271–284. London: Routledge & Kegan Paul. ISBN 0-202-30841-3.
- Wittmann, Henri (1973). "The Lexicostatistical Classification of the French-Based Creole Languages." Lexicostatistics in Genetic Linguistics: Proceedings of the Yale Conference, April 3–4, 1971, dir. Isidore Dyen, 89–99. La Haye: Mouton.[1]
External links
Look up Appendix:Swadesh lists in Wiktionary, the free dictionary.
- Lexico-semantic universals: A critical overview
- Rosetta project
- Swadesh Lists of Brazilian Native Languages
- Illustrated linguistic and etymology blog by Stephan Steinbach