Словарь (также известный как лексикон ) — это набор слов , обычно набор слов на языке или набор , известный отдельному человеку. Слово словарь произошло от латинского vocabulum , что означает «слово, имя». Он является важным компонентом языка и общения , помогая передавать мысли, идеи, эмоции и информацию. Словарный запас может быть устным , письменным или жестовым , и его можно разделить на два основных типа: активный словарный запас (слова, которые человек использует регулярно) и пассивный словарный запас (слова, которые человек узнает, но не использует часто). Словарный запас человека постоянно расширяется с помощью различных методов, включая прямое обучение , самостоятельное чтение и изучение естественного языка, но он также может сокращаться из-за забывания , травмы или болезни . Кроме того, словарный запас является важным предметом изучения в различных дисциплинах, таких как лингвистика , образование , психология и искусственный интеллект . Словарный запас не ограничивается отдельными словами; он также включает в себя многословные единицы, известные как словосочетания , идиомы и другие типы фразеологии. Приобретение адекватного словарного запаса является одной из самых больших проблем в изучении второго языка .
Словарный запас обычно относится к набору слов, которые человек знает и использует на определенном языке. [1] Это фундаментальный аспект овладения языком и развития грамотности.
В лингвистике под словарным запасом понимаются все слова языка или лексического репертуара человека. Он охватывает как пассивный словарь говорящего, включающий слова, которые он узнает или понимает, так и его активный словарный запас, включающий слова, которые он регулярно использует в устной и письменной речи. [2]
В контексте образования словарный запас относится к совокупности слов, включая их значения и использование, которые учащийся изучает и использует. Приобретение словарного запаса является центральным аспектом языкового образования, поскольку оно напрямую влияет на понимание прочитанного, экспрессивные и рецептивные языковые навыки, а также академическую успеваемость. [3]
В психологии, особенно в когнитивной психологии, словарный запас понимается как мера языковой обработки и когнитивного развития. Он может служить индикатором интеллектуальных способностей или когнитивного статуса, при этом словарные тесты часто являются частью интеллекта и нейропсихологических оценок . [4]
В компьютерной лингвистике и искусственном интеллекте словарь — это заранее определенный набор слов, используемый для задач обработки естественного языка , таких как распознавание речи или анализ текста . В моделях машинного обучения словарь — это набор уникальных слов из набора обучающих данных, который составляет основу для извлечения признаков и обучения модели . [5]
В семиотике словарь относится к полному набору символов и знаков в знаковой системе или тексте, что расширяет определение за пределы чисто вербального общения и включает в себя другие формы символического общения. [6]
Слово имеет множество значений, и наше понимание таких понятий, как размер словарного запаса, различается в зависимости от используемого определения.
Наиболее распространенное определение приравнивает слова к леммам (изменяемая или словарная форма; сюда входит прогулка , но не прогулки, шел или ходьба ). В большинстве случаев леммы не включают имена собственные (имена людей, мест, компаний и т. д.). Другое определение, часто используемое при исследовании размера словарного запаса, — это словосемейство . Это все слова, которые могут быть образованы от основного слова (например, слова « без усилий», «без усилий», «усилие», «с усилием» — все они являются частью слова «семейные усилия» ). Оценки размера словарного запаса варьируются от 200 тысяч до 10 тысяч, в зависимости от используемого определения. [7]
Различие между типом и токеном — это лингвистическая концепция, которая относится к подсчету или измерению слов в тексте. Он полезен для изучения языка и дискурса, оценки сложности и богатства словарного запаса или для определенных вычислительных приложений.
Количество токенов в тексте — это общее количество слов без учета их уникальности. Каждое отдельное появление слова учитывается отдельно, поэтому, если слово повторяется, учитывается каждый экземпляр. Например, в предложении, которое я услышал, когда вы позвонили своему сыну , есть восемь токенов. Это потому, что имеется восемь отдельных слов ( я , слышал , ты , когда , ты , звал , твой , сын ).
В число типов входят только уникальные слова, обычно это уникальные леммы. Если лемма встречается в тексте несколько раз, при подсчете типов она учитывается только один раз. Итак, в том же предложении, которое я услышал от вас, когда вы позвонили своему сыну , есть шесть типов. Это потому, что в предложении шесть уникальных лемм ( Я , слышал , тебя , когда , звал , сын ). Лемма you учитывается только один раз, несмотря на то, что слова you , you и your встречаются в предложении трижды .
Первое важное различие, которое необходимо сделать при оценке знания слов, заключается в том, является ли знание продуктивным (также называемым достижением или активным) или восприимчивым (также называемым получением или пассивным); даже внутри этих противоположных категорий зачастую нет четкого различия. Слова, которые обычно понятны, когда их слышат, читают или видят, составляют восприимчивый словарный запас человека. Эти слова могут варьироваться от хорошо известных до едва известных (см. степень знания ниже). Рецептивный словарь человека обычно больше из двух. Например, хотя маленький ребенок еще не умеет говорить, писать или жестикулировать, он может выполнять простые команды и понимать значительную часть языка, с которым он сталкивается. В этом случае рецептивный словарный запас ребенка, вероятно, составляет десятки, а то и сотни слов, а активный словарный запас равен нулю. Однако когда ребенок учится говорить или жестикулировать, его активный словарный запас начинает увеличиваться. Продуктивный словарный запас также может быть больше, чем рецептивный, например, у изучающего второй язык, который выучил слова посредством изучения, а не воздействия, и может их произносить, но испытывает трудности с распознаванием их в разговоре.
Таким образом, продуктивная лексика обычно относится к словам, которые могут быть созданы в соответствующем контексте и соответствовать предполагаемому значению говорящего или подписывающего лица. Однако, как и в случае с рецептивным словарем, существует множество степеней, на которых конкретное слово может считаться частью активного словаря. Знание того, как произносить, подписывать или писать слово, не обязательно означает, что использованное слово правильно или точно отражает предполагаемое сообщение; но оно отражает минимальный объем продуктивных знаний.
В пределах рецептивного и продуктивного различия лежит ряд способностей, которые часто называют степенью знаний . Это просто указывает на то, что слово постепенно входит в словарный запас человека с течением времени по мере изучения новых аспектов знания слова. Условно эти этапы можно описать так:
Различные степени знания слов подразумевают большую глубину знаний , но процесс является более сложным. Знание слова имеет множество аспектов, некоторые из которых не являются иерархическими, поэтому их освоение не обязательно следует линейной прогрессии, предполагаемой степенью знания . Для лучшей реализации этой концепции было предложено несколько рамок знания слов. Одна из таких рамок включает девять аспектов:
Перечислено в порядке от наиболее обширного к наиболее ограниченному: [8] [9]
Читательский словарь человека – это все слова, распознаваемые при чтении. Этот класс словарного запаса, как правило, наиболее обширен, поскольку новые слова чаще встречаются при чтении, чем при прослушивании.
Словарный запас человека включает в себя слова, распознаваемые при прослушивании речи. Такие сигналы, как тон и жесты говорящего, тема обсуждения и социальный контекст разговора, могут передавать значение незнакомого слова.
Речевой словарь человека включает слова, используемые в речи , и обычно является подмножеством словарного запаса слушающего. Из-за спонтанного характера речи слова часто используются незначительно и непреднамеренно, но выражение лица и тон голоса могут компенсировать это неправильное употребление.
Письменное слово появляется в таких разных реестрах, как официальные эссе и ленты в социальных сетях. Хотя многие письменные слова редко встречаются в речи, письменный словарный запас человека обычно ограничен предпочтениями и контекстом: писатель может предпочитать один синоним другому, и он вряд ли будет использовать техническую лексику, относящуюся к предмету, который его не интересует или не интересует. знание.
Американский философ Ричард Рорти охарактеризовал «окончательный словарный запас» человека следующим образом:
Все люди имеют при себе набор слов, которые они используют для оправдания своих действий, своих убеждений и своей жизни. Это слова, в которых мы формулируем похвалу нашим друзьям и презрение к нашим врагам, нашим долгосрочным проектам, нашим глубочайшим сомнениям в себе и нашим самым большим надеждам… Я назову эти слова «последним словарем человека». Эти слова - это все, что он может сделать с языком; за ними остается только беспомощная пассивность или применение силы. ( Непредвиденные обстоятельства, ирония и солидарность, стр. 73) [10]
В младенчестве ребенок инстинктивно пополняет словарный запас. Младенцы имитируют слова, которые они слышат, а затем связывают эти слова с предметами и действиями. Это словарь слушания. За этим следует разговорный словарный запас, поскольку мысли ребенка становятся все более зависимыми от его способности самовыражаться, не полагаясь на жесты или лепет. Как только словарный запас для чтения и письма начинает развиваться посредством вопросов и обучения , ребенок начинает обнаруживать аномалии и нарушения речи.
В первом классе ребенок, умеющий читать, запоминает примерно в два раза больше слов, чем не умеющий. Как правило, этот разрыв в дальнейшем не сокращается. Это приводит к расширению словарного запаса к пяти-шести годам, когда англоговорящий ребенок выучит около 1500 слов. [11]
Словарный запас растет на протяжении всей жизни. В возрасте от 20 до 60 лет люди изучают примерно на 6000 больше лемм или по одной через день. [12] Среднестатистический 20-летний человек знает 42 000 лемм из 11 100 словесных семейств. [12] Люди расширяют свой словарный запас, например, читая, играя в словесные игры и участвуя в программах, связанных со словарным запасом. Знакомство с традиционными печатными СМИ учит правильному правописанию и словарному запасу, а общение с текстовыми сообщениями приводит к более мягким ограничениям приемлемости слов. [13]
Оценка среднего размера словарного запаса сопряжена с различными трудностями и ограничениями из-за разных определений и используемых методов, например, что это за слово, что нужно знать, какие словари-образцы использовались, как проводились тесты и так далее. [12] [16] [17] [18] Словарный запас носителей языка также сильно различается в пределах языка и зависит от уровня образования говорящего.
В результате оценки варьируются от 10 000 до 17 000 семейств слов [16] [19] или от 17 000 до 42 000 словарных слов для молодых людей, носителей английского языка. [12] [17]
Исследование 2016 года показывает, что 20-летние носители английского языка узнают в среднем 42 000 лемм : от 27 100 для самых низких 5% населения до 51 700 лемм для самых высоких 5%. Эти леммы взяты из 6100 семейств слов из самых низких 5% населения и из 14 900 словесных семейств из самых высоких 5%. 60-летние знают в среднем на 6000 лемм больше.[12]
Согласно другому мнению, в начале 1995 года учащиеся младших классов средней школы могли распознавать значения примерно 10 000–12 000 слов, тогда как для студентов колледжей это число вырастает примерно до 12 000–17 000, а для пожилых людей - примерно до 17 000 и более. [20]
У носителей немецкого языка средний абсолютный объем словарного запаса колеблется от 5900 лемм в первом классе до 73 000 у взрослых. [21]
Знание 3000 наиболее часто встречающихся семейств английских слов или 5000 наиболее часто встречающихся слов обеспечивает 95% словарный запас устной речи. [22] Для минимального понимания прочитанного был предложен порог в 3000 семейств слов (5000 лексических единиц) [23] [24] , а для чтения для удовольствия требуется 5000 семейств слов (8000 лексических единиц). [25] «Оптимальный» порог в 8000 семейств слов дает охват 98% (включая имена собственные). [24]
Изучение словарного запаса является одним из первых шагов в изучении второго языка, но учащийся никогда не заканчивает приобретение словарного запаса. Приобретение нового словарного запаса — это непрерывный процесс, будь то на родном языке или на втором языке. Существует множество техник, которые помогают приобрести новый словарный запас.
Хотя запоминание может показаться утомительным или скучным, связывание одного слова на родном языке с соответствующим словом на втором языке до тех пор, пока оно не будет заучено, считается одним из лучших методов пополнения словарного запаса. К тому времени, когда ученики достигают совершеннолетия, они, как правило, владеют рядом индивидуальных методов запоминания. Хотя многие утверждают, что запоминание обычно не требует сложной когнитивной обработки, которая увеличивает запоминание (Sagarra and Alba, 2006), [26] оно обычно требует большого количества повторений, а интервальное повторение с помощью карточек является устоявшимся методом запоминания, особенно используется для приобретения словарного запаса при изучении языка с помощью компьютера . Другие методы обычно требуют больше времени и времени на припоминание.
Некоторые слова невозможно легко связать посредством ассоциации или других методов. Когда слово на втором языке фонологически или визуально похоже на слово на родном языке, часто предполагается, что они также имеют схожие значения . Хотя это часто бывает, это не всегда так. Когда вы сталкиваетесь с ложным другом , запоминание и повторение являются ключом к мастерству. Если изучающий второй язык при изучении нового словарного запаса полагается исключительно на словесные ассоциации, ему будет очень трудно освоить ложных друзей. Когда необходимо освоить большой словарный запас за ограниченный промежуток времени, когда учащемуся необходимо быстро вспомнить информацию, когда слова представляют собой абстрактные понятия или их трудно представить в мысленном образе, или когда можно отличить ложных друзей, механическое запоминание является метод использования. Недавно была представлена нейросетевая модель изучения новых слов в разных орфографиях, учитывающая специфичные для L1 способности к запоминанию у изучающих L2 (Hadzibeganovic and Cannas, 2009). [27]
Один из способов изучения словарного запаса — использование мнемонических приемов или создание ассоциаций между словами. Этот метод известен как «метод ключевых слов» (Sagarra and Alba, 2006). [26] Это также требует много времени для реализации – и требует много времени, чтобы вспомнить – но поскольку это объединяет несколько новых странных идей, это может помочь в обучении. [26] Также она, по-видимому, не противоречит системе двойного кодирования Пайвио [28] , поскольку она использует визуальные и вербальные умственные способности. Тем не менее, это лучше всего использовать для слов, обозначающих конкретные вещи, поскольку абстрактные понятия труднее запомнить. [26]
Было разработано несколько списков слов, чтобы предоставить людям с ограниченным словарным запасом возможность быстрого овладения языком или эффективного общения. К ним относятся базовый английский (850 слов), специальный английский (1500 слов), список общих услуг (2000 слов) и список академических слов . В некоторых словарях учащихся разработаны определяющие словари , которые содержат только наиболее распространенные и основные слова. В результате определения слов в таких словарях могут быть понятны даже учащимся с ограниченным словарным запасом. [29] [30] [31] Некоторые издатели создают словари на основе частоты слов [32] или тематических групп. [33] [34] [35]
Список Сводеша был составлен для исследования в области лингвистики .
Фокусная лексика — это специализированный набор терминов и различий, который особенно важен для определенной группы: людей с определенной направленностью опыта или деятельности. Лексикон или словарный запас — это словарь языка: набор названий вещей, событий и идей. Некоторые лингвисты полагают, что лексика влияет на восприятие вещей людьми, гипотеза Сепира-Уорфа . Например, у нуэров Судана есть сложный словарный запас для описания крупного рогатого скота. У нуэров есть десятки названий крупного рогатого скота из-за его особой истории, экономики и окружающей среды [ необходимы разъяснения ] . Такого рода сравнения вызвали некоторые лингвистические разногласия, например, по поводу количества « эскимосских слов, обозначающих снег ». Носители английского языка, обладающие соответствующими специальными знаниями, также могут использовать сложные и точные словари для снега и крупного рогатого скота, когда в этом возникает необходимость. [36] [37]