Лексическая плотность — это концепция компьютерной лингвистики , которая измеряет структуру и сложность человеческого общения на языке. [1] Лексическая плотность оценивает лингвистическую сложность письменного или устного произведения по функциональным словам (грамматическим единицам) и содержательным словам (лексическим единицам, лексемам ). Одним из методов расчета лексической плотности является вычисление отношения лексических единиц к общему количеству слов. Другой метод — вычислить соотношение лексических элементов к количеству более высоких структурных элементов в композиции, например, к общему количеству предложений в предложениях. [2] [3]
Лексическая плотность человека меняется с возрастом, образованием, стилем общения, обстоятельствами, необычными травмами или состоянием здоровья [4] и его или ее творческими способностями. Присущая человеческому языку и родному языку структура может влиять на лексическую плотность стиля письма и речи человека. Кроме того, после стадии раннего детства человеческое общение в письменной форме обычно более лексически более плотное, чем в устной форме. [5] [6] Лексическая плотность влияет на читаемость композиции и легкость, с которой слушатель или читатель может понять сообщение. [7] [8] Лексическая плотность также может влиять на запоминаемость и удержание предложения и сообщения. [9]
Лексическая плотность – это доля содержательных слов (лексических единиц) в данном дискурсе. Его можно измерить либо как отношение лексических единиц к общему количеству слов, либо как отношение лексических единиц к числу высших структурных единиц в предложениях (например, придаточных). [2] [3] Лексический элемент обычно представляет собой реальное содержание и включает существительные, глаголы, прилагательные и наречия. Грамматический элемент обычно представляет собой функциональный клей и нить, которые сплетают содержание и включают местоимения, союзы, предлоги, определители и определенные классы конечных глаголов и наречий. [5]
Лексическая плотность — один из методов, используемых в анализе дискурса, как описательный параметр, который варьируется в зависимости от регистра и жанра. Существует множество предложенных методов расчета лексической плотности любого произведения или корпуса. Лексическую плотность можно определить как:
В 1971 году Юр предложил следующую формулу для расчета лексической плотности предложения:
Бибер называет это соотношение «соотношением типа и токена». [10]
В 1985 году Холлидей пересмотрел знаменатель формулы Юра и предложил следующую формулу для расчета лексической плотности предложения: [1]
В некоторых формулировках предложенная Холлидеем лексическая плотность рассчитывается как простое соотношение без множителя «100». [2] [1]
Измерения лексической плотности могут различаться для одной и той же композиции в зависимости от того, как определяется «лексический элемент» и какие элементы классифицируются как лексические или грамматические элементы. Любая принятая методология, последовательно применяемая к различным композициям, обеспечивает лексическую плотность этих композиций. Обычно лексическая плотность письменного произведения выше, чем устного. [2] [3] По словам Юра, письменные формы человеческого общения на английском языке обычно имеют лексическую плотность выше 40%, тогда как устные формы, как правило, имеют лексическую плотность ниже 40%. [2] В обзоре исторических текстов, проведенном Майклом Стаббсом, типичная лексическая плотность художественной литературы колебалась от 40% до 54%, а документальной литературы - от 40% до 65%. [3] [11] [12]
Отношения и близость между участниками конкретного общения влияют на лексическую плотность, утверждает Уре, а также обстоятельства, предшествующие началу общения одного и того же говорящего или писателя. По ее мнению, более высокая лексическая плотность письменных форм общения обусловлена прежде всего тем, что письменные формы человеческого общения предполагают большую подготовку, размышление и пересмотр. [2] Человеческие дискуссии и разговоры, включающие или ожидающие обратной связи, как правило, менее редки и имеют меньшую лексическую плотность. Напротив, утверждают Стаббс и Бибер, инструкции, приказы правоохранительных органов, новости, читаемые с экранных подсказок в течение отведенного времени, и литература, которая, как ожидают авторы, будет доступна читателю для повторного чтения, имеют тенденцию максимизировать лексическую плотность. [2] [13] В исследованиях лексической плотности устного и письменного материала в разных европейских странах и возрастных группах Йоханссон и Стрёмквист сообщают, что лексическая плотность групп населения была одинаковой и зависела от морфологической структуры родного языка и внутри одного и того же языка. страны, выбранные возрастные группы. Лексическая плотность была самой высокой у взрослых, тогда как вариации, оцениваемые как лексическое разнообразие, утверждает Йоханссон, были выше у подростков той же возрастной группы (13-летние, 17-летние). [14] [15]