В лингвистике термин lexis (от древнегреческого : λέξις 'слово') обозначает полный набор всех возможных слов в языке или определенное подмножество слов, которые сгруппированы по некоторым определенным лингвистическим критериям. Например, общий термин English lexis относится ко всем словам английского языка , [1] в то время как более конкретный термин English religious lexis относится к определенному подмножеству в пределах английского lexis, охватывающему только слова, которые семантически связаны с религиозной сферой жизни. [2]
В системно-функциональной лингвистике лексика или лексическая единица — это способ, которым называют определенную вещь или тип явления. Поскольку лексика с системно-функциональной точки зрения — это способ вызова, она может быть реализована несколькими грамматическими словами, такими как «Белый дом», «Нью-Йорк» или «сердечный приступ». Более того, поскольку лексика — это способ вызова, разные слова, такие как child , children , child 's и children's, могут реализовывать одну и ту же лексическую единицу.
Лексическая группировка может быть:
Основная область исследований, психолингвистика и нейролингвистика , включает в себя вопрос о том, как слова извлекаются из ментального лексического корпуса в процессе обработки и производства языка в режиме онлайн. Например, когортная модель пытается описать лексический поиск в терминах сегментной активации конкурирующих лексических записей. [3] [4]
В последние годы составление языковых баз данных с использованием реальных образцов из устной и письменной речи позволило исследователям по-новому взглянуть на состав языков. Среди прочего, статистические методы исследования предлагают надежное понимание способов взаимодействия слов. Наиболее интересные результаты были получены в дихотомии между использованием языка (как язык используется) и использованием языка (как язык мог бы использоваться).
Использование языка показывает, какие вхождения слов и их партнеров наиболее вероятны. Главным открытием этого исследования является то, что пользователи языка в очень большой степени полагаются на готовые языковые « лексические куски », которые можно легко комбинировать для формирования предложений. Это устраняет необходимость для говорящего анализировать каждое предложение грамматически, но при этом эффективно справляется с ситуацией. Типичные примеры включают «Я понимаю, что вы имеете в виду» или «Не могли бы вы передать мне...» или «Недавние исследования показывают, что...»
С другой стороны, использование языка — это то, что происходит, когда готовые фрагменты не удовлетворяют непосредственным потребностям говорящего; другими словами, новое предложение вот-вот будет сформировано и должно быть проанализировано на предмет правильности. Правила грамматики были усвоены носителями языка, что позволяет им определять жизнеспособность новых предложений. Использование языка можно определить как запасной вариант, когда все другие варианты исчерпаны.
При статистическом анализе структуры языка полезно начать с высокочастотных контекстных слов или так называемых ключевых слов в контексте (KWIC). После того, как миллионы образцов устной и письменной речи были сохранены в базе данных, эти KWIC можно отсортировать и проанализировать на предмет их сопутствующего текста или слов, которые обычно встречаются вместе с ними. Ценные принципы, с помощью которых можно анализировать KWIC, включают:
После сбора данных их можно отсортировать для определения вероятности совпадений. Один из распространенных и хорошо известных способов — с помощью конкорданса : KWIC центрируется и показывается с десятками примеров его использования, как в примере для «возможности» ниже.
Вот-вот будет надет, выглядит реальной возможностью. Теперь, когда Бенн больше не Хиетт говорит, что это остается реальной возможностью: как часть ООП, ФОП «Грэм добавил. Это тоже возможно», — признал Уитлок. Сильная боль всегда была возможна. В начале века, как что, когда это возможно, любая другая возможность, включая выступления внешних что мы можем, что мы используем каждую возможность, включая каждую возможность можно было бы сдать отдельно. Другая возможность - это "конструктивный вандализм" народ отвергает насилие и возможность насилия может возможность французы голосуют и теперь имеют возможность выиграть два места в немедленно расследовать возможность предъявления ей уголовных обвинений и Источники из Шри-Ланки говорят, что возможность переговоров с тамильцами В шейхствах также может существовать возможность поощрения волнений. двенадцати государств-членов о возможности их угрозы Мари уже рассматривала возможность убедить [f] функция зависимости, но возможность капиталистического развития, были почти беззащитны. Возможность вторжения была очевидна странно и беспокоятся о возможности употребления наркотиков, так и скажите. Скажите им впервые был созван для обсуждения возможности государственного переворота с целью возвращения по линии МИ5 и в возможности использования государства для очернения Причинами этого шага была возможность появления нового рынка. Дешевые терминалы быть оценены индивидуально. Возможность генетического тестирования приносит это учитывая привилегию. Другая возможность, конечно, заключается в том, что прогулка Все это подрывает возможность экономических реформ и требует получить. (Зная, что нет возможности совершить половой акт, который был откровенно циничен в отношении возможности достижения социализма 5 чтобы они могли осознать возможность быть гражданами, вовлеченными в отравление и пожар, сталкиваясь с возможностью собственной смерти, чтобы просто быть вчерашний слух о возможности использования агентства для сбора в 1903 году, и я не вижу возможности заменить это. Машина, которую мы здесь действует генетический фактор, возможность которого подтверждается по крайней мере несколькими отказался даже допустить возможность того, что какая-либо из наций имеет долгую историю, есть вероятность, что недавний всплеск Полиция расследует возможность того, что ее видели некоторое время. любые врачи, которые считают, что существует вероятность, что они могли быть инфицированы находитесь в магазине, есть большая вероятность, что вы пользуетесь увлажняющим кремом Жить надо зарабатывать. Возможность того, что молодой человек будет он завершил свой рассказ о возможности контрабанды наркотиков была посвящена изучению возможности того, что так называемые древние народы
После создания такого соответствия можно проанализировать совместные появления других слов с KWIC. Это делается с помощью t-score . Если мы возьмем, к примеру, слово «stranger» (сравнительное прилагательное и существительное), анализ t-score предоставит нам информацию, например, о частоте слов в корпусе: такие слова, как «no» и «to», как ни странно, встречаются не так уж часто; такое слово, как «controversy», встречается гораздо реже. Затем он вычисляет вхождения этого слова вместе с KWIC (« joint frequency »), чтобы определить, является ли эта комбинация необычно распространенной, другими словами, встречается ли эта комбинация значительно чаще, чем можно было бы ожидать по ее частоте. Если это так, то словосочетание считается сильным и заслуживает более пристального внимания.
В этом примере «no stranger to» — очень частое словосочетание; как и такие слова, как «mysterious», «handsome» и «dark». Это неудивительно. Однако более интересным является «no stranger to controversy». Однако, возможно, самым интересным примером является идиоматическое «perfect stranger». Такое словосочетание нельзя было предсказать само по себе, поскольку оно не означает «a stranger who is perfect», как следовало бы ожидать. Его необычно высокая частота показывает, что эти два слова тесно связаны и как выражение являются весьма идиоматичными.
Изучение корпусной лингвистики дает нам много информации о реальной природе языка, как показано выше. По сути, лексический корпус, по-видимому, построен на предпосылке, что использование языка лучше всего рассматривать как процесс сборки , в ходе которого мозг связывает вместе готовые фрагменты. Интуитивно это имеет смысл: это естественный способ облегчить бремя необходимости «изобретать велосипед» каждый раз, когда мы говорим. Кроме того, использование известных выражений быстро передает массу информации, поскольку слушателю не нужно разбивать высказывание на составные части. В книге « Слова и правила » Стивен Пинкер показывает этот процесс в работе с правильными и неправильными глаголами: мы собираем первые, которые предоставляют нам правила, которые мы можем применять к неизвестным словам (например, окончание «‑ed» для глаголов прошедшего времени позволяет нам склонять неологизм «to google» в «googled»). Другие шаблоны, неправильные глаголы, мы храним отдельно как уникальные элементы для запоминания. [6]
Другой метод эффективного хранения языка в лексическом корпусе включает использование метафоры в качестве принципа хранения. («Хранилище» и «файлы» являются хорошими примерами того, как человеческая память и память компьютера были связаны с одним и тем же словарным запасом; это не всегда было так). Работа Джорджа Лакоффа обычно приводится в качестве краеугольного камня для изучения метафоры в языке. [7] Один пример довольно распространен: «время — деньги». Мы можем экономить, тратить и тратить и время, и деньги. Другой интересный пример — из сферы бизнеса и секса: компании проникают на рынок, привлекают клиентов и обсуждают «управление отношениями». Бизнес — это также война: запустить рекламную кампанию, закрепиться (уже восходящая метафора в военном употреблении) на рынке, понести убытки. Системы, с другой стороны, — это вода: поток информации, переполненный людьми, поток трафика. Теория лексического усвоения NOA [ требуется разъяснение ] утверждает, что фильтр метафорической сортировки помогает упростить хранение языка и избежать перегрузки.
Компьютерные исследования показали, что грамматика, в смысле ее способности создавать совершенно новый язык, избегается, насколько это возможно. Бибер и его команда, работающие в Университете Аризоны над Cobuild GSWE, отметили необычно высокую частоту связок слов, которые сами по себе не имеют смысла. Но выборка из одного или двух быстро предполагает их функцию: их можно вставлять как грамматический клей без какого-либо предварительного анализа формы. Даже беглое наблюдение за примерами показывает, насколько они распространены во всех формах использования языка, хотя мы едва ли осознаем их существование. Исследования показывают, что язык сильно приправлен такими связками во всех регистрах; два примера включают «do you want me to», часто встречающееся в речи, или «there was no significant», встречающееся в академических регистрах. Собранные вместе в речи, они могут создавать понятные предложения, такие как «I'm not sure» + «if they're» + «they're going», образуя «I'm not sure if they're going». Такое предложение снижает нагрузку на лексические единицы, поскольку не требует никакого грамматического анализа. [8]
Британский лингвист Майкл К. Холлидей предлагает полезную дихотомию устной и письменной речи , которая на самом деле влечет за собой смену парадигмы: в то время как лингвистическая теория постулирует превосходство устной речи над письменной (поскольку первая является исходной, возникает естественным образом и, таким образом, предшествует письменной речи) или письменной над устной (по тем же причинам: письменная речь является высшей формой элементарной речи), Холлидей утверждает, что это две совершенно разные сущности.
Он утверждает, что речь грамматически сложна, в то время как письмо лексически плотно. [9] Другими словами, такое предложение, как «мой кузен, тот, о котором я говорил на днях — тот, который живет в Хьюстоне, а не в Далласе — позвонил мне вчера, чтобы рассказать мне ту же самую историю о Мэри, которая...», скорее всего, можно найти в разговоре, а не в газетном заголовке. «Премьер-министр обещает примирение», с другой стороны, было бы типичным новостным заголовком. Один более коммуникативный (устный), другой — скорее инструмент записи (письменный).
Работа Холлидея предполагает нечто радикально иное: язык ведет себя в регистрах . Бибер и др., работая над LGSWE, работали с четырьмя (они не являются исчерпывающими, а лишь примерными): разговор , литература , новости , академический . Эти четыре регистра четко подчеркивают различия в использовании языка, которые не были бы ясны при «грамматическом» подходе. Неудивительно, что каждый регистр благоприятствует использованию разных слов и структур: в то время как новостные заголовки, например, грамматически просты, разговорные анекдоты полны лексических повторений. Однако лексика новостей может быть довольно плотной, так же как грамматика речи может быть невероятно сложной.
{{cite book}}
: CS1 maint: multiple names: authors list (link)