В лексикографии [ требуется ссылка ] лексическая единица — это отдельное слово, часть слова или цепочка слов ( катена ), которые образуют основные элементы лексикона языка (≈ словарный запас). [ требуется ссылка ] Примерами являются cat , traffic light , take care of , by the way и it's raining cats and dogs . Лексические единицы, как правило, можно понимать как передающие одно значение, во многом как лексемы , но не ограничиваются отдельными словами. Лексические единицы подобны семам в том, что они являются «естественными единицами», переводимыми между языками или при изучении нового языка. В этом последнем смысле иногда говорят, что язык состоит из грамматикализованной лексики, а не лексикализованной грамматики. Весь запас лексических единиц в языке называется его лексикой .
Лексические элементы, состоящие из более чем одного слова, иногда также называются лексическими блоками , гамбитами , лексическими фразами , лексикализованными основами или речевыми формулами . [ требуется ссылка ] Иногда также используется термин полисловные листемы . [ требуется ссылка ]
Распространенные типы лексических единиц/фрагментов включают в себя: [1]
Связанное понятие — это семантические отношения существительное-модификатор , в которых определенные пары слов имеют стандартную интерпретацию. Например, фраза вирус простуды обычно понимается как относящаяся к вирусу, который вызывает простуду, а не к вирусу, который простужен.
Многие лексические элементы являются либо целым словом, либо частью слова, тогда как многие другие лексические элементы состоят из частей одного или нескольких слов или нескольких слов в целом. Основной вопрос в этой области касается соответствия формы и значения. Многие многословные лексические элементы не могут быть истолкованы как составляющие в синтаксисе ни в каком смысле. Но если они не являются составляющими, то как их классифицировать? Относительно недавнее развитие в области синтаксиса предусматривает лексические элементы, хранящиеся в лексиконе как катены , при этом данная катена может быть или не быть составной частью. [2] В синтаксисе катена — это любой элемент или комбинация элементов (слов или частей слов), которые непрерывны в вертикальном измерении, то есть в иерархии слов. Элементы образуют катену, поскольку они связаны друг с другом зависимостями. В настоящее время создаются некоторые деревья грамматики зависимостей, содержащие многословные лексические элементы, которые являются катенами, но не составными частями. Следующие деревья иллюстрируют фразовые глаголы:
Глагол и частица (красного цвета) в каждом случае составляют конструкцию глагола-частицы, которая является единым лексическим элементом. Два слова остаются катеной, даже если сдвиг изменяет порядок их появления. Следующие деревья иллюстрируют полислова:
Составные слова полислов (красные) непрерывны в вертикальном измерении и, следовательно, являются катенами. Однако их нельзя толковать как составляющие, поскольку они не образуют полных поддеревьев. Следующие деревья иллюстрируют идиомы:
Фиксированные слова, составляющие идиому (выделены красным), каждый раз образуют катену. Обратите внимание, что your не является частью идиомы в первом дереве (дерево a), поскольку посессор является переменным, например, He is pulling my/her/his/someone's/etc. leg . Важное предостережение относительно катен идиомы заключается в том, что они могут быть разбиты в синтаксисе, например, Your leg is being pull . Однако утверждается, что эти лексические элементы хранятся как катены в лексиконе; они не всегда появляются как катены в фактическом синтаксисе.