Слово — это базовый элемент языка , который несет смысл , может использоваться сам по себе и не прерывается . [1] Несмотря на то, что носители языка зачастую интуитивно понимают, что такое слово, среди лингвистов нет единого мнения по поводу его определения, а многочисленные попытки найти конкретные критерии понятия остаются спорными. [2] Были предложены различные стандарты в зависимости от теоретической основы и описательного контекста; они не сходятся в одном определении. [3] : 13:618 Некоторые конкретные определения термина «слово» используются для передачи его различных значений на разных уровнях описания, например, на основе фонологической , грамматической или орфографической основы. Другие предполагают, что эта концепция — просто условность, используемая в повседневных ситуациях. [4] : 6
Понятие «слово» отличается от понятия морфемы , которая представляет собой наименьшую единицу языка, имеющую значение, даже если она не может существовать сама по себе. [1] Слова состоят как минимум из одной морфемы. Морфемы также могут быть объединены для создания других слов в процессе морфологического происхождения . [2] : 768 В английском и многих других языках морфемы, составляющие слово, обычно включают по крайней мере один корень (например, «рок», «бог», «тип», «запись», «может», «не ") и, возможно, некоторые аффиксы ("-s", "un-", "-ly", "-ness"). Слова, имеющие более одного корня («[тип][писатель], «[корова][мальчик]с», «[теле][графически]ически») называются сложными словами . В свою очередь, слова объединяются в другие элементы языка, такие как фразы («красный камень», «мириться»), предложения («Я бросил камень») и предложения («Я бросил камень, но пропущенный").
Во многих языках понятие о том, что представляет собой «слово», можно выучить в рамках изучения системы письма. [5] Это относится к английскому языку и большинству языков, написанных с использованием алфавитов, произошедших от древних латинских или греческих алфавитов . В английской орфографии последовательности букв «рок», «бог», «писать», «с», «the» и «не» считаются одноморфемными словами, тогда как «роки», «безбожие», « «пишущая машинка» и «не могу» — это слова, состоящие из двух или более морфем («рок»+»с», «не»+»бог»+»ли»+»ность», «тип»+»писать»+»эр «и «можно» + «не»).
С самого начала изучения лингвистики предпринимались многочисленные попытки определить, что такое слово, с использованием множества различных критериев. [5] Однако до сих пор не найдено удовлетворительного определения, применимого ко всем языкам и на всех уровнях лингвистического анализа. Однако можно найти последовательные определения «слова» на разных уровнях описания. [4] : 6 К ним относятся определения на фонетическом и фонологическом уровне, согласно которым это наименьший сегмент звука, который теоретически может быть изолирован с помощью словесного ударения и пограничных маркеров; на орфографическом уровне как сегмент, обозначенный пробелами в письменной или печатной форме ; на основе морфологии как основного элемента грамматических парадигм типа словоизменения , отличного от словоформ; внутри семантики как наименьшего и относительно самостоятельного носителя значения в лексиконе; и синтаксически , как наименьшая перестановочная и заменяемая единица предложения. [2] : 1285
В некоторых языках эти разные типы слов совпадают, и можно анализировать, например, «фонологическое слово» как «грамматическое слово». Однако в других языках они могут соответствовать элементам разного размера. [4] : 1 Большая часть трудностей проистекает из европоцентристской предвзятости, поскольку языки за пределами Европы могут не следовать интуиции европейских ученых. Некоторые из критериев, разработанных для «слова», могут быть применимы только к языкам широкоевропейской синтетической структуры . [4] : 1-3 Из-за этого неясного статуса некоторые лингвисты предлагают вообще избегать термина «слово», вместо этого сосредоточившись на более определенных терминах, таких как морфемы . [6]
Словари делят лексику языка на отдельные формы, называемые леммами . Их можно рассматривать как указание на то, что представляет собой «слово», по мнению авторов этого языка. Эта письменная форма слова составляет лексему . [2] : 670-671 Наиболее подходящим способом измерения длины слова является подсчет его слогов или морфем. [7] Когда слово имеет несколько определений или несколько значений, это может привести к путанице в дебатах или обсуждениях. [8]
Одно различимое значение термина «слово» можно определить на фонологических основаниях. Это единица, большая или равная слогу, которую можно отличить по сегментным или просодическим признакам или по ее взаимодействию с фонологическими правилами. В валматджари австралийский язык, корни или суффиксы могут иметь только один слог, но фонологическое слово должно состоять как минимум из двух слогов. Корень двусложного глагола может иметь нулевой суффикс, например luwa-ø «ударить!», а односложный корень должен иметь суффикс, например ya-nta «идти!», что соответствует сегментной схеме слов валматджари. В диалекте Питьянтьатьяра языка Вати , другого языка из Австралии, средний слог слова может заканчиваться согласной, но последний слог слова должен заканчиваться гласной. [4] : 14
В большинстве языков ударение может служить критерием фонологического слова. В языках с фиксированным ударением границы слова можно определить по его местоположению. Хотя в языках с фонематическим ударением невозможно предсказать границы слов только по ударению, в каждом слове будет только один слог с основным ударением, что позволяет определить общее количество слов в высказывании. [4] : 16
Многие фонологические правила действуют только внутри фонологического слова или, в частности, за его пределами. В венгерском языке зубные согласные /d/, /t/, /l/ или /n/ ассимилируются со следующей полугласной /j/, давая соответствующий небный звук, но только в пределах одного слова. И наоборот, внешние правила сандхи действуют через границы слов. Прототипический пример этого правила взят из санскрита ; однако начальная мутация согласного в современных кельтских языках или феномен связывания r в некоторых неротических английских диалектах также могут использоваться для иллюстрации границ слов. [4] : 17
Часто бывает, что фонологическое слово не соответствует нашему интуитивному представлению о слове. Финское сложное слово pääkaupunki «столица» фонологически состоит из двух слов ( pää « голова» и kaupunki «город»), поскольку оно не соответствует финским образцам гармонии гласных внутри слов. И наоборот, одно фонологическое слово может состоять из более чем одного синтаксического элемента, как, например, в английской фразе I'll Come , где I'll образует одно фонологическое слово. [3] : 13:618
Слово можно рассматривать как элемент внутреннего лексикона говорящего; это называется лексема . Однако это может отличаться от значения в повседневной речи слова «слово», поскольку в одну лексему входят все изменяемые формы. Лексема чайник относится как к чайнику в единственном числе , так и к чайникам во множественном числе . Возникает также вопрос, в какой степени в лексему должны входить изменяемые или составные слова, особенно в агглютинативных языках. Например, нет никаких сомнений в том, что в турецком языке лексема дома должна включать именительный падеж единственного числа ev и evler множественного числа . Однако неясно, должно ли оно также включать в себя слово evlerinizden «из ваших домов», образованное посредством регулярного суффикса. Существуют также такие лексемы, как «черное и белое» или «сделай сам», которые хотя и состоят из нескольких слов, но все же образуют одно словосочетание с заданным значением. [3] : 13:618
Грамматические слова предложено состоять из ряда грамматических элементов, которые встречаются вместе (а не в отдельных местах внутри предложения) в фиксированном порядке и имеют определенное значение. Однако из всех этих критериев есть исключения. [4] : 19
Отдельные грамматические слова имеют фиксированную внутреннюю структуру; при изменении структуры меняется и значение слова. В языке Диирбал , который может использовать множество словообразовательных аффиксов с существительными, есть двойной суффикс -джарран и суффикс -габун, означающий «другой». С существительным йиби их можно объединить в йиби-джарран-габун («еще две женщины») или йиби-габун-джарран («две другие женщины»), но изменение порядка суффиксов также меняет их значение. Носители языка также обычно связывают со словом определенное значение, а не с отдельной морфемой. Например, когда их просят рассказать о лжи, они редко сосредотачиваются на значении таких морфем, как -th или -ness . [4] : 19–20
Леонард Блумфилд представил концепцию «минимальных свободных форм» в 1928 году. Слова считаются наименьшей значимой единицей речи , которая может существовать сама по себе. [9] : 11 Это соотносит фонемы (единицы звука) с лексемами (единицами значения). Однако некоторые письменные слова не являются минимальными свободными формами , поскольку сами по себе они не имеют смысла (например, и из ). [10] : 77 Некоторые семантики выдвинули теорию так называемых семантических примитивов или семантических простых чисел , неопределимых слов, представляющих фундаментальные понятия, которые имеют интуитивное значение. Согласно этой теории, семантические простые числа служат основой для описания значения без цикличности других слов и связанных с ними концептуальных обозначений. [11] [12]
В минималистской школе теоретического синтаксиса слова (также называемые в литературе лексическими единицами ) трактуются как «пучки» языковых признаков , объединенных в структуру с формой и значением. [13] : 36–37 Например, слово «коалы» имеет семантические признаки (оно обозначает объекты реального мира, коал ), категориальные признаки (оно является существительным), числовые признаки (оно стоит во множественном числе и должно согласовываться с глаголами, местоимения и указательные падежи в своей области), фонологические особенности (произносится определенным образом) и т. д.
В языках с литературной традицией вопрос о том, что считать отдельным словом, зависит от орфографии . Разделители слов , обычно пробелы и знаки препинания , распространены в современной орфографии языков, использующих алфавитное письмо , но это относительно современное явление в истории письменности . При кодировании символов сегментация слов зависит от того, какие символы определены как разделители слов. В английской орфографии сложные выражения могут содержать пробелы. Например, каждое из слов «мороженое» , «бомбоубежище » и «вставать» обычно состоит из более чем одного слова (поскольку каждый из компонентов представляет собой произвольную форму, за возможным исключением « get »), и то же самое относится и к слову «никто» , но и к аналогичному слову. составленные кем -то и никем не считаются отдельными словами.
Иногда языки, близкие грамматически, по-разному рассматривают слова одного и того же порядка. Например, возвратные глаголы во французском инфинитиве отделены от соответствующей частицы, например, se laver («мыться»), тогда как в португальском языке они пишутся через дефис, например, lavar-se , а в испанском они соединяются, например, lavarse . [а]
Не все языки четко разделяют слова. Мандаринский китайский язык — очень аналитический язык с небольшим количеством флективных аффиксов, что делает ненужным орфографическое разграничение слов. Однако в мандаринском языке существует множество многоморфемных соединений, а также множество связанных морфем, которые затрудняют четкое определение того, что представляет собой слово. [14] : 56 Японцы используют орфографические подсказки для разграничения слов, например, переключение между кандзи (символами, заимствованными из китайской письменности) и двумя слоговыми буквами кана . Это довольно мягкое правило, потому что слова содержания также могут быть написаны хираганой для эффекта, хотя, если это делается слишком часто, обычно добавляются пробелы для обеспечения разборчивости. Вьетнамская орфография, хотя и использует латинский алфавит , разграничивает односложные морфемы, а не слова.
Задача определения того, что представляет собой «слово», включает в себя определение того, где заканчивается одно слово и начинается другое слово, то есть определение границ слова. Есть несколько способов определить, где следует расположить границы слов разговорной речи: [5]
Морфология – это изучение образования и структуры слов. Слова могут подвергаться различным морфологическим процессам, которые традиционно подразделяются на две большие группы: деривация и флексия . Деривация — это процесс, при котором новое слово создается из существующих с корректировкой его значения и часто с изменением класса слова. Например, в английском языке глагол to Convert может быть преобразован в существительное a Convert посредством смещения ударения и в прилагательное Convertible посредством аффиксации. Изменение добавляет к слову грамматическую информацию, такую как указание падежа, времени или рода. [14] : 73
В синтетических языках одна основа слова (например, любовь ) может иметь несколько различных форм (например, любит , любящий и любимый ). Однако для некоторых целей это обычно не разные слова, а разные формы одного и того же слова. В этих языках слова можно считать составленными из ряда морфем .
В частности, в индоевропейских языках выделяются морфемы:
Таким образом, протоиндоевропейский *wr̥dhom можно было бы анализировать как состоящий из
Философы считали слова объектом восхищения, по крайней мере, с V века до нашей эры, с момента зарождения философии языка . Платон проанализировал слова с точки зрения их происхождения и звуков, из которых они состоят, и пришел к выводу, что между звуком и значением существует некоторая связь, хотя слова со временем сильно меняются. Джон Локк писал, что употребление слов «должно быть осмысленными обозначениями идей», хотя они выбираются «не на основании какой-либо естественной связи, которая существует между отдельными членораздельными звуками и определенными идеями, ибо тогда среди всех людей был бы только один язык». ; но путем добровольного навязывания, посредством чего такое слово произвольно становится знаком такой идеи». [16] Мысль Витгенштейна перешла от слова как представления значения к «значению слова является его употребление в языке». [17]
Каждое слово принадлежит к категории, основанной на общих грамматических свойствах. Обычно лексикон языка можно разделить на несколько таких групп слов. Общее количество категорий, а также их типы не являются универсальными и различаются в зависимости от языка. Например, в английском языке есть группа слов, называемых артиклями , например the (определенный артикль) или a (неопределенный артикль), которые обозначают определенность или идентифицируемость. Этот класс отсутствует в японском языке, что зависит от контекста, указывающего на эту разницу. С другой стороны, в японском языке есть класс слов, называемых частицами , которые используются для обозначения именных фраз в соответствии с их грамматической функцией или тематическим отношением, которые в английском языке отмечаются с помощью порядка слов или просодии. [18] : 21–24
Неясно, являются ли какие-либо категории, кроме междометия, универсальными частями человеческого языка. Основное двудольное деление, повсеместно встречающееся в естественных языках, — это разделение существительных и глаголов . Однако в некоторых языках вакашан и салиш все содержательные слова можно понимать как вербальные по своей природе. В Lushootseed , языке Салиш, все слова со значениями, подобными существительным, могут использоваться в предикативном значении, где они действуют как глагол. Например, слово sbiaw можно понимать как «(есть) койот», а не просто «койот». [19] [3] : 13:631 С другой стороны, в эскимосско-алеутских языках все содержательные слова можно анализировать как номинальные, при этом агентивные существительные выполняют роль, наиболее близкую к глаголам. Наконец, в некоторых австронезийских языках неясно, применимо ли это различие, и все слова лучше всего можно описать как междометия, которые могут выполнять роли других категорий. [3] : 13:631
Современная классификация слов по классам основана на работах Дионисия Фракса , который в I веке до нашей эры выделил восемь категорий древнегреческих слов: существительное , глагол , причастие , артикль , местоимение , предлог , наречие и союз . Более поздние латинские авторы, Аполлоний Дискол и Присциан, применили его концепцию к своему языку; так как в латыни нет артиклей, то заменили этот класс междометием . Прилагательные («счастливый»), квантификаторы («немногие») и числительные («одиннадцать») не выделялись в этих классификациях из-за их морфологического сходства с существительными в латинском и древнегреческом языках. Они были признаны отдельными категориями только тогда, когда ученые начали изучать более поздние европейские языки. [3] : 13:629
В индийской грамматической традиции Панини ввел аналогичную фундаментальную классификацию на номинальный (нама, суП) и глагольный (акхьята, тин) классы, основанные на наборе суффиксов , взятых в слове. Некоторые слова могут быть спорными, например, сленг в формальном контексте; неправильные термины, поскольку они не имеют в виду то, что подразумевают; или многозначные слова из-за потенциальной путаницы между их различными значениями. [20]
В древнегреческой и римской грамматической традиции слово было основной единицей анализа. Изучались разные грамматические формы данной лексемы; однако попыток разложить их на морфемы не предпринималось. [21] : 70 Это могло быть результатом синтетической природы этих языков, в которых внутреннюю структуру слов труднее расшифровать, чем в аналитических языках. Не существовало также понятия о разных видах слов, например грамматических или фонологических – слово считалось единой конструкцией. [4] : 269 Слово ( dictiō ) определялось как минимальная единица высказывания ( ōrātiō ), выражение законченной мысли. [21] : 70
{{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: location missing publisher (link){{cite book}}
: |work=
игнорируется ( помощь ){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: location missing publisher (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link)