Слово — это базовый элемент языка , который несет значение , может использоваться сам по себе и является непрерывным. [1] Несмотря на то, что носители языка часто интуитивно понимают, что такое слово, среди лингвистов нет единого мнения по его определению, и многочисленные попытки найти конкретные критерии концепции остаются спорными. [2] Были предложены различные стандарты в зависимости от теоретической базы и описательного контекста; они не сходятся на едином определении. [3] : 13:618 Некоторые конкретные определения термина «слово» используются для передачи его различных значений на разных уровнях описания, например, на основе фонологической , грамматической или орфографической основы. Другие предполагают, что концепция — это просто соглашение, используемое в повседневных ситуациях. [4] : 6
Понятие «слово» отличается от понятия морфемы , которая является наименьшей единицей языка, имеющей значение, даже если она не может существовать сама по себе. [1] Слова состоят как минимум из одной морфемы. Морфемы также могут быть объединены для создания других слов в процессе морфологического образования . [2] : 768 В английском и многих других языках морфемы, составляющие слово, обычно включают как минимум один корень (например, «rock», «god», «type», «writ», «can», «not») и, возможно, некоторые аффиксы («-s», «un-», «-ly», «-ness»). Слова с более чем одним корнем («[type][writ]er», «[cow][boy]s», «[tele][graph]ically») называются сложными словами . В свою очередь, слова объединяются, образуя другие элементы языка, такие как фразы («красный камень», «мириться с»), предложения («я бросил камень») и предложения («я бросил камень, но промахнулся»).
Во многих языках понятие того, что составляет «слово», может быть изучено как часть изучения системы письма. [5] Это касается английского языка и большинства языков, которые пишутся с помощью алфавитов, полученных из древних латинских или греческих алфавитов . В английской орфографии последовательности букв «rock», «god», «write», «with», «the» и «not» считаются словами с одной морфемой, тогда как «rocks», «ungodliness», «typewriter» и «cannot» — это слова, состоящие из двух или более морфем («rock»+«s», «un»+«god»+«li»+«ness», «type»+«writ»+«er» и «can»+«not»).
С начала изучения лингвистики было предпринято множество попыток определить, что такое слово, с использованием множества различных критериев. [5] Однако пока не найдено удовлетворительного определения, применимого ко всем языкам и на всех уровнях лингвистического анализа. Однако возможно найти последовательные определения «слова» на разных уровнях описания. [4] : 6 К ним относятся определения на фонетическом и фонологическом уровне, что это наименьший сегмент звука, который может быть теоретически изолирован словесным ударением и граничными маркерами; на орфографическом уровне как сегмент, обозначенный пробелами в письме или печати ; на основе морфологии как базового элемента грамматических парадигм, таких как словоизменение , отличного от словоформ; в семантике как наименьший и относительно независимый носитель значения в лексиконе; и синтаксически , как наименьшая переставляемая и заменяемая единица предложения. [2] : 1285
В некоторых языках эти различные типы слов совпадают, и можно проанализировать, например, «фонологическое слово» как по сути то же самое, что и «грамматическое слово». Однако в других языках они могут соответствовать элементам разного размера. [4] : 1 Большая часть трудностей проистекает из европоцентристского уклона, поскольку языки за пределами Европы могут не следовать интуиции европейских ученых. Некоторые из критериев, разработанных для «слова», могут быть применимы только к языкам с общеевропейской синтетической структурой . [4] : 1-3 Из-за этого неясного статуса некоторые лингвисты предлагают вообще избегать термина «слово», вместо этого сосредоточившись на более определенных терминах, таких как морфемы . [6]
Словари классифицируют лексикон языка в индивидуально перечисленные формы, называемые леммами . Их можно рассматривать как указание на то, что составляет «слово» по мнению авторов этого языка. Эта письменная форма слова составляет лексему . [ 2] : 670-671 Наиболее подходящим способом измерения длины слова является подсчет его слогов или морфем. [7] Когда слово имеет несколько определений или несколько значений, это может привести к путанице в дебатах или обсуждениях. [8]
Одно различимое значение термина «слово» можно определить на фонологических основаниях. Это единица, большая или равная слогу, которую можно различить на основе сегментных или просодических признаков или через ее взаимодействие с фонологическими правилами. В австралийском языке валматьяри корни или суффиксы могут иметь только один слог, но фонологическое слово должно иметь по крайней мере два слога. Двусложный корень глагола может иметь нулевой суффикс, например, luwa-ø 'hit!', но односложный корень должен иметь суффикс, например, ya-nta 'go!', таким образом, соответствуя сегментной модели слов валматьяри. В диалекте питджантьятьяра языка вати , другого языка из Австралии, слог в середине слова может заканчиваться на согласную, но слог в конце слова должен заканчиваться на гласную. [4] : 14
В большинстве языков ударение может служить критерием фонологического слова. В языках с фиксированным ударением можно установить границы слова по его местоположению. Хотя в языках с фонематическим ударением невозможно предсказать границы слова только по ударению, в каждом слове будет только один слог с первичным ударением, что позволяет определить общее количество слов в высказывании. [4] : 16
Многие фонологические правила действуют только в пределах фонологического слова или, в частности, за пределами границ слова. В венгерском языке зубные согласные /d/, /t/, /l/ или /n/ ассимилируются со следующим полугласным /j/, давая соответствующий палатальный звук, но только в пределах одного слова. Наоборот, внешние правила sandhi действуют за пределами границ слова. Прототипический пример этого правила происходит из санскрита ; однако начальная мутация согласного в современных кельтских языках или явление связывания r в некоторых неротичных английских диалектах также могут быть использованы для иллюстрации границ слова. [4] : 17
Часто бывает так, что фонологическое слово не соответствует нашему интуитивному представлению о слове. Финское сложное слово pääkaupunki 'столица' фонологически состоит из двух слов ( pää 'голова' и kaupunki 'город'), поскольку оно не соответствует финским моделям гармонии гласных внутри слов. И наоборот, одно фонологическое слово может состоять из более чем одного синтаксического элемента, например, в английской фразе I'll come , где I'll образует одно фонологическое слово. [3] : 13:618
Слово можно рассматривать как элемент внутреннего лексикона говорящего; это называется лексемой . Однако это может отличаться от значения в повседневной речи «слова», поскольку одна лексема включает все склоняемые формы. Лексема чайник относится как к единственному числу чайника, так и к множественному числу чайников . Также возникает вопрос, в какой степени склоняемые или составные слова должны быть включены в лексему, особенно в агглютинативных языках. Например, нет никаких сомнений в том, что в турецком языке лексема для дома должна включать именительный падеж единственного числа ev и множественное число evler . Однако неясно, должно ли оно также охватывать слово evlerinizden 'из ваших домов', образованное посредством регулярной суффиксации. Существуют также лексемы, такие как «черный и белый» или «сделай сам», которые, хотя и состоят из нескольких слов, все же образуют единое словосочетание с заданным значением. [3] : 13:618
Грамматические слова, как предполагается, состоят из ряда грамматических элементов, которые встречаются вместе (не в отдельных местах внутри предложения) в фиксированном порядке и имеют установленное значение. Однако, есть исключения из всех этих критериев. [4] : 19
Отдельные грамматические слова имеют фиксированную внутреннюю структуру; когда структура меняется, значение слова также меняется. В языке дьирбал , который может использовать много производных аффиксов с его существительными, есть двойной суффикс -jarran и суффикс -gabun, означающий «другой». С существительным yibi они могут быть организованы в yibi-jarran-gabun («еще две женщины») или yibi-gabun-jarran («две другие женщины»), но изменение порядка суффиксов также меняет их значение. Носители языка также обычно связывают определенное значение со словом, а не с одной морфемой. Например, когда их просят рассказать о неправдивости, они редко сосредотачиваются на значении морфем, таких как -th или -ness . [4] : 19–20
Леонард Блумфилд ввел концепцию «минимальных свободных форм» в 1928 году. Слова рассматриваются как наименьшая значимая единица речи , которая может существовать сама по себе. [9] : 11 Это соотносит фонемы (единицы звука) с лексемами (единицами значения ). Однако некоторые написанные слова не являются минимальными свободными формами, поскольку они не имеют смысла сами по себе (например, and в ). [10] : 77 Некоторые семантики выдвинули теорию так называемых семантических примитивов или семантических примитивов , неопределимых слов, представляющих фундаментальные концепции, которые интуитивно значимы. Согласно этой теории, семантические примитивы служат основой для описания значения, без цикличности, других слов и связанных с ними концептуальных обозначений. [11] [12]
В минималистской школе теоретического синтаксиса слова (также называемые в литературе лексическими единицами ) трактуются как «связки» языковых признаков , объединенных в структуру с формой и значением. [13] : 36–37 Например, слово «koalas» имеет семантические признаки (оно обозначает объекты реального мира, коал ), категориальные признаки (это существительное), числовые признаки (оно имеет множественное число и должно согласовываться с глаголами, местоимениями и указательными местоимениями в своей области), фонологические признаки (оно произносится определенным образом) и т. д.
В языках с литературной традицией вопрос о том, что считать одним словом, зависит от орфографии . Разделители слов , как правило, пробелы и знаки препинания, распространены в современной орфографии языков, использующих алфавитное письмо , но они являются относительно недавним развитием в истории письма . В кодировке символов сегментация слов зависит от того, какие символы определены как разделители слов. В английской орфографии составные выражения могут содержать пробелы. Например, ice cream , air raid shelter и get up каждое, как правило, считается состоящим из более чем одного слова (поскольку каждый из компонентов является свободной формой, за возможным исключением get ), и так же как no one , но аналогично составленные someone и nobody считаются отдельными словами.
Иногда языки, которые близки грамматически, будут рассматривать один и тот же порядок слов по-разному. Например, возвратные глаголы во французском инфинитиве отделены от соответствующей им частицы, например, se laver («мыть себя»), тогда как в португальском они пишутся через дефис, например, lavar-se , а в испанском они соединяются, например, lavarse . [a]
Не все языки четко разграничивают слова. Мандаринский китайский язык — высокоаналитический язык с небольшим количеством флективных аффиксов, что делает ненужным орфографическое разграничение слов. Однако в мандаринском языке существует множество многоморфемных соединений, а также множество связанных морфем, которые затрудняют четкое определение того, что составляет слово. [14] : 56 Японский язык использует орфографические подсказки для разграничения слов, такие как переключение между кандзи (символами, заимствованными из китайской письменности) и двумя слоговыми азбуками кана . Это довольно мягкое правило, поскольку содержательные слова также могут быть записаны хираганой для эффекта, хотя, если делать это широко, обычно добавляются пробелы для сохранения разборчивости. Вьетнамская орфография, хотя и использует латинский алфавит , разграничивает односложные морфемы, а не слова.
Задача определения того, что составляет слово, включает определение того, где заканчивается одно слово и начинается другое. Существует несколько методов определения границ слов, присутствующих в речи: [5]
Морфология — это изучение словообразования и структуры. Слова могут подвергаться различным морфологическим процессам, которые традиционно подразделяются на две большие группы: деривация и словоизменение . деривация — это процесс, в котором новое слово создается из существующих, с корректировкой его значения и часто с изменением класса слова. Например, в английском языке глагол to convert может быть изменен в существительное a convert посредством смещения ударения и в прилагательное convertible посредством аффиксации. Словоизменение добавляет грамматическую информацию к слову, например, указывает на падеж, время или род. [14] : 73
В синтетических языках одна и та же основа слова (например, love ) может склоняться, образуя несколько различных форм (например, loves , loving и loved ). Однако для некоторых целей они обычно не считаются разными словами, а скорее разными формами одного и того же слова. В этих языках слова можно считать образованными из нескольких морфем .
В частности, в индоевропейских языках различают следующие морфемы:
Таким образом, праиндоевропейское *wr̥dhom можно проанализировать как состоящее из
Философы считали слова объектами очарования по крайней мере с V века до н. э., с основанием философии языка . Платон анализировал слова с точки зрения их происхождения и звуков, их составляющих, заключив, что существует некоторая связь между звуком и значением, хотя слова сильно меняются со временем. Джон Локк писал, что использование слов «должно быть разумными знаками идей», хотя они выбираются «не какой-либо естественной связью, которая существует между отдельными членораздельными звуками и определенными идеями, ибо тогда был бы только один язык среди всех людей; но добровольным навязыванием, посредством которого такое слово произвольно делается знаком такой идеи». [16] Мысль Витгенштейна перешла от слова как представления значения к «значению слова является его использование в языке». [17]
Каждое слово принадлежит к категории, основанной на общих грамматических свойствах. Обычно лексикон языка можно разделить на несколько таких групп слов. Общее количество категорий, а также их типы не являются универсальными и различаются в разных языках. Например, в английском языке есть группа слов, называемых артиклями , например, the (определенный артикль) или a (неопределенный артикль), которые обозначают определенность или идентифицируемость. Этот класс отсутствует в японском языке, который зависит от контекста, чтобы указать на это различие. С другой стороны, в японском языке есть класс слов, называемых частицами , которые используются для обозначения именных фраз в соответствии с их грамматической функцией или тематическим отношением, которое в английском языке обозначается с помощью порядка слов или просодии. [18] : 21–24
Неясно, являются ли какие-либо категории, кроме междометий, универсальными частями человеческого языка. Основное двусоставное деление, повсеместное в естественных языках, — это деление на существительные и глаголы . Однако в некоторых языках вакашан и салиш все содержательные слова могут пониматься как глагольные по своей природе. В языке лушутсид , языке салиш, все слова со «существительными» значениями могут использоваться предикативно, где они функционируют как глагол. Например, слово sbiaw может пониматься как «(является) койотом», а не просто «койот». [19] [3] : 13:631 С другой стороны, в эскимосско-алеутских языках все содержательные слова можно проанализировать как номинальные, при этом агентивные существительные играют роль, наиболее близкую к глаголам. Наконец, в некоторых австронезийских языках неясно, применимо ли это различие, и все слова можно лучше всего описать как междометия, которые могут выполнять роли других категорий. [3] : 13:631
Текущая классификация слов по классам основана на работе Дионисия Фракийского , который в I веке до н. э. выделил восемь категорий древнегреческих слов: существительное , глагол , причастие , артикль , местоимение , предлог , наречие и союз . Более поздние латинские авторы, Аполлоний Дискол и Присциан, применили его структуру к своему собственному языку; поскольку в латыни нет артиклей, они заменили этот класс междометием . Прилагательные («счастливый»), квантификаторы («немного») и числительные («одиннадцать») не были разделены в этих классификациях из-за их морфологического сходства с существительными в латыни и древнегреческом. Они были признаны отдельными категориями только тогда, когда ученые начали изучать более поздние европейские языки. [3] : 13:629
В индийской грамматической традиции Панини ввел похожую фундаментальную классификацию на номинальный (nāma, suP) и глагольный (ākhyāta, tiN) классы, основанные на наборе суффиксов, принимаемых словом. Некоторые слова могут быть спорными, например, сленг в формальном контексте; неправильные названия, поскольку они не означают то, что они подразумевают; или многозначные слова, из-за потенциальной путаницы между их различными смыслами. [20]
В древнегреческой и римской грамматической традиции слово было базовой единицей анализа. Изучались различные грамматические формы данной лексемы; однако не было попыток разложить их на морфемы. [21] : 70 Это могло быть результатом синтетической природы этих языков, где внутренняя структура слов может быть сложнее для декодирования, чем в аналитических языках. Также не было понятия различных видов слов, таких как грамматические или фонологические — слово считалось единой конструкцией. [4] : 269 Слово ( dictiō ) определялось как минимальная единица высказывания ( ōrātiō ), выражение законченной мысли. [21] : 70
{{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: location missing publisher (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: location missing publisher (link){{cite book}}
: CS1 maint: others (link){{cite book}}
: CS1 maint: others (link)