Орфография — это набор правил письма на языке , включая нормы орфографии , пунктуации , границ слов , заглавных букв , переносов и ударения .
Большинство национальных и международных языков имеют устоявшуюся систему письма , которая подверглась существенной стандартизации, поэтому демонстрирует меньше диалектных вариаций, чем разговорный язык. [1] [2] Эти процессы могут привести к окаменению моделей произношения, которые больше не наблюдаются в речи (например, «would» и «should»); они также могут отражать преднамеренные попытки ввести вариативность ради национальной идентичности, как это видно на примере попыток Ноа Вебстера ввести легко заметные различия между американским и британским правописанием (например, «honor» и «honour»).
Орфографические нормы развиваются посредством социального и политического влияния на различных уровнях, таких как встречи с печатью в образовании, на рабочем месте и в государстве. Некоторые страны создали языковые академии в попытке регулировать аспекты национального языка, включая его орфографию, например, Académie Française во Франции и Королевская испанская академия в Испании. Для большинства языков, включая английский, такого органа не существует. Некоторые негосударственные организации, такие как газеты и академические журналы , выбирают большую орфографическую однородность, применяя определенное руководство по стилю или стандарт правописания, такой как Оксфордское правописание .
Английское слово орфография датируется 15 веком. Оно происходит от французского : orthographie , от латинского : orthographia , которое происходит от древнегреческого : ὀρθός ( orthós «правильный») и γράφειν ( gráphein , «писать»). [3]
Орфография в фонетических системах письма часто связана с вопросами правописания , то есть отношениями графем к фонемам , встречающимся в речи. [4] [5] Другие элементы, которые можно считать частью орфографии, включают переносы , заглавные буквы , границы слов , ударение и пунктуацию . [6] Таким образом, орфография описывает или определяет символы, используемые в письме, и соглашения, которые регулируют их использование.
Большинство естественных языков, развившихся как устные языки и письменные системы, обычно создавались или адаптировались как способы представления разговорного языка. Правила для этого, как правило, стандартизируются для данного языка, что приводит к развитию орфографии, которая обычно считается «правильной». В лингвистике орфография часто относится к любому методу написания языка без суждения о правильном и неправильном, с научным пониманием того, что орфографическая стандартизация существует в спектре силы соглашения. Однако первоначальное значение слова подразумевает дихотомию правильного и неправильного, и слово по-прежнему чаще всего используется для обозначения конкретно стандартизированной предписывающей манеры письма. Проводится различие между эмической и этической точками зрения, при этом эмический подход учитывает восприятие правильности пользователями языка, а этический подход является чисто описательным, учитывая только эмпирические качества любой используемой системы.
Орфографические единицы, такие как буквы алфавита , технически называются графемами . Это тип абстракции , аналогичный фонемам разговорных языков; различные физические формы письменных символов считаются представляющими одну и ту же графему, если различия между ними несущественны для смысла. Таким образом, графему можно рассматривать как абстракцию набора глифов , которые все функционально эквивалентны. Например, в письменном английском (или других языках, использующих латинский алфавит ) существуют два различных физических представления (глифа) строчной латинской буквы «a» : a и ɑ . Поскольку замена любого из них другим не может изменить значение слова, они считаются аллографами одной и той же графемы, которая может быть записана как ⟨a⟩ . Формы курсива и полужирного начертания также являются аллографическими.
Графемы или их последовательности иногда помещаются между угловыми скобками, как в ⟨b⟩ или ⟨back⟩ . Это отличает их от фонематической транскрипции, которая помещается между косыми чертами ( /b/ , /bæk/ ), и от фонетической транскрипции , которая помещается между квадратными скобками ( [b] , [bæk] ).
Системы письма , на которых основаны орфографии, можно разделить на несколько типов в зависимости от того, какой тип единицы каждый символ служит для представления. Основными типами являются логографические (с символами, представляющими слова или морфемы ), слоговые (с символами, представляющими слоги) и алфавитные (с символами, приблизительно представляющими фонемы ). Многие системы письма сочетают в себе черты более чем одного из этих типов, и было предложено несколько подробных классификаций. Японский язык является примером системы письма, которая может быть записана с использованием комбинации логографических символов кандзи и слоговых символов хираганы и катаканы ; как и во многих неалфавитных языках, алфавитные символы ромадзи также могут использоваться по мере необходимости. [7]
Орфографии, использующие алфавиты и слоговые азбуки , основаны на принципе, что письменные символы ( графемы ) соответствуют единицам звука разговорного языка: фонемам в первом случае и слогам во втором. Практически во всех случаях это соответствие не является точным. Орфографии разных языков предлагают разную степень соответствия между написанием и произношением. Например, английская , французская , датская и тайская орфографии крайне нерегулярны, тогда как орфографии таких языков, как русский , немецкий , испанский , финский , турецкий и сербскохорватский, представляют произношение гораздо более точно. [ необходима цитата ]
Орфография, в которой соответствия между написанием и произношением являются очень сложными или непоследовательными, называется глубокой орфографией (или, менее формально, говорят, что язык имеет нерегулярное написание ). Орфография с относительно простыми и последовательными соответствиями называется поверхностной (и язык имеет регулярное написание ).
Одной из главных причин расхождения правописания и произношения является то, что звуковые изменения , происходящие в разговорной речи, не всегда отражаются в орфографии, и, следовательно, правописание соответствует историческому, а не современному произношению. Одним из последствий этого является то, что многие правописания начинают отражать морфофонемную структуру слова, а не его чисто фонематическую структуру (например, английская правильная морфема прошедшего времени постоянно пишется как -ed, несмотря на ее разное произношение в разных словах). Это обсуждается далее в Фонематическая орфография § Морфофонемные особенности .
Слоговые системы японского языка ( хирагана и катакана ) являются примерами почти идеально поверхностной орфографии: кана почти идеально соответствует произносимым слогам, хотя и с некоторыми исключениями , когда символы отражают исторические или морфонематические особенности: в частности, использование ぢji иづzu (а не じji и ずzu , их произношение на стандартном токийском диалекте), когда иероглиф является озвучкой основного ち или つ (см. рендаку ), а также использование は, を и へ для обозначения звуков わ, お и え как остатки исторического использования каны .
Корейская письменность хангыль и тибетское письмо изначально также имели крайне поверхностную орфографию, но как отражение современного языка они часто также отражают морфофонемные особенности.
Полное обсуждение степеней соответствия между написанием и произношением в алфавитной орфографии, включая причины, по которым такое соответствие может нарушаться, см. в разделе Фонематическая орфография .
Орфография, основанная на соответствии фонемам, иногда может не иметь символов для представления всех фонемных различий в языке. Это называется дефектной орфографией . Примером в английском языке является отсутствие какого-либо указания на ударение . [ требуется ссылка ] Другим примером является диграф ⟨th⟩ , который представляет две разные фонемы (как в then и thin ) и заменяет старые буквы ⟨ ð ⟩ и ⟨ þ ⟩ . Более систематическим примером являются абджады, такие как арабский и еврейский алфавиты, в которых краткие гласные обычно остаются ненаписанными и должны быть выведены читателем.
Когда алфавит заимствуется из исходного языка для использования с новым языком — как это было сделано с латинским алфавитом для многих языков или японской катаканой для неяпонских слов — он часто оказывается дефектным в представлении фонем нового языка. Иногда эта проблема решается с помощью таких приемов, как диграфы (например, ⟨sh⟩ и ⟨ch⟩ в английском языке, где пары букв представляют отдельные звуки), диакритические знаки (например, карон на буквах ⟨š⟩ и ⟨č⟩ , которые представляют те же звуки в чешском языке ), или добавлением совершенно новых символов (как некоторые языки ввели букву ⟨ w ⟩ в латинский алфавит) или символов из другого алфавита, например, руны ⟨ þ ⟩ в исландском.
После классического периода греческий язык разработал систему строчных букв с диакритическими знаками, чтобы иностранцы могли изучать произношение и грамматические особенности. Поскольку произношение букв со временем менялось, диакритические знаки были сокращены до представления ударного слога. В современном греческом наборе эта система была упрощена до единственного ударения, указывающего, какой слог ударный. [8]