stringtranslate.com

Фонематическая орфография

Фонематическая орфография — это орфография (система письменности языка ), в которой графемы (письменные символы) соответствуют фонемам языка (наименьшим единицам речи, которые могут различать слова). Естественные языки редко имеют идеальную фонематическую орфографию; в орфографиях, основанных на алфавитных системах письма, можно ожидать высокой степени соответствия графем и фонем, но они различаются по степени полноты этого соответствия. Английская орфография , например, является алфавитной, но в значительной степени нефонематической; Когда-то на среднеанглийском этапе, когда зародилось современное правописание, он был в основном фонематическим, но разговорный английский быстро менялся, а орфография была гораздо более стабильной, что привело к современной нефонематической ситуации. Напротив, албанская , сербская / хорватская / боснийская / черногорская , румынская , итальянская , турецкая , испанская , финская , чешская , латвийская , эсперанто , корейская и суахили орфографические системы гораздо ближе подходят к последовательным фонематическим представлениям.

В менее формальных терминах язык с ярко выраженной фонематической орфографией можно охарактеризовать как язык с регулярным написанием . Другая терминология - это глубокая и поверхностная орфография , в которой глубина орфографии - это степень, в которой она отличается от истинно фонематической. Эту концепцию можно также применить к неалфавитным системам письма, таким как слоговые письма .

Идеальная фонематическая орфография

В идеальной фонематической орфографии должно быть полное взаимно однозначное соответствие ( биекция ) между графемами (буквами) и фонемами языка, и каждая фонема неизменно будет представлена ​​соответствующей графемой. Таким образом, написание слова однозначно и прозрачно указывало бы на его произношение, и наоборот, говорящий, знающий произношение слова, мог бы без всякого сомнения сделать вывод о его написании. Такая идеальная ситуация встречается редко, но существует в нескольких языках.

Спорным примером идеальной фонематической орфографии является сербско-хорватский язык. [ противоречиво ] В его алфавите ( латинском , а также сербском кириллическом алфавите ) 30 графем, каждая из которых однозначно соответствует одной из фонем. Эта, казалось бы, совершенная, но простая фонематическая орфография была достигнута в 19 веке: кириллица впервые была создана в 1814 году сербским лингвистом Вуком Караджичем , а латинский алфавит — в 1830 году хорватским лингвистом Людевитом Гаем . Однако и латиница Гая, и сербская кириллица не различают короткие и долгие гласные, а также нетонические (пишется короткая), восходящие и нисходящие тона, которые есть в сербохорватском языке. В сербско-хорватском языке тона и длины гласных опционально записывались как (на латыни) ⟨e⟩, ⟨ē⟩, ⟨è⟩, ⟨é⟩, ⟨ş⟩ и ⟨ş⟩, особенно в словарях.

Другая такая идеальная фонематическая орфография является родной для эсперанто , в которой используется сформулированный тогда принцип создателя языка Л. Л. Заменгофа «одна буква, один звук». [1]

Отклонения от фонематической орфографии

Существует два различных типа отклонения от фонематического идеала. В первом случае точное взаимно-однозначное соответствие может быть потеряно (например, какая-то фонема может быть представлена ​​орграфом вместо одной буквы), но «закономерность» сохраняется: алгоритм все равно существует ( но более сложный) для предсказания написания по произношению и наоборот. Во втором случае возникает истинная неравномерность, так как одни слова начинают писаться и произноситься по иным правилам, чем другие, и предсказание написания по произношению и наоборот уже невозможно.

Случай 1: Обычный

Произношение и написание по-прежнему предсказуемо совпадают.

Примеры:

sch против s-ch на ретороманском языке

ng против n + g на валлийском

ch против çh в мэнском гэльском языке : это немного другой случай, когда один и тот же диграф используется для двух разных одиночных фонем.

ai против ai по- французски

Часто это происходит из-за использования алфавита, который изначально использовался для другого языка ( в этих примерах — латинского алфавита ), и поэтому не имеет отдельных букв для всех фонем, используемых в текущем языке (хотя в некоторых орфографиях используются такие устройства, как в качестве диакритических знаков для увеличения количества доступных букв).

Случай 2: Нерегулярный

Произношение и написание не всегда совпадают предсказуемым образом.

Большинство орфографий не отражают изменения в произношении, известные как сандхи , при которых на произношение влияют соседние звуки в соседних словах (однако письменный санскрит и другие индийские языки отражают такие изменения). В языке также могут использоваться разные наборы символов или разные правила для разных наборов словарных единиц, таких как японские слоги хирагана и катакана (а также различная трактовка в английской орфографии слов, заимствованных из латыни и греческого языка).

Морфонематические особенности

Алфавитные орфографии часто имеют морфонематические , а не чисто фонематические особенности . Это означает, что написание в некоторой степени отражает основную морфологическую структуру слов, а не только их произношение. Следовательно, разные формы морфемы ( минимальной значимой единицы языка) часто пишутся одинаково или одинаково, несмотря на различия в их произношении. Зачастую это происходит по историческим причинам; морфонемное написание отражает предыдущее произношение, существовавшее до исторических звуковых изменений , которые вызвали изменения в произношении данной морфемы. Такое написание может помочь в распознавании слов при чтении.

Некоторые примеры морфонематических особенностей в орфографии описаны ниже.

Корейский хангыль за прошедшие столетия изменился с высоко фонематической орфографии на преимущественно морфонемную. [ нужна цитата ] Японская кана почти полностью фонематична, но имеет несколько морфонематических аспектов, в частности, использование ぢdi и づdu (а не じji и ずzu , их произношение в стандартном токийском диалекте ), когда иероглиф является озвучиванием основного ちили つ. Это результат изменения звука рендаку в сочетании со слиянием формально разных мораэ йотсугана . Русская орфография также по большей части морфонемна, поскольку не отражает редукции гласных, ассимиляции согласных и конечно-заглушенного оглушения. Кроме того, в некоторых сочетаниях согласных есть тихие согласные.

Дефектные орфографии

Дефектная орфография – это орфография, которая не способна передать все фонемы или фонематические различия в языке. Примером такого недостатка в английской орфографии является отсутствие различия между звонкими и глухими фонемами «th» ( / ð / и / θ / соответственно), встречающимися в таких словах, как / ˈ ð ɪ s / (звонкий) и тонкий / ˈ θ ɪ n / (глухой) соответственно, с написанием ⟨th⟩ .

Сравнение языков

Языки, текущая орфография которых имеет высокое соответствие графемы к фонемам и фонемам к графемам (за исключением исключений, связанных с заимствованиями и ассимиляцией), включают:

Многие фонематические орфографии в остальном немного дефектны, см. страницу «Дефектное письмо» § Латинское письмо . Графемы b и v представляют одну и ту же фонему во всех вариантах испанского языка (кроме Валенсии), тогда как в испанском языке Америки /s/ может быть представлен графемами s , c или z .

В современных индоарийских языках, таких как хинди , пенджаби , гуджарати , майтхили и некоторых других, присутствует удаление шва , при котором неявная гласная по умолчанию подавляется без явной маркировки как таковая. Другие, такие как маратхи , не имеют высокого соответствия длины гласных между графемами и фонемами.

Бенгальский и ассамский языки , несмотря на несколько поверхностную орфографию, имеют более глубокую орфографию, чем его индоарийские родственники, поскольку местами в них присутствуют тихие согласные . Более того, из-за слияния звуков одни и те же фонемы часто представляются разными графемами. Это также приводит к существованию множества омофонов в этих языках.

Французскому языку с его немыми буквами , обильным использованием носовых гласных и пропусками может показаться, что не хватает большого соответствия между написанием и произношением, но его правила произношения, хотя и сложны, последовательны и предсказуемы с достаточной степенью точности. С другой стороны, соответствие фонем буквам часто невелико, и последовательность звуков может иметь несколько способов написания, часто с разными значениями.

Орфографии, такие как немецкий , венгерский (в основном фонематический, за исключением ly , j представляет один и тот же звук, но длина согласного и гласного не всегда точна, а различные варианты написания отражают этимологию, а не произношение), португальский и новогреческий ( написанный с помощью Греческий алфавит ), а также корейский хангыль иногда считаются промежуточными по глубине (например, они включают в себя множество морфонематических особенностей, как описано выше).

Как и во французском языке, гораздо легче определить произношение немецкого слова по его написанию, чем наоборот. Например, для говорящих, которые объединяют /eː/ и /ɛː/, фонема /eː/ может писаться как e , ee , eh , ä или äh .

Английская орфография в высшей степени не фонематична. Неравномерность английского правописания возникает отчасти потому, что Великий сдвиг гласных произошел после того, как была установлена ​​орфография; отчасти потому, что английский язык в разное время приобрел большое количество заимствованных слов, сохраняя свое первоначальное написание на разных уровнях; и отчасти потому, что регуляризация написания (отход от ситуации, когда для одного и того же слова было приемлемо много разных вариантов написания) произошла произвольно в течение периода без какого-либо центрального плана. Однако даже в английском языке есть общие, хотя и сложные правила, которые предсказывают произношение на основе написания, и некоторые из этих правил в большинстве случаев успешны; Правила прогнозирования правописания по произношению имеют более высокий процент неудач.

Большинство искусственных языков, таких как эсперанто и ложбан, имеют в основном фонематическую орфографию.

Слоговые системы японского языка ( хирагана и катакана ) являются примерами почти совершенно поверхностной орфографии – исключения включают использование ぢ и づ (обсуждалось выше), а также использование は, を и へ для обозначения звуков わ, お и え. как реликвии исторического использования каны . Также отсутствует указание на тональный акцент, что приводит к омографии таких слов, как 箸 и 橋 (はし в хирагане), которые различаются в речи.

Ксавье Маржу [3] использует искусственную нейронную сеть для ранжирования 17 орфографий в соответствии с их уровнем орфографической глубины . Среди протестированных орфографий китайская и французская орфографии, за которыми следуют английская и русская, являются наиболее непрозрачными в отношении письма (т.е. направление фонем к графемам), а английская, за которой следует голландский, является наиболее непрозрачной в отношении чтения (т.е. направление графем к фонемам); Эсперанто, арабский, финский, корейский, сербохорватский и турецкий языки очень поверхностны как для чтения, так и для письма; Итальянский плохо читает и очень поверхностно пишет, бретонский, немецкий, португальский и испанский плохо читают и пишут.

Перестройка орфографии

Со временем произношение меняется , а написание устаревает, как это произошло с английским и французским языками . Чтобы поддерживать фонематическую орфографию, такая система будет нуждаться в периодическом обновлении, как это пытались сделать различные регуляторы языка и предложили другие реформаторы орфографии .

Иногда произношение слова меняется в соответствии с его написанием; это называется орфографическим произношением . Это чаще всего встречается с заимствованными словами, но иногда случается и с устоявшимися родными словами.

В некоторых английских личных именах и географических названиях связь между написанием имени и его произношением настолько далека, что ассоциации между фонемами и графемами невозможно легко определить. Более того, во многих других словах произношение впоследствии развилось из фиксированного написания, так что следует сказать, что фонемы представляют собой графемы, а не наоборот. А во многих технических жаргонах основным средством общения является письменная речь, а не устная, поэтому фонемы представляют собой графемы, и не имеет значения, как произносится слово. Более того, звуки, которые грамотные люди воспринимают в слове, существенно зависят от фактического написания слова. [4]

Иногда в странах письменный язык подвергается реформе орфографии , чтобы привести письмо в соответствие с современным разговорным языком. Они могут варьироваться от простых изменений в написании и словоформах до переключения всей системы письма, как это произошло, когда Турция перешла с арабского алфавита на турецкий алфавит латинского происхождения.

Фонетическая транскрипция

Методы фонетической транскрипции, такие как Международный фонетический алфавит (IPA), направлены на описание произношения в стандартной форме. Они часто используются для устранения двусмысленностей в написании письменной речи. Их также можно использовать для написания языков, у которых ранее не было письменной формы. Такие системы, как IPA, можно использовать для фонематического представления или для отображения более подробной фонетической информации (см. Узкая и широкая транскрипция ).

Фонематическая орфография отличается от фонетической транскрипции; тогда как в фонематической орфографии аллофоны обычно представляются одной и той же графемой, чисто фонетический сценарий потребует различения фонетически различных аллофонов. Возьмем пример из американского английского: звук /t/ в словах «table» и «cat» в фонематической орфографии будет писаться одним и тем же символом; однако в строго фонетическом сценарии будет проводиться различие между придыхательной буквой «t» в слове «стол», лоскутом в слове «масло», безнаддувной «t» в слове «стоп» и голосовой буквой «t» в слове «кошка» (не все эти аллофоны существуют во всех диалектах английского языка ). Другими словами, звук, который большинство носителей английского языка воспринимают как /t/, на самом деле представляет собой группу звуков, произносимых немного по-разному в зависимости от того, где они встречаются в слове. В идеальной фонематической орфографии одна буква на группу звуков (фонема), а разные буквы только там, где звуки различают слова (поэтому «кровать» пишется иначе, чем «бет»).

Узкая фонетическая транскрипция представляет телефоны — звуки, которые способен воспроизводить человек, многие из которых часто группируются в одну фонему в любом естественном языке, хотя группы различаются в разных языках. В английском языке, например, не делается различия между согласными с придыханием и без придыхания, но в других языках, таких как корейский , бенгальский и хинди , это делается.

Звуки речи всех языков мира могут быть записаны довольно небольшим универсальным фонетическим алфавитом. Стандартом для этого является Международный фонетический алфавит .

Смотрите также

Рекомендации

  1. ^ "Базаж элпаролай правил — PMEG" . bertilow.com.
  2. ^ Хуальде, Хосе Игнасио (2005). Звуки испанского языка . Издательство Кембриджского университета. п. 103, 146. ISBN 0-521-54538-2.
  3. ^ Маржу, Ксавье (июнь 2021 г.). «OTEANN: Оценка прозрачности орфографии с помощью искусственной нейронной сети». Материалы третьего семинара по вычислительной типологии и многоязычному НЛП : 1–9. arXiv : 1912.13321 . doi :10.18653/v1/2021.sigtyp-1.1. S2CID  209515879.
  4. ^ Дэвид Старк. «Стандартное правописание - Произношение 1». Английское орфографическое общество. Архивировано из оригинала 7 марта 2014 года.