stringtranslate.com

Фонематическая орфография

Фонематическая орфография — это орфография (система записи языка ), в которой графемы (письменные символы) последовательно соответствуют фонемам языка (наименьшим единицам речи, которые могут различать слова) или, в более общем смысле, диафонемам языка . Естественные языки редко имеют идеально фонематическую орфографию; высокую степень соответствия графема-фонема можно ожидать в орфографиях, основанных на алфавитных системах письма, но они различаются по тому, насколько полно это соответствие. Например, английская орфография является алфавитной, но в высшей степени нефонемной.

В менее формально точных терминах язык с высокой фонематической орфографией может быть описан как имеющий регулярное написание или фонетическое написание . Другая терминология — это терминология глубоких и поверхностных орфографий , в которой глубина орфографии — это степень, в которой она отклоняется от истинно фонематической. Эта концепция может также применяться к неалфавитным системам письма, таким как слоговые азбуки .

Идеальная фонематическая орфография

В идеальной фонематической орфографии было бы полное взаимно-однозначное соответствие ( биекция ) между графемами (буквами) и фонемами языка, и каждая фонема неизменно была бы представлена ​​соответствующей ей графемой. Таким образом, написание слова недвусмысленно и прозрачно указывало бы на его произношение, и наоборот, говорящий, знающий произношение слова, мог бы без всяких сомнений вывести его написание. Такая идеальная ситуация встречается редко, но существует в нескольких языках.

Отклонения от фонематической орфографии

Существует два различных типа отклонения от фонематического идеала. В первом случае точное соответствие один к одному может быть утрачено (например, некоторая фонема может быть представлена ​​диграфом вместо одной буквы), но «регулярность» сохраняется: все еще существует алгоритм ( но более сложный) для предсказания написания по произношению и наоборот. Во втором случае вводится настоящая нерегулярность, поскольку некоторые слова начинают писать и произносить по правилам, отличным от других, и предсказание написания по произношению и наоборот больше невозможно.

Случай 1: Обычный

Произношение и написание по-прежнему соответствуют друг другу предсказуемым образом.

Примеры:

sch против s-ch в ретороманском языке

ng против n + g в валлийском

ch против çh в мэнском гэльском : это немного другой случай, когда один и тот же диграф используется для двух разных фонем.

ai против во французском

Часто это происходит из-за использования алфавита, который изначально использовался для другого языка ( в этих примерах — латинского алфавита ), и поэтому в нем нет отдельных букв для всех фонем, используемых в текущем языке (хотя в некоторых орфографиях используются такие приемы, как диакритические знаки, для увеличения количества доступных букв).

Случай 2: Нерегулярный

Произношение и написание не всегда соответствуют предсказуемому.

В бенгальском языке буквы 'শ', 'ষ' и ' স соответствуют одному и тому же звуку / ʃ /. Более того, согласные кластеры 'স্ব', 'স্য', 'শ্ব ', 'শ্ম', 'শ্য', 'ষ্ম ', 'ষ্য' также часто имеют одинаковое произношение, / ʃ / или / ʃ ʃ /.

Большинство орфографий не отражают изменения в произношении, известные как сандхи , в которых на произношение влияют соседние звуки в соседних словах (письменный санскрит и другие индийские языки , однако, отражают такие изменения). Язык может также использовать разные наборы символов или разные правила для разных наборов словарных единиц, таких как японские слоговые азбуки хирагана и катакана (и разная обработка в английской орфографии слов, полученных из латинского и греческого языков).

Морфофонематические особенности

Алфавитные орфографии часто имеют черты, которые являются морфофонемическими , а не чисто фонематическими. Это означает, что написание в некоторой степени отражает лежащую в основе морфологическую структуру слов, а не только их произношение. Поэтому различные формы морфемы ( минимальной значимой единицы языка) часто пишутся одинаково или похоже, несмотря на различия в их произношении. Это часто происходит по историческим причинам; морфофонемное написание отражает предыдущее произношение до исторических звуковых изменений , которые вызвали вариацию в произношении данной морфемы. Такое написание может помочь в распознавании слов при чтении.

Ниже описаны некоторые примеры морфофонемных особенностей орфографии.

Корейская орфография хангыль на протяжении столетий менялась от сильно фонематической до в основном морфофонемной. [ необходима цитата ] Японская кана почти полностью фонематична, но имеет несколько морфофонемных аспектов, особенно в использовании ぢdi и づdu (а не じji и ずzu , как они произносятся в стандартном токийском диалекте ), когда иероглиф является озвончением базового ち или つ. Это происходит из-за изменения звука rendaku в сочетании со слиянием yotsugana формально различных morae. Русская орфография также в основном морфофонемная, поскольку она не отражает редукцию гласных, ассимиляцию согласных и окончательное шумное оглушение. Кроме того, некоторые сочетания согласных имеют немые согласные.

Неправильная орфография

Дефектная орфография — это та, которая не способна отражать все фонемы или фонемные различия в языке. Примером такого недостатка в английской орфографии является отсутствие различия между звонкими и глухими фонемами «th» ( / ð / и / θ / соответственно), встречающимися в таких словах, как / ˈ ð ɪ s / ( звонкий) и thin / ˈ θ ɪ n / (глухой) соответственно, причем обе они пишутся как ⟨th⟩ .

Сравнение языков

Языки, в современной орфографии которых наблюдается высокая степень соответствия графем фонемам и фонем графемам (исключая исключения, связанные с заимствованиями и ассимиляцией), включают:

Многие фонематические орфографии немного дефектны, см. страницу Дефектное письмо § Латинское письмо . Графемы b и v представляют одну и ту же фонему во всех вариантах испанского языка (кроме валенсийского), в то время как в испанском языке Америки /s/ может быть представлено графемами s , c или z .

Современные индоарийские языки, такие как хинди , пенджаби , гуджарати , майтхили и несколько других, характеризуются удалением шва , когда неявная гласная по умолчанию подавляется без явного обозначения как таковая. Другие, такие как маратхи , не имеют высокого соответствия графема-фонема для длин гласных.

Бенгальский , несмотря на немного поверхностную орфографию, имеет более глубокую орфографию, чем его индоарийские собратья, поскольку в нем местами присутствуют немые согласные . Более того, из-за слияния звуков одни и те же фонемы часто представлены разными графемами. С другой стороны, в ассамском языке нет ретрофлексных согласных, и поэтому символы для ретрофлексных согласных (например, ট ('t') и ড ('d')), которые он унаследовал в своей письменности от древнего письма брахми, также произносятся как их зубные версии. Более того, как в бенгали , так и в ассамском языке нет никаких различий в длине гласных. Таким образом, такие буквы, как ই ('i') и ঈ ('i:'), а также উ ('u') и ঊ ('u:') имеют такое же произношение, как 'i' и 'u' соответственно. Это приводит к существованию в этих языках множества омофонов (слов с одинаковым произношением, но разным написанием и значением).

Французский язык , с его немыми буквами и его обильным использованием носовых гласных и элизии , может показаться лишенным большого соответствия между написанием и произношением, но его правила произношения, хотя и сложны, последовательны и предсказуемы с достаточной степенью точности. Соответствие фонем буквам, с другой стороны, часто низкое, и последовательность звуков может иметь несколько способов написания, часто с разными значениями.

Орфографии, такие как немецкая , венгерская ( в основном фонематические, за исключением ly , j, представляющих один и тот же звук, но длина согласного и гласного не всегда точна, а различные варианты написания отражают этимологию, а не произношение), португальская и новогреческая ( письменная с использованием греческого алфавита ), а также корейский хангыль , иногда считаются имеющими промежуточную глубину (например, они включают в себя множество морфофонемных особенностей, как описано выше).

Подобно французскому языку, гораздо проще вывести произношение немецкого слова из его написания, чем наоборот. Например, для носителей, которые объединяют /eː/ и /ɛː/, фонема /eː/ может быть написана как e , ee , eh , ä или äh .

Английская орфография крайне нефонемна. Нерегулярность английского правописания возникает отчасти из-за того, что Великий сдвиг гласных произошел после того, как орфография была установлена; отчасти из-за того, что английский язык приобрел большое количество заимствованных слов в разное время, сохранив свое первоначальное написание на разных уровнях; и отчасти из-за того, что регуляризация правописания (отход от ситуации, в которой для одного и того же слова было приемлемо много разных написаний) происходила произвольно в течение определенного периода без какого-либо центрального плана. Однако даже в английском языке есть общие, хотя и сложные, правила, которые предсказывают произношение по написанию, и некоторые из этих правил в большинстве случаев оказываются успешными; правила, предсказывающие правописание по произношению, имеют более высокий процент неудач.

Большинство искусственных языков, таких как эсперанто и ложбан, имеют преимущественно фонематическую орфографию.

Слоговые системы японского языка ( хирагана и катакана ) являются примерами почти совершенно поверхностной орфографии – исключения включают использование ぢ и づ (обсуждалось выше) , а также использование は, を и へ для обозначения звуков わ, お и え. как реликвии исторического использования каны . Также нет указания на тональный акцент, что приводит к омографии таких слов, как 箸 и 橋 (はし в хирагане), которые различаются в речи.

Ксавье Маржу [2] использует искусственную нейронную сеть для ранжирования 17 орфографий в соответствии с их уровнем орфографической глубины . Среди протестированных орфографий китайская и французская орфографии, за которыми следуют английский и русский, являются наиболее непрозрачными с точки зрения письма (т. е. направления фонем к графемам), а английский, за которым следует голландский, является наиболее непрозрачным с точки зрения чтения (т. е. направления графем к фонемам); эсперанто, арабский, финский, корейский, сербохорватский и турецкий языки очень поверхностны как для чтения, так и для письма; итальянский язык поверхностен для чтения и очень поверхностен для письма, бретонский, немецкий, португальский и испанский языки поверхностны для чтения и письма.

Изменение орфографии

Со временем произношение меняется , а написание устаревает, как это произошло с английским и французским языками . Для поддержания фонематической орфографии такая система должна периодически обновляться, как это пытались сделать различные регуляторы языка и предлагали другие реформаторы правописания .

Иногда произношение слова меняется, чтобы соответствовать его написанию; это называется орфографическим произношением . Это чаще всего встречается в заимствованных словах, но иногда случается и в случае устоявшихся родных слов.

В некоторых английских личных именах и географических названиях связь между написанием имени и его произношением настолько далека, что ассоциации между фонемами и графемами не могут быть легко идентифицированы. Более того, во многих других словах произношение впоследствии развилось из фиксированного написания, так что приходится говорить, что фонемы представляют графемы, а не наоборот. И во многих технических терминах основным средством общения является письменный язык, а не устный, поэтому фонемы представляют графемы, и неважно, как произносится слово. Более того, звуки, которые грамотные люди воспринимают как услышанные в слове, в значительной степени зависят от фактического написания слова. [3]

Иногда страны проводят реформу правописания письменного языка , чтобы привести его в соответствие с современным разговорным языком. Это может варьироваться от простых изменений правописания и форм слов до переключения всей системы письма, как это было, когда Турция перешла с арабского алфавита на турецкий алфавит на основе латиницы .

Фонетическая транскрипция

Методы фонетической транскрипции, такие как Международный фонетический алфавит (МФА), направлены на описание произношения в стандартной форме. Они часто используются для разрешения неоднозначностей в написании письменного языка. Они также могут использоваться для записи языков, не имеющих предыдущей письменной формы. Такие системы, как МФА, могут использоваться для фонематического представления или для отображения более подробной фонетической информации (см. Узкая и широкая транскрипция ).

Фонематическая орфография отличается от фонетической транскрипции; в то время как в фонематической орфографии аллофоны обычно представлены одной и той же графемой, чисто фонетическое письмо потребовало бы, чтобы фонетически различные аллофоны были различимы. Возьмем пример из американского английского: звук /t/ в словах "table" и "cat" в фонематической орфографии будет записан одним и тем же символом; однако строго фонетическое письмо провело бы различие между придыхательным "t" в "table", лоскутом в "butter", непридыхательным "t" в "stop" и глоттализованным "t" в "cat" (не все эти аллофоны существуют во всех диалектах английского языка ). Другими словами, звук, который большинство носителей английского языка считают /t/, на самом деле является группой звуков, все из которых произносятся немного по-разному в зависимости от того, где они встречаются в слове. Идеальная фонематическая орфография имеет одну букву на группу звуков (фонему), при этом буквы различаются только там, где звуки различаются по словам (например, «bed» пишется иначе, чем «bet»).

Узкая фонетическая транскрипция представляет фоны , звуки, которые люди способны воспроизводить, многие из которых часто группируются вместе как одна фонема в любом данном естественном языке, хотя группировки различаются в разных языках. Например, английский язык не различает придыхательные и непридыхательные согласные, но другие языки, такие как корейский , бенгальский и хинди , различают.

Звуки речи всех языков мира могут быть записаны с помощью сравнительно небольшого универсального фонетического алфавита. Стандартом для этого является Международный фонетический алфавит .

Смотрите также

Ссылки

  1. ^ Хуальде, Хосе Игнасио (2005). Звуки испанского языка . Издательство Кембриджского университета. п. 103, 146. ISBN 0-521-54538-2.
  2. ^ Маржу, Ксавье (июнь 2021 г.). «OTEANN: Оценка прозрачности орфографии с помощью искусственной нейронной сети». Труды Третьего семинара по вычислительной типологии и многоязычному NLP : 1–9. arXiv : 1912.13321 . doi : 10.18653/v1/2021.sigtyp-1.1. S2CID  209515879.
  3. ^ Старк, Дэвид. «Произношение 1». Стандартизированное правописание. Общество английского правописания. Архивировано из оригинала 7 марта 2014 г.