Орфографическая глубина алфавитной орфографии указывает на степень, в которой письменный язык отклоняется от простого соответствия буква - фонема один к одному. Она зависит от того, насколько легко предсказать произношение слова на основе его написания: поверхностные орфографии легко произносить на основе написанного слова, а глубокие орфографии трудно произносить на основе того, как они написаны.
В поверхностных орфографиях соответствие между написанием и звуком является прямым: исходя из правил произношения, можно правильно произнести слово. [1] Другими словами, поверхностные (прозрачные) орфографии, также называемые фонематическими орфографиями , имеют однозначную связь между графемами и фонемами, и написание слов очень последовательно. К таким примерам относятся японская кана , хинди , лаосский (с 1975 года), испанский , финский , турецкий , грузинский , латинский , итальянский , сербохорватский , украинский и валлийский .
Напротив, в глубоких (непрозрачных) орфографиях связь менее прямая, и читатель должен выучить произвольное или необычное произношение нерегулярных слов. Другими словами, глубокие орфографии — это системы письма, в которых нет однозначного соответствия между звуками (фонемами) и буквами ( графемами ), которые их представляют. Они могут отражать этимологию ( английский , датский , шведский , фарерский , китайский , [2] тибетский , монгольский , тайский , кхмерский , бирманский , лаосский (до 1975 года; теперь используется только за рубежом), французский или франко-провансальский ).
Орфографии, такие как немецкая , венгерская (в основном фонематические, за исключением ly , j, представляющих один и тот же звук, но согласная и гласная долготы не всегда точны, и различные варианты написания отражают этимологию, а не произношение), португальская , новогреческая , исландская , корейская , тамильская и русская считаются языками средней глубины, поскольку они включают в себя множество морфофонемных особенностей. (см. §Сравнение между языками )
Письменный корейский язык представляет собой необычный гибрид; каждая фонема в языке представлена буквой, но буквы упакованы в «квадратные» единицы из двух-четырех фонем, каждый квадрат представляет слог. В корейском языке очень сложные фонологические правила вариации, особенно в отношении согласных, а не гласных, в отличие от английского. Например, корейское слово 훗일 , которое должно произноситься как [husil] на основе стандартных произношений компонентов графемы, на самом деле произносится как [hunnil] . Среди согласных корейского языка только один всегда произносится точно так, как пишется.
Итальянский язык предлагает наглядные примеры дифференциальной направленности в глубине. Даже в очень поверхностной орфографической системе написание-в-произношение и произношение-в-написание могут быть не одинаково понятны. Существует два основных несовершенных соответствия гласных буквам: в ударных слогах e может представлять как открытую [ɛ], так и закрытую [e] , а o обозначает как открытую [ɔ] , так и закрытую [o] . Согласно орфографическим принципам, используемым для языка, [ˈsɛtta] 'sect', например, с открытой [ɛ] может быть написано только как setta , а [ˈvetta] 'summit' с закрытой [e] может быть написано только как vetta — если слушатель может это услышать, он может это написать. Но поскольку буква e назначена для представления как [ɛ] , так и [e] , нет принципиального способа узнать, следует ли произносить написанные слова setta и vetta с [ɛ] или [e] — написание не предоставляет информацию, необходимую для правильного произношения. Второй пробел в поверхностной орфографии итальянского языка заключается в том, что, хотя позиция ударения в словах лишь отчасти предсказуема, она обычно не указывается на письме. Для целей правописания не имеет значения, какой слог ударный в топонимах Arsoli и Carsoli , но написание не дает никаких подсказок о том, что это ARsoli и CarSOli (и, как и в случае с буквой e выше, ударное o в слове Carsoli , которое есть [ɔ] , неизвестно из правописания).
Согласно гипотезе орфографической глубины, поверхностные орфографии легче поддерживают процесс распознавания слов, который включает в себя фонологию языка. Напротив, глубокие орфографии побуждают читателя обрабатывать печатные слова, обращаясь к их морфологии через визуально-орфографическую структуру печатного слова (см. также Ram Frost ). [3] [4] Для языков с относительно глубокой орфографией, таких как английский , французский , невокализованный арабский [ требуется ссылка ] или иврит , новым читателям гораздо сложнее научиться декодировать слова. В результате дети учатся читать медленнее. [5] Для языков с относительно поверхностной орфографией, таких как итальянский и финский , новым читателям несложно научиться декодировать слова. В результате дети учатся читать относительно быстро. [5]
Ван ден Бош и др. [6] рассматривают орфографическую глубину как композицию по крайней мере двух отдельных компонентов. Один из них касается сложности отношений между элементами на графемном уровне (графемы) и элементами на фонемном уровне (фонемы), т. е. насколько сложно преобразовать графемные строки (слова) в фонемные строки. Второй компонент связан с разнообразием на графемном уровне и со сложностью определения графемных элементов слова (графемный анализ), т. е. как выровнять фонемную транскрипцию с ее орфографическим аналогом.
Ксавье Маржу [7] использует искусственную нейронную сеть для ранжирования 17 орфографий по уровню прозрачности. Среди протестированных орфографий китайская и французская орфографии, за которыми следуют английский и русский, являются наиболее непрозрачными в отношении письма (т. е. направления фонем к графемам), а английский, за которым следует голландский, является наиболее непрозрачным в отношении чтения (т. е. направления графем к фонемам); эсперанто, арабский, финский, корейский, сербохорватский и турецкий языки очень поверхностны как для чтения, так и для письма; итальянский язык поверхностен для чтения и очень поверхностен для письма, бретонский, немецкий, португальский и испанский языки поверхностны для чтения и письма.