Орфографическая глубина алфавитной орфографии указывает на степень отклонения письменного языка от простого однозначного соответствия букв и фонем . Это зависит от того, насколько легко предсказать произношение слова на основе его написания: поверхностные орфографии легко произнести на основе написанного слова, а глубокие орфографии трудно произнести на основе того, как они написаны.
В неглубокой орфографии орфографо-звуковое соответствие прямое: исходя из правил произношения, можно правильно произнести слово. [1] Другими словами, неглубокие (прозрачные) орфографии, также называемые фонематическими орфографиями , имеют взаимно однозначное отношение между графемами и фонемами, а написание слов очень последовательное. К таким примерам относятся хинди , испанский , финский , турецкий , латинский и итальянский языки .
Напротив, в глубоких (непрозрачных) орфографиях связь менее прямая, и читатель должен выучить произвольное или необычное произношение неправильных слов. Другими словами, глубокая орфография — это системы письма, в которых нет однозначного соответствия между звуками (фонемами) и буквами ( графемами ), которые их представляют. Они могут отражать этимологию ( английское , фарерское , монгольское письмо , тайское , французское или франко-провансальское письмо ) или быть морфонемными ( корейское или русское письмо ).
Письменный корейский представляет собой необычный гибрид; каждая фонема в языке представлена буквой, но буквы упакованы в «квадратные» блоки по две-четыре фонемы, каждый квадрат представляет собой слог. В корейском языке очень сложные правила фонологических вариаций, особенно в отношении согласных, а не гласных, в отличие от английского языка. Например, корейское слово 훗일 , которое следует произносить как [husil] исходя из стандартного произношения компонентов графемы, на самом деле произносится как [hunnil] . Среди согласных корейского языка только один всегда произносится именно так, как пишется.
Итальянский предлагает яркие примеры глубокой дифференциальной направленности. Даже в очень поверхностной орфографической системе отношения правописания к произношению и произношения к правописанию могут быть не одинаково ясными. Есть два основных несовершенных соответствия гласных буквам: в ударных слогах e может обозначать либо открытое [ɛ] , либо закрытое [e] , а o означает либо открытое [ɔ] , либо закрытое [o] . В соответствии с орфографическими принципами, используемыми в языке, [ˈsɛtta] «секта», например, с открытым [ɛ] может писаться только setta , а [ˈvetta] «саммит» с закрытым [e] может быть только vetta — если слушатель может это услышать, они могут это произнести. Но поскольку буква e предназначена для обозначения как [ɛ], так и [e] , не существует принципиального способа узнать, следует ли произносить написанные слова setta и vetta с [ɛ] или [e] — написание не дает информации. необходим для точного произношения. Второй пробел в неглубокой орфографии итальянского языка заключается в том, что, хотя положение ударения в словах предсказуемо лишь частично, оно обычно не указывается в письменной форме. Для целей правописания не имеет значения, какой слог является ударным в топонимах Arsoli и Carsoli , но их написание не дает никакого представления о том, что это ARsoli и CarSOli (и, как и в случае с буквой e выше, ударение o в словах Carsoli , что означает [ɔ] , по написанию неизвестно).
Согласно гипотезе орфографической глубины, неглубокая орфография легче поддерживает процесс распознавания слов, включающий фонологию языка. Напротив, глубокая орфография побуждает читателя обрабатывать печатные слова, обращаясь к их морфологии через визуально-орфографическую структуру печатного слова (см. также Ram Frost ). [2] [3] Для языков с относительно глубокой орфографией, таких как английский , французский , негласный арабский [ нужна ссылка ] или иврит , новым читателям гораздо труднее научиться расшифровывать слова. В результате дети учатся читать медленнее. [4] В языках с относительно неглубокой орфографией, таких как итальянский и финский , у новых читателей не возникает проблем с обучением расшифровке слов. В результате дети учатся читать относительно быстро. [4]
Фонетические системы письма японского языка ( хирагана и катакана ) — еще один пример поверхностной орфографии, но в японском языке также используются логографы ( кандзи ), которые значительно сложнее. Кроме того, латинизация, известная как ромадзи , становится все более распространенной, но не используется традиционно. Однако в отличие от алфавитных орфографий (английской, французской, итальянской, турецкой и др.) японские орфографии хираганы и катаканы основаны на открытых слогах речи (согласных-гласных) или, точнее, на море , с одним письменный символ каждого слога/моры языка. В то время как в японском языке есть только три графемы для шести фонем, как в слове катана (японская хирагана:かたな, японская катакана:カタナIPA: японское произношение: [/ka ta na/] ), японская кана делится на слоги/мораэ с помощью простой Структура V или C+V (с одной морой -C, которая обычно появляется только в концах слогов), а не отдельными гласными и согласными; для написания слова необходимо меньше графем. Поскольку фонология японского языка относительно проста по сравнению со многими другими языками, написание японского языка с использованием слогов, а не букв алфавита, является возможным вариантом.
Ван ден Бош и др. [5] считают орфографическую глубину составом как минимум двух отдельных компонентов. Одна из них связана со сложностью отношений между элементами графемного уровня (графемами) и элементами фонематического уровня (фонемами), т. е. с тем, насколько трудно преобразовать графемные строки (слова) в фонематические строки. Второй компонент связан с разнообразием на графемном уровне, а также со сложностью определения графемных элементов слова (графемный синтаксический анализ), т. е. с тем, как привести фонематическую транскрипцию в соответствие с ее орфографическим аналогом.
Ксавье Маржу [6] использует искусственную нейронную сеть для ранжирования 17 орфографий в соответствии с уровнем их прозрачности. Среди протестированных орфографий китайская и французская орфографии, за которыми следуют английская и русская, являются наиболее непрозрачными в отношении письма (т.е. направление фонем к графемам), а английская, за которой следует голландский, является наиболее непрозрачной в отношении чтения (т.е. направление графем к фонемам); Эсперанто, арабский, финский, корейский, сербохорватский и турецкий языки очень поверхностны как для чтения, так и для письма; Итальянский плохо читает и очень поверхностно пишет, бретонский, немецкий, португальский и испанский плохо читают и пишут.