В лингвистике графема — наименьшая функциональная единица письменности . [1] Слово графема происходит от древнегреческого γράφω (gráphō) «писать» и суффикса -eme по аналогии с фонемой и другими названиями эмических единиц . Изучение графем называется графемикой . Понятие графем абстрактно и похоже на понятие вычисления символа . Для сравнения, определенная форма, которая представляет любую конкретную графему в данном шрифте , называется глифом .
Существуют две основные противоположные концепции графем. [2]
В так называемой референтной концепции графемы трактуются как мельчайшие единицы письма, соответствующие звукам (точнее фонемам ). В этой концепции буква sh в письменном английском слове Shake будет графемой, поскольку она представляет фонему /ʃ/ . Эта референциальная концепция связана с гипотезой зависимости , которая утверждает, что письмо просто изображает речь.
Напротив, аналогичная концепция определяет графемы аналогично фонемам, т.е. через письменные минимальные пары , такие как «тряска » и «змея» . В этом примере h и n являются графемами, поскольку они различают два слова. Эта аналогичная концепция связана с гипотезой автономии, согласно которой письмо является самостоятельной системой и должно изучаться независимо от речи. Обе концепции имеют слабые стороны. [3]
Некоторые модели придерживаются обеих концепций одновременно, включая две отдельные единицы, [4] которым даются такие имена, как графемная графема для графемы в соответствии с аналогичной концепцией ( h in Shake ) и фонологическая графема для графемы в соответствии с референтной концепцией. концепция ( sh in тряска ). [5]
В более новых концепциях, в которых графема трактуется семиотически как диадический языковой знак , [6] она определяется как минимальная единица письма, которая одновременно лексически различима и соответствует языковой единице ( фонеме , слогу или морфеме ). [7]
Графемы часто обозначаются в угловых скобках : ⟨a⟩ , ⟨b⟩ и т. д. [8] Это аналогично обозначению косой черты ( /a/ , /b/ ), используемому для фонем , и обозначению квадратных скобок, используемому для фонетических обозначений . транскрипции ( [a] , [b] ).
Точно так же, как поверхностные формы фонем являются звуками речи или телефонами (а разные телефоны, представляющие одну и ту же фонему, называются аллофонами ), поверхностные формы графем являются глифами (иногда графами ), а именно конкретными письменными представлениями символов (и различных глифов). представляющие одну и ту же графему, называются аллографами ).
Таким образом, графему можно рассматривать как абстракцию набора глифов, которые функционально эквивалентны.
Например, в письменном английском языке (или других языках, использующих латинский алфавит ) существует два разных физических представления строчной латинской буквы «а»: « a » и « ɑ ». Поскольку, однако, замена одного из них другим не может изменить значение слова, они считаются аллографами одной и той же графемы, которую можно записать ⟨a⟩ . Точно так же графема, соответствующая «арабской цифре ноль», имеет уникальную семантическую идентичность и значение Юникода, U+0030
но имеет вариации в форме перечеркнутого нуля . Курсив и жирный шрифт также являются аллографическими, как и вариации, наблюдаемые в формах с засечками (как в Times New Roman ) и без засечек (как в Helvetica ).
Существуют некоторые разногласия относительно того, являются ли заглавные и строчные буквы аллографами или отдельными графемами. Заглавные буквы обычно встречаются в определенных триггерных контекстах, которые не меняют значения слова: например, в имени собственном, или в начале предложения, или во всех заглавных буквах в газетном заголовке. В других контекстах использование заглавных букв может определять значение: сравните, например, польский и польский : первый — это язык, второй — чистка обуви.
Некоторые лингвисты считают орграфы , такие как ⟨sh⟩ на корабле , отдельными графемами, но обычно их анализируют как последовательности графем. Однако нестилистические лигатуры , такие как ⟨æ⟩ , являются отдельными графемами, как и различные буквы с отличительными диакритическими знаками , такие как ⟨ç⟩ .
Идентичные глифы не всегда могут представлять одну и ту же графему. Например, три буквы ⟨A⟩ , ⟨А⟩ и ⟨Α⟩ выглядят одинаково, но каждая имеет разное значение: по порядку это латинская буква A , кириллическая буква Azϔ/Азъ и греческая буква Alpha . Каждый из них имеет свой собственный код в Юникоде: U+0041 A ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА A , U+0410 А КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА A и U+0391 Α ГРЕЧЕСКАЯ ЗАГЛАВНАЯ БУКВА АЛЬФА .
Основными типами графем являются логограммы (более точно называемые морфограммами [9] ), которые представляют слова или морфемы (например, китайские иероглифы , амперсанд «&», обозначающий слово и , арабские цифры ); слоговые символы, обозначающие слоги (как в японской кане ); и буквенные буквы, примерно соответствующие фонемам (см. следующий раздел). Полное описание различных типов см. в разделе « Система письма § Функциональная классификация» .
При письме используются дополнительные графемические компоненты, такие как знаки препинания , математические символы , разделители слов , такие как пробел, и другие типографские символы . Древние логографические сценарии часто использовали молчаливые определители , чтобы устранить неоднозначность значения соседнего (немого) слова.
Как упоминалось в предыдущем разделе, в языках, использующих алфавитные системы письма, многие графемы в принципе заменяют фонемы ( значительные звуки) языка. Однако на практике орфографии таких языков влекут за собой по крайней мере определенное отклонение от идеала точного соответствия графем и фонем. Фонема может быть представлена мультиграфом ( последовательностью более чем одной графемы), поскольку диграф sh представляет один звук в английском языке (а иногда одна графема может представлять более одной фонемы, как в случае с русской буквой я или испанской c). ). Некоторые графемы могут вообще не обозначать никакого звука (например, b в английском долге или h во всех испанских словах, содержащих указанную букву), и часто правила соответствия между графемами и фонемами становятся сложными или нерегулярными, особенно в результате исторических событий. звуковые изменения , которые не обязательно отражаются на написании. «Поверхностные» орфографии, такие как орфографии стандартного испанского и финского языка , имеют относительно регулярное (хотя и не всегда однозначное) соответствие между графемами и фонемами, в то время как орфографии французского и английского языков имеют гораздо менее регулярное соответствие и известны как глубокие орфографии .
Мультиграфы, представляющие одну фонему, обычно рассматриваются как комбинации отдельных букв, а не как отдельные графемы. Однако в некоторых языках мультиграф может рассматриваться как единая единица для целей сопоставления ; например, в чешском словаре раздел слов, начинающихся с ⟨ch⟩ , идет после ⟨h⟩ . [10] Дополнительные примеры см. в разделе «Алфавитный порядок» § Соглашения, специфичные для языка .