В письменном языке логограмма (от древнегреческого logos «слово» и gramma «то , что нарисовано или написано»), также логограф или лексиграф , является письменным символом , который представляет собой семантический компонент языка, такой как слово или морфема . Китайские иероглифы , используемые в китайском , а также в других языках, являются логограммами, как и египетские иероглифы и символы в клинописи . Система письма , которая в основном использует логограммы, называется логографией . Нелогографические системы письма, такие как алфавиты и слоговые азбуки , являются фонематическими : их отдельные символы представляют звуки напрямую и не имеют какого-либо присущего им значения. Однако все известные логографии имеют некоторый фонетический компонент, как правило, основанный на принципе ребуса , и добавление фонетического компонента к чистым идеограммам считается ключевым нововведением, позволяющим системе письма адекватно кодировать человеческий язык.
Логографические системы включают в себя самые ранние системы письма; первые исторические цивилизации Месопотамии, Египта, Китая и Мезоамерики использовали ту или иную форму логографического письма. [1] [2]
Все логографические письменности, когда-либо использовавшиеся для естественных языков, опираются на принцип ребуса для расширения относительно ограниченного набора логограмм: подмножество символов используется для их фонетических значений, как согласных, так и слоговых. Термин логосиллабарный используется для того, чтобы подчеркнуть частично фонетическую природу этих письменностей, когда фонетической областью является слог. В древнеегипетских иероглифах , Ч'олти' и в китайском языке произошло дополнительное развитие детерминативов , которые объединяются с логограммами, чтобы сузить их возможное значение. В китайском языке они объединены с логографическими элементами, используемыми фонетически; такие « радикальные и фонетические» символы составляют основную часть письма. Древнеегипетский и китайский языки отнесли активное использование ребуса к написанию иностранных и диалектных слов.
Логоконсонантные письменности имеют графемы, которые могут быть расширены фонетически в соответствии с согласными слов, которые они представляют, игнорируя гласные. Например, египетский
использовался для записи как sȝ 'утка', так и sȝ 'сын', хотя вполне вероятно, что эти слова произносились по-разному, за исключением согласных. Основными примерами логоконсонантных шрифтов являются египетские иероглифы , иератические , и демотические : Древнеегипетский .
В логосиллабических письменностях есть графемы , которые представляют морфемы, часто многосложные морфемы, но при расширении фонетически представляют отдельные слоги. Они включают клинопись, анатолийские иероглифы , критские иероглифы , линейное письмо А и линейное письмо В , китайские иероглифы , письмо майя , ацтекское письмо , миштекское письмо и первые пять фаз письма бамум .
Своеобразная система логограмм, разработанная в рамках пехлевийского письма (развившегося из арамейского абджада ) , использовалась для записи среднеперсидского языка в течение большей части периода Сасанидов ; логограммы состояли из букв, которые составляли слово на арамейском языке , но произносились как на персидском (например, сочетание mlk произносилось бы как «шах»). Эти логограммы, называемые hozwārishn (форма гетерограмм ), были полностью отменены после арабского завоевания Персии и принятия варианта арабского алфавита . [ требуется цитата ]
Все исторические логографические системы включают фонетическое измерение, поскольку непрактично иметь отдельный базовый символ для каждого слова или морфемы в языке. [a] В некоторых случаях, например, в клинописи, которая использовалась для аккадского языка, подавляющее большинство глифов используются для их звуковых значений, а не логографически. Многие логографические системы также имеют семантический/идеографический компонент (см. идеограмму ), называемый «детерминативами» в случае египетского и «радикалами» в случае китайского. [b]
Типичное египетское использование заключалось в дополнении логограммы, которая потенциально могла представлять несколько слов с разным произношением, с детерминантом для сужения значения и фонетическим компонентом для уточнения произношения. В случае китайского языка подавляющее большинство символов представляют собой фиксированную комбинацию радикала, который указывает на его номинальную категорию, плюс фонетический компонент для представления о произношении. Система майя использовала логограммы с фонетическими дополнениями, как египетская, при этом отсутствовали идеографические компоненты.
Китайские ученые традиционно классифицируют китайские иероглифы ( ханцзы ) на шесть типов по этимологии.
Первые два типа являются «односоставными», что означает, что иероглиф был создан независимо от других иероглифов. «Односоставные» пиктограммы и идеограммы составляют лишь малую часть китайских логограмм. Более продуктивными для китайской письменности были два «составных» метода, то есть иероглиф создавался путем объединения разных иероглифов. Несмотря на то, что их называют «составными», эти логограммы все еще являются отдельными иероглифами и пишутся так, чтобы занимать то же количество места, что и любая другая логограмма. Последние два типа — это методы использования иероглифов, а не формирование самих иероглифов.
Самый продуктивный метод китайского письма, радикально-фонетический, стал возможен благодаря игнорированию определенных различий в фонетической системе слогов. В древнекитайском языке обычно игнорировались конечные согласные /s/ и /ʔ/ ; они превратились в тоны в среднекитайском языке , которые также игнорировались при создании новых символов. Также игнорировались различия в придыхании (между придыхательными и непридыхательными шумными и звонкими и глухими сонорными); древнекитайское различие между слогами типа A и типа B (часто описываемое как наличие и отсутствие палатализации или фарингализации ) ; а иногда и озвончение начальных шумных и/или наличие медиального /r/ после начального согласного. В более ранние времена, как правило, допускалась большая фонетическая свобода. В средние века в Китае вновь создаваемые иероглифы, как правило, точно соответствовали произношению, за исключением тона, — часто в качестве фонетического компонента использовался иероглиф, который сам по себе являлся радикально-фонетическим соединением.
Из-за длительного периода языковой эволюции такие компонентные «намеки» в иероглифах, предоставляемые радикально-фонетическими соединениями, иногда бесполезны и могут вводить в заблуждение в современном использовании. Например, на основе每'each', произносимого как měi в стандартном мандаринском , есть иероглифы侮'humiliate',悔'to regret' и海'sea', произносимые соответственно как wǔ , huǐ и hǎi в мандаринском. Три из этих иероглифов произносились очень похоже в древнекитайском языке: /mˤəʔ/ (每), /m̥ˤəʔ/ (悔) и /m̥ˤəʔ/ (海) согласно недавней реконструкции Уильяма Х. Бакстера и Лорана Сагарта [4] , но звуковые изменения за прошедшие около 3000 лет (включая два различных диалектных развития в случае последних двух иероглифов) привели к радикально разным произношениям.
В контексте китайского языка китайские иероглифы (известные как ханцзы ) в целом представляют собой слова и морфемы, а не чистые идеи; однако принятие китайских иероглифов японским и корейским языками (где они известны как кандзи и ханджа соответственно) привело к некоторым осложнениям в этой картине.
Многие китайские слова, состоящие из китайских морфем, были заимствованы в японский и корейский языки вместе с их иероглифическими представлениями; в этом случае морфемы и иероглифы были заимствованы вместе. В других случаях, однако, иероглифы были заимствованы для представления исконно японских и корейских морфем, на основе одного лишь значения. В результате один иероглиф может в конечном итоге представлять несколько морфем со схожим значением, но разного происхождения в нескольких языках. Из-за этого кандзи и ханджа иногда описываются как морфографические системы письма. [ необходима цитата ]
Поскольку многие исследования по обработке языка были сосредоточены на английском и других языках с алфавитным письмом, многие теории обработки языка подчеркивали роль фонологии в создании речи. Противопоставление логографически кодированных языков, где один символ представлен фонетически и идеографически, с фонетически/фонематически написанными языками дало понимание того, как разные языки полагаются на разные механизмы обработки. Исследования по обработке логографически кодированных языков, среди прочего, рассматривали нейробиологические различия в обработке, причем одной из областей особого интереса была полушарная латерализация. Поскольку логографически кодированные языки более тесно связаны с изображениями, чем алфавитно кодированные языки, несколько исследователей выдвинули гипотезу, что активация правой стороны должна быть более выраженной в логографически кодированных языках. Хотя некоторые исследования дали результаты, согласующиеся с этой гипотезой, слишком много контрастных результатов, чтобы сделать какие-либо окончательные выводы о роли полушарной латерализации в орфографически и фонетически кодированных языках. [5]
Другая тема, которой было уделено некоторое внимание, — это различия в обработке омофонов. Вердоншот и др. [6] исследовали различия во времени, необходимом для чтения омофона вслух, когда перед символом показывалась картинка, которая была связана или не связана [7] с омофонным символом. Были исследованы как японские, так и китайские омофоны. В то время как производство слов в алфавитно-кодированных языках (таких как английский) показало относительно устойчивый иммунитет к воздействию контекстных стимулов, [8] Вердоншот и др. [9] обнаружили, что японские омофоны кажутся особенно чувствительными к этим типам эффектов. В частности, время реакции было короче, когда участникам показывали фонологически связанную картинку перед тем, как их просили прочитать целевой символ вслух. Примером фонологически связанного стимула из исследования может быть, например, когда участникам показывали изображение слона, которое произносится как zou на японском языке, перед тем, как им показывали китайский иероглиф造, который также читается как zou . Не было обнаружено никакого эффекта фонологически связанных контекстных картинок на время реакции при чтении китайских слов. Сравнение (частично) логографически кодированных языков японского и китайского интересно, потому что в то время как японский язык состоит из более чем 60% омографических гетерофонов (символов, которые можно прочитать двумя или более разными способами), большинство китайских иероглифов имеют только одно чтение. Поскольку оба языка логографически кодированы, разница в задержке при чтении вслух японских и китайских слов из-за эффектов контекста не может быть приписана логографической природе систем письма. Вместо этого авторы выдвигают гипотезу, что разница во времени задержки обусловлена дополнительными затратами на обработку в японском языке, где читатель не может полагаться исключительно на прямой маршрут орфографии к фонологии, но также должна быть доступна информация на лексико-синтаксическом уровне, чтобы выбрать правильное произношение. Эта гипотеза подтверждается исследованиями, показывающими, что японские пациенты с болезнью Альцгеймера, у которых ухудшилось понимание символов, все еще могли читать слова вслух без особых затруднений. [10] [11]
Исследования, сравнивающие обработку английских и китайских омофонов в задачах лексического решения, обнаружили преимущество для обработки омофонов в китайском языке и недостаток для обработки омофонов в английском языке. [12] Недостаток обработки в английском языке обычно описывается с точки зрения относительного отсутствия омофонов в английском языке. Когда встречается омофоническое слово, сначала активируется фонологическое представление этого слова. Однако, поскольку это неоднозначный стимул, необходимо сопоставление на орфографическом/лексическом («ментальном словаре») уровне, прежде чем стимул может быть устранен неоднозначностью и может быть выбрано правильное произношение. Напротив, в языке (например, китайском), где существует много иероглифов с одинаковым чтением, предполагается, что человек, читающий иероглиф, будет более знаком с омофонами, и что эта осведомленность поможет обработке иероглифа и последующему выбору правильного произношения, что приведет к более короткому времени реакции при обращении к стимулу. В попытке лучше понять влияние омофонии на обработку Хино и др. [8] провели серию экспериментов, используя японский язык в качестве целевого. Контролируя узнаваемость, они обнаружили преимущество обработки омофонов над негомофонами в японском языке, аналогичное тому, что ранее было обнаружено в китайском языке. Исследователи также проверили, будут ли орфографически похожие омофоны давать недостаток в обработке, как это было в случае с английскими омофонами, [13] но не нашли никаких доказательств этого. Очевидно, что существует разница в том, как омофоны обрабатываются в логографически кодированных и алфавитно кодированных языках, но связано ли преимущество обработки омофонов в логографически кодированных языках японском и китайском (т. е. их системах письма) с логографической природой письменностей или это просто отражает преимущество языков с большим количеством омофонов независимо от природы письменности, еще предстоит выяснить.
Главное отличие логограмм от других систем письма заключается в том, что графемы не связаны напрямую с их произношением. Преимущество такого разделения в том, что понимание произношения или языка писателя не является необходимым, например, 1 понимается независимо от того, называет ли его читатель one , ichi или wāḥid . Аналогично, люди, говорящие на разных разновидностях китайского языка, могут не понимать друг друга в устной речи, но могут понимать друг друга в значительной степени в письменной форме, даже если они не пишут на стандартном китайском языке . Поэтому в Китае, Вьетнаме, Корее и Японии до современных времен письменное общение (筆談) было нормой восточноазиатской международной торговли и дипломатии с использованием классического китайского языка . [ необходима цитата ] [ сомнительно – обсудить ]
Однако это разделение также имеет большой недостаток, требующий запоминания логограмм при обучении чтению и письму отдельно от произношения. Хотя это и не является неотъемлемой чертой логограмм, а обусловлено уникальной историей развития, в японском языке есть дополнительная сложность, заключающаяся в том, что почти каждая логограмма имеет более одного произношения. Наоборот, фонетический набор символов пишется точно так же, как и произносится, но с недостатком, что небольшие различия в произношении вносят двусмысленность. Многие алфавитные системы, такие как греческая , латинская , итальянская , испанская и финская, идут на практический компромисс, стандартизируя написание слов, сохраняя при этом почти однозначную связь между символами и звуками. Орфография в некоторых других языках, таких как английский , французский , тайский и тибетский , сложнее; комбинации символов часто произносятся по-разному, как правило, в зависимости от их истории. Хангыль , система письма корейского языка , является примером алфавитного письма, которое было разработано для замены логограмматического ханджа с целью повышения грамотности. Последнее сейчас используется редко, но сохраняет некоторую актуальность в Южной Корее, иногда в сочетании с хангылем. [ необходима цитата ]
Согласно исследованию, заказанному правительством, 3500 наиболее часто используемых иероглифов, перечисленных в « Таблице общих иероглифов современного китайского языка » Китайской Народной Республики (现代汉语常用字表, Xiàndài Hànyǔ Chángyòngzì Biǎo ), покрывают 99,48% из двух миллионов слов. Что касается традиционных китайских иероглифов, то в « Таблице стандартных форм общенациональных иероглифов » (常用國字標準字體表) Министерства образования Китайской Республики перечислено 4808 иероглифов , а в « Списке графем общеупотребительных китайских иероглифов » (常用字字形表) Бюро образования и трудовых ресурсов Гонконга — 4759 , оба из которых предназначены для изучения в начальной и средней школе. Образование после начальной школы включает не столько новых иероглифов, сколько новых слов, которые в основном представляют собой комбинации двух или более уже изученных иероглифов. [14]
Ввод сложных символов может быть обременительным на электронных устройствах из-за практического ограничения количества клавиш ввода. Существуют различные методы ввода логограмм, либо путем разбиения их на составные части, как в методах набора китайского языка Cangjie и Wubi , либо с использованием фонетических систем, таких как Bopomofo или Pinyin, где слово вводится так, как оно произносится, а затем выбирается из списка соответствующих ему логограмм. Хотя первый метод (линейно) быстрее, его сложнее выучить. Однако в системе китайского алфавита штрихи, образующие логограмму, набираются так, как они обычно пишутся, а затем вводится соответствующая логограмма. [ необходимо разъяснение ]
Также из-за количества глифов в программировании и вычислениях в целом требуется больше памяти для хранения каждой графемы, так как набор символов больше. Для сравнения, ISO 8859 требует только один байт для каждой графемы, в то время как Basic Multilingual Plane, закодированный в UTF-8, требует до трех байт. С другой стороны, английские слова, например, в среднем состоят из пяти символов и пробела на слово [15] [ самостоятельно опубликованный источник ] и, таким образом, требуют шесть байт для каждого слова. Поскольку многие логограммы содержат более одной графемы, неясно, какой из них более эффективен с точки зрения памяти. Кодировки переменной ширины позволяют унифицированному стандарту кодирования символов, такому как Unicode, использовать только байты, необходимые для представления символа, что снижает накладные расходы, возникающие при слиянии больших наборов символов с меньшими.