Тамильское письмо ( தமிழ் அரிச்சுவடி Tamiḻ ariccuvaṭi [tamiɻ ˈaɾitːɕuʋaɽi] ) — письмо абугида , которое используется тамилами и носителями тамильского языка в Индии , Шри-Ланке , Малайзия , Сингапур , Индонезия и другие страны пишут на тамильском языке . [5] Это один из официальных сценариев Индийской Республики . Некоторые языки меньшинств, такие как Саураштра , Бадага , Ирула и Пания, также написаны тамильским письмом. [6]
Тамильское письмо имеет 12 гласных ( உயிரெழுத்து , uyireḻuttu , «душебуквы»), 18 согласных ( மெய்யெழுத்து , meyyeḻuttu , «телесные буквы») и один специальный символ, ஃ ( ஆய்த எழுத்து , āytha eḻuttu ). ஃ называется «அக்கு», акку и в тамильской орфографии не классифицируется как ни согласная, ни гласная. [7] Однако он указан в конце набора гласных. Письменность слоговая , а не алфавитная . Пишется слева направо.
Считается, что тамильское письмо, как и другие брахмические письма , произошло от исходного письма брахми . [8] Самые ранние надписи, которые считаются принятыми примерами тамильского письма, датируются периодом Ашоки . Письмо, используемое в таких надписях, обычно известно как тамильское-брахми или «тамильское письмо» и во многом отличается от стандартного ашокского брахми. Например, раннее тамильское-брахми, в отличие от ашокского брахми, имело систему различения чистых согласных ( в этом примере m ) и согласных с присущей гласной ( в этом примере ma ). Кроме того, по словам Ираватама Махадевана , раннее тамильское брахми использовало несколько иные маркеры гласных, имело дополнительные символы для обозначения букв, которых нет в санскрите , и пропускало буквы для звуков, отсутствующих в тамильском, таких как звонкие согласные и придыхательные. [8] Надписи со 2-го века используют более позднюю форму тамильского брахми, которая в значительной степени похожа на систему письма, описанную в Толкаппияме , древней тамильской грамматике. В частности, они использовали пулли для подавления присущей гласной. [9] После этого тамильские буквы эволюционировали в сторону более округлой формы и к 5-му или 6-му веку достигли формы, называемой ранним ваттехутту . [10]
Однако современная тамильская письменность не произошла от этой письменности. [11] В 4 веке [12] династия Паллава создала новую письменность, названную письмом Паллава для тамильского языка, и алфавит Грантха развился из нее, добавив алфавит Ваттехутту для звуков, не встречающихся для записи санскрита. [4] Параллельно с алфавитом Грантха на территориях Паллавы и Чола снова появилась новая письменность (письмо Чола-Паллава, которое развилось в современное тамильское письмо), напоминающая то же развитие глифов, что и Грантха, однако сильно сокращенная по своим формам и не обгоняющая неродные тамильские звуки. К 8 веку новые письменности вытеснили Ваттехутту в королевствах Паллава и Чола , которые лежали в северной части тамилоязычного региона. Однако Vaṭṭeḻuttu продолжали использовать в южной части тамилоязычного региона, в королевствах Чера и Пандья до XI века, когда королевство Пандья было завоевано Чолами, которые унаследовали его, будучи вассалами Паллавов в течение короткого времени. [3] [4]
С падением королевства Паллавов династия Чола выдвинула письменность Чола-Паллава как фактическую письменность. В течение следующих нескольких столетий письменность Чола-Паллава превратилась в современную тамильскую письменность. Грантха и ее родительская письменность оказали значительное влияние на тамильскую письменность. Использование пальмовых листьев в качестве основного средства письма привело к изменениям в письменности. Писец должен был быть осторожен, чтобы не проткнуть листья стилусом во время письма, потому что лист с отверстием с большей вероятностью порвется и быстрее сгниет. В результате использование пулли для различения чистых согласных стало редким, при этом чистые согласные обычно писались так, как будто присутствовала присущая им гласная. Аналогично, маркер гласной ( ஃ ), называемый: тамильский : குற்றியலுகரம் , романизированный: kuṟṟiyal-ukaram , букв. «короткий звук «у», полуокругленный звук «у» , который встречается в конце некоторых слов и в средней позиции в некоторых сложных словах, обозначая укороченный звук «у» , также вышел из употребления и был заменен маркером для простого звука «у» ( ு ) . Звук puḷḷi ( ஂ ) не появлялся вновь до появления книгопечатания , но маркер kuṟṟiyal-ukaram ( ஃ ) так и не вернулся к использованию в этих целях, хотя его использование сохранилось в некоторых грамматических концептуальных словах, тогда как сам звук по-прежнему существует и играет важную роль в тамильской просодии .
Формы некоторых букв были упрощены в 19 веке, чтобы облегчить набор текста. В 20 веке сценарий был еще больше упрощен в серии реформ, которые упорядочили маркеры гласных, используемые с согласными, устранив специальные маркеры и большинство нерегулярных форм.
Тамильский алфавит отличается от других алфавитов, производных от брахми, несколькими способами. В отличие от любого другого брахмийского алфавита, он не представляет регулярно звонкие или придыхательные согласные , поскольку они не являются фонемами тамильского языка, хотя звонкие и фрикативные аллофоны взрывных согласных встречаются в разговорном тамильском языке. Так , например, символ க் k представляет / k /, но также может произноситься [ g ] или [ x ] на основе правил тамильской фонологии . Отдельный набор символов появляется для этих звуков, когда тамильский алфавит используется для записи санскрита или других языков.
Также в отличие от других видов письма брахми, в тамильском письме редко используются типографские лигатуры для представления слитных согласных, которые встречаются в тамильском языке гораздо реже, чем в других индийских языках. Там, где они встречаются, слитные согласные записываются путем написания иероглифа для первого согласного, добавления puḷḷi для подавления присущего ему гласного, а затем написания иероглифа для второго согласного. Есть несколько исключений, а именно க்ஷ kṣa и ஶ்ரீ śrī .
ISO 15919 — это международный стандарт транслитерации тамильского и других индийских алфавитов в латинские символы. Он использует диакритические знаки для преобразования гораздо большего набора брахмических согласных и гласных в латинский алфавит.
Согласные называются буквами "тела" ( мэй ). Согласные делятся на три категории: валлинам (твердые согласные), меллинам (мягкие согласные, включая все носовые ) и итайинам (средние согласные).
Существуют некоторые лексические правила образования слов. В «Толкаппияме» описываются такие правила. Вот несколько примеров: слово не может заканчиваться на определенные согласные и не может начинаться на некоторые согласные, включая r-, l- и ḻ-; в тамильском языке шесть носовых согласных : велярный носовой ங், палатальный носовой ஞ், ретрофлексный носовой ண், зубной носовой ந், губно-губной носовой ம் и альвеолярный носовой ன்.
Порядок алфавита (строго абугида ) в тамильском языке почти совпадает с таковым в соседних языках как по местоположению, так и по лингвистике, что отражает общее происхождение их письменностей от брахми.
В тамильском языке 18 согласных — mey eluttukkal . Традиционные грамматики классифицировали эти 18 на три группы по 6 букв в каждой. Эта классификация основана на способе артикуляции и, следовательно, на природе этих букв. Vallinam (твердая группа), mellinam (мягкая группа) и idaiyinam (средняя группа). Все согласные произносятся в течение половины единицы (māttirai) времени, когда они изолированы (согласные в сочетании с гласными будут произноситься с длительностью гласного). [13]
Тамильская речь включает в себя много фонем, которые не были частью классификации Tolkāppiyam . Буквы, используемые для записи этих звуков, известные как Grantha , используются как часть тамильского языка. Они изучаются с начальной школы и включены в Tamil All Character Encoding (TACE16) .
Существует также соединение ஶ்ரீ ( śrī ), эквивалентное श्री в деванагари .
Комбинации согласных с ஃ ( ஆய்த எழுத்து , āyda eḻuttu , эквивалент нукта ) иногда используются для обозначения фонем иностранных языков, особенно для написания исламских и христианских текстов. Например: asif = அசிஃப் , azārutīn̠ = அஃஜாருதீன் , Чингисхан = கெங்கிஸ் ஃகான் . [ нужна ссылка ]
Диакритический знак, похожий на нукту, используется при записи языка бадага , а для транскрипции звуков языка ирула используется двойная точка нукта . [15]
Также были предприняты попытки различать звонкие и глухие согласные с помощью нижних индексов — два, три и четыре, которые обозначают глухие придыхательные, звонкие, звонкие придыхательные соответственно. Это использовалось для транскрипции санскритских слов в санскритско-тамильских книгах, как показано в таблице ниже. [16] [17]
Стандарт Unicode использует надстрочные цифры для той же цели, как в ப² pha , ப³ ba и ப⁴ bha . [18]
Гласные также называются буквами «жизни» ( uyir ) или «души». Вместе с согласными ( mei , которые называются буквами «тела») они образуют сложные, слоговые ( abugida ) буквы, которые называются «живыми» или «воплощенными» буквами ( uyir mei , т.е. буквы, которые имеют и «тело», и «душу»).
В тамильском языке 12 гласных, которые делятся на краткие и долгие (по пять каждого типа), а также два дифтонга .
Используя в качестве примера согласную «к»:
Специальная буква ஃ , представленная тремя точками, называется āyta eḻuttu или aḵ . Первоначально она представляла собой архаичное тамильское сохранение дравидийского звука ḥ, который был утерян почти во всех современных дравидийских языках, и в тамильском традиционно выполняет чисто грамматическую функцию, но в наше время она стала использоваться как диакритический знак для представления иностранных звуков. Например, ஃப используется для английского звука f , которого нет в тамильском. Она также служила до того, как пальмовые листья стали основным средством письма для слов, заканчивающихся на неотъемлемую согласную-гласную u, в качестве правила произношения для краткого u , называемого – тамильский : குற்றியலுகரம் , романизированный: kuṟṟiyal-ukaram , букв. 'короткий звук 'u''. Следующие согласные передали это поведение: கு , சு , டு , து , பு , று . Вместо того, чтобы писать как в наши дни без каких-либо маркеров, например ( тамильский : அது , романизированный: Atu ), он писался с предшествующим ஃ , как – тамильский : அஃது , романизированный: Aḥtu .
Другая архаичная тамильская буква ஂ , представленная небольшим полым кружком и называемая Aṉuvara , — это Anusvara . Она традиционно использовалась как гоморганическая носовая перед согласным, а также как губно-губная носовая ( m ) или альвеолярная носовая ( n ) в конце слова, в зависимости от контекста.
Долгие ( nedil ) гласные примерно в два раза длиннее кратких ( kuṟil ) гласных. Дифтонги обычно произносятся примерно в полтора раза длиннее кратких гласных, хотя некоторые грамматические тексты помещают их вместе с долгими ( nedil ) гласными.
Как можно увидеть в составной форме, знак гласной может быть добавлен справа, слева или с обеих сторон согласных. Он также может образовывать лигатуру . Эти правила развиваются, и в более старом использовании лигатур больше, чем в современном. То, что вы фактически видите на этой странице, зависит от вашего выбора шрифта; например, Code2000 покажет больше лигатур, чем Latha.
Есть сторонники реформы письменности, которые хотят исключить все лигатуры и разместить все гласные знаки с правой стороны.
Unicode кодирует символ в логическом порядке (всегда сначала согласная), тогда как устаревшие 8-битные кодировки (такие как TSCII ) предпочитают письменный порядок. Это делает необходимым изменение порядка при преобразовании из одной кодировки в другую; недостаточно просто сопоставить один набор кодовых точек с другим.
В следующей таблице перечислены гласные буквы ( uyir или life) вверху и согласные буквы ( mei или body) по бокам, сочетание которых дает все тамильские сложные буквы ( uyirmei ).
Помимо обычных цифр (от 0 до 9), в тамильском языке также есть цифры для 10, 100 и 1000. Также можно найти символы для дробей и других числовых понятий. [19]
Тамильское письмо было добавлено в стандарт Unicode в октябре 1991 года с выпуском версии 1.0.0. Блок Unicode для тамильского языка — U+0B80–U+0BFF. Серые области обозначают неназначенные кодовые точки. Большинство неназначенных кодовых точек обозначены как зарезервированные, поскольку они находятся в том же относительном положении, что и символы, назначенные в других южноазиатских блоках письма, которые соответствуют фонемам, не существующим в тамильском письме.
Были предприняты попытки объединить письмо грантха с тамильским; [16] [20] однако эти предложения вызвали недовольство некоторых. [21] [22] В конечном итоге, учитывая деликатность вопроса, было решено, что два письма следует кодировать независимо, за исключением цифр. [23]
Были представлены предложения по кодированию символов, используемых для дробных значений в традиционной бухгалтерской практике. [24] Хотя ICTA Шри-Ланки не одобрила это предложение , [25] оно было признано правительством Тамил Наду [26] и было добавлено в стандарт Unicode в марте 2019 года с выпуском версии 12.0. Блок Unicode для тамильского дополнения — U+11FC0–U+11FFF:
Как и другие южноазиатские письменности в Unicode, тамильская кодировка изначально была получена из стандарта ISCII . И ISCII , и Unicode кодируют тамильский язык как абугиду . В абугиде каждый базовый символ представляет согласную и гласную по умолчанию. Согласные с другой гласной или голые согласные представлены путем добавления символа-модификатора к базовому символу. Каждая кодовая точка, представляющая похожую фонему, кодируется в той же относительной позиции в каждом блоке южноазиатской письменности в Unicode, включая тамильский. Поскольку Unicode представляет тамильский язык как абугиду, все чистые согласные (согласные без связанной гласной) и слоги в тамильском языке могут быть представлены путем объединения нескольких кодовых точек Unicode, как можно увидеть в тамильской слоговой азбуке Unicode ниже. В Unicode 5.1 были добавлены именованные последовательности для всех тамильских согласных и слогов.
Unicode 5.1 также имеет именованную последовательность для тамильской лигатуры SRI ( śrī ), ஶ்ரீ, записанную с использованием ஶ ( śa ). Название этой последовательности — TAMIL SYLLABLE SHRII, она состоит из последовательности Unicode U+0BB6 U+0BCD U+0BB0 U+0BC0. Лигатура также может быть записана с использованием ஸ ( sa ) для создания идентичной лигатуры ஸ்ரீ, состоящей из последовательности Unicode U+0BB8 U+0BCD U+0BB0 U+0BC0; но это не приветствуется стандартом Unicode. [27]
Медиа, связанные с тамильским письмом на Wikimedia Commons