Алфавит урду ( урду : اُردُو حُرُوفِ تَہَجِّی , романизированный : urdū ḥurūf-i tahajjī ) — алфавит с письмом справа налево, используемый для письма на урду . Это модификация персидского алфавита , который сам по себе произошел от арабской письменности . Он имеет статус одного из официальных в республиках Пакистан , Индия и Южная Африка . Алфавит урду имеет до 39 [4] или 40 [5] различных букв без отдельных регистров и обычно пишется каллиграфическим шрифтом насталик , тогда как арабский язык чаще пишется стилем насх .
Обычно при простой транслитерации урду латинским алфавитом (так называемый «римский урду ») опускаются многие фонематические элементы, не имеющие эквивалента в английском или других языках, использующих латинскую графику.
Стандартное письмо урду является модифицированной версией персидско -арабского письма и берет свое начало в Иране 13-го века . Оно также связано с шахмукхи , используемым для вариантов языка пенджаби в Пенджабе, Пакистан . Оно тесно связано с развитием стиля насталик персидско-арабского письма.
Несмотря на изобретение пишущей машинки на урду в 1911 году, газеты на урду продолжали публиковать отпечатки рукописных текстов каллиграфов, известных как катибы или хуш-нави , до конца 1980-х годов. Пакистанская национальная газета Daily Jang была первой газетой на урду, которая использовала набор на основе компьютерного насталик . В настоящее время предпринимаются усилия по разработке более сложной и удобной для пользователя поддержки урду на компьютерах и в Интернете . В настоящее время почти все газеты, журналы и периодические издания на урду создаются на компьютерах с программным обеспечением урду.
Помимо Индийского субконтинента , письменность урду также используется большой диаспорой Пакистана , в том числе в Великобритании , Объединенных Арабских Эмиратах , Соединенных Штатах , Канаде , Саудовской Аравии и других местах. [5]
На урду используется стиль письма насталик ( персидский : نستعلیق Nastaʿlīq). Каллиграфический стиль письма насталик возник как персидская смесь шрифтов насх и талик . После мусульманского завоевания индийского субконтинента насталик стал предпочтительным стилем письма для урду. Это доминирующий стиль в Пакистане, и многие урду-писатели в других частях мира используют его. Насталик более курсивный и плавный, чем его аналог насх.
В арабском алфавите и многих других, полученных от него, буквы считаются имеющими две или три общие формы, в зависимости от их положения в слове (хотя арабская каллиграфия может добавить много сложности). Но стиль насталик, в котором написан урду, использует более трех общих форм для многих букв, даже в простых недекоративных документах. [6]
Письменность урду — это письменность абджад , произошедшая от современной персидской письменности , которая сама является производной от арабской письменности . Как абджад, письменность урду показывает только согласные и долгие гласные; краткие гласные могут быть выведены только из отношения согласных друг к другу. Хотя этот тип письменности удобен в семитских языках, таких как арабский и иврит , чьи согласные корни являются ключом предложения, урду — индоевропейский язык , который требует большей точности в произношении гласных звуков, следовательно, требует большего запоминания. Количество букв в алфавите урду несколько неоднозначно и является предметом споров. [7]
Tāʼ marbūṭah также иногда считается 40-й буквой алфавита урду, хотя она редко используется, за исключением некоторых заимствованных из арабского языка слов. Tāʼ marbūṭah считается формой tā, арабской версии урду tē, но она не произносится как таковая, и при замене на букву урду в натурализованных заимствованных словах она обычно заменяется на Gol hē.
Хамзу может быть трудно распознать в почерке урду и шрифтах, предназначенных для ее копирования, поскольку она очень похожа на две точки сверху, как в ت Té и ق Qaf, тогда как в арабских и геометрических шрифтах она более отчетлива и очень похожа на западную форму цифры 2 (два).
В урду к персидско-арабской основе добавлено больше букв для представления звуков, отсутствующих в персидском языке, в котором уже добавлены дополнительные буквы к самой арабской основе для представления звуков, отсутствующих в арабском языке. Добавленные буквы показаны в таблице ниже:
Отдельная буква do-chashmi- he , ھ , существует для обозначения /ʰ/ или /ʱ/ . Эта буква в основном используется как часть множества диграфов, подробно описанных в подразделе выше. В дополнение к этим буквам, Шахмукхи добавляет 2 согласных поверх алфавита урду для записи пенджаби , а Сарайки добавляет еще 4 согласных.
В древнеиндийском языке для обозначения ретрофлексных согласных использовались четыре точки ٿ ڐ ڙ над тремя арабскими буквами ت د ر . [16] В рукописном письме эти точки часто писались как маленькая вертикальная линия, прикрепленная к маленькому треугольнику. Впоследствии эта форма стала идентична маленькой букве ط t̤oʼē . [17] Обычно ошибочно полагают, что сама ṭāʾ использовалась для обозначения ретрофлексных согласных, поскольку она была выразительным альвеолярным согласным, который, по мнению арабских писцов, приближался к ретрофлексным согласным хиндустани. [ требуется цитата ] В современном урду to'e всегда произносится как зубной , а не ретрофлексный . [ требуется цитата ]
В языке урду десять гласных и десять назализованных гласных. Каждый гласный имеет четыре формы в зависимости от его положения: начальную, среднюю, конечную и изолированную. Как и в его родительском арабском алфавите, гласные урду представлены с помощью комбинации диграфов и диакритических знаков. Alif , Waw , Ye , He и их варианты используются для представления гласных.
В урду нет отдельных гласных букв. Краткие гласные ( a , i , u ) представлены необязательными диакритическими знаками ( zabar , zer , pesh ) перед предыдущей согласной или заполнителем согласной ( alif , ain или hamzah ), если слог начинается с гласной, а долгие гласные — согласными alif , ain , ye и wa'o как matres lectionis, с устраняющими неоднозначность диакритическими знаками, некоторые из которых являются необязательными ( zabar , zer , pesh ), а некоторые — нет ( madd , hamzah ). В урду нет кратких гласных в конце слов. Это таблица гласных урду:
Алиф — первая буква алфавита урду, и она используется исключительно как гласная. В начале слова алиф может использоваться для представления любой из кратких гласных: اب ab , اسم ism , اردو Urdū . Для длинной ā в начале слов используется алиф-мад: آپ āp , но простой алиф в середине и в конце: بھاگنا bhāgnā .
Wāʾo используется для передачи гласных «ū», «o», «u» и «au» ([uː], [oː], [ʊ] и [ɔː] соответственно), а также для передачи губно-зубного аппроксиманта [ʋ]. Только когда ему предшествует согласная k͟hē ( خ ), wāʾo может передавать звук «u» ([ʊ]) (например, в خود , « k͟hud » — я сам ), или не произносится вообще (например, в خواب , « k͟haab » — мечта ). Это известно как немое wāʾo и присутствует только в словах, заимствованных из персидского. [18]
Ye делится на два варианта: choṭī ye («маленький ye») и baṛī ye («большой ye»).
Choṭī ye ( ی ) пишется во всех формах точно так же, как в персидском языке. Используется для долгой гласной "ī" и согласной "y".
Baṛī ye ( ے ) используется для передачи гласных "e" и "ai" ( /eː/ и /ɛː/ соответственно). Baṛī ye на письме можно отличить от choṭī ye только тогда, когда оно стоит в конце слова/лигатуры. Кроме того, Baṛī ye никогда не используется в начале слова/лигатуры, в отличие от choṭī ye .
Он делится на два варианта: gol he («круглый он») и do-cašmi he («двуглазый он»).
Gol he ( ہ ) пишется кругло и зигзагом и может передавать звук "h" ( /ɦ/ ) в любом месте слова. Кроме того, в конце слова его можно использовать для передачи долгих гласных "a" или "e" ( /ɑː/ или /eː/ ), что также немного меняет его форму (в современных цифровых системах письма эта окончательная форма достигается путем написания двух he's подряд).
Буква «до-кашми хе» ( ھ ) пишется так же, как в арабском стиле насх (в виде петли), чтобы создать придыхательные согласные и записать арабские слова.
В начальной и конечной позиции слово «айн» не произносится и заменяется звуком предшествующей или последующей гласной.
Назализация гласных представлена nun ghunna , написанной после их неназализованных версий, например: ہَے , когда назализовано, становится ہَیں . В средней форме nun ghunna пишется так же, как nun , и отличается диакритическим знаком, называемым maghnoona или ulta jazm , который представляет собой надстрочный символ V над ن٘ .
Примеры:
В урду используется тот же подмножество диакритических знаков, что и в арабском языке, основанное на персидских традициях. В урду также используются персидские названия диакритических знаков вместо арабских названий. Обычно используемые диакритические знаки — это забар (араб . fatḥah ), зер (араб . kasrah ), пеш (араб. dammah ), которые используются для пояснения произношения гласных, как показано выше. Джазам ( ـْـ , араб. sukun ) используется для обозначения скопления согласных , а ташдид ( ـّـ , араб. shaddah ) используется для обозначения геминации , хотя он никогда не используется для глаголов, которые требуют, чтобы двойные согласные писались отдельно. Другие диакритические знаки включают кхари забар (араб. dagger alif ), до забар (араб. fathatan ), которые встречаются в некоторых распространенных арабских заимствованиях. Другие арабские диакритические знаки также иногда используются, хотя и очень редко, в заимствованных из арабского словах. Зер-е-изафат и хамза-е-изафат описаны в следующем разделе.
Помимо обычных диакритических знаков, в урду также есть специальные диакритические знаки, которые часто встречаются только в словарях для пояснения неправильного произношения. К этим диакритическим знакам относятся kasrah-e-majhool , fathah-e-majhool , dammah-e-majhool , maghnoona , ulta jazam , alif-e-wavi и некоторые другие очень редкие диакритические знаки. Среди них только maghnoona обычно используется в словарях и имеет представление Unicode в U+0658. Другие диакритические знаки редко записываются в печатной форме, в основном в некоторых расширенных словарях. [19]
Изафат — это синтаксическая конструкция из двух существительных, где первый компонент — определяемое существительное, а второй — детерминант. Эта конструкция была заимствована из персидского языка. Для соединения этих двух слов используется краткая гласная «i», а при произнесении новообразованного слова краткая гласная присоединяется к первому слову. Если первое слово заканчивается на согласную или на ʿain ( ع ), оно может быть написано как zer ( ِ ) в конце первого слова, но обычно не пишется вообще. Если первое слово заканчивается на choṭī he ( ہ ) или ye ( ی или ے ), то hamzā ( ء ) используется над последней буквой ( ۂ или ئ или ۓ ). Если первое слово заканчивается на долгую гласную ( ا или و ), то в конце первого слова добавляетсядругой вариант baṛī ye ( ے ) с хамзой наверху ( ئے , полученный путем добавления ے к ئ ). [20]
На заре компьютеров урду не был должным образом представлен ни на одной кодовой странице . Одной из самых ранних кодовых страниц, представляющих урду, была кодовая страница IBM 868, которая датируется 1990 годом. [21] Другими ранними кодовыми страницами, представляющими алфавиты урду, были кодировки Windows-1256 и MacArabic, обе из которых датируются серединой 1990-х годов. В Unicode урду представлен внутри арабского блока. Другая кодовая страница для урду, которая используется в Индии, — это Perso-Arabic Script Code for Information Interchange . В Пакистане 8-битная кодовая страница, разработанная Национальным управлением по языкам, называется Urdu Zabta Takhti ( اردو ضابطہ تختی ) (UZT) [22] , которая представляет урду в его наиболее полной форме, включая некоторые из его специализированных диакритических знаков, хотя UZT не предназначен для сосуществования с латинским алфавитом.
Как и другие системы письма, полученные из арабского алфавита, урду использует диапазон Unicode 0600–06FF. [23] Некоторые глифы в этом диапазоне кажутся визуально похожими (или идентичными при использовании определенных шрифтов), даже если базовая кодировка отличается. Это создает проблемы для хранения и поиска информации. Например, электронная копия «Словаря хиндустани и английского языка» Джона Шекспира в Чикагском университете [24] включает слово « بهارت » ( bhārat «Индия»). Поиск строки « بھارت » не возвращает результатов, тогда как запрос с (идентичной во многих шрифтах) строкой « بهارت » возвращает правильную запись. [25] Это связано с тем, что срединная форма буквы урду do chashmi he (U+06BE), используемой для формирования придыхательных диграфов в урду, визуально идентична в своей срединной форме арабской букве hāʾ (U+0647; фонетическое значение /h/ ). В урду фонема /h/ представлена символом U+06C1, называемым gol he (круглый he ) или chhoti he (маленький he ).
В 2003 году Центр исследований в области обработки языка урду (CRULP) [26] — исследовательская организация, связанная с Пакистанским национальным университетом компьютерных и новых наук — подготовил предложение по преобразованию однобайтовой кодировки UZT символов урду в стандарт Unicode. [27] Это предложение предполагает предпочтительный глиф Unicode для каждого символа в алфавите урду.
Daily Jang была первой газетой на урду, набранной в цифровом виде на языке насталик с помощью компьютера. Ведутся работы по разработке более сложной и удобной поддержки урду на компьютерах и в Интернете. В настоящее время почти все газеты, журналы и периодические издания на урду составляются на компьютерах с помощью различных программных продуктов на урду, наиболее распространенным из которых является пакет InPage Desktop Publishing. Microsoft включила поддержку языка урду во все новые версии Windows, и как Windows Vista , так и Microsoft Office 2007 доступны на урду через поддержку Language Interface Pack [28] . Большинство дистрибутивов Linux Desktop позволяют легко установить поддержку урду и переводы. [29] Apple реализовала клавиатуру языка урду на мобильных устройствах в своем обновлении iOS 8 в сентябре 2014 года. [30]
Существует несколько стандартов латинизации для записи урду с помощью латинского алфавита, хотя они не очень популярны, поскольку большинство из них не представляют язык урду должным образом. Вместо стандартных схем латинизации люди в Интернете, на мобильных телефонах и в средствах массовой информации часто используют нестандартную форму латинизации, которая пытается имитировать английскую орфографию . Проблема с этим видом латинизации заключается в том, что ее могут читать только носители языка, и даже для них это очень трудно. Среди стандартизированных схем латинизации наиболее точной является латинизация ALA-LC , которая также поддерживается Национальным управлением языка. Другие схемы латинизации часто отклоняются, потому что они либо не могут правильно представлять звуки в урду, либо они часто не учитывают орфографию урду и отдают предпочтение произношению, а не орфографии. [31]
Управление национального языка Пакистана разработало ряд систем с особыми обозначениями для обозначения неанглийских звуков, но их может правильно прочитать только тот, кто уже знаком с заимствованными буквами. [ необходима ссылка ]
Роман урду также имеет значение среди христиан Пакистана и Северной Индии . Урду был доминирующим родным языком среди христиан Карачи и Лахора в современном Пакистане и Мадхья-Прадеше , Уттар-Прадеш Раджастхан в Индии, в начале 19-го и 20-го века, и до сих пор используется христианами в этих местах. Пакистанские и индийские христиане часто использовали латиницу для письма на урду. Таким образом, роман урду был распространенным способом письма среди пакистанских и индийских христиан в этих областях до 1960-х годов. Библейское общество Индии издает Библии на роман урду , которые пользовались спросом в конце 1960-х годов (хотя они все еще издаются сегодня). Церковные песенники также распространены на роман урду. Однако использование роман урду снижается с более широким использованием хинди и английского языка в этих штатах.