stringtranslate.com

алфавит урду

Алфавит урду ( урду : اُردُو حُرُوفِ تَہَجِّی‌ , романизированныйurdū ḥurūf-i tahajjī ) — алфавит с письмом справа налево, используемый для письма на урду . Это модификация персидского алфавита , который сам по себе произошел от арабской письменности . Он имеет статус одного из официальных в республиках Пакистан , Индия и Южная Африка . Алфавит урду имеет до 39 [4] или 40 [5] различных букв без отдельных регистров и обычно пишется каллиграфическим шрифтом насталик , тогда как арабский язык чаще пишется стилем насх .

Обычно при простой транслитерации урду латинским алфавитом (так называемый «римский урду ») опускаются многие фонематические элементы, не имеющие эквивалента в английском или других языках, использующих латинскую графику.

История

Стандартное письмо урду является модифицированной версией персидско -арабского письма и берет свое начало в Иране 13-го века . Оно также связано с шахмукхи , используемым для вариантов языка пенджаби в Пенджабе, Пакистан . Оно тесно связано с развитием стиля насталик персидско-арабского письма.

Несмотря на изобретение пишущей машинки на урду в 1911 году, газеты на урду продолжали публиковать отпечатки рукописных текстов каллиграфов, известных как катибы или хуш-нави , до конца 1980-х годов. Пакистанская национальная газета Daily Jang была первой газетой на урду, которая использовала набор на основе компьютерного насталик . В настоящее время предпринимаются усилия по разработке более сложной и удобной для пользователя поддержки урду на компьютерах и в Интернете . В настоящее время почти все газеты, журналы и периодические издания на урду создаются на компьютерах с программным обеспечением урду.

Помимо Индийского субконтинента , письменность урду также используется большой диаспорой Пакистана , в том числе в Великобритании , Объединенных Арабских Эмиратах , Соединенных Штатах , Канаде , Саудовской Аравии и других местах. [5]

Насталик

Пример, демонстрирующий правила пропорций Насталика (персидского). [ необходима ссылка ]

На урду используется стиль письма насталик ( персидский : نستعلیق Nastaʿlīq). Каллиграфический стиль письма насталик возник как персидская смесь шрифтов насх и талик . После мусульманского завоевания индийского субконтинента насталик стал предпочтительным стилем письма для урду. Это доминирующий стиль в Пакистане, и многие урду-писатели в других частях мира используют его. Насталик более курсивный и плавный, чем его аналог насх.

В арабском алфавите и многих других, полученных от него, буквы считаются имеющими две или три общие формы, в зависимости от их положения в слове (хотя арабская каллиграфия может добавить много сложности). Но стиль насталик, в котором написан урду, использует более трех общих форм для многих букв, даже в простых недекоративных документах. [6]

Алфавит

Письменность урду — это письменность абджад , произошедшая от современной персидской письменности , которая сама является производной от арабской письменности . Как абджад, письменность урду показывает только согласные и долгие гласные; краткие гласные могут быть выведены только из отношения согласных друг к другу. Хотя этот тип письменности удобен в семитских языках, таких как арабский и иврит , чьи согласные корни являются ключом предложения, урду — индоевропейский язык , который требует большей точности в произношении гласных звуков, следовательно, требует большего запоминания. Количество букв в алфавите урду несколько неоднозначно и является предметом споров. [7]

Названия букв и фонемы

Сноски:
  1. ^ порядок словаря [11]
  2. ^ [ требуется ссылка ]
  3. ^ В начале слова он может представлять другую гласную, содержащую диакритический знак гласной, который обычно содержится в согласной, предшествующей гласной, например اُردو "Урду" . Но диакритический знак, указывающий, какая гласная, часто опускается اردو, как и другие диакритические знаки коротких гласных.
  4. ^ abcd Ни одно слово на урду не начинается с ں , ھ , ڑ или ے . [ нужна ссылка ]
  5. ^ Используется в основном для заимствований из персидского языка .
  6. ^ Версия, показанная слева, — это U+06BA, которая используется только в конце слов. Когда она используется в середине слова, это диакритический знак U+0658, который обычно опускается (см. ниже дополнительную информацию о пропуске диакритических знаков в урду).
  7. ^ Отсутствует в словарном порядке, поскольку не используется в начале слов.
  8. ^ Иногда choṭī hē используется для обозначения hey, но choṭī hē может также относиться к арабскому/персидскому варианту, стилистическому варианту, представляющему эквивалентную букву, но персидский и арабский языки обычно используют U+0647, тогда как урду использует U+06C1 для gōl hey . [12] См. также: Урду в Unicode.
  9. ^ Хамза: В урду хамза не произносится во всех формах , за исключением случаев, когда она используется как хамза-и-изафат . Основное использование хамзы в урду — указание на скопление гласных.
  10. ^ [ требуется ссылка ]

Дополнительные персонажи и вариации

арабский Та' марбута

Tāʼ marbūṭah также иногда считается 40-й буквой алфавита урду, хотя она редко используется, за исключением некоторых заимствованных из арабского языка слов. Tāʼ marbūṭah считается формой tā, арабской версии урду tē, но она не произносится как таковая, и при замене на букву урду в натурализованных заимствованных словах она обычно заменяется на Gol hē.

Стол

Сноски:

  1. ^ Слева: Урду Насталик . Справа: Арабский Насх или современный стиль.
  2. ^ Текст Nastaliq будет отображаться в другом стиле, если на устройстве не установлен соответствующий шрифт.
  3. ^ ab Большинство гласных диакритических знаков опущены в большинстве текстов на урду, но тексты на урду обычно различают алиф мад и включают хамзу над бари йе, гол хе и вау. Например, алиф мад и гол алиф в آزادی - "āzādī", ɑ:zɑ:d̪i , свобода
    [15] - различаются в большинстве контекстов.
  4. См.: Хамза в Насталике.
  5. См.: Хамза в Насталике.
  6. ^ см.: арабское Tāʼ marbūṭah выше.

Хамза в Насталике

Хамзу может быть трудно распознать в почерке урду и шрифтах, предназначенных для ее копирования, поскольку она очень похожа на две точки сверху, как в ت Té и ق Qaf, тогда как в арабских и геометрических шрифтах она более отчетлива и очень похожа на западную форму цифры 2 (два).

Диграфы

Отличия отперсидский алфавит

В урду к персидско-арабской основе добавлено больше букв для представления звуков, отсутствующих в персидском языке, в котором уже добавлены дополнительные буквы к самой арабской основе для представления звуков, отсутствующих в арабском языке. Добавленные буквы показаны в таблице ниже:

Отдельная буква do-chashmi- he , ھ , существует для обозначения /ʰ/ или /ʱ/ . Эта буква в основном используется как часть множества диграфов, подробно описанных в подразделе выше. В дополнение к этим буквам, Шахмукхи добавляет 2 согласных поверх алфавита урду для записи пенджаби , а Сарайки добавляет еще 4 согласных.

Ретрофлексные буквы

В древнеиндийском языке для обозначения ретрофлексных согласных использовались четыре точки ٿ ڐ ڙ над тремя арабскими буквами ت د ر . [16] В рукописном письме эти точки часто писались как маленькая вертикальная линия, прикрепленная к маленькому треугольнику. Впоследствии эта форма стала идентична маленькой букве ط t̤oʼē . [17] Обычно ошибочно полагают, что сама ṭāʾ использовалась для обозначения ретрофлексных согласных, поскольку она была выразительным альвеолярным согласным, который, по мнению арабских писцов, приближался к ретрофлексным согласным хиндустани. [ требуется цитата ] В современном урду to'e всегда произносится как зубной , а не ретрофлексный . [ требуется цитата ]

Гласные

В языке урду десять гласных и десять назализованных гласных. Каждый гласный имеет четыре формы в зависимости от его положения: начальную, среднюю, конечную и изолированную. Как и в его родительском арабском алфавите, гласные урду представлены с помощью комбинации диграфов и диакритических знаков. Alif , Waw , Ye , He и их варианты используются для представления гласных.

Таблица гласных

В урду нет отдельных гласных букв. Краткие гласные ( a , i , u ) представлены необязательными диакритическими знаками ( zabar , zer , pesh ) перед предыдущей согласной или заполнителем согласной ( alif , ain или hamzah ), если слог начинается с гласной, а долгие гласные — согласными alif , ain , ye и wa'o как matres lectionis, с устраняющими неоднозначность диакритическими знаками, некоторые из которых являются необязательными ( zabar , zer , pesh ), а некоторые — нет ( madd , hamzah ). В урду нет кратких гласных в конце слов. Это таблица гласных урду:

Алиф

Алиф — первая буква алфавита урду, и она используется исключительно как гласная. В начале слова алиф может использоваться для представления любой из кратких гласных: اب ab , اسم ism , اردو Urdū . Для длинной ā в начале слов используется алиф-мад: آپ āp , но простой алиф в середине и в конце: بھاگنا bhāgnā .

Ва'о

Wāʾo используется для передачи гласных «ū», «o», «u» и «au» ([uː], [oː], [ʊ] и [ɔː] соответственно), а также для передачи губно-зубного аппроксиманта [ʋ]. Только когда ему предшествует согласная k͟hē ( خ ), wāʾo может передавать звук «u» ([ʊ]) (например, в خود , « k͟hud » — я сам ), или не произносится вообще (например, в خواب , « k͟haab » — ​​мечта ). Это известно как немое wāʾo и присутствует только в словах, заимствованных из персидского. [18]

Вы

Ye делится на два варианта: choṭī ye («маленький ye») и baṛī ye («большой ye»).

Choṭī ye ( ی ) пишется во всех формах точно так же, как в персидском языке. Используется для долгой гласной "ī" и согласной "y".

Baṛī ye ( ے ) используется для передачи гласных "e" и "ai" ( /eː/ и /ɛː/ соответственно). Baṛī ye на письме можно отличить от choṭī ye только тогда, когда оно стоит в конце слова/лигатуры. Кроме того, Baṛī ye никогда не используется в начале слова/лигатуры, в отличие от choṭī ye .

2 он

Он делится на два варианта: gol he («круглый он») и do-cašmi he («двуглазый он»).

Gol he ( ہ ) пишется кругло и зигзагом и может передавать звук "h" ( /ɦ/ ) в любом месте слова. Кроме того, в конце слова его можно использовать для передачи долгих гласных "a" или "e" ( /ɑː/ или /eː/ ), что также немного меняет его форму (в современных цифровых системах письма эта окончательная форма достигается путем написания двух he's подряд).

Буква «до-кашми хе» ( ھ ) пишется так же, как в арабском стиле насх (в виде петли), чтобы создать придыхательные согласные и записать арабские слова.

Айн

В начальной и конечной позиции слово «айн» не произносится и заменяется звуком предшествующей или последующей гласной.

Нун Гуннах

Назализация гласных представлена ​​nun ghunna , написанной после их неназализованных версий, например: ہَے , когда назализовано, становится ہَیں . В средней форме nun ghunna пишется так же, как nun , и отличается диакритическим знаком, называемым maghnoona или ulta jazm , который представляет собой надстрочный символ V над ن٘ .

Примеры:

Диакритические знаки

В урду используется тот же подмножество диакритических знаков, что и в арабском языке, основанное на персидских традициях. В урду также используются персидские названия диакритических знаков вместо арабских названий. Обычно используемые диакритические знаки — это забар (араб . fatḥah ), зер (араб . kasrah ), пеш (араб. dammah ), которые используются для пояснения произношения гласных, как показано выше. Джазам ( ـْـ , араб. sukun ) используется для обозначения скопления согласных , а ташдид ( ـّـ , араб. shaddah ) используется для обозначения геминации , хотя он никогда не используется для глаголов, которые требуют, чтобы двойные согласные писались отдельно. Другие диакритические знаки включают кхари забар (араб. dagger alif ), до забар (араб. fathatan ), которые встречаются в некоторых распространенных арабских заимствованиях. Другие арабские диакритические знаки также иногда используются, хотя и очень редко, в заимствованных из арабского словах. Зер-е-изафат и хамза-е-изафат описаны в следующем разделе.

Помимо обычных диакритических знаков, в урду также есть специальные диакритические знаки, которые часто встречаются только в словарях для пояснения неправильного произношения. К этим диакритическим знакам относятся kasrah-e-majhool , fathah-e-majhool , dammah-e-majhool , maghnoona , ulta jazam , alif-e-wavi и некоторые другие очень редкие диакритические знаки. Среди них только maghnoona обычно используется в словарях и имеет представление Unicode в U+0658. Другие диакритические знаки редко записываются в печатной форме, в основном в некоторых расширенных словарях. [19]

Изафат

Изафат — это синтаксическая конструкция из двух существительных, где первый компонент — определяемое существительное, а второй — детерминант. Эта конструкция была заимствована из персидского языка. Для соединения этих двух слов используется краткая гласная «i», а при произнесении новообразованного слова краткая гласная присоединяется к первому слову. Если первое слово заканчивается на согласную или на ʿain ( ع ), оно может быть написано как zer (   ِ  ) в конце первого слова, но обычно не пишется вообще. Если первое слово заканчивается на choṭī he ( ہ ) или ye ( ی или ے ), то hamzā ( ء ) используется над последней буквой ( ۂ или ئ или ۓ ). Если первое слово заканчивается на долгую гласную ( ا или و ), то в конце первого слова добавляетсядругой вариант baṛī ye ( ے ) с хамзой наверху ( ئے , полученный путем добавления ے к ئ ). [20]

Компьютеры и алфавит урду

На заре компьютеров урду не был должным образом представлен ни на одной кодовой странице . Одной из самых ранних кодовых страниц, представляющих урду, была кодовая страница IBM 868, которая датируется 1990 годом. [21] Другими ранними кодовыми страницами, представляющими алфавиты урду, были кодировки Windows-1256 и MacArabic, обе из которых датируются серединой 1990-х годов. В Unicode урду представлен внутри арабского блока. Другая кодовая страница для урду, которая используется в Индии, — это Perso-Arabic Script Code for Information Interchange . В Пакистане 8-битная кодовая страница, разработанная Национальным управлением по языкам, называется Urdu Zabta Takhti ( اردو ضابطہ تختی ) (UZT) [22] , которая представляет урду в его наиболее полной форме, включая некоторые из его специализированных диакритических знаков, хотя UZT не предназначен для сосуществования с латинским алфавитом.

Кодировка урду в Unicode

Как и другие системы письма, полученные из арабского алфавита, урду использует диапазон Unicode 0600–06FF. [23] Некоторые глифы в этом диапазоне кажутся визуально похожими (или идентичными при использовании определенных шрифтов), даже если базовая кодировка отличается. Это создает проблемы для хранения и поиска информации. Например, электронная копия «Словаря хиндустани и английского языка» Джона Шекспира в Чикагском университете [24] включает слово « بهارت » ( bhārat «Индия»). Поиск строки « بھارت » не возвращает результатов, тогда как запрос с (идентичной во многих шрифтах) строкой « بهارت » возвращает правильную запись. [25] Это связано с тем, что срединная форма буквы урду do chashmi he (U+06BE), используемой для формирования придыхательных диграфов в урду, визуально идентична в своей срединной форме арабской букве hāʾ (U+0647; фонетическое значение /h/ ). В урду фонема /h/ представлена ​​символом U+06C1, называемым gol he (круглый he ) или chhoti he (маленький he ).

В 2003 году Центр исследований в области обработки языка урду (CRULP) [26] — исследовательская организация, связанная с Пакистанским национальным университетом компьютерных и новых наук — подготовил предложение по преобразованию однобайтовой кодировки UZT символов урду в стандарт Unicode. [27] Это предложение предполагает предпочтительный глиф Unicode для каждого символа в алфавите урду.

Программное обеспечение

Daily Jang была первой газетой на урду, набранной в цифровом виде на языке насталик с помощью компьютера. Ведутся работы по разработке более сложной и удобной поддержки урду на компьютерах и в Интернете. В настоящее время почти все газеты, журналы и периодические издания на урду составляются на компьютерах с помощью различных программных продуктов на урду, наиболее распространенным из которых является пакет InPage Desktop Publishing. Microsoft включила поддержку языка урду во все новые версии Windows, и как Windows Vista , так и Microsoft Office 2007 доступны на урду через поддержку Language Interface Pack [28] . Большинство дистрибутивов Linux Desktop позволяют легко установить поддержку урду и переводы. [29] Apple реализовала клавиатуру языка урду на мобильных устройствах в своем обновлении iOS 8 в сентябре 2014 года. [30]

Стандарты и системы романизации

Существует несколько стандартов латинизации для записи урду с помощью латинского алфавита, хотя они не очень популярны, поскольку большинство из них не представляют язык урду должным образом. Вместо стандартных схем латинизации люди в Интернете, на мобильных телефонах и в средствах массовой информации часто используют нестандартную форму латинизации, которая пытается имитировать английскую орфографию . Проблема с этим видом латинизации заключается в том, что ее могут читать только носители языка, и даже для них это очень трудно. Среди стандартизированных схем латинизации наиболее точной является латинизация ALA-LC , которая также поддерживается Национальным управлением языка. Другие схемы латинизации часто отклоняются, потому что они либо не могут правильно представлять звуки в урду, либо они часто не учитывают орфографию урду и отдают предпочтение произношению, а не орфографии. [31]

Управление национального языка Пакистана разработало ряд систем с особыми обозначениями для обозначения неанглийских звуков, но их может правильно прочитать только тот, кто уже знаком с заимствованными буквами. [ необходима ссылка ]

Роман урду также имеет значение среди христиан Пакистана и Северной Индии . Урду был доминирующим родным языком среди христиан Карачи и Лахора в современном Пакистане и Мадхья-Прадеше , Уттар-Прадеш Раджастхан в Индии, в начале 19-го и 20-го века, и до сих пор используется христианами в этих местах. Пакистанские и индийские христиане часто использовали латиницу для письма на урду. Таким образом, роман урду был распространенным способом письма среди пакистанских и индийских христиан в этих областях до 1960-х годов. Библейское общество Индии издает Библии на роман урду , которые пользовались спросом в конце 1960-х годов (хотя они все еще издаются сегодня). Церковные песенники также распространены на роман урду. Однако использование роман урду снижается с более широким использованием хинди и английского языка в этих штатах.

Словарь ключевых слов из названий букв

Смотрите также

Ссылки

  1. ^ "Конституция Южно-Африканской Республики, 1996 - Глава 1: Основополагающие положения". www.gov.za . Получено 6 декабря 2014 г. .
  2. ^ "Балтийский алфавит и произношение". omniglot.com . Получено 31 января 2023 г. .
  3. ^ Башир, Елена ; Хуссейн, Сармад; Андерсон, Дебора (5 мая 2006 г.). "N3117: Предложение добавить символы, необходимые для кховар, торвали и бурушаски" (PDF) . ISO/IEC JTC1/SC2/WG2.
  4. ^ ab Project Fluency (7 октября 2016 г.). Урду: полный курс обучения урду для начинающих: начните говорить на базовом урду немедленно (ред. Kindle). Независимая издательская платформа Createspace. стр. Kindle Locations 66–67. ISBN 978-1539047803.
  5. ^ ab "Урду". Всеязык .
  6. ^ "*позиционная диаграмма*". Урду: некоторые мысли о скрипте и грамматике, а также другие общие заметки для студентов . Получено 28 февраля 2020 г. – через www.columbia.edu.
  7. ^ "Споры о количестве букв в алфавите урду". DAWN.COM . 15 июня 2009 г.
  8. Delacy 2003, стр. XV–XVI.
  9. ^ abc "Урду романизация" (PDF) . Библиотека Конгресса.
  10. Романизация географических названий в Пакистане. ГЭГНООН, 18-я сессия. Женева, 12–23 августа 1996 г. Рабочие документы № 85 и № 85 Доп. 1.
  11. ^ Бхатия, Тедж К.; Хоул, Ашок; Коул, Ашок (2015). Разговорный урду: полный курс для начинающих. Routledge. С. 41–42. ISBN 978-1-317-30471-5. Получено 30 июня 2020 г. .
  12. ^ abcdefghi "Urdu Alphabet". www.user.uni-hannover.de . Архивировано из оригинала 11 сентября 2019 года . Получено 29 февраля 2020 года .
  13. ^ abcd "Расширенное арабское письмо". unicode.org . Получено 6 апреля 2020 г. .
  14. ^ abcdef "На основе ISO 8859-6". unicode.org . Получено 6 апреля 2020 г. .
  15. ^ abcdefghijklmno "Urdu: Oxford Living Dictionaries". Urdu: Oxford Living Dictionaries . Архивировано из оригинала 18 октября 2016 года . Получено 15 марта 2020 года .
  16. Баллантайн, Джеймс Роберт (1842). Грамматика языка хиндустани с краткими замечаниями о диалектах брадж и дакхани. Madden & Company. стр. 11.
  17. ^ Берггрен, Олаф (2002). Скрипты. Библиотека Александрина. п. 108.
  18. ^ Грирсон, Джордж Абрахам . «Управление языком урду». Language Information Services (LIS)-India . Получено 23 июля 2022 г.
  19. ^ «Предложение о включении некоторых символов в Unicode» (PDF) .
  20. Деласи 2003, стр. 99–100.
  21. ^ "Кодовая страница IBM 868"
  22. ^ "Урду Забта Тахти" (PDF) .
  23. ^ "Арабский" (PDF) . unicode.org . Получено 7 апреля 2019 г. .
  24. ^ "Словарь, хиндустани и английский". Dsal.uchicago.edu. 29 сентября 2009 г. Получено 18 декабря 2011 г.
  25. ^ "Словарь, хиндустани и английский". Dsal.uchicago.edu. Архивировано из оригинала 15 декабря 2012 года . Получено 18 декабря 2011 года .
  26. ^ "Центр исследований в области обработки языка урду". Crulp.org . Получено 18 декабря 2011 г.
  27. ^ Архивный индекс на Wayback Machine
  28. ^ "Можно использовать Windows" . Microsoft.com . Проверено 18 декабря 2011 г.
  29. ^ «Ubuntu на урду «Веб-уголок Аасима» . Aasims.wordpress.com . Проверено 18 декабря 2011 г.
  30. ^ "E-Urdu: Как призыв одного человека в пользу Насталика был услышан Apple". The Express Tribune . 16 октября 2014 г. Получено 29 марта 2015 г.
  31. ^ "Поиск в حرفی ۔ ایک ابتدائی تعارف: نبلٰی پیرزادہ" . nlpd.gov.pk.
  32. ^ ab "Urdu: Oxford Living Dictionaries (перевод с урду на английский)". Urdu: Oxford Living Dictionaries . Получено 15 марта 2020 г. .[ мертвая ссылка ]
  33. ^ "خلا سے زمین پر انگریزی کےحروف تہجی" . BBC News اردو (на урду). 5 января 2016 года . Проверено 7 мая 2020 г.

Источники

Внешние ссылки