stringtranslate.com

Транслитерация хинди–урду

Хинди-урду (деванагари: हिन्दी-उर्दू , насталик: ہندی-اردو ) (также известный как хиндустани ) [1] [2] является лингва-франка современной Северной Индии и Пакистана (вместе классически известных как хиндустан). ). [3] Современный стандартный хинди официально зарегистрирован в Индии как стандарт, написанный с использованием сценария деванагари , а стандартный урду официально зарегистрирован в Пакистане как стандарт, написанный с использованием расширенного персидско-арабского алфавита .

Транслитерация хинди-урду (или транслитерация хиндустани ) необходима для того, чтобы носители хиндустани понимали текст друг друга, и это особенно важно, учитывая, что базовый язык регистров хинди и урду почти одинаков. [4] Транслитерация теоретически возможна из-за общей фонологии хиндистани, лежащей в основе хинди-урду. В настоящее время язык хиндустани рассматривается как объединяющий язык, [5] как изначально предлагал Махатма Ганди для разрешения спора хинди-урду . [6] («Хиндустани» не следует путать с последователями индуизма , поскольку «инду» на персидском означает « индо »)

Технически, прямое сопоставление сценариев один к одному или транслитерация без потерь на основе правил с хинди на урду невозможны, в основном потому, что хинди записан в письме абугида , а урду записан в письме абджад , а также из-за других ограничений, таких как сопоставление нескольких похожих символов из персидско-арабского на один символ в деванагари. [7] Тем не менее, были попытки сопоставления на основе словаря, которые дали очень высокую точность, обеспечивая почти идеальную транслитерацию. [8] Для литературных областей простая транслитерация между хинди и урду будет недостаточна, поскольку формальный хинди больше склоняется к санскритской лексике, тогда как формальный урду больше склоняется к персидской и арабской лексике; следовательно, для таких случаев потребуется система, объединяющая транслитерацию и перевод. [9]

В дополнение к хинди-урду, были предприняты попытки разработать индо-пакистанские системы транслитерации для таких диграфических языков, как синдхи (письменный на расширенном персидско-арабском языке в Синде Пакистана и на деванагари синдхами в разделенной Индии ), пенджаби (письменный на гурмукхи в Восточном Пенджабе и шахмукхи в Западном Пенджабе ), сараики (письменный на расширенном шахмукхи в Сараикистане и неофициально на синдхи-деванагари в Индии) и кашмири (письменный на расширенном персидско-арабском языке мусульманами Кашмира и на расширенном деванагари индусами Кашмира ). [10] [11] [12]

Гласные

Согласные

В алфавите хиндустани имеется богатый набор согласных, поскольку его словарный запас представляет собой смешанную лексику ( рехта ), происходящую от древнехинди (от дехлеви ) с заимствованиями из парси (от пехлеви ) и арабского языков, которые, в свою очередь, относятся к 3 разным языковым семьям: индоарийской , иранской и семитской .

В следующей таблице приведено приблизительное соответствие один к одному для согласных хинди-урду [17] , особенно для вычислительных целей (преобразование без потерь). Обратите внимание, что это прямое преобразование не даст правильного написания [18] , а скорее читабельный текст для обоих читателей. Обратите внимание, что схемы транслитерации хинди-урду могут использоваться и для пенджаби , для преобразования гурмукхи (восточный пенджаби) в шахмукхи (западный пенджаби), поскольку шахмукхи является надмножеством алфавита урду (с 2 дополнительными согласными), а письмо гурмукхи можно легко преобразовать в письмо деванагари.

Согласные санскритские

Следующие согласные чаще всего используются в словах, которые напрямую заимствованы или адаптированы из санскрита .

Имплозивные согласные

Эти согласные в основном встречаются только в таких языках, как синдхи и сараики .

Цифры

Знаки препинания и символы

Образец текста

Ниже приведен отрывок из индуистской поэмы « Таранах-э-Хинди», написанной Мухаммадом Икбалом .

Смотрите также

Ссылки

  1. ^ "About Hindi-Urdu". North Carolina State University . Архивировано из оригинала 15 августа 2009 года . Получено 9 августа 2009 года .
  2. ^ Рэй, Анируддха (2011). Разнообразные грани истории: очерки в честь Анируддхи Рэя . Книги Примуса. ISBN 978-93-80607-16-0. В 1879 году был опубликован « Словарь хиндустани» Фэллона; а два года спустя (1881) Джон Дж. Платтс выпустил свой «Словарь урду, классического хинди и английского» , в котором подразумевалось, что хинди и урду являются литературными формами одного языка. Совсем недавно Кристофер Р. Кинг в своей книге «Один язык, две письменности» (1994) представил позднюю историю единого разговорного языка в двух формах с ясностью и подробностями, которых заслуживает эта тема.
  3. ^ Эшмор, Гарри С. (1961). Encyclopaedia Britannica: новый обзор всеобщих знаний, том 11. Encyclopaedia Britannica . стр. 579. Повседневная речь более 50 000 000 человек из всех общин на севере Индии и в Западном Пакистане является выражением общего языка, хиндустани.
  4. ^ Lehal, Gurpreet Singh; Saini, Tejinder Singh (декабрь 2012 г.). «Разработка полной системы транслитерации урду-хинди». Труды COLING 2012: Плакаты . Мумбаи, Индия: Оргкомитет COLING 2012: 643–652.
  5. ^ Дэвид Ланн, Dawn com (28 января 2019 г.). «Урду и хинди могли бы стать одним языком под названием хиндустани. Позволит ли это политика языка?». Scroll.in . Получено 08.04.2021 .
  6. ^ «Как Ганди изменил свое мнение после экспериментов с хинди в качестве национального языка». Прабху Малликарджунан . The Feral. 3 октября 2019 г.
  7. ^ Висвесвария, Картик; Чентамаракшан, Виджил; Камбхатла, Нандакишор (август 2010 г.). «Урду и хинди: перевод и обмен лингвистическими ресурсами». Колинг 2010: Плакаты . Оргкомитет Coling 2010: 1283–1291.[ мертвая ссылка ]
  8. ^ Лехал, Гурприт Сингх; Саини, Теджиндер Сингх (2010). «Система транслитерации с хинди на урду» (PDF) . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  9. ^ Дуррани, Надир; Саджад, Хассан; Фрейзер, Александр; Шмид, Хельмут (июль 2010 г.). «Машинный перевод с хинди на урду посредством транслитерации». Труды 48-го ежегодного собрания Ассоциации компьютерной лингвистики . Уппсала, Швеция: Ассоциация компьютерной лингвистики: 465–474.
  10. ^ "Транслитерация персидско-арабского в индийское письмо". sangam.learnpunjabi.org . Получено 07.04.2021 .
  11. ^ "Saraiki - Система машинной транслитерации деванагари - SDMTS". www.sanlp.org . Получено 09.08.2021 .
  12. ^ Лавайе, Аадил; Как, Аадил; Мехди, Нали (январь 2010 г.). «Создание кросс-скриптового кашмирского конвертера: проблемы и решения». Труды Oriental COCOSDA .
  13. ^ Диакритические знаки в урду обычно не пишутся, а подразумеваются и интерпретируются в зависимости от контекста предложения.
  14. ^ [ɛ] встречается как условный аллофон /ə/ рядом с /ɦ/, окруженным с обеих сторон шва. Обычно второй шва подвергается синкопированию, и в результате получается просто [ɛ], предшествующий /ɦ/ . В хинди нет буквы для представления ə, как это обычно подразумевается
  15. ^ В хинди есть отдельные буквы для придыхательных согласных, тогда как в урду есть специальная буква для обозначения придыхательных согласных.
  16. ^ Ни одно слово в хиндустани не может начинаться с назальной буквы/диакритического знака. В урду начальная форма (буква) для представления назальнного слова: ن٘ (nūn + маленькая nūn ghunna диакритический знак)
  17. ^ NC, Gokul (2021-05-07), GokulNC/Indic-PersoArabic-Script-Converter , получено 2021-05-28
  18. ^ Ахмед, Нисар. "Эффективная система транслитерации хинди-урду" (PDF) . 5-я Международная. Междисциплинарная конференция, 29-31 октября, в ICBS, Лахор .
  19. ^ abcde Шапиро, Майкл К. (1989). Букварь современного стандартного хинди . Мотилал Банарсидасс Publ. п. 20. ISBN 978-81-208-0508-8. В дополнение к основным согласным звукам, обсуждаемым в разделах 3.1 и 3.2, многие говорящие используют любой или все пять дополнительных согласных (क़ , ख़ ḳh ,ग़ ġ , ज़ z , फ़ f ) в словах иностранного происхождения (в основном из персидского, арабского, английского и португальского языков). Последние два из них, ज़ z и फ़ f , являются начальными звуками в английских zig и fig соответственно. Согласный क़ является глухим увулярным взрывным звуком, несколько похожим на k , но произносимым дальше во рту. ख़ ḳh является глухим фрикационным звуком, похожим по произношению на конечный звук немецкого ach . ग़ ġ обычно произносится как глухой увулярный фрикативный звук, хотя иногда его можно услышать как смычку, а не фрикативный звук. В деванагари каждый из этих пяти звуков представлен с помощью точки под одним из основных согласных знаков. На практике, однако, точка часто опускается, предоставляя читателю возможность самому воспроизвести правильное произношение на основе его предыдущих знаний языка.
  20. ^ abcde Pandey, Dipti; Mondal, Tapabrata; Agrawal, SS; Bangalore, Srinivas (2013). "Разработка и пригодность базы данных речевых языков индийских языков для построения системы ASR на основе Watson". Международная конференция Oriental COCOSDA 2013 года, проведенная совместно с Конференцией по исследованиям и оценке азиатских разговорных языков 2013 года (O-COCOSDA/CASLRE) . стр. 3. doi :10.1109/ICSDA.2013.6709861. ISBN 978-1-4799-2378-6. S2CID  26461938. Только на хинди 10 фонем व /v/ क़ /q/ ञ /ɲ/ य /j/ ष /ʂ/ ख़ /x/ ग़ /ɣ/ ज़ /z/ झ़ /ʒ/ फ़ /f/
  21. ^ abc "Предложение о расширении арабского блока" (PDF) .