stringtranslate.com

Транслитерация деванагари

Деванагарииндийское письмо, используемое для многих индоарийских языков Северной Индии и Непала , включая хинди , маратхи и непальский , которое использовалось для записи классического санскрита . Существует несколько довольно похожих методов транслитерации с деванагари на латинское письмо (процесс, иногда называемый романизацией ), включая влиятельную и не содержащую потерь нотацию IAST . [1] Романизированное деванагари также называется романагари . [2]

ИАСТ

Международный алфавит транслитерации санскрита (IAST) является подмножеством стандарта ISO 15919 , используемого для транслитерации санскрита , пракрита и пали в латиницу с диакритическими знаками. IAST является широко используемым стандартом. Он использует диакритические знаки для устранения неоднозначности фонетически похожих, но не идентичных санскритских глифов. Например, зубные и ретрофлексные согласные устраняются неоднозначностью с помощью нижней точки: зубной द=d и ретрофлексный ड=ḍ. Важной особенностью IAST является то, что он обратим без потерь, [ требуется ссылка ], т. е. транслитерация IAST может быть преобразована обратно в правильный деванагари или в другие южноазиатские письменности без неоднозначности. Многие шрифты Unicode полностью поддерживают отображение и печать IAST.

Система Хантера

Система Хантера — это «национальная система романизации в Индии», официально принятая правительством Индии . [3] [4] [5]

Система Хантера была разработана в девятнадцатом веке Уильямом Уилсоном Хантером , тогдашним генеральным инспектором Индии. [6] Когда она была предложена, она сразу же столкнулась с противодействием со стороны сторонников ранее практиковавшегося несистематического и часто искажающего «метода сэра Роджера Даулера» (раннее искажение Сирадж уд-Даула ) фонетической транскрипции, что достигло кульминации в драматическом противостоянии на заседании Совета Индии 28 мая 1872 года, где новый метод Хантера одержал победу. Метод Хантера был изначально проще и расширяем на несколько индийских письменностей, поскольку он систематизировал транслитерацию графем , и он стал преобладать и получил правительственное и академическое признание. [6] Противники модели транслитерации графем продолжали предпринимать безуспешные попытки изменить политику правительства вплоть до начала века, а один критик призвал обратиться к «правительству Индии с просьбой полностью отказаться от попыток научной (т. е. Хантеровской) транслитерации и принять решение раз и навсегда в пользу возврата к старому фонетическому написанию». [7]

Со временем метод Хантера распространился на несколько индийских письменностей, включая бирманскую и тибетскую . [8] [9] Также были сделаны положения об удалении шва в индоарийских языках , где это применимо, например, хинди कानपुर транслитерируется как kānpur (а не kānapura ), а санскритское क्रम транслитерируется как krama (а не kram ). Система претерпела некоторую эволюцию с течением времени. Например, долгие гласные были отмечены диакритическим знаком ударения в оригинальной версии, но позже в обновлении правительства Индии 1954 года это было заменено макроном . [ 10] Таким образом, जान ( жизнь ) ранее романизировалось как ján , но начало романизироваться как jān . Система Хантера подвергалась критике на протяжении многих лет за то, что не давала фонетически точных результатов и была «бесстыдно ориентирована на англоязычную аудиторию». [10] В частности, отсутствие дифференциации между ретрофлексными и зубными согласными (например, и оба представлены как d ) неоднократно подвергалось критике и вдохновило на несколько предложенных модификаций Хантера, включая использование диакритического знака под ретрофлексными согласными (например, сделав = d и = , что более читабельно, но требует диакритической печати) или их написание с заглавной буквы (например, сделав = d и = D , что не требует диакритической печати, но менее читабельно, потому что смешивает строчные и заглавные буквы в словах). [11]

Альтернативные методы транслитерации

Схемы с диакритическими знаками

Национальная библиотека в Калькутте романизация

Романизация Национальной библиотеки в Калькутте , предназначенная для романизации всех индийских письменностей , является расширением IAST . Она отличается от IAST использованием символов ē и ō для и (e и o используются для кратких гласных, присутствующих во многих индийских языках), использованием 'ḷ' для согласной (в каннада ) и отсутствием символов для , и .

ИСО 15919

Стандартное соглашение о транслитерации не только для деванагари [12] , но и для всех южноазиатских языков было кодифицировано в стандарте ISO 15919 2001 года, что стало основой для современных цифровых библиотек, соответствующих нормам Международной организации по стандартизации (ISO). ISO 15919 определяет общую основу Unicode для транслитерации латиницей южноазиатских текстов на самых разных языках/письменностях.

Транслитерации ISO 15919 являются платформенно-независимыми текстами, поэтому их можно использовать одинаково во всех современных операционных системах и программных пакетах, если они соответствуют нормам ISO. Это является предпосылкой для всех современных платформ, поэтому ISO 15919 стал новым стандартом для цифровых библиотек и архивов для транслитерации всех южноазиатских текстов. [ оригинальное исследование? ]

ISO 15919 [13] использует диакритические знаки для сопоставления гораздо большего набора брахмических графем с латинским алфавитом. Часть, специфичная для деванагари, почти идентична академическому стандарту IAST : "Международный алфавит санскритской транслитерации", и ALA-LC , стандарту Библиотеки Конгресса США. [14]

Другой стандарт, United Nations Romanization Systems for Geographical Names (UNRSGN), был разработан Группой экспертов ООН [15] по географическим названиям (UNGEGN) [16] и охватывает многие брахмические письменности. Существуют некоторые различия [17] между ISO 15919 и UNRSGN.

ASCII-схемы

Гарвард-Киото

По сравнению с IAST , Harvard-Kyoto выглядит намного проще. Он не содержит никаких диакритических знаков, которые есть в IAST. Вместо диакритических знаков Harvard-Kyoto использует заглавные буквы . Использование заглавных букв делает набор текста в Harvard-Kyoto намного проще, чем в IAST, но создает слова с заглавными буквами внутри.

Схема ITRANS

ITRANS — это расширение Гарвард-Киото . Схема транслитерации ITRANS была разработана для программного пакета ITRANS , препроцессора для индийских письменностей . Пользователь вводит данные латинскими буквами, а препроцессор ITRANS преобразует латинские буквы в деванагари (или другие индийские письменности). Последняя версия ITRANS — версия 5.30, выпущенная в июле 2001 года. [ необходима цитата ]

Вельтуис

Недостатком вышеприведенных схем ASCII является чувствительность к регистру, что подразумевает, что транслитерированные имена не могут быть заглавными. Эта трудность избегается с помощью системы, разработанной в 1996 году Франсом Вельтуисом для TeX , в некоторой степени основанной на IAST, в которой регистр не имеет значения.

ВХ

Нотация WX — это схема транслитерации для представления индийских языков в ASCII. Эта схема возникла в IIT Kanpur для вычислительной обработки индийских языков и широко используется в сообществе обработки естественного языка (NLP) в Индии. Нотация (хотя и не идентифицированная) используется, например, в учебнике по NLP от IIT Kanpur.[1] Основные особенности этой схемы транслитерации: Каждая согласная и каждая гласная имеет единственное отображение в латинице. Следовательно, это префиксный код,[2] выгодный с точки зрения вычислений. Обычно строчные буквы используются для неаспирированных согласных и кратких гласных, в то время как заглавные буквы используются для аспирированных согласных и долгих гласных. В то время как ретрофлексированные глухие и звонкие согласные отображаются в «t, T, d и D», зубные отображаются в «w, W, x и X». Отсюда и название схемы «WX», отсылающее к идиосинкразическому отображению. Ubuntu Linux обеспечивает поддержку клавиатуры для нотации WX.

СЛП1

SLP1 (Sanskrit Library Phonetic) — чувствительная к регистру схема, изначально использовавшаяся Sanskrit Library [18] , которая была разработана Питером Шарфом и (покойным) Малкольмом Хайманом, которые впервые описали ее в приложении B своей книги «Лингвистические проблемы кодирования санскрита». [19] Преимущество SLP1 перед другими кодировками заключается в том, что для каждой буквы деванагари используется один символ ASCII, что облегчает обратную транслитерацию. [20]

хинглиш

Хинглиш относится к нестандартизированному романизированному хинди, используемому в Интернете, особенно в социальных сетях. В Индии романизированный хинди является доминирующей формой выражения в Интернете. В анализе комментариев на YouTube Палакодети и др. определили, что 52% комментариев были на романизированном хинди, 46% на английском и 1% на деванагари хинди. [21]

Другие

Другие менее популярные схемы ASCII включают нотацию WX , Vedatype и 7-битную ISO 15919. Нотация WX — это схема транслитерации для представления индийских языков в ASCII. Она возникла в IIT Kanpur для вычислительной обработки индийских языков и широко используется в сообществе обработки естественного языка (NLP) в Индии. Эта схема описана в NLP Panini, заархивирована 26 ноября 2013 года в Wayback Machine (Приложение B). Она похожа на SLP1, но не такая универсальная, что касается охвата ведического санскрита. Сравнение WX с другими схемами можно найти в Huet (2009), App A. Vedatype — это еще одна схема, используемая для кодирования ведических текстов в Университете менеджмента Махариши . Онлайн-утилита перекодирования по всем этим схемам предоставляется в Библиотеке санскрита. ISO 15919 включает в себя так называемый "ограниченный набор символов" для замены диакритических знаков префиксами, так что он совместим с ASCII. Иллюстрированное объяснение здесь от Энтони Стоуна.

Сравнение транслитерации

Ниже приводится сравнение [22] основных методов транслитерации [23] , используемых для деванагари.

Гласные

Согласные

За отдельными согласными буквами деванагари следует неявная шва (/Ə/). Во всех системах транслитерации эта /Ə/ должна быть представлена ​​явно с помощью «a» или любого эквивалента шва .

Неправильные сочетания согласных

Другие согласные

Сравнение IAST с ISO 15919

В таблице ниже показаны только различия между стандартами ISO 15919 и IAST для транслитерации деванагари .

Подробности

Лечение врожденного шва

Согласные деванагари включают «врожденный звук а», называемый шва , который должен быть явно представлен символом «а» в транслитерации. Многие слова и имена, транслитерированные с деванагари, заканчиваются на «а», чтобы указать произношение на оригинальном санскрите . Этот шва обязательно удаляется в нескольких современных индоарийских языках , таких как хинди , пенджаби , маратхи и других. Это приводит к различным транслитерациям для санскрита и языков, удаляющих шва, которые сохраняют или удаляют шва по мере необходимости:

В некоторых словах может сохраняться конечная буква «a», как правило, потому, что без нее их было бы трудно произнести:

По этой причине некоторые слова, оканчивающиеся на согласные группы, в различных современных индийских языках изменяются следующим образом: Мантра = мантар. Шабда = шабад. Сушумна = сушумана.

Ретрофлексные согласные

Большинство индийских языков различают ретрофлексные и дентальные формы дентальных согласных. В официальных схемах транслитерации для обозначения дентальной формы используются стандартные латинские буквы, а ретрофлексная форма обозначается специальными знаками или использованием других букв. Например, в транслитерации IAST ретрофлексными формами являются ṇ, ṭ, ḍ и ṣ.

В большинстве неформальных транскрипций различие между ретрофлексными и зубными согласными не указывается. Однако многие пишут ретрофлексные согласные с заглавной буквы на клавиатуре QWERTY в неформальных сообщениях. Это обычно устраняет необходимость в транслитерации.

Придыхательные согласные

Там, где буква "h" появляется после взрывного согласного в транслитерации деванагари, она всегда указывает на придыхание . Таким образом, "ph" произносится как p в "pit" (с небольшим выдохом, который выпускается при произнесении), никогда как ph в "photo" ( IPA /f/). (С другой стороны, "p" произносится как p в "spit" без выброса воздуха.) Аналогично "th" является придыхаемым "t", а не th в "this" (звонкий, IPA /ð/) и не th в "thin" (глухой, IPA /θ/).

Стремление обычно указывается как в формальной, так и в неформальной системе транслитерации.

Использование компьютера как движущая сила романизации

Поскольку английский язык широко используется в качестве профессионального и высшего образовательного языка в Индии, доступность клавиатур деванагари затмевается английской клавиатурой. Аналогично, программное обеспечение и пользовательские интерфейсы, выпущенные и продвигаемые в Индии, на английском языке, как и большая часть компьютерного образования, доступного там. Из-за низкой осведомленности о раскладках клавиатуры деванагари многие индийские пользователи печатают хинди латиницей.

До того, как деванагари был добавлен в Unicode , для отображения деванагари в Интернете использовалось множество обходных путей, и многие сайты и службы продолжали их использовать, несмотря на широкую доступность шрифтов Unicode, поддерживающих деванагари. Хотя существует несколько соглашений о транслитерации для транслитерации хинди в латиницу, большинство из них основаны на диакритических знаках. Поскольку большинство индийцев знакомы с латиницей через английский язык (который традиционно не использует диакритические знаки), эти системы транслитерации гораздо менее широко известны. Большинство таких «романагари» транслитерируется произвольно, чтобы имитировать английское написание, и, таким образом, приводит к многочисленным несоответствиям.

Это также вредно для поисковых систем, которые не классифицируют текст на хинди в латинском алфавите как хинди. Тот же текст может также не классифицироваться как английский.

Независимо от раскладки физической клавиатуры, можно установить раскладки клавиатуры хинди на основе Unicode на большинстве современных операционных систем. Существует множество онлайн-сервисов, которые точно транслитерируют текст, написанный латиницей, в деванагари, используя для справки словари хинди, такие как Google transliteration или Microsoft Indic Language Input Tool . Это решение похоже на редакторы методов ввода , которые традиционно используются для ввода текста на языках, использующих сложные символы, в частности, те, которые используют логографии.

История транслитерации санскрита

Ранние санскритские тексты изначально передавались путем заучивания и повторения. В постхараппской Индии не было системы письма на индийских языках до создания (в IV-III вв. до н. э.) письменностей кхарошти и брахми . Эти системы письма, хотя и были адекватны для среднеиндийских языков , не были хорошо адаптированы для письма на санскрите. Однако более поздние потомки брахми были модифицированы таким образом, чтобы они могли записывать санскрит с точными фонетическими подробностями. Самый ранний физический текст на санскрите — это наскальная надпись правителя западных кшатрапов Рудрадамана , написанная около 150 г. н. э. в Джунагадхе , Гуджарат . Из-за значительного распространения различных разновидностей брахми в Средние века сегодня не существует единого письма, используемого для письма на санскрите; скорее, знатоки санскрита могут писать на этом языке в форме любого письма, используемого для письма на их местном языке. Однако со времен позднего Средневековья появилась тенденция использовать деванагари для написания санскритских текстов для широкого круга читателей.

Западные ученые в XIX веке приняли деванагари для печатных изданий санскритских текстов. Edio princeps Ригведы Макса Мюллера был на деванагари. Лондонские наборщики Мюллера соревновались со своими петербургскими коллегами, работавшими над словарем Бётлингка и Рота, в вырезании всех необходимых лигатурных шрифтов .

С самого начала западная санскритская филология также ощущала необходимость в романизированном написании языка. [ необходима цитата ] Франц Бопп в 1816 году использовал схему романизации, наряду с деванагари, отличающуюся от IAST выражением долготы гласных с помощью циркумфлекса (â, î, û), а придыхания — с помощью spiritus asper (например, bʽ для IAST bh). Шипящие IAST ṣ и ś он выражал с помощью spiritus asper и lenis соответственно (sʽ, sʼ). Монье-Вильямс в своем словаре 1899 года использовал ć, ṡ и sh для IAST c, ś и ṣ соответственно.

С конца 19 века интерес Запада к набору деванагари снизился. [ необходима цитата ] Теодор Ауфрехт опубликовал свое издание Ригведы 1877 года на романизированном санскрите, а Ведическая грамматика Артура Макдонелла 1910 года (и Ведическая грамматика для студентов 1916 года ) также обходятся без деванагари (в то время как его вводная грамматика санскрита для студентов сохраняет деванагари наряду с романизированным санскритом). Современные западные издания санскритских текстов появляются в основном на IAST.

Смотрите также

Ссылки

  1. ^ Дайя Нанд Шарма (1972), Транслитерация на латиницу и деванагари языков индийской группы, Обзор Индии, 1972, ... С течением времени возникла практически единая система транслитерации деванагари и родственных алфавитов. Тем не менее, единая система романизации пока не разработана ...
  2. ^ MHAISKAR, RAHUL (2015). «Romanagari — альтернатива современным медиаписьмам». Бюллетень исследовательского института колледжа Декан . 75 : 195–202. ISSN  0045-9801. JSTOR  26264736.
  3. ^ Группа экспертов ООН по географическим названиям, Департамент ООН по экономическим и социальным вопросам (2007), Техническое справочное руководство по стандартизации географических названий, Издательство ООН, 2007, ISBN 978-92-1-161500-5, ... ISO 15919 ... Нет никаких свидетельств использования этой системы ни в Индии, ни в международных картографических продуктах ... Система Хантера является фактически используемой национальной системой латинизации в Индии ...
  4. ^ Департамент ООН по экономическим и социальным вопросам (1955), Региональная картографическая конференция ООН для Азии и Дальнего Востока, том 2, ООН, 1955, ... В Индии используется система Хантера, в соответствии с которой каждый звук в местном языке единообразно представлен определенной буквой в латинском алфавите ...
  5. ^ Национальная библиотека (Индия) (1960), Индийские научные и технические публикации, выставка 1960: библиография, Совет по научным и промышленным исследованиям, Правительство Индии, 1960, ... Была использована система транслитерации Хантера, которая получила международное признание ...
  6. ^ Фрэнсис Генри Скрин (1901), Жизнь сэра Уильяма Уилсона Хантера, KCSI, MA, LL.D., вице-президента Королевского Азиатского общества и т. д., Longmans, Green, and co., 1901, ... фонетический или «метод сэра Роджера Даулера» ... Государственный секретарь и подавляющее большинство его советников безоговорочно поддержали систему Хантера ...
  7. The Fortnightly, том 68, Chapman and Hall, 1897, 1897, ... индийское правительство отказывается от всех попыток научной (т. е. Хантеровской) транслитерации и принимает решение раз и навсегда в пользу возврата к старому фонетическому написанию ...
  8. ^ Mînn Latt Yêkháun (1966), Модернизация бирманского языка, Восточный институт в академии, Издательство Чехословацкой академии наук, 1966, ... Существует система транскрипции бирманских слов латинскими буквами, которая называется «правительственным» или «охотничьим» методом ...
  9. ^ Кунвар Кришан Рампал (1993), Картографирование и компиляция, Concept Publishing Company, 1993, ISBN 978-81-7022-414-3, ... Система Хантериан имеет правила транслитерации на английский язык названий хинди, урду, арабского, бирманского, китайского и тибетского происхождения. Эти правила описаны в Главе VI, Обзор Индии, Справочник по топографической картографии ...
  10. ^ ab Романизация топонимов в странах Южной Азии , получено 27 февраля 2011 г. , ... В источниках конца 19 века система отмечает долгие гласные острым ударением и передает буквы k и q как k. Однако, когда система была снова опубликована в 1954 году, были внесены изменения. Долгие гласные теперь отмечались макроном4, а различие qk сохранялось ...
  11. ^ Институт геодезистов (Индия) (1991), Индийский геодезист, тома 33-34, Институт геодезистов., 1991, ... Предложено г-ном GS Oberoi, директором Геодезического управления Индии, вместо существующей таблицы «Система транслитерации Хантера», которая не делает различий между и , и ड़ , и ...
  12. ^ Сравнение деванагари: ISO, ALA-LC, Hunterian в 2005 году, автор Томас Т. Педерсен из Eesti Keele Instituut Instituut Транслитерация нелатинских письменностей
  13. ^ Транслитерация индийских письменностей: как использовать ISO 15919 Архивировано 14 апреля 2016 г. на Wayback Machine ntlworld.com.
  14. ^ Романизация хинди LC в формате PDF по стандарту Библиотеки Конгресса, loc.gov.
  15. ^ Группа экспертов ООН по географическим названиям, Департамент ООН по экономическим и социальным вопросам (2007), Техническое справочное руководство по стандартизации географических названий, Издательство ООН, 2007, ISBN 978-92-1-161500-5, ... ISO 15919 ... Нет никаких свидетельств использования этой системы ни в Индии, ни в международных картографических продуктах ... Система Хантера является фактически используемой национальной системой латинизации в Индии ...
  16. ^ "Рабочая группа UNGEGN по системам романизации". Группа экспертов ООН по географическим названиям UNGEGN, www.eki.ee .Eesti Keele Instituut . Получено 14 февраля 2017 г.
  17. ^ "Различия между ISO 15919 и UNRSGN". Рабочая группа по системам романизации. Группа экспертов ООН по географическим названиям UNGEGN. www.eki.ee/wgrs/ .Eesti Keele Instituut . Март 2016 . Получено 13 февраля 2017 .
  18. ^ "The Sanskrit Library » Tools » Indic Script Comparison Table". Архивировано из оригинала 8 августа 2014 года.
  19. ^ Шарф, Питер М.; Хайман, Малкольм Д. (2011). Лингвистические проблемы кодирования санскрита (PDF) .
  20. ^ Помощь по морфологии
  21. ^ Палакодети, Шрифани; ХудаБухш, Ашикур Р.; Джайячандран, Гуха (2021), «Машинный перевод с низкими ресурсами», Малоресурсный анализ текста в социальных сетях , Сингапур: Springer Singapore, стр. 7–9, doi : 10.1007/978-981-16-5625-5_5, ISBN 978-981-16-5624-8, S2CID  244313560 , получено 24 сентября 2022 г.
  22. ^ Таблица соответствия с 7 методами Harvard-Kyoto, ITRANS, Velthuis, SLP, WX-system и IAST, Devanagari, используемыми ILTP-DC для санскрита. Инструмент транслитерации санскрита. Преобразование из одной схемы в другую. Поддерживается «Центром распространения и внедрения индийских языковых технологий» (ILTP-DC) правительства Индии. Работает с 7 системами: Harvard-Kyoto, ITRANS, Velthuis, SLP, WX-system и IAST, Devanagari.
  23. ^ Диаграмма: разница между IAST и ISO. Инструмент транслитерации (конвертера) Aksharamukha. Akshara Mukha — это бесплатный конвертер азиатских письменностей (двусторонний). Он поддерживает 5 основных соглашений о транслитерации латиницы, таких как IAST, ISO, Harvard-Kyoto, ITRANS и Velthuis. Он может выполнять взаимное преобразование, например, из Velthuis в ISO. Он также преобразует между 20 различными южноазиатскими и восточноазиатскими письменностями. Вы можете получить доступ к проекту здесь. При использовании инструмента «источник» может быть установлен, например, на: ITRANS или Harvard-Kyoto, а «цель» может быть установлена ​​на определенную письменность, например, деванагари-хинди. (Если вы используете североиндийскую письменность, отметьте флажок: Удалить «a»). Он также может работать в обратном направлении, например, с хинди на латиницу с помощью транслитерации ISO.

Внешние ссылки