stringtranslate.com

Деванагари транслитерация

Деванагарииндийское письмо, используемое для многих индоарийских языков Северной Индии и Непала , включая хинди , маратхи и непальский , который использовался для написания классического санскрита . Существует несколько похожих методов транслитерации с деванагари на латинский алфавит (процесс, который иногда называют латинизацией ), включая влиятельную нотацию IAST без потерь . [1] Романизированный Деванагари также называют Романагари . [2]

ИАСТ

Международный алфавит санскритской транслитерации (IAST) является подмножеством стандарта ISO 15919 , используемого для транслитерации санскрита , пракрита и паки в латинский алфавит с диакритическими знаками. IAST — широко используемый стандарт. Он использует диакритические знаки для устранения неоднозначности фонетически похожих, но не идентичных санскритских глифов. Например, зубные и ретрофлексные согласные обозначаются точкой: зубной द=d и ретрофлексный ड=ḍ. Важной особенностью IAST является то, что он обратим без потерь, т . е . транслитерация IAST может быть преобразована обратно в правильный деванагари или в другие южноазиатские сценарии без двусмысленности. Многие шрифты Unicode полностью поддерживают отображение и печать IAST.

Хантерианская система

Хантерианская система — это «национальная система латинизации в Индии», официально принятая правительством Индии . [3] [4] [5]

Система Хантера была разработана в девятнадцатом веке Уильямом Уилсоном Хантером , тогдашним генеральным инспектором Индии. [6] Когда это было предложено, оно сразу же встретило сопротивление со стороны сторонников ранее практиковавшегося несистематического и часто искажающего «метода сэра Роджера Даулера» (раннее искажение Сираджа уд-Даулы ) фонетической транскрипции, кульминацией которого стала драматическая Столкновение на заседании Совета Индии 28 мая 1872 года, где новый метод Хантера одержал победу. Метод Хантера был по своей сути более простым и расширяемым для нескольких индийских письменностей, поскольку он систематизировал транслитерацию графем , и он стал преобладать и получил признание правительства и академических кругов. [6] Противники модели транслитерации графем продолжали предпринимать безуспешные попытки обратить вспять государственную политику до начала века, при этом один критик призывал «правительство Индии отказаться от всех попыток научной (т.е. хантеровской) транслитерации, и решите раз и навсегда в пользу возврата к старому фонетическому написанию». [7]

Со временем хантеровский метод расширился и стал охватывать несколько индийских письменностей, включая бирманский и тибетский . [8] [9] Положения об удалении шва в индоарийских языках также были сделаны там, где это применимо, например, хинди कानपुर транслитерируется как канпур (а не канапура ), а санскритский क्रम транслитерируется как крама (а не крам ). Система со временем претерпела некоторую эволюцию. Например, долгие гласные в исходной версии обозначались диакритическим знаком с акцентом , но позже в обновлении правительства Индии 1954 года он был заменен макроном . [10] Таким образом, जान ( жизнь ) ранее латинизировалось как ján, но начало латинизироваться как jān . Система Хантера на протяжении многих лет подвергалась критике за то, что она не дает фонетически точных результатов и «беззастенчиво ориентирована на англоязычную аудиторию». [10] В частности, отсутствие дифференциации между ретрофлексными и зубными согласными (например, и оба представлены буквой d ) вызвало неоднократную критику и вдохновило на несколько предложенных модификаций Хантерианского языка, включая использование диакритического знака ниже ретрофлексов (например, создание = d и = , что более читабельно, но требует диакритической печати) или использовать их с заглавной буквы (например, сделать = d и = D , что не требует диакритической печати, но менее читабельно, поскольку в словах смешиваются строчные и заглавные буквы). [11]

Альтернативные методы транслитерации

Схемы с диакритическими знаками

Национальная библиотека в Калькутте, латинизация

Латинизация Национальной библиотеки Калькутты , предназначенная для латинизации всех индийских письменностей , является продолжением IAST . Он отличается от IAST использованием символов ē и ō для и (e и o используются для кратких гласных, присутствующих во многих индийских языках), использованием «ḷ» для согласного (на каннаде ) и отсутствие символов , и .

ИСО 15919

Стандартное соглашение о транслитерации не только для деванагари [12] , но и для всех южноазиатских языков было кодифицировано в стандарте ISO 15919 2001 года, обеспечив основу для современных цифровых библиотек, соответствующих нормам Международной организации по стандартизации (ISO). ISO 15919 определяет общую основу Unicode для латинской транслитерации южноазиатских текстов на самых разных языках/скриптах.

Транслитерации ISO 15919 представляют собой тексты, независимые от платформы, поэтому их можно одинаково использовать во всех современных операционных системах и пакетах программного обеспечения, если они соответствуют нормам ISO. Это необходимое условие для всех современных платформ, чтобы ISO 15919 стал новым стандартом для цифровых библиотек и архивов для транслитерации всех южноазиатских текстов. [ оригинальное исследование? ]

ISO 15919 [13] использует диакритические знаки для сопоставления гораздо большего набора брахмических графем с латинским алфавитом. Часть, специфичная для Деванагари, почти идентична академическому стандарту IAST : «Международный алфавит санскритской транслитерации» и ALA-LC , стандарту Библиотеки Конгресса США. [14]

Другой стандарт, Система латинизации географических названий Организации Объединенных Наций (UNRSGN), был разработан Группой экспертов ООН [15] по географическим названиям (UNGEGN) [16] и охватывает многие брахмические письменности. Существуют некоторые различия [17] между ISO 15919 и UNRSGN.

ASCII-схемы

Гарвард-Киото

По сравнению с IAST Гарвард -Киото выглядит гораздо проще. Он не содержит диакритических знаков , которые содержит IAST. Вместо диакритических знаков Гарвард-Киото использует заглавные буквы . Использование заглавных букв значительно упрощает набор текста в Гарварде-Киото, чем в IAST, но создает слова с заглавными буквами внутри.

Схема ИТРАНС

ITRANS является продолжением Гарвард-Киото . Схема транслитерации ITRANS была разработана для программного пакета ITRANS — препроцессора индийских письменностей . Пользователь вводит латинские буквы, а препроцессор ITRANS преобразует латинские буквы в деванагари (или другие индийские шрифты). Последней версией ITRANS является версия 5.30 , выпущенная в июле 2001 года .

Вельтуис

Недостатком вышеупомянутых схем ASCII является чувствительность к регистру, что означает, что транслитерированные имена не могут быть написаны с заглавной буквы. Этой трудности можно избежать с помощью системы, разработанной в 1996 году Франсом Велтуисом для TeX , в общих чертах основанной на IAST, и в этом случае она не имеет значения.

ВХ

Нотация WX — это схема транслитерации для представления индийских языков в формате ASCII. Эта схема возникла в ИИТ Канпура для вычислительной обработки индийских языков и широко используется сообществом специалистов по обработке естественного языка (НЛП) в Индии. Обозначение (хотя и неопознанное) используется, например, в учебнике по НЛП ИИТ Канпура.[1] Существенными особенностями этой схемы транслитерации являются: Каждая согласная и каждая гласная буква преобразуются в римский язык. Следовательно, это префиксный код[2], выгодный с вычислительной точки зрения. Обычно строчные буквы используются для согласных без придыхания и кратких гласных, а заглавные буквы используются для согласных с придыханием и долгих гласных. В то время как ретрофлексированные глухие и звонкие согласные сопоставляются с буквами «t, T, d и D», зубные зубы сопоставляются с буквами «w, W, x и X». Отсюда и название схемы «WX», относящееся к своеобразному отображению. Ubuntu Linux обеспечивает поддержку клавиатуры для обозначения WX.

SLP1

SLP1 (фонетическая библиотека санскрита) — это регистрозависимая схема, первоначально использовавшаяся Библиотекой санскрита [18] и разработанная Питером Шарфом и (покойным) Малкольмом Хайманом, которые впервые описали ее в приложении B к своей книге «Лингвистические проблемы кодирования санскрита». [19] Преимущество SLP1 перед другими кодировками заключается в том, что для каждой буквы деванагари используется один символ ASCII, что упрощает обратную транслитерацию. [20]

хинглиш

Хинглиш относится к нестандартизированному романизированному хинди, используемому в Интернете, особенно в социальных сетях. В Индии романизированный хинди является доминирующей формой выражения мнения в Интернете. Анализируя комментарии на YouTube , Палакодети и др. выявили, что 52% комментариев были на романизированном хинди, 46% на английском и 1% на деванагари хинди. [21]

Другие

Другие менее популярные схемы ASCII включают нотацию WX , Vedatype и 7-битный стандарт ISO 15919. Нотация WX — это схема транслитерации для представления индийских языков в ASCII. Он возник в ИИТ Канпура для вычислительной обработки индийских языков и широко используется сообществом специалистов по обработке естественного языка (НЛП) в Индии. Эта схема описана в НЛП Панини, архивировано 26 ноября 2013 г. в Wayback Machine (Приложение Б). В том, что касается ведического санскрита, он похож на SLP1, но не так универсален, как SLP1. Сравнение WX с другими схемами можно найти в Huet (2009), App A. Vedatype — еще одна схема, используемая для кодирования ведических текстов в Университете управления Махариши . Утилита онлайн-перекодирования для всех этих схем доступна в Библиотеке санскрита. ISO 15919 включает так называемую опцию «ограниченного набора символов» для замены диакритических знаков префиксами, чтобы обеспечить совместимость с ASCII. Иллюстрированное объяснение от Энтони Стоуна.

Сравнение транслитерации

Ниже приводится сравнение [22] основных методов транслитерации [23] , используемых для деванагари.

Гласные

Согласные

За отдельными согласными буквами деванагари следует неявное шва (/Ə/). Во всех системах транслитерации /Ə/ должно быть явно представлено с помощью «a» или любого эквивалента shwa .

Неправильные группы согласных

Другие согласные

Сравнение IAST с ISO 15919

В таблице ниже показаны только различия между ISO 15919 и IAST для транслитерации деванагари .

Подробности

Лечение врожденной швы

Согласные деванагари включают «свойственный» звук, называемый шва , который должен быть явно представлен символом «а» в транслитерации. Многие слова и имена, транслитерированные с деванагари, заканчиваются на «а», что указывает на произношение на оригинальном санскрите . Эта шва в обязательном порядке исключена в некоторых современных индоарийских языках , таких как хинди , пенджаби , маратхи и других. Это приводит к разной транслитерации для санскрита и языков с удалением шва, которые сохраняют или исключают шва в зависимости от обстоятельств:

В некоторых словах может сохраняться окончание а, обычно потому, что без него их было бы трудно произнести:

Из-за этого некоторые слова, оканчивающиеся группами согласных, в различных современных индийских языках изменяются следующим образом: Мантра = мантар. Шабда = шабад. Сушумна = сушумана.

Ретрофлексные согласные

В большинстве индийских языков проводится различие между ретрофлексными и зубными формами зубных согласных. В формальных схемах транслитерации для обозначения зубной формы используются стандартные латинские буквы, а ретрофлексная форма обозначается специальными знаками или использованием других букв. Например, в транслитерации IAST ретрофлексными формами являются ṇ, ṭ, ḍ и ṣ.

В большинстве неформальных транскрипций различие между ретрофлексными и зубными согласными не указывается. Однако многие используют ретрофлексные согласные с заглавной буквы на клавиатуре QWERTY при неформальном обмене сообщениями. Это обычно устраняет необходимость транслитерации.

Придыхательные согласные

Если буква «h» появляется после взрывной согласной в транслитерации деванагари, она всегда указывает на стремление . Таким образом, «ph» произносится как « в слове «яма» (с небольшим выдохом воздуха, как говорится), а не как « ph » в слове «photo» ( IPA /f/). (С другой стороны, «p» произносится как « p » в «плевке» без выпуска воздуха.) Точно так же «th» — это придыхаемая «t», а не th в «this» (озвученная, IPA /ð/ ) ни слова « тонкий» (глухой, IPA /θ/).

Стремление обычно указывается как в формальной, так и в неформальной системе транслитерации.

Использование компьютера как стимул для латинизации

Поскольку английский широко используется в качестве профессионального языка и языка высшего образования в Индии, доступность клавиатур деванагари затмевается английскими клавиатурами. Точно так же программное обеспечение и пользовательские интерфейсы, выпускаемые и продвигаемые в Индии, ведутся на английском языке, как и большая часть доступного там компьютерного образования. Из-за низкой осведомленности о раскладке клавиатуры деванагари многие индийские пользователи печатают на хинди латинским алфавитом.

До того, как деванагари был добавлен в Unicode , для отображения деванагари в Интернете использовалось множество обходных путей, и многие сайты и службы продолжали использовать их, несмотря на широкую доступность шрифтов Unicode, поддерживающих деванагари. Хотя существует несколько соглашений по транслитерации с хинди на римский, большинство из них основаны на диакритических знаках. Поскольку большинство индийцев знакомы с латинским письмом через английский язык (который традиционно не использует диакритические знаки), эти системы транслитерации известны гораздо менее широко. Большинство таких «романагари» транслитерируются произвольно, чтобы имитировать английское написание, что приводит к многочисленным несоответствиям.

Это также вредно для поисковых систем, которые не классифицируют текст на хинди, написанный латинским алфавитом, как хинди. Тот же текст также не может быть отнесен к английскому языку.

Независимо от раскладки физической клавиатуры, в большинстве современных операционных систем можно установить раскладки клавиатуры на хинди на основе Юникода . Существует множество онлайн-сервисов, которые точно транслитерируют текст, написанный на латыни, на деванагари, используя для справки словари хинди, такие как транслитерация Google или инструмент ввода индийского языка Microsoft . Это решение похоже на редакторы методов ввода , которые традиционно используются для ввода текста на языках, использующих сложные символы, таких как китайский , японский или корейский .

История санскритской транслитерации

Ранние санскритские тексты первоначально передавались путем запоминания и повторения. В постхараппской Индии не было системы письменности индийских языков до создания (в IV-III вв. до н.э.) письменностей Харошти и Брахми . Эти системы письма, хотя и подходили для среднеиндийских языков , не были хорошо приспособлены к написанию на санскрите. Однако более поздние потомки Брахми были модифицированы, чтобы они могли записывать санскрит с точными фонетическими деталями. Самый ранний физический текст на санскрите — это наскальная надпись правителя Западной Кшатрапы Рудрадамана , написанная ок. 150 г. н. э., Джунагад , Гуджарат . Из-за значительного распространения различных разновидностей брахми в средние века сегодня не существует единого алфавита, используемого для написания санскрита; скорее, ученые-санскритологи могут писать на этом языке в той форме, которая используется для написания их местного языка. Однако со времен позднего средневековья появилась тенденция использовать деванагари для написания санскритских текстов для широкой читательской аудитории.

Западные ученые XIX века использовали Деванагари для печатных изданий санскритских текстов. Издание Princeps Ригведы Макса Мюллера находилось в Деванагари. Лондонские наборщики Мюллера соревновались со своими петербургскими коллегами, работавшими над словарем Бётлингка и Рота, в вырезании всех необходимых видов лигатуры.

С самого начала западная санскритская филология также ощущала потребность в латинизированном написании языка. [ нужна цитата ] Франц Бопп в 1816 году использовал схему латинизации, наряду с деванагари, отличающуюся от IAST выражением длины гласного с помощью циркумфлекса (â, î, û) и стремления с помощью Spiritus asper (например, bʽ для IAST bh). Шипящие звуки IAST ṣ и ś он выражал с помощью Spiritus asper и lenis соответственно (sʽ, sʼ). Монье-Вильямс в своем словаре 1899 года использовал ć, ṡ и sh для IAST c, ś и ṣ соответственно.

С конца 19 века интерес Запада к набору текста деванагари снизился. [ нужна цитация ] Теодор Ауфрехт опубликовал свое издание Ригведы 1877 года на латинизированном санскрите, а Ведическая грамматика Артура Макдонелла 1910 года (и Ведическая грамматика 1916 года для студентов ) также обходятся без деванагари (в то время как его вводная санскритская грамматика для студентов сохраняет деванагари наряду с латинизированным санскритом). ). Современные западные издания санскритских текстов появляются в основном в IAST.

Смотрите также

Рекомендации

  1. ^ Дайя Нанд Шарма (1972), Транслитерация на римский и деванагари языков индийской группы, Обзор Индии, 1972, ... С течением времени возникла практически единая система транслитерации деванагари и родственных алфавитов. . Тем не менее, ни одна единая система романизации до сих пор не сложилась...
  2. ^ МАЙСКАР, РАУЛ (2015). «Романагари - альтернатива произведениям современных СМИ». Бюллетень Исследовательского института Деканского колледжа . 75 : 195–202. ISSN  0045-9801. JSTOR  26264736.
  3. ^ Группа экспертов Организации Объединенных Наций по географическим названиям, Департамент ООН по экономическим и социальным вопросам (2007 г.), Техническое справочное руководство по стандартизации географических названий, Публикации Организации Объединенных Наций, 2007 г., ISBN 978-92-1-161500-5, ... ISO 15919 ... Нет никаких свидетельств использования этой системы ни в Индии, ни в международной картографической продукции... Хантерианская система является фактически используемой национальной системой латинизации в Индии...
  4. ^ Департамент ООН по экономическим и социальным вопросам (1955), Региональная картографическая конференция ООН для Азии и Дальнего Востока, Том 2, Организация Объединенных Наций, 1955, ... В Индии используется система Хантера, согласно которой каждый звук в местном языке язык единообразно представлен определенной буквой латинского алфавита...
  5. ^ Национальная библиотека (Индия) (1960), Индийские научные и технические публикации, выставка 1960: библиография, Совет научных и промышленных исследований, правительство Индии, 1960 ... Хантеровская система транслитерации, получившая международное признание, имеет использовался...
  6. ^ ab Фрэнсис Генри Скрайн (1901), Жизнь сэра Уильяма Уилсона Хантера, KCSI, MA, LL.D., вице-президента Королевского азиатского общества и т. д., Лонгманс, Грин и компания, 1901, ... фонетический или «метод сэра Роджера Даулера»… Государственный секретарь и подавляющее большинство его советников безоговорочно поддержали систему Хантера…
  7. ^ The Fortnightly, том 68, Чепмен и Холл, 1897, 1897, ... индийское правительство отказаться от всех попыток научной (т. е. хантеровской) транслитерации и принять решение раз и навсегда в пользу возврата к старой фонетике написание ...
  8. ^ Минн Латт Йекхаун (1966), Модернизация бирманского языка, Восточный академический институт, Издательство Чехословацкой академии наук, 1966, ... Действительно существует система транскрипции бирманских слов латинскими буквами, которая называется « Правительство», или «хантеровский» метод...
  9. ^ Кунвар Кришан Рампал (1993), Картирование и компиляция, Concept Publishing Company, 1993, ISBN 978-81-7022-414-3, ... В системе Хантера есть правила транслитерации на английский язык имен из хинди, урду, арабского, бирманского, китайского и тибетского происхождения. Эти правила описаны в главе VI «Обзор Индии», «Справочник по топографическому картографированию»...
  10. ^ ab Романизация топонимов в странах Южной Азии , получено 27 февраля 2011 г. , ... В источниках конца XIX века система отмечает долгие гласные с острым ударением и отображает буквы k и q как k. Однако, когда система была снова опубликована в 1954 году, в нее были внесены изменения. Долгие гласные теперь обозначались макроном4, а различие qk сохранялось...
  11. ^ Институт геодезистов (Индия) (1991), Индийский геодезист, тома 33–34, Институт геодезистов., 1991, ... Предложено. Г-н Г.С. Оберой, директор Службы обзора Индии, вместо существующей таблицы «Хантеровская система транслитерации», в которой не делается различий между и , и ड़ , и ...
  12. ^ Сравнение деванагари: ISO, ALA-LC, Hunterian в 2005 году, автор Томас Т. Педерсен из Eesti Keele Instituut Instituut Транслитерация нелатинских письменностей
  13. ^ Транслитерация индийских сценариев: как использовать ISO 15919. Архивировано 14 апреля 2016 г. на Wayback Machine ntlworld.com.
  14. ^ Латинизация LC на хинди в формате pdf по стандарту Библиотеки Конгресса, loc.gov.
  15. ^ Группа экспертов Организации Объединенных Наций по географическим названиям, Департамент ООН по экономическим и социальным вопросам (2007 г.), Техническое справочное руководство по стандартизации географических названий, Публикации Организации Объединенных Наций, 2007 г., ISBN 978-92-1-161500-5, ... ISO 15919 ... Нет никаких свидетельств использования этой системы ни в Индии, ни в международной картографической продукции... Хантерианская система является фактически используемой национальной системой латинизации в Индии...
  16. ^ "Рабочая группа UNGEGN по системам латинизации" . Группа экспертов ООН по географическим названиям UNGEGN, www.eki.ee. Eesti Keele Instituut . Проверено 14 февраля 2017 г.
  17. ^ «Различия между ISO 15919 и UNRSGN» . Рабочая группа по системам латинизации. Группа экспертов ООН по географическим названиям UNGEGN. www.eki.ee/wgrs/.Eesti Keele Instituut . Март 2016 года . Проверено 13 февраля 2017 г. .
  18. ^ «Библиотека санскрита » Инструменты » Таблица сравнения индийских письменностей» . Архивировано из оригинала 8 августа 2014 года.
  19. ^ Шарф, Питер М.; Хайман, Малкольм Д. (2011). Лингвистические проблемы кодирования санскрита (PDF) .
  20. ^ Помощь по морфологии
  21. ^ Палакодеты, Шрифани; ХудаБухш, Ашикур Р.; Джаячандран, Гуха (2021), «Машинный перевод с низкими ресурсами», Анализ текста в социальных сетях с низкими ресурсами , Сингапур: Springer Singapore, стр. 7–9, doi : 10.1007/978-981-16-5625-5_5, ISBN 978-981-16-5624-8, S2CID  244313560 , получено 24 сентября 2022 г.
  22. ^ Таблица сопоставления с 7 методами Гарвард-Киото, ITRANS, Velthuis, SLP, WX-системой и IAST, Деванагари, используемыми ILTP-DC для санскрита. Инструмент транслитерации санскрита. Преобразование из одной схемы в другую. Поддерживается «Центром распространения и внедрения технологий индийского языка» (ILTP-DC) правительства Индии. Работает с 7 системами: Гарвард-Киото, ITRANS, Velthuis, SLP, WX-system и IAST, Devanagari.
  23. ^ Диаграмма: разница между IAST и ISO. Инструмент транслитерации (конвертер) Акшарамукха. Akshara Mukha — это бесплатный конвертер азиатских шрифтов (двусторонний). Он поддерживает 5 основных соглашений по латинской транслитерации, таких как IAST, ISO, Harvard-Kyoto, ITRANS и Velthuis. Он может конвертировать, например, из Velthuis в ISO. Он также конвертирует 20 различных шрифтов Южной и Восточной Азии. Вы можете получить доступ к проекту отсюда. При использовании этого инструмента в качестве «источника» можно указать, например: ITRANS или Harvard-Kyoto, а в качестве «цели» можно указать определенный сценарий, например деванагари-хинди. (Если вы используете североиндийский алфавит, установите флажок: Удалить букву «а»). Он также может работать и в обратном направлении, например, с хинди на латынь с помощью транслитерации ISO.

Внешние ссылки