stringtranslate.com

Романизация

Мандаринский китайский язык , как и многие языки, можно латинизировать несколькими способами; выше: традиционные и упрощенные китайские иероглифы, означающие китайский язык, и системы латинизации Hanyu Pinyin , Gwoyeu Romatzyh , Wade-Giles и Yale для этих символов.

В лингвистике романизация — это преобразование текста из другой системы письма в римский (латинский) алфавит или систему для этого. Методы романизации включают транслитерацию для представления письменного текста и транскрипцию для представления устного слова, а также их комбинации. Методы транскрипции можно подразделить на фонематическую транскрипцию , которая записывает фонемы или единицы семантического значения в речи, и более строгую фонетическую транскрипцию , которая записывает звуки речи с точностью.

Методы

Существует множество последовательных или стандартизированных систем романизации. Их можно классифицировать по их характеристикам. Характеристики конкретной системы могут сделать ее более подходящей для различных, иногда противоречивых приложений, включая поиск документов, лингвистический анализ, легкость чтения, точное представление произношения.

Транслитерация

Если романизация пытается транслитерировать исходный сценарий, руководящим принципом является однозначное сопоставление символов исходного языка с целевым сценарием, с меньшим акцентом на том, как результат звучит при произношении в соответствии с языком читателя. Например, романизация японского языка Нихон-сики позволяет информированному читателю восстановить исходные японские слоги каны со 100% точностью, но требует дополнительных знаний для правильного произношения.

Транскрипция

Фонематич.

Большинство романизаций предназначены для того, чтобы позволить случайному читателю, незнакомому с оригинальным письмом, произносить исходный язык достаточно точно. Такие романизации следуют принципу фонематической транскрипции и пытаются передать значимые звуки ( фонемы ) оригинала как можно точнее на целевом языке. Популярная романизация Хепберна японского языка является примером транскрипционной романизации, разработанной для носителей английского языка.

Фонетический

Фонетическая конверсия идет на шаг дальше и пытается изобразить все фоны исходного языка, при необходимости жертвуя разборчивостью, используя символы или соглашения, не встречающиеся в целевом сценарии. На практике такое представление почти никогда не пытается представить все возможные аллофоны — особенно те, которые встречаются естественным образом из-за эффектов коартикуляции — и вместо этого ограничивается наиболее значительными аллофоническими различиями. Международный фонетический алфавит является наиболее распространенной системой фонетической транскрипции.

Торговля

Для большинства языковых пар создание пригодной для использования романизации подразумевает торговлю между двумя крайностями. Чистые транскрипции, как правило, невозможны, поскольку исходный язык обычно содержит звуки и различия, не встречающиеся в целевом языке, но которые должны быть показаны для того, чтобы романизированная форма была понятной. Кроме того, из-за диахронической и синхронической дисперсии ни один письменный язык не представляет ни один разговорный язык с идеальной точностью, а голосовая интерпретация сценария может в значительной степени различаться в разных языках. В наше время цепочка транскрипции обычно выглядит следующим образом: разговорный иностранный язык, письменный иностранный язык, письменный родной язык, разговорный (читаемый) родной язык. Уменьшение количества этих процессов, т. е. удаление одного или обоих этапов письма, обычно приводит к более точным устным артикуляциям. В целом, за пределами ограниченной аудитории ученых, романизации, как правило, больше склоняются к транскрипции. В качестве примера рассмотрим японское боевое искусство 柔術: романизация Нихон-сики zyûzyutu может позволить тому, кто знает японский язык, восстановить слоги каныじゅうじゅつ, но большинству носителей английского языка, или, скорее, читателей, будет легче угадать произношение по версии Хепберн, jūjutsu .

Романизация отдельных систем письма

арабский

Арабский алфавит используется для записи арабского , персидского , урду , пушту и синдхи , а также множества других языков в мусульманском мире, в частности африканских и азиатских языков, не имеющих собственных алфавитов. Стандарты романизации включают в себя следующее:

персидский

Примечания :

  1. ^ abcd Также используется как гласная.
  2. ^ abc Хамза и айн не транслитерируются в начале слов.
  3. ^ abcd Вместо седиля можно использовать точку ниже.
  4. ^ В начале слов сочетание خو произносилось как /xw/ или /xʷ/ в классическом персидском языке. В современных вариантах глайд /ʷ/ утрачен, хотя написание не изменилось. Его все еще можно услышать в дари как реликтовое произношение. Сочетание /xʷa/ было изменено на /xo/ (см. ниже).
  5. ^ abcdefghi На языке дари.
  6. ^ abc Не транслитерируется в конце слов.
  7. ^ ab В сочетании یة в конце слов.
  8. ^ При использовании вместо ت в конце слов.
  9. ^ Диакритические знаки ( харакат ) пишутся редко.
  10. ^ После خ от более раннего /xʷa/ . Часто транслитерируется как xwa или xva . Например, خور /xor/ "солнце" было /xʷar/ в классическом персидском языке.
  11. ^ ab После гласных.

армянский

грузинский


Примечания :

  1. ^ abcde Архаичные буквы.
  2. ^ abcdefgh Они созданы на основе вышеупомянутой компоновки и предпочтительны для избежания двусмысленности, поскольку выражения: t, j, g, ch могут означать две буквы.
  3. ^ Первоначальное использование буквы y для ყ, скорее всего, было обусловлено их сходством друг с другом.

греческий

Системы романизации существуют как для современного , так и для древнегреческого языка .

иврит

Еврейский алфавит латинизируется с использованием нескольких стандартов:

Индийские (брахмические) письмена

Брахмическая семья абугидас используется для языков индийского субконтинента и юго-восточной Азии. На западе существует давняя традиция изучать санскрит и другие индийские тексты в латинской транслитерации. Различные соглашения о транслитерации использовались для индийских письменностей со времен сэра Уильяма Джонса. [13 ]

Деванагари-насталик (хиндустани)

Хиндустанииндоарийский язык с крайней диграфией и диглоссией, возникшими в результате спора между хинди и урду, начавшегося в 1800-х годах. Технически, сам хиндустани не признан ни языковым сообществом, ни какими-либо правительствами. Два стандартизированных регистра , стандартный хинди и стандартный урду , признаны официальными языками в Индии и Пакистане. Однако на практике ситуация такова,

Диграфия делает любую работу, написанную на одной из этих систем письма, в значительной степени недоступной для пользователей другой системы письма, хотя в остальном хиндустани является совершенно взаимопонятным языком, что по сути означает, что любое сотрудничество в области текстов с открытым исходным кодом невозможно между читателями деванагари и насталик.

Инициатива Hamari Boli [15] , начатая в 2011 году, является полномасштабной инициативой по планированию языка с открытым исходным кодом , направленной на реформу и модернизацию письменности, стиля, статуса и лексики хиндустани. Одной из основных заявленных целей Hamari Boli является освобождение хиндустани от парализующей диграфии деванагари–насталик путем романизации. [16]

китайский

Романизация синитских языков , в частности мандаринского , оказалась очень сложной проблемой, хотя вопрос еще больше усложняется политическими соображениями. Из-за этого многие таблицы романизации содержат китайские иероглифы плюс одну или несколько романизаций или чжуинь .

Мандарин

Материковый Китай
Тайвань
  1. Гвою Роматзи (GR, 1928–1986, на Тайване в 1945–1986; до 1945 года на Тайване использовалось японское письмо ромадзи),
  2. Фонетические символы мандаринского диалекта II (MPS II, 1986–2002),
  3. Тонгён Пиньинь (2002–2008 гг.), [19] [20] и
  4. Ханью Пиньинь (с 1 января 2009 г.). [21] [22]
Сингапур

кантонский

Ву

Мин Нан или Хоккиен

Теочью

Мин Донг

Мин Бэй

японский

Романизация (или, более обобщенно, латинские буквы ) в японском языке называется " rōmaji " . Наиболее распространенными системами являются:

корейский

Хотя латинизация принимала различные и порой, казалось бы, неструктурированные формы, некоторые наборы правил все же существуют:

Несколько проблем с МР привели к разработке новых систем:

тайский

Тайский язык , на котором говорят в Таиланде и некоторых районах Лаоса, Бирмы и Китая, использует собственную письменность , вероятно, произошедшую от смешения тайско-лаосского и древнекхмерского языков брахмской семьи .

Нуосу

Язык нуосу , на котором говорят в Южном Китае, использует собственную письменность — письмо и . Единственная существующая система романизации — YYPY (Yi Yu Pin Yin), которая представляет тон буквами, прикрепленными к концу слога, поскольку в языке нуосу запрещены коды. В нем не используются диакритические знаки, и, как следствие, из-за большого фонемного инвентаря языка нуосу, он требует частого использования диграфов, в том числе для монофтонговых гласных.

тибетский

Тибетская письменность имеет две официальные системы латинизации: тибетская пиньинь (для лхасского тибетского письма ) и римская дзонг-кэ (для дзонг-кэ ).

кириллица

В англоязычных библиотечных каталогах, библиографиях и большинстве академических публикаций во всем мире используется метод транслитерации Библиотеки Конгресса .

В языкознании научная транслитерация применяется как для кириллицы , так и для глаголицы . Это касается как старославянского языка , так и современных славянских языков , использующих эти алфавиты.

Белорусский

болгарский

Система, основанная на научной транслитерации и ISO/R 9:1968, считалась официальной в Болгарии с 1970-х годов. С конца 1990-х годов болгарские власти перешли на так называемую Streamlined System, избегая использования диакритических знаков и оптимизируя совместимость с английским языком. Эта система стала обязательной для публичного использования с законом, принятым в 2009 году. [29] Там, где старая система использовала <č,š,ž,št,c,j,ă>, новая система использует <ch,sh,zh,sht,ts,y,a>.

Новая болгарская система была одобрена для официального использования также ООН в 2012 году [30] , а также BGN и PCGN в 2013 году [31].

кыргызский

македонский

Русский

Не существует единой общепринятой системы написания русского языка с использованием латинского алфавита — на самом деле существует огромное количество таких систем: некоторые из них адаптированы для конкретного целевого языка (например, немецкого или французского), некоторые предназначены для транслитерации библиотекаря, некоторые предписаны для паспортов российских путешественников; транскрипция некоторых имен является чисто традиционной. Все это привело к большому дублированию имен. Например, имя русского композитора Чайковского может также быть написано как Tchaykovsky , Tchajkovskij , Tchaikowski , Tschaikowski , Czajkowski , Čajkovskij , Čajkovski , Chajkovskij , Çaykovski , Chaykovsky , Chaykovskiy , Chaikovski , Tshaikovski , Tšaikovski , Tsjajkovskij и т . д. Системы включают в себя :

сирийский

Латинская письменность для сирийского языка была разработана в 1930-х годах в соответствии с государственной политикой в ​​отношении языков меньшинств Советского Союза , некоторые материалы были опубликованы. [40]

украинский

Украинская национальная система 2010 года была принята UNGEGN в 2012 году и BGN/PCGN в 2020 году. Она также очень близка к модифицированной (упрощенной) системе ALA-LC, которая оставалась неизменной с 1941 года.

Обзор и резюме

В таблице ниже показана наиболее распространенная фонемная транскрипция романизации, используемая для нескольких различных алфавитов. Хотя для многих случайных пользователей этого достаточно, для каждого алфавита используется несколько альтернатив и много исключений. Для получения подробной информации см. каждый из языковых разделов выше. (Символы хангыль разбиты на компоненты джамо .)

Смотрите также

Ссылки

  1. ^ "Deutsche Morgenländische Gesellschaft" . Dmg-web.de . Проверено 2 июля 2015 г.
  2. ^ "Стандарты, обучение, тестирование, оценка и сертификация". BSI-Global.com . BSI Group . Получено 25.04.2013 .
  3. ^ "Арабский" (PDF) . Eki.ee . Получено 2015-07-02 .
  4. ^ "Qalam: A Convention for Morphological Arabic-Latin-Arabic Transliteration". EServer.org . Архивировано из оригинала (TXT) 2009-02-08 . Получено 2015-07-02 .
  5. ^ "Buckwalter Arabic Transliteration". Qamus.org . Получено 25.04.2013 .
  6. ^ Бисли, Кен (2010-11-22). "Транслитерация Баквалтера". Xerox Research Centre Europe . Архивировано из оригинала 2002-04-24 . Получено 2013-04-25 .
  7. ^ "Арабский" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  8. ^ "Greek" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  9. ^ "The TLG® Beta Code Manual 2004" (PDF) . Thesaurus Linguae Graecae . Калифорнийский университет в Ирвайне . 23 июня 2004 г. Архивировано из оригинала (PDF) 29 января 2006 г.
  10. ^ Лефорт, Франсуа; Рубелакис-Ангелакис, Каллиопи А. "Транслитерационная схема ISO 843". biology.uoc.gr . Университет Крита . Архивировано из оригинала 10 декабря 2004 г.
  11. ^ "Иврит" (PDF) . Eki.ee . Получено 2015-07-02 .
  12. ^ "Иврит и идиш" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  13. ^ Габриэль Прадипака. "Санскрит 3: сравнение систем транслитерации". Sanskrit-Sanscrito.com.ar . Архивировано из оригинала 2004-03-15 . Получено 2013-04-25 .
  14. ^ "Хинди" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  15. ^ "Что такое HamariBoli?". HamariBoli . 2011-06-15. Архивировано из оригинала 2013-06-01 . Получено 2013-04-25 .
  16. The News International — 29 декабря 2011 г. Архивировано 16 июня 2013 г. на Wayback Machine — «Хамари боли (наш язык), возможно, одно из первых серьезных начинаний по исследованию, развитию и поощрению роста латинского письма в использовании языка урду/хинди».
  17. ^ "Chinese" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  18. ^ "Новые правила романизации китайского языка". Библиотека Конгресса . 1998-11-03 . Получено 2013-04-25 .
  19. ^ "Тунъён пиньинь — новая система романизации". Taipei Times . 2002-07-11.
  20. ^ «Власти Тайваня обеспокоены пропуском схемы Tongyong Pinyin». People's Daily Online . 2002-07-12.
  21. ^ "Hanyu Pinyin станет стандартной системой в 2009 году". Taipei Times . 2008-09-18.
  22. ^ "Правительство улучшит англоязычную среду". The China Post . 2008-09-18. Архивировано из оригинала 2008-09-19.
  23. ^ "Японский" (PDF) . Библиотека Конгресса . Получено 28.09.2014 .
  24. ^ "Корейский" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  25. ^ "Поверхностное сравнение между ними". Sori.org . Получено 25.04.2013 .
  26. ^ "Справочник по романизации корейского языка". Glossika.com . Архивировано из оригинала 14 февраля 2006 г.
  27. ^ "Thai" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  28. ^ "Белорусский" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  29. Государственная газета № 19, София, 13 марта 2009 г. (на болгарском языке)
  30. ^ "Романизация ООН болгарского языка для географических названий (1977)". Eki.ee . Получено 27.06.2015 .
  31. ^ "Система романизации для болгарского языка, система BGN/PCGN 1952" (PDF) . earth-info.nga.mil . Национальное агентство геопространственной разведки . Архивировано из оригинала (PDF) 19 декабря 2007 г.
  32. ^ "Cyrillic Translations". DSpace.Dial.Pipex.com . Архивировано из оригинала 2012-07-16 . Получено 2013-04-25 .
  33. ^ "Russian" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  34. ^ Димитер Добрев. «Транслитерация» [Транслитерация]. Методии.com (на русском языке) . Проверено 25 апреля 2013 г.
  35. Базовый и оптимизированный. Архивировано 12 апреля 2016 г. на Wayback Machine . Романизация русского языка. 2006–2016 гг.
  36. ^ Л. Иванов. «Упрощенная романизация русской кириллицы». Contrastive Linguistics . XLII (2017) № 2. С. 66-73. ISSN  0204-8701
  37. ^ Interscript. Упрощенная романизация русской кириллицы (базовая упрощённая система).
  38. ^ Interscript. Оптимизированная романизация русской кириллицы (оптимизированная оптимизированная система).
  39. ^ "Транслитерация русского алфавита" [Транслитерация русского алфавита]. Russki-mat.net (на русском языке) . Проверено 25 апреля 2013 г.
  40. ^ SP Brock, «Три тысячи лет арамейской литературы», в Aram,1:1 (1989)
  41. ^ "Ukrainian" (PDF) . Библиотека Конгресса . Получено 2015-07-02 .
  42. ^ "Додаток до рішення № 9". www.hostmaster.net.ua . Архивировано из оригинала 7 марта 2005 года.
  43. ^ "Украинский" (PDF) . Eki.ee . Получено 2015-07-02 .
  44. ^ "Украинский" (PDF) . Transliteration.Eki.ee . Получено 2015-07-02 .

Внешние ссылки

О латинизации
Романизация онлайн

Для персидской романизации

Для романизации кантонского диалекта