Румынский алфавит — это вариант латинского алфавита , используемый для письма на румынском языке . Он является модификацией классического латинского алфавита и состоит из 31 буквы, [1] [2] пять из которых (Ă, Â, Î, Ș и Ț) были изменены по сравнению с их латинскими оригиналами для фонетических требований языка.
Буквы Q ( chiu ), W ( dublu v ) и Y ( igrec или i grec, что означает «греческое i») были официально введены в румынский алфавит в 1982 году, хотя они использовались и ранее. Они встречаются только в иностранных словах и их румынских производных, таких как quasar , watt и yacht . Буква K , хотя и относительно старая, также используется редко и появляется только в именах собственных и международных неологизмах, таких как kinetic , broker , karate . [3] Эти четыре буквы по-прежнему воспринимаются как иностранные, что объясняет их использование в стилистических целях в таких словах, как nomenklatură (обычно nomenclatură , что означает «номенклатура», но иногда пишется с k вместо c, если речь идет о членах коммунистического руководства в Советском Союзе и странах Восточного блока, поскольку nomenklatura используется в английском языке). [4]
Большинство <qu> и <y> в изученных латинских словах (или греческих словах через латынь) заменяются на <cv> и <i> соответственно (например, acvariu "аквариум", oxigen "кислород"). Однако <y> сохраняется в ytriu ("иттрий") и yterbiu ("иттербий"), вероятно, из-за символов элементов Y и Yb.
В случаях, когда слово является прямым заимствованием и имеет диакритические знаки, отсутствующие в вышеуказанном алфавите, официальная орфография, как правило, отдает предпочтение их использованию ( München , Angoulême и т. д., в отличие от использования Istanbul вместо İstanbul ).
[5]
Румынская орфография в основном фонематическая, без немых букв (но см. i ). В таблице ниже приведено соответствие между буквами и звуками. Некоторые буквы имеют несколько возможных прочтений, даже если не принимать во внимание аллофоны . Когда гласные /i/ , /u/ , /e/ и /o/ изменяются на соответствующие им полугласные , это не отмечается на письме. Буквы K, Q, W и Y появляются только в иностранных заимствованиях; произношение W и Y и сочетания QU зависит от происхождения слова, в котором они появляются.
* См. запятую ниже (ş и ş) и седиль (ş и ţ).
Румынская орфография не использует акценты или диакритические знаки – это вторичные символы, добавляемые к буквам (т. е. основные глифы ) для изменения их произношения или для различения слов. Однако в румынском алфавите есть пять специальных букв (связанных с четырьмя различными звуками), которые образованы путем изменения других латинских букв; строго говоря, эти буквы функционируют как основные глифы сами по себе, а не как буквы с диакритическими знаками, но их часто называют последними.
Буква â употребляется исключительно в середине слов; ее прописная форма встречается только в надписях, написанных заглавными буквами.
Написание букв ș и ț с седилем вместо запятой Румынская академия считает некорректным. Румынские сочинения, включая книги, созданные для обучения детей письму, рассматривают запятую и седиль как вариацию шрифта. См. Unicode и HTML ниже.
Буквы î и â фонетически и функционально идентичны. Причина использования обеих из них историческая, указывающая на латинское происхождение языка .
В течение нескольких десятилетий до реформы правописания в 1904 году для одной и той же фонемы использовалось четыре или пять букв ( â , ê , î , û и иногда ô , см. Удаленные буквы), согласно этимологическому правилу. [8] Все они использовались для представления гласной /ɨ/ , к которой сходились исходные латинские гласные, написанные с циркумфлексами. Реформа 1904 года оставила только две буквы, â и î , выбор которых следовал правилам, которые менялись несколько раз в течение 20-го века.
В течение первой половины века правилом было использование î в начале и конце слова, и â везде в остальном. Были исключения, предписывающие использование î во внутренних позициях, когда слова объединялись или производились с помощью префиксов или суффиксов. Например, прилагательное urît "уродливый" писалось с î, потому что оно происходит от глагола a urî "ненавидеть".
В 1953 году, в коммунистическую эпоху , Румынская академия устранила букву â , заменив ее на î везде, включая название страны, которая должна была писаться как Romînia . Первое положение совпало с официальным обозначением страны как Народной Республики , что означало, что ее полное название было Republica Populară Romînă . Небольшая реформа правописания в 1964 году вернула букву â , но только в написании român «румынский» и всех его производных, включая название страны. Таким образом, Социалистическая Республика , провозглашенная в 1965 году, связана с написанием Republica Socialistă România .
Вскоре после падения правительства Чаушеску Румынская академия решила вновь ввести â с 1993 года, отменив последствия реформы правописания 1953 года и по сути вернувшись к правилам 1904 года (с некоторыми отличиями). Этот шаг был публично оправдан как исправление либо коммунистического нападения на традицию, либо советского влияния на румынскую культуру, а также как возвращение к традиционному правописанию, которое несет на себе отпечаток латинского происхождения языка. [9] [10] [11] Однако политический контекст в то время был таков, что Румынская академия в значительной степени считалась коммунистическим и коррумпированным учреждением — Николае Чаушеску и его жена Елена были ее почетными членами, а членство контролировалось Коммунистической партией. [12] Таким образом, реформа правописания 1993 года рассматривалась как попытка Академии порвать со своим коммунистическим прошлым. [13] [14] Академия пригласила национальное сообщество лингвистов, а также иностранных лингвистов, специализирующихся на румынском языке, для обсуждения этой проблемы; [15] когда они в подавляющем большинстве выступили против реформы правописания в резких выражениях, их позиция была явно отклонена как слишком научная. [16] [17]
Согласно реформе 1993 года, выбор между î и â , таким образом, снова основан на правиле, которое не является ни строго этимологическим, ни фонологическим, а позиционным и морфологическим. Звук всегда пишется как â , за исключением начала и конца слов, где вместо него следует использовать î . Исключения включают собственные имена существительные , где использование букв заморожено, каким бы оно ни было, и сложные слова, компоненты которых каждый по отдельности подчиняются правилу (например, ne- + î ndemânatic → ne î ndemânatic "неуклюжий", а не * ne â ndemânatic ). Однако исключение больше не распространяется на слова, полученные с помощью суффиксов, в отличие от нормы 1904 года; например, то, что писалось urît после 1904 года, стало urât после 1993 года.
Хотя реформа была предложена как способ показать латинское происхождение румынского языка, статистически только несколько слов, написанных с â согласно реформе 1993 года, на самом деле происходят от латинских слов, имеющих a в соответствующей позиции. [18] Фактически, это включает в себя большое количество слов, которые содержали i в оригинальной латыни и аналогичным образом пишутся с i в их итальянских или испанских аналогах. Примерами являются rîu «река», от латинского rivus (сравните испанское río ), теперь пишется râu ; наряду с rîde < ridere , sîn < sinus , strînge < stringere , lumînare < luminaria и т. д.
Хотя норма правописания 1993 года является обязательной в румынском образовании и официальных изданиях, и постепенно большинство других изданий стали использовать ее, все еще есть отдельные лица, издания и издательства, которые предпочитают предыдущую норму правописания или смешанную гибридную систему; среди них еженедельный культурный журнал Dilema Veche и ежедневная Gazeta Sporturilor . Некоторые издания позволяют авторам выбирать любую норму правописания; к ним относятся România literară , журнал Союза писателей Румынии , и издательства, такие как Polirom . Словари, грамматики и другие лингвистические работы также были опубликованы с использованием î и sînt долгое время после реформы 1993 года. [19]
В конечном итоге конфликт возникает из-за двух различных лингвистических рассуждений о том, как писать /ɨ/ . Выбор â происходит из-за того, что a является самой средней или центральной из пяти гласных (официальная болгарская романизация использует ту же логику, выбирая a для ъ, в результате чего название страны пишется как Balgariya ; а также европейская португальская гласная /ɐ/ для a, упомянутого выше), тогда как î является попыткой выбрать латинскую букву, которая наиболее интуитивно передает звук /ɨ/ (подобно тому, как в польском языке используется буква y ).
Хотя стандарт Румынской академии предписывает варианты с запятой под звуками /ʃ/ и /ts/ , варианты с седилем по-прежнему широко используются. Во многих печатных и онлайн-текстах по-прежнему неправильно используются " s с седилем " и " t с седилем ". Такое положение дел обусловлено первоначальным отсутствием стандартизации глифов, усугубленным отсутствием поддержки компьютерных шрифтов для вариантов с запятой под звуками (подробности см. в разделе Unicode).
Отсутствие поддержки диакритических знаков запятых было исправлено в текущих версиях основных операционных систем: Windows Vista или более новых, дистрибутивах Linux после 2005 года и поддерживаемых в настоящее время версиях macOS. По поручению Европейского Союза Microsoft выпустила обновление шрифта для исправления этого недостатка в Windows XP (также применимое к 2000/Server 2003) в начале 2007 года, вскоре после того, как Румыния присоединилась к Европейскому Союзу.
До реформы орфографии 1904 года существовало несколько дополнительных букв с диакритическими знаками.
Кроме того, акут ( á , í ) использовался в глагольных инфинитивах и формах 3-го лица несовершенного вида с ударением на последнем слоге: lăudá («хвалить»), aud̦í («слышать»), 3-е лицо несовершенного вида lăudá , aud̦iá . Грубый удар ( à , ì , ù ) использовался в формах 3-го лица совершенного вида с ударением на последнем слоге: lăudà , aud̦ì . [26]
Использование этих букв не было полностью принято даже до 1904 года, поскольку некоторые издания (например, Timpul и Universul ) решили использовать упрощенный подход, который напоминал современную письменность румынского языка. [ необходима ссылка ]
Как и в других языках, в румынских текстах иногда используется акут для обозначения ударной гласной в некоторых словах. Такое использование является регулярным в заглавных словах словаря, но также иногда встречается в тщательно отредактированных текстах для устранения неоднозначности между омографами , которые также не являются омофонами , например, для различения cópii («копии») и copíi («дети»), éra («эра») и erá («был»), ácele («игл») и acéle («те») и т. д. Ударение также различает омографические формы глаголов, такие как încúie и încuié («он запирает» и «он запер»). [27]
Диакритические знаки в некоторых заимствованиях сохраняются: bourrée , pietà . Иностранные имена также обычно пишутся с их оригинальными диакритическими знаками: Bâle , Molière , даже когда острый акцент может быть ошибочно истолкован как ударение, как в István или Gérard . Однако часто используемые иностранные имена, такие как названия городов или стран, часто пишутся без диакритических знаков: Bogota , Panama , Peru . [28]
Стандарт кодировки символов ISO 8859 изначально определял единую кодовую страницу для всей Центральной и Восточной Европы — ISO 8859-2 . Эта кодовая страница включает только «s» и «t» с седилями. Юго-восточноевропейский ISO 8859-16 включает «s» и «t» с запятой ниже на тех же местах, где «s» и «t» с седилями были в ISO 8859-2. Однако кодовая страница ISO 8859-16 стала стандартом после того, как Unicode получил широкое распространение, поэтому она в значительной степени игнорировалась поставщиками программного обеспечения.
Циркумфлекс и бреве с акцентом румынских букв были частью стандарта Unicode с момента его создания, как и варианты седиля для s и t. Ș и ț (варианты с запятой под ними) были добавлены в Unicode версии 3.0. [29] [30] Начиная с версии Unicode 3.0 и до версии 5.1, символы, использующие седиль, были определены стандартом Unicode как «используемые как в турецких, так и в румынских данных», и что «вариант глифа с запятой под ним предпочтителен для румынского языка»; относительно недавно закодированных символов, использующих запятую, было сказано, что их следует использовать «когда требуется особая форма запятой под ними». [31] [32] В Unicode 5.2 прямо указано, что «в турецком языке предпочтительнее форма с седилем, а в румынском — форма с запятой снизу», при этом упоминается (возможно, по историческим причинам), что «в турецком и румынском языках седиль и запятая снизу иногда заменяют друг друга». [33]
Широкое внедрение было затруднено в течение нескольких лет из-за отсутствия шрифтов, предоставляющих новые глифы. В мае 2007 года, через четыре месяца после вступления Румынии (и Болгарии) в ЕС , Microsoft выпустила обновленные шрифты, которые включают все официальные глифы румынского (и болгарского ) алфавита. [34] Это обновление шрифта было нацелено на Windows 2000, XP и Server 2003. Подмножество Unicode, наиболее широко поддерживаемое в системах Microsoft Windows, Windows Glyph List 4 , по-прежнему не включает варианты S и T с запятой под ними.
Гласные с диакритическими знаками кодируются следующим образом:
Adobe Systems решила [35] , что глифы Unicode "t с седилем" U+0162/3 не используются ни в одном языке. (Он фактически используется, но в очень немногих языках. T с седилем существует как часть общего алфавита камерунских языков , в некоторых гагаузских орфографиях, в кабильском диалекте берберского языка и, возможно, в других местах.) Поэтому Adobe заменила глифы на "t с запятой снизу" (U+021A/B) во всех шрифтах, которые они поставляют. Неприятным последствием этого решения является то, что румынские документы, использующие (неофициальные) точки Unicode U+015E/F и U+0162/3 (для ş и ţ), отображаются в шрифтах Adobe визуально непоследовательным образом, используя "s с седилем", но "t с запятой" (см. рисунок). Шрифты линотипа , поддерживающие румынские глифы, в основном следуют этому соглашению. [36]
Шрифты, используемые Microsoft до Windows Vista, также реализуют этот фактический стандарт Adobe. Немногие шрифты Microsoft обеспечивают единообразный вид при использовании вариантов седиля; наиболее заметными из них являются Tahoma , Verdana , Trebuchet MS , Microsoft Sans Serif и Segoe UI .
Бесплатные шрифты DejaVu и Linux Libertine предоставляют правильные и последовательные глифы в обоих вариантах. Шрифты Liberation от Red Hat поддерживают только варианты с запятой ниже, начиная с версии 1.04, запланированной для включения в Fedora 10.
ROM/locl
Функция OpenTypeНекоторые шрифты OpenType от Adobe и все шрифты Vista серии C реализуют дополнительную функцию OpenType GSUB/latn/ROM/locl
. [37] Эта функция заставляет «s с седилем» отображаться с использованием того же глифа, что и «s с запятой ниже». Когда происходит это второе (но необязательное) переназначение, румынский текст Unicode отображается с запятой ниже глифов независимо от вариантов кодовой точки.
К сожалению, большинство шрифтов Microsoft до Vista OpenType ( Arial и т. д.) не реализуют эту ROM/locl
функцию даже после обновления шрифтов Европейского Союза [34] , поэтому старые документы будут выглядеть непоследовательно, как в левой части рисунка выше. Некоторые шрифты, например Verdana и Trebuchet MS , не только имеют единообразный вид для вариантов седиля (после обновления ЕС), но и одновременно переназначают седиля s и t на варианты с запятой под ними при ROM/locl
активации. Бесплатные шрифты DejaVu и Linux Libertine пока не предлагают эту функцию в своих текущих выпусках, но версии для разработки предлагают.
Pango поддерживает locl
тег с версии 1.17. XeTeX поддерживает locl
с версии 0.995. По состоянию на июль 2008 года очень немногие приложения Windows поддерживают locl
тег feature. Из пакета Adobe CS3 только InDesign поддерживает его. [38]
Статус поддержки румынского языка в бесплатных шрифтах, поставляемых с Fedora, поддерживается на Fedoraproject.org.
Unicode также позволяет представлять диакритические знаки как отдельные объединяющиеся диакритические знаки . Соответствующие объединяющиеся акценты — U+0326 COMBINING COMMA BELOW и U+0327 COMBINING CEDILLA. Поддержка применения объединяющейся запятой ниже к буквам S и T могла плохо поддерживаться в коммерческих шрифтах в прошлом, но почти все современные шрифты могут успешно обрабатывать как знаки седиля, так и запятые ниже для S и T. Как и в случае со всеми шрифтами, качество типографики может различаться, поэтому предпочтительнее использовать вместо этого отдельные кодовые точки. Всякий раз, когда в документе используется объединяющийся диакритический знак, используемый шрифт должен быть протестирован, чтобы подтвердить, что он отображается приемлемо.
LaTeX позволяет набирать текст на румынском языке с использованием седиля Ş и Ţ с использованием кодировки Cork . Варианты comma-below не полностью поддерживаются в стандартных 8-битных кодировках шрифтов TeX. Отсутствие стандартного LICR (LaTeX Internal Character Representations) для comma-below Ș и Ț является частью проблемы. latin10
Метод ввода пытается исправить проблему, определяя акцент \textcommabelow LICR. К сожалению, это не поддерживается методом utf8
ввода.
Эту проблему можно частично обойти в документе LaTeX с помощью следующих настроек, которые позволят использовать ș, ț или их седилевые варианты непосредственно в исходном коде LaTeX:
\usepackage[latin10,utf8]{inputenc}% транслитерирует символы utf8 с çedila в их представлении с запятой под ней\DeclareUnicodeCharacter{015F}{\textcommabelow s} % ş\DeclareUnicodeCharacter{015E}{\textcommabelow S} % Ş\DeclareUnicodeCharacter{0163}{\textcommabelow t} % ţ\DeclareUnicodeCharacter{0162}{\textcommabelow T} % Ţ% транслитерирует символы utf8 с запятой под ними в представление с запятой под ними\DeclareUnicodeCharacter{0219}{\textcommabelow s} % ș\DeclareUnicodeCharacter{0218}{\textcommabelow S} % Ș\DeclareUnicodeCharacter{021B}{\textcommabelow t} % ț\DeclareUnicodeCharacter{021A}{\textcommabelow T} % Ț
Пакет latin10
составляет запятые-под глифами путем наложения запятой и букв S и T. Этот метод подходит только для печати. В документах PDF , созданных таким образом, поиск или копирование текста не работают должным образом. Польская кодировка QX имеет некоторую поддержку запятых-под глифами, которые неправильно отображаются в седиль LICR, но также не имеет A breve (Ă), которая всегда должна быть составной, поэтому недоступна для поиска.
В шрифтах Latin Modern Type 1 T с запятой ниже находится под именем AGL /Tcommaaccent. Это противоречит решению Adobe, обсуждавшемуся выше, которое помещает T с запятой-ниже в /Tcedilla. В результате ни одно фиксированное сопоставление не может работать во всех шрифтах Type 1; каждый шрифт должен иметь свое собственное сопоставление. К сожалению, драйверы вывода TeX, такие как dvips , dvipdfm или внутренний драйвер PDF pdfTeX , получают доступ к глифам по имени AGL . Поскольку все упомянутые драйверы вывода не знают об этой особенности, проблема по сути неразрешима для всех шрифтов. В результате нужно использовать шрифты, которые включают сопоставление, которое не обходит TeX. Это касается более нового движка TeX XeTeX , который может использовать шрифты Unicode OpenType и не обходит карту Unicode шрифта.
Современные компьютерные операционные системы можно настроить на реализацию стандартной румынской раскладки клавиатуры, что позволит печатать на любой клавиатуре так, как будто это румынская клавиатура.
В таких системах, как Linux, которые используют систему XCompose, румынские буквы могут быть набраны с нерумынской раскладки клавиатуры с помощью клавиши compose-key . Раскладка клавиатуры системы должна быть настроена на использование клавиши compose-key. (Точно, как это делается, зависит от дистрибутива.) Например, клавиша «левый Alt» часто используется как клавиша compose-key.
Чтобы набрать букву с диакритическим знаком, клавиша compose-key удерживается нажатой, пока нажимается другая клавиша, указывающая на применяемый знак, затем набирается базовая буква. Например, при использовании английской (США) раскладки клавиатуры, чтобы набрать ț, удерживайте клавишу compose-key, набирая точку с запятой ';', затем отпустите клавишу compose-key и наберите 't'. Другие знаки можно применять аналогичным образом следующим образом:
Существует румынский эквивалент англоязычных алфавитов правописания . Большинство кодовых слов — это имена людей, за исключением K, J, Q, W и Y. Буквы с диакритическими знаками (Ă, Â, Î, Ș, Ț) обычно передаются без диакритических знаков (A, A, I, S, T).