Польская орфография — система письма польского языка . В языке используется польский алфавит, который происходит от латинского алфавита , но включает в себя некоторые дополнительные буквы с диакритическими знаками . [1] : 6 Орфография в основном фонетическая, или, скорее, фонематическая — написанные буквы (или их комбинации) последовательно соответствуют звукам, или, скорее, фонемам , разговорного польского языка. Подробную информацию о системе фонем см. в Польской фонологии .
Диакритические знаки, используемые в польском алфавите, — это крестка (графически похожая на акут ) в буквах ć, ń, ó, ś, ź ; кропка ( надточие ) в букве ż ; черта в букве ł ; и огонек («хвостик») в буквах ą, ę . В польском алфавите 32 буквы [1] : 4 (или 35 букв, если включить иностранные буквы q, v, x ) [2] : 9 гласных и 23 или 26 согласных .
Буквы q (называемые ku ), v (называемые fau или редко we [3] ) и x (называемые iks ) используются в некоторых иностранных словах и коммерческих названиях. В заимствованных словах они часто заменяются на kw , w , и ( ks или gz ) соответственно (как в kwarc "кварц", weranda "веранда", ekstra "экстра", egzosfera , "экзосфера").
При указании написания слов некоторые буквы могут быть произнесены более выразительно, чтобы отличить их от других идентично произносимых символов. Например, H может быть обозначена как samo h («h only»), чтобы отличить ее от CH (ce ha) . Буква Ż может быть обозначена как « żet (или zet ) z kropką » («Ż with a dot»), чтобы отличить ее от RZ (er zet) . Буква U может быть обозначена как u otwarte («open u», ссылка на ее графическую форму) или u zwykłe («regular u»), чтобы отличить ее от Ó, которая иногда называется ó zamknięte («closed ó»), ó kreskowane или ó z kreską («ó with a stroke accent»), альтернативно o kreskowane или oz kreską («o with a stroke accent»). Буква ó является реликтом сотен лет назад, когда в польском языке существовало различие долготы, похожее на то, что было в чешском языке , и в то время также были распространены á и é . Впоследствии различие долготы исчезло, а á и é были отменены, но ó стала произноситься так же, как u .
Обратите внимание, что польские буквы с диакритическими знаками рассматриваются как полностью независимые буквы в алфавитном порядке (в отличие от таких языков, как французский , испанский и немецкий ). Например, być идет после bycie . Диакритические буквы также имеют свои собственные разделы в словарях (слова, начинающиеся с ć, обычно не перечислены в c ). Однако нет обычных слов, начинающихся с ą или ń .
В польском языке дополнительно используются диграфы ch , cz , dz , dź , dż , rz и sz . Сочетания некоторых согласных с буквой i перед гласной можно считать диграфами: ci как позиционный вариант ć , si как позиционный вариант ś , zi как позиционный вариант ź , и ni как позиционный вариант ń (но см. специальное замечание о ni ниже); и есть также один триграф dzi как позиционный вариант dź . Они не рассматриваются как-либо по-особенному в алфавитном порядке. Например, ch рассматривается просто как c с последующей h , а не как одна буква, как в чешском или словацком (например, в слове Chojnice заглавная только первая буква, и оно сортируется после Canki и перед Cieszyn ).
^1 Правила написания альвеоло-палатальных согласных см. ниже.
^2 В некоторых диалектах H может быть гортанным [ ɦ ] .
^3 В редких случаях ⟨rz⟩ не является диграфом и представляет собой два отдельных звука:
Звонкие согласные буквы часто представляют глухие звуки (как показано в таблицах выше). Это происходит из-за нейтрализации , которая происходит в конце слов и в определенных согласных кластерах ; например, ⟨b⟩ в klub («клуб») произносится как ⟨p⟩ , а ⟨rz⟩ в prze- звучит как ⟨sz⟩ . Реже глухие согласные буквы могут представлять звонкие звуки; например, ⟨k⟩ в także («также») произносится как ⟨g⟩ . Условия этой нейтрализации описаны в разделе Озвончение и оглушение в статье о польской фонологии.
Правило написания альвеоло-палатальных звуков /ɕ/ , /ʑ/ , /t͡ɕ/ , /d͡ʑ/ и /ɲ/ следующее: перед гласной ⟨i⟩ используются простые буквы ⟨szc dz n⟩ ; перед другими гласными используются сочетания ⟨si zi ci dzi ni⟩ ; если за ними не следует гласная, используются диакритические формы ⟨ś ź ć dź ń⟩ . Например, ⟨s⟩ в siwy («седой»), ⟨si⟩ в siarka («сера») и ⟨ś⟩ в święty («святой») представляют звук /ɕ/ .
Особое внимание следует уделить ⟨n⟩ перед ⟨i⟩ плюс гласная. В словах иностранного происхождения ⟨i⟩ вызывает палатализацию предшествующей согласной ⟨n⟩ в /ɲ/ , и она произносится как /j/ . Такая ситуация возникает, когда соответствующая родительная форма оканчивается на -nii , произносимое как /ɲji/ , а не на -ni , произносимое как /ɲi/ (что является типичной ситуацией для слов польского происхождения). Примеры см. в таблице в следующем разделе.
Согласно одной системе, аналогичные принципы применяются к палатализованным согласным /kʲ/ , /ɡʲ/ и /xʲ/ , за исключением того, что они могут встречаться только перед гласными. Таким образом, написание выглядит следующим образом: ⟨kg (c)h⟩ перед ⟨i⟩ и ⟨ki gi (c)hi⟩ в противном случае. Например, ⟨k⟩ в kim («whom», instr.) и ⟨ki⟩ в kiedy оба представляют /kʲ/ . В системе без палатализованных велярных они анализируются как /k/, /ɡ/ и /x/ перед /i/ и /kj/, /ɡj/ и /xj/ перед другими гласными.
За исключением случаев, упомянутых в предыдущем абзаце, буква ⟨i⟩ , если за ней следует другая гласная в том же слове, обычно представляет /j/ , но она также оказывает палатализующее действие на предыдущую согласную. Например, pies («собака») произносится как [pʲjɛs] ( /pjɛs/ ). Некоторые слова с ⟨n⟩ перед ⟨i⟩ и гласной также следуют этой схеме (см. ниже). Фактически i — это обычное написание /j/ между предшествующей согласной и последующей гласной. Буква ⟨j⟩ обычно появляется в этой позиции только после ⟨c⟩ , ⟨s⟩ и ⟨z⟩, если необходимо избежать эффекта палатализации, описанного выше (как в presja "давление", Azja "Азия", lekcja "урок" и распространенных суффиксах -cja "-tion", -zja "-sion": stacja "станция", wizja "видение"). Буква ⟨j⟩ после согласных также используется при конкатенации двух слов, если второе слово в паре начинается с ⟨j⟩ , например, wjazd "вход" происходит от w + jazd(a) . Произношение последовательности wja (в wjazd ) такое же, как произношение wia (в wiadro "ведро").
Окончание -ii , которое появляется в склоняемых формах некоторых существительных иностранного происхождения, которые имеют -ia в именительном падеже (всегда после ⟨g⟩ , ⟨k⟩ , ⟨l⟩ и ⟨r⟩ ; иногда после ⟨m⟩ , ⟨n⟩ и других согласных), произносится как [ji] с палатализацией предшествующего согласного. Например, dalii (родительный падеж от dalia "dalia"), Bułgarii (родительный падеж от Bułgaria "Bulgaria"), chemii (родительный падеж от chemia "chemistry"), religii (родительный падеж от religia "religion"), amfibii (родительный падеж от amfibia "amphibia"). Обычное произношение - [i] . Вот почему дети часто делают ошибки в написании и пишут -i в склоняемых формах, как armii , Danii или гиперкорректно пишут ziemii вместо ziemi (слова польского происхождения не имеют окончания -ii , а просто -i , например, ziemi , родительный падеж от ziemia ).
Однако в некоторых редких случаях, когда согласному предшествует другой согласный, -ii может произноситься как [i] , но предшествующий согласный все равно будет палатализованным, например, Anglii (родительный падеж от Anglia «Англия») произносится [anɡlʲi] . (Написание Angli , очень часто встречающееся в Интернете, является просто ошибкой в орфографии, вызванной таким произношением.)
Особая ситуация касается ⟨n⟩ : у него полная палатализация до [ɲ] перед -ii , которая произносится как [ji] – и такая ситуация возникает только тогда, когда соответствующая форма именительного падежа на -nia произносится как [ɲja] , а не как [ɲa] .
Например (обратите внимание на заглавные и строчные буквы):
Окончание -ji всегда произносится как /ji/ . Оно появляется только после c , s и z . Произношение его как простого /i/ считается ошибкой произношения. Например, presji (родительный падеж от presja "давление") - /prɛsji/ ; poezji (родительный падеж от poezja "поэзия") - /pɔɛzji/ ; racji (родительный падеж от racja "разум") - /rat͡sji/ .
Буквы ⟨ą⟩ и ⟨ę⟩ , когда за ними следуют взрывные и аффрикаты, представляют собой ротовую гласную, за которой следует носовая согласная, а не носовую гласную. Например, ⟨ą⟩ в слове dąb («дуб») произносится как /ɔm/ , а ⟨ę⟩ в слове tęcza («радуга») произносится как /ɛn/ (носовой звук ассимилируется со следующим согласным). Когда за ними следует ⟨l⟩ или ⟨ł⟩ , а в случае ⟨ę⟩ , также в конце слов большинством говорящих (в ситуации, когда говорящий произносит гласную носом, она назализуется лишь слегка), [4] эти буквы произносятся просто как /ɔ/ или /ɛ/ .
Помимо случаев, описанных в разделах выше, в польском языке есть три звука, которые могут быть записаны двумя разными способами, в зависимости от слова. Это результат исторических звуковых изменений. Правильное написание часто можно вывести из написания других морфологических форм слова или родственных слов в польском или других славянских языках.
Буква ⟨u⟩ представляет /w/ в диграфах ⟨au⟩ и ⟨eu⟩ в заимствованных словах, например, autor, Europa ; но не в исконно русских словах, например, nauka , произносимом [naˈu.ka] .
Существуют определенные кластеры, где письменный согласный обычно не произносится. Например, ⟨ł⟩ в словах mógł («мог бы») и jabłko («яблоко») в обычной речи опускается.
Имена в польском языке обычно пишутся с заглавной буквы, как и в английском. В польском языке не пишутся с заглавной буквы названия месяцев и дней недели, а также прилагательные и другие формы, образованные от имен собственных (например, angielski "английский").
Такие титулы, как pan («господин»), pani («госпожа»), lekarz («доктор») и т. д., а также их сокращения не пишутся с заглавной буквы, за исключением письменного вежливого обращения. Местоимения второго лица традиционно пишутся с заглавной буквы в официальной письменной речи (например, письмах или официальных электронных письмах); так же могут использоваться и другие слова для прямого обращения к кому-либо в официальной обстановке, например Czytelnik («читатель» в газетах или книгах). Местоимения третьего лица пишутся с заглавной буквы, чтобы выразить почтение, чаще всего в священном контексте.
Польская пунктуация похожа на английскую. Однако существуют более строгие правила использования запятых — придаточные предложения почти всегда выделяются запятой, в то время как использование запятой перед сочинительным союзом со значением «и» ( i , a или oraz ) обычно считается неправильным.
Сокращения (но не акронимы или инициалы ) сопровождаются точкой, когда они заканчиваются на букву, отличную от той, которая заканчивает полное слово. Например, dr не имеет точки, когда оно обозначает doktor , но принимает ее, когда обозначает флективную форму, такую как doktora , а prof. имеет точку, потому что оно происходит от profesor ( профессор ).
Апострофы используются для обозначения выпадения конечного звука иностранных слов, не произносимого перед польскими окончаниями, как в Harry'ego ( [xaˈrɛɡɔ] , родительный падеж от Harry [ˈxarɨ] – конечный [ɨ] выпадает в родительном падеже). Однако его часто ошибочно используют для отделения основы заимствованного слова от любого окончания, например, *John'a , которое должно быть Johna (родительный падеж от John ; ни один звук не выпадает).
Кавычки используются по-разному: либо «обычные польские кавычки», либо «французские кавычки» (без пробела) для первого уровня, и «одинарные польские кавычки» или «французские кавычки» для второго уровня, что дает три стиля вложенных кавычек:
В некоторых старых гравюрах использовались «такие польские цитаты».
Поляки переняли латинский алфавит в XII веке. Однако этот алфавит был плохо приспособлен для представления некоторых польских звуков, таких как палатальные согласные и носовые гласные . Следовательно, польское правописание в Средние века было крайне непоследовательным, так как разные писатели использовали разные системы для представления этих звуков. Например, в ранних документах буква c могла обозначать звуки, которые сейчас пишутся как c, cz, k , в то время как буква z использовалась для звуков, которые сейчас пишутся как z, ż, ś, ź . Вскоре писатели начали экспериментировать с диграфами (комбинациями букв), новыми буквами (φ и ſ, больше не используются) и, в конечном итоге, с диакритическими знаками .
Польский алфавит был одной из двух основных форм орфографии на основе латиницы, разработанной для славянских языков , другой является чешская орфография , характеризующаяся каронами (hačeks), как в букве č . Другие основные славянские языки, которые сейчас пишутся на основе латинского алфавита ( словацкий , словенский и сербохорватский ), используют системы, похожие на чешскую. Сербское правописание также ближе к чешскому, хотя оно включает больше польских элементов, чем вышеупомянутые языки. Польско-основанные орфографии используются для кашубского и, как правило, силезского языков , на обоих говорят в Польше.
Существует несколько различных систем кодирования польского алфавита для компьютеров. Все буквы польского алфавита включены в Unicode , и поэтому можно использовать кодировки на основе Unicode, такие как UTF-8 и UTF-16 . Польский алфавит полностью включен в базовую многоязычную плоскость Unicode. ISO 8859-2 (Latin-2), ISO 8859-13 (Latin-7), ISO 8859-16 (Latin-10) и Windows-1250 — популярные 8-битные кодировки, поддерживающие польский алфавит.
Польские буквы, отсутствующие в английском алфавите, используют следующие HTML-символы [6] и кодовые точки Unicode : [7] [8]
Для других кодировок см. следующую таблицу. Числа в таблице шестнадцатеричные .
Распространенным тестовым предложением, содержащим все польские диакритические буквы, является бессмысленное « Zażółć gęślą jaźń ».