C , или c , является третьей буквой латинского алфавита , используемой в современном английском алфавите , алфавитах других западноевропейских языков и других языках мира. Ее название на английском языке - cee (произносится / ˈ s iː / ), множественное число cees . [1]
«C» происходит от той же буквы, что и «G». Семиты называли его gimel . Знак, возможно, заимствован из египетского иероглифа, обозначающего пращу , что могло быть значением имени gimel . Другая возможность заключается в том, что он изображал верблюда, семитское название которого было gamal . Барри Б. Пауэлл , специалист по истории письма, утверждает: «Трудно представить, как gimel = «верблюд» может быть получен из изображения верблюда (на нем может быть изображен его горб или его голова и шея!)». [2]
В этрусском языке взрывные согласные не имели контрастной звонкости , поэтому греческая « Γ » (гамма) была принята в этрусском алфавите для представления /k/ . Уже в западном греческом алфавите гамма впервые приняла «' форма в раннем этрусском, затем '' в классическом этрусском. В латыни он в конечном итоге принял форму ' c ' в классической латыни . В самых ранних латинских надписях буквы ' ckq ' использовались для представления звуков / k / и / ɡ / (которые не различались на письме). Из них ' q ' использовался для представления / k / или / ɡ / перед округлым гласным, ' k ' перед ' a ' и ' c ' в других местах. [3] В 3 веке до н. э. был введен измененный символ для / ɡ / , а сам ' c ' был сохранен для / k / . Использование ' c ' (и его варианта ' g ') заменило большинство использований ' k ' и ' q '. Таким образом, в классический период и после ' g ' рассматривался как эквивалент греческой гаммы, а ' c ' как эквивалент каппы; это видно по романизации греческих слов, например, «ΚΑΔΜΟΣ», «ΚΥΡΟΣ» и «ΦΩΚΙΣ», которые вошли в латынь как « cadmvs », « cyrvs » и « phocis » соответственно.
В других алфавитах есть буквы, гомоглифичные букве «с», но не аналогичные ей по использованию и происхождению, как, например, кириллическая буква Es (С, с), которая произошла от полулунной сигмы .
Когда в Британии был введен латинский алфавит, ⟨c⟩ представлял только /k/ , и это значение буквы сохранилось в заимствованиях во всех островных кельтских языках : в валлийском , [4] ирландском и гэльском ⟨c⟩ представляет только /k/ . Древнеанглийская система письма на основе латыни была заимствована у кельтов, по-видимому, из Ирландии; следовательно, ⟨c⟩ в древнеанглийском также изначально представлял /k/ ; современные английские слова kin , break , broken , thick и seek произошли от древнеанглийских слов, написанных с помощью ⟨c⟩ : cyn, brecan, brocen, þicc и séoc . Однако в течение древнеанглийского периода /k/ перед передними гласными ( /e/ и /i/ ) был палатализован , изменившись к десятому веку на [tʃ] , хотя ⟨c⟩ все еще использовался, как в circ(i)ce , wrecc(e)a . На континенте, тем временем, похожее фонетическое изменение перед теми же двумя гласными также происходило почти во всех современных романских языках (например, в итальянском ).
В вульгарной латыни /k/ стал палатализованным в [tʃ] в Италии и Далмации; во Франции и на Пиренейском полуострове он стал [ts] . Тем не менее, для этих новых звуков ⟨ c ⟩ все еще использовался перед буквами ⟨e⟩ и ⟨i⟩ . Таким образом, буква представляла два различных значения. Впоследствии латинская фонема /k w / (пишется ⟨ qv ⟩ ) делабиализировалась в /k/ , что означает, что в различных романских языках /k/ был перед передними гласными. Кроме того, Норман использовал букву ⟨k⟩ , так что звук /k/ мог быть представлен либо ⟨k⟩ , либо ⟨c⟩ , последняя из которых могла представлять либо /k/, либо /ts/ в зависимости от того, предшествовала ли она передней гласной букве или нет. Соглашение об использовании как ⟨c⟩ , так и ⟨k⟩ было применено к написанию английского языка после нормандского завоевания , что привело к значительному переписыванию древнеанглийских слов. Таким образом, в то время как древнеанглийские candel , clif , corn , crop и cú остались неизменными, cent , cǣᵹ ( cēᵹ ), cyng , brece и sēoce теперь (без каких-либо изменений звучания) писались как Kent , keȝ , kyng , breke и seoke ; даже cniht ('рыцарь') впоследствии был изменен на kniht , а þic ('толстый') был изменен на thik или thikk . Древнеанглийское ⟨cw⟩ также со временем было вытеснено французским ⟨qu⟩ , так что древнеанглийские cwēn («королева») и cwic («быстрый») превратились в среднеанглийские quen и quik соответственно.
Звук [tʃ] , к которому древнеанглийский палатализированный /k/ продвинулся, также появился во французском языке, в основном из латинского /k/ перед ⟨a⟩ . Во французском языке он был представлен диграфом ⟨ch⟩ , как в champ (от латинского camp-um ), и это написание было введено в английский язык: Евангелия Хэттона , написанные около 1160 года , содержат в Евангелиях от Матфея i-iii слова child , chyld , riche и mychel вместо cild , rice и mycel древнеанглийской версии, с которой они были скопированы. В этих случаях древнеанглийское ⟨c⟩ уступило место ⟨k⟩ , ⟨qu⟩ и ⟨ch⟩ ; с другой стороны, ⟨c⟩ в своем новом значении /ts/ в основном появлялся во французских словах, таких как processiun , emperice и grace , а также заменял ⟨ts⟩ в нескольких древнеанглийских словах, таких как miltse, bletsien , в раннесреднеанглийских milce , blecien . К концу тринадцатого века и во Франции, и в Англии этот звук /ts/ был деаффрицирован в /s/ ; и с этого времени ⟨c⟩ представлял /s/ перед передними гласными либо по этимологическим причинам, как в lance , cent , либо чтобы избежать двусмысленности из-за «этимологического» использования ⟨s⟩ вместо /z/ , как в ace , mouse , once , pence , defense .
Таким образом, чтобы показать этимологию, в английском написании есть advice , devise (вместо *advize , *devize ), в то время как advice , device , dice , ice , mouses , twice и т. д. не отражают этимологию; пример распространил это на Therefore , pence , defense и т. д., где нет этимологической причины для использования ⟨c⟩ . Предыдущие поколения также писали sence вместо sense . Таким образом, сегодня романские языки и английский имеют общую черту, унаследованную от орфографических правил вульгарной латыни , где ⟨c⟩ принимает либо «твердое», либо «мягкое» значение в зависимости от следующей буквы.
В английской орфографии ⟨c⟩ обычно представляет собой «мягкое» значение / s / перед буквами ⟨e⟩ (включая латинские диграфы ⟨ae⟩ и ⟨oe⟩ или соответствующие лигатуры ⟨æ⟩ и ⟨œ⟩ ), ⟨i⟩ и ⟨y⟩ , а также «твердое» значение / k / перед любыми другими буквами или в конце слова. Однако в английском языке есть ряд исключений: « soccer » и « Celt » — это слова, которые имеют / k / там, где ожидалось бы / s / . «Мягкий» ⟨c⟩ может представлять звук / ʃ / в диграфе ⟨ci⟩ , когда он предшествует гласной, как в словах «delicious» и «appreciate», а также в слове «ocean» и его производных.
Диграф ⟨ ch ⟩ чаще всего представляет / tʃ / , но также может представлять / k / (в основном в словах греческого происхождения) или / ʃ / (в основном в словах французского происхождения). Для некоторых диалектов английского языка он также может представлять / x / в таких словах, как loch , в то время как другие носители языка произносят конечный звук как / k / . Триграф ⟨tch⟩ всегда представляет / tʃ / . Диграф ⟨ck⟩ часто используется для представления звука / k / после коротких гласных, как в "wicket".
C — двенадцатая по частоте использования буква в английском языке (после E , T , A , O , I , N , S , H , R , D и L ), с частотой около 2,8% в словах.
В романских языках: французском , испанском , итальянском , румынском и португальском , ⟨c⟩ обычно имеет «твёрдое» значение /k/ и «мягкое» значение, произношение которого варьируется в зависимости от языка. Во французском, португальском, каталонском и испанском языках Латинской Америки и некоторых мест в Испании мягкое значение ⟨c⟩ — /s/, как и в английском. В испанском языке, на котором говорят в большей части Испании, мягкое ⟨c⟩ — это глухой зубной фрикативный звук /θ/ . В итальянском и румынском языках мягкое ⟨c⟩ — [t͡ʃ] .
Германские языки обычно используют ⟨c⟩ для романских заимствований или диграфов, таких как ⟨ch⟩ и ⟨ck⟩ , но правила различаются в разных языках. Из всех германских языков только английский использует начальную ⟨c⟩ в исконно германских словах, таких как come . Помимо английского, голландский использует ⟨c⟩ чаще всего для большинства романских заимствований и диграфа ⟨ch⟩ . Немецкий использует ⟨c⟩ в диграфах ⟨ch⟩ и ⟨ck⟩ , а также триграф ⟨sch⟩ , но сам по себе только в неассимилированных заимствованиях и именах собственных. Датский сохраняет мягкое ⟨c⟩ в романских словах, но меняет твердое ⟨c⟩ на ⟨k⟩ . В шведском языке действуют те же правила для мягкого и твёрдого ⟨c⟩, что и в датском, а также используется ⟨c⟩ в диграфе ⟨ck⟩ и очень распространённом слове och , «и». Норвежский , африкаанс и исландский языки являются наиболее строгими, заменяя все случаи ⟨c⟩ на ⟨k⟩ или ⟨s⟩ и резервируя ⟨c⟩ для неассимилированных заимствованных слов и имён.
Все балто-славянские языки , использующие латинский алфавит, а также албанский , венгерский , пушту , несколько саамских языков , эсперанто , идо , интерлингва и американистская фонетическая нотация (и те аборигенные языки Северной Америки, практическая орфография которых от неё происходит), используют ⟨c⟩ для представления /t͡s/ , глухой альвеолярной или глухой зубной свистящей аффрикаты . В ханьюй пиньинь , стандартной романизации мандаринского китайского языка , эта буква представляет собой аспирированную версию этого звука, /t͡s h / .
Среди неевропейских языков, принявших латинский алфавит, ⟨c⟩ представляет собой множество звуков. Юпикский , индонезийский , малайский и ряд африканских языков, таких как хауса , фула и мандинго, разделяют мягкое итальянское значение /t͡ʃ/ . В азербайджанском , крымско-татарском , курманджи (курдском ) и турецком ⟨c⟩ обозначает звонкий аналог этого звука, звонкий постальвеолярный аффрикат /d͡ʒ/ . В ябеме и похожих языках, таких как букава , ⟨c⟩ обозначает гортанную смычку /ʔ/ . Коса и зулу используют эту букву для обозначения щелчка /ǀ/ . В некоторых других африканских языках, таких как берберские языки , ⟨c⟩ используется для /ʃ/ . В фиджийском языке ⟨c⟩ обозначает звонкий зубной фрикативный звук /ð/ , тогда как в сомалийском он имеет значение / ʕ / .
Буква ⟨c⟩ также используется как транслитерация кириллической ⟨ц⟩ в латинских формах сербского , македонского и иногда украинского языков , наряду с диграфом ⟨ts⟩ .
В качестве фонетического символа строчная буква ⟨ c ⟩ является символом Международного фонетического алфавита (МФА) и символом X-SAMPA для глухого небного взрывного согласных , а заглавная буква ⟨C⟩ является символом X-SAMPA для глухого небного фрикатива .
Существует несколько распространённых диграфов с ⟨c⟩ , наиболее распространённым из которых является ⟨ch⟩ , который в некоторых языках (например, в немецком ) встречается гораздо чаще, чем ⟨c⟩ в отдельности. ⟨ch⟩ принимает различные значения в других языках.
Как и в английском языке, ⟨ck⟩ со значением /k/ часто используется после кратких гласных в других германских языках, таких как немецкий и шведский (другие германские языки, такие как голландский и норвежский , используют вместо этого ⟨kk⟩ ). Диграф ⟨cz⟩ встречается в польском языке, а ⟨cs⟩ — в венгерском, представляя /t͡ʂ/ и /t͡ʃ/ соответственно. Диграф ⟨sc⟩ представляет /ʃ/ в древнеанглийском, итальянском и нескольких языках, родственных итальянскому (где это происходит только перед передними гласными , в противном случае он представляет /sk/ ). Триграф ⟨sch⟩ представляет /ʃ/ в немецком языке.
Добавить к C с диакритическими знаками:
Латинские буквы ⟨C⟩ и ⟨c⟩ имеют кодировки Unicode U+0043 C ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА C и U+0063 c ЛАТИНСКАЯ СТРОЧНАЯ БУКВА C . Это те же кодовые точки , которые используются в ASCII и ISO 8859 . Существуют также предварительно составленные кодировки символов для ⟨C⟩ и ⟨c⟩ с диакритическими знаками, для большинства из перечисленных выше; остальные создаются с помощью комбинированных диакритических знаков .
Вариантные формы буквы имеют уникальные кодовые точки для использования специалистами: набор буквенно-цифровых символов в математике и науке, глухие палатальные звуки в лингвистике, а также полуширинные и полноширинные формы для совместимости со шрифтами CJK . Кириллический омоглиф латинской ⟨C⟩ имеет отдельную кодировку: U+0421 С КИРИЛЛИЧЕСКАЯ ЗАГЛАВНАЯ БУКВА ES .