Латинское письмо , также известное как римский алфавит , представляет собой систему письма , основанную на буквах классического латинского алфавита , произошедшего от формы греческого алфавита , который использовался в древнегреческом городе Кумы в Великой Греции . Греческий алфавит был изменен этрусками , а впоследствии их алфавит был изменен древними римлянами . Существует несколько алфавитов с латинским письмом , которые отличаются графемами, сопоставлением и фонетическими значениями от классического латинского алфавита.
Латинский алфавит является основой Международного фонетического алфавита , а 26 наиболее распространенных букв — это буквы, содержащиеся в базовом латинском алфавите ISO , которые совпадают с буквами английского алфавита .
Латинский алфавит является основой для наибольшего числа алфавитов любой письменной системы [1] и является наиболее широко распространенной письменной системой в мире. Латинский алфавит используется как стандартный метод письма в языках Западной и Центральной Европы, большей части Африки к югу от Сахары, Америки и Океании, а также во многих языках в других частях мира.
Письмо называется либо латинским шрифтом, либо римским шрифтом, в связи с его происхождением из Древнего Рима (хотя некоторые заглавные буквы имеют греческое происхождение). В контексте транслитерации часто встречается термин « романизация » ( британский английский : «romanisation»). [2] [3] Unicode использует термин «латинский» [4], как и Международная организация по стандартизации (ISO). [5]
Система счисления называется римской системой счисления, а совокупность элементов известна как римские цифры . Цифры 1, 2, 3 ... являются латинскими/римскими числами для индо-арабской системы счисления .
Использование букв I и V как для согласных, так и для гласных оказалось неудобным, поскольку латинский алфавит был адаптирован к германским и романским языкам. W возникла как удвоенная V (VV), использовавшаяся для представления звонкого губно-велярного аппроксиманта / w /, встречавшегося в древнеанглийском языке еще в VII веке. Она вошла в обиход в конце XI века, заменив букву wynn ⟨Ƿ ƿ⟩ , которая использовалась для того же звука. В романских языках минускульная форма V была округлой u ; от нее в XVI веке произошла округлой заглавной U для гласной, в то время как новый, заостренный минускул v был получен от V для согласной. В случае I для согласной стала использоваться конечная форма с наклонной чертой j , а не наклонная форма ограничивалась использованием гласной. Такие соглашения были нестабильными на протяжении столетий. Буква J была введена в английский язык для обозначения согласной в XVII веке (до этого она редко встречалась в качестве гласной), но до XIX века она не считалась отдельной буквой в алфавитном порядке.
К 1960-м годам для компьютерной и телекоммуникационной отраслей в странах Первого мира стало очевидно , что необходим непатентованный метод кодирования символов. Международная организация по стандартизации (ISO) инкапсулировала латинский алфавит в свой стандарт ( ISO/IEC 646 ). Чтобы добиться широкого признания, эта инкапсуляция основывалась на популярном использовании. Поскольку Соединенные Штаты занимали лидирующее положение в обеих отраслях в 1960-х годах, стандарт был основан на уже опубликованном Американском стандартном коде для обмена информацией , более известном как ASCII , который включал в набор символов 26 × 2 (заглавные и строчные) буквы английского алфавита . Более поздние стандарты, выпущенные ISO, например ISO/IEC 10646 ( Unicode Latin ), продолжали определять 26 × 2 буквы английского алфавита как базовый латинский алфавит с расширениями для обработки других букв в других языках.
Латинский алфавит распространился вместе с латынью с Апеннинского полуострова на земли, окружающие Средиземное море , с расширением Римской империи . Восточная часть империи, включая Грецию, Турцию, Левант и Египет, продолжала использовать греческий язык в качестве lingua franca , но латынь была широко распространена в западной части, и по мере того, как западные романские языки развивались из латыни, они продолжали использовать и адаптировать латинский алфавит.
С распространением западного христианства в Средние века латинский алфавит постепенно переняли народы Северной Европы , говорившие на кельтских языках (вытеснив огамический алфавит), германских языках (вытеснив более ранние рунические алфавиты ) или балтийских языках , а также носители нескольких уральских языков , в частности венгерского , финского и эстонского .
Латинский алфавит также стал использоваться для письма западнославянских языков и нескольких южнославянских языков , поскольку люди, которые на них говорили, приняли римский католицизм . Носители восточнославянских языков в основном приняли кириллицу вместе с православным христианством . Сербский язык использует оба алфавита, причем кириллица преобладает в официальном общении, а латиница — в других местах, как определено Законом об официальном использовании языка и алфавита. [6]
Еще в 1500 году латинское письмо было ограничено в основном языками, на которых говорили в Западной , Северной и Центральной Европе . Православные славяне Восточной и Юго-Восточной Европы в основном использовали кириллицу , а греческий алфавит использовался грекоговорящими людьми по всему восточному Средиземноморью. Арабское письмо было широко распространено в исламе, как среди арабов , так и среди неарабских народов, таких как иранцы , индонезийцы , малайцы и тюркские народы . Большая часть остальной Азии использовала различные брахмические алфавиты или китайское письмо .
В результате европейской колонизации латинская письменность распространилась в Америке , Океании , некоторых частях Азии, Африки и Тихоокеанского региона в формах, основанных на испанском , португальском , английском , французском , немецком и голландском алфавитах.
Он используется во многих австронезийских языках , включая языки Филиппин , а также малазийские и индонезийские языки , заменяя более ранние арабские и местные брахмические алфавиты. Латинские буквы послужили основой для форм слоговой азбуки чероки, разработанной Секвойей ; однако звуковые значения совершенно иные. [ необходима цитата ]
Под влиянием португальских миссионеров был разработан латинский алфавит для вьетнамского языка , в котором ранее использовались китайские иероглифы . Алфавит на основе латиницы заменил китайские иероглифы в администрации в 19 веке при французском правлении.
В конце 19 века румыны перешли на использование латинского алфавита, отказавшись от румынской кириллицы . Румынский язык относится к романским языкам .
В 1928 году в рамках реформ Мустафы Кемаля Ататюрка новая Турецкая Республика приняла латинский алфавит для турецкого языка , заменив модифицированный арабский алфавит. Большинство тюркоязычных народов бывшего СССР , включая татар , башкир , азербайджанцев , казахов , киргизов и других, в 1930-х годах заменили свои письменные системы на латинский единый тюркский алфавит ; но в 1940-х годах все они были заменены кириллицей.
После распада Советского Союза в 1991 году три из новых независимых тюркоязычных республик — Азербайджан , Узбекистан , Туркменистан , а также румыноязычная Молдова — официально приняли латинский алфавит для своих языков. Киргизия , ираноязычный Таджикистан и сепаратистский регион Приднестровье сохранили кириллицу, главным образом из-за тесных связей с Россией.
В 1930-х и 1940-х годах большинство курдов заменили арабскую письменность двумя латинскими алфавитами. Хотя только официальное курдское правительство использует арабский алфавит для государственных документов, латинский курдский алфавит по-прежнему широко используется во всем регионе большинством курдоговорящих .
В 1957 году Китайская Народная Республика провела реформу письменности языка чжуан , изменив его орфографию с саундип , системы письма, основанной на китайском, на латинский алфавит, который использовал смесь латинских, кириллических и IPA букв для представления как фонем, так и тонов языка чжуан, без использования диакритических знаков. В 1982 году это было дополнительно стандартизировано для использования только латинских букв.
С крахом Дерга и последующим окончанием десятилетий амхарской ассимиляции в 1991 году различные этнические группы в Эфиопии отказались от письменности геэз , которая была сочтена неподходящей для языков за пределами семитской ветви . [7] В последующие годы языки кафа , [8] оромо , [9] сидама , [10] сомалийцы , [10] и волайта [10] перешли на латиницу, в то время как продолжаются дебаты о том, следует ли последовать этому примеру для языков хадийя и камбаата . [11]
15 сентября 1999 года власти Татарстана , Россия, приняли закон, согласно которому к 2011 году латиница станет официальной письменностью наряду с кириллицей для татарского языка . [12] Однако год спустя российское правительство отменило закон и запретило латинизацию на своей территории. [13]
В 2015 году правительство Казахстана объявило, что к 2025 году казахская латиница заменит казахскую кириллицу в качестве официальной письменности казахского языка . [14] Также ведутся разговоры о переходе с кириллицы на латиницу в Украине, [15] Кыргызстане , [16] [17] и Монголии . [18] Однако с тех пор Монголия решила возродить монгольскую письменность вместо перехода на латиницу. [19]
В октябре 2019 года организация National Representational Organization for Inuit in Canada (ITK) объявила о том, что введет единую систему письма для языков инуитов в стране. Система письма основана на латинском алфавите и смоделирована по образцу той, которая используется в гренландском языке . [20]
12 февраля 2021 года правительство Узбекистана объявило, что завершит переход с кириллицы на латиницу для узбекского языка к 2023 году. Планы по переходу на латиницу первоначально начались в 1993 году, но впоследствии были приостановлены, и кириллица осталась широко распространенной. [21] [22]
В настоящее время крымскотатарский язык использует как кириллицу, так и латиницу. Использование латиницы было первоначально одобрено представителями крымских татар после распада Советского Союза [23], но никогда не было реализовано региональным правительством. После аннексии Крыма Россией в 2014 году латинская графика была полностью отменена. Тем не менее, крымские татары за пределами Крыма продолжают использовать латиницу, и 22 октября 2021 года правительство Украины одобрило предложение, одобренное Меджлисом крымскотатарского народа, о переходе крымскотатарского языка на латиницу к 2025 году. [24]
В июле 2020 года 2,6 миллиарда человек (36% населения мира) используют латинский алфавит. [25]
К 1960-м годам компьютерной и телекоммуникационной промышленности в странах Первого мира стало очевидно , что необходим непатентованный метод кодирования символов. Международная организация по стандартизации (ISO) инкапсулировала латинский алфавит в свой стандарт ( ISO/IEC 646 ). Чтобы добиться широкого признания, эта инкапсуляция основывалась на популярном использовании.
Поскольку в 1960-х годах Соединенные Штаты занимали лидирующее положение в обеих отраслях, стандарт был основан на уже опубликованном Американском стандартном коде для обмена информацией , более известном как ASCII , который включал в набор символов 26 × 2 (заглавные и строчные) буквы английского алфавита . Более поздние стандарты, выпущенные ISO, например ISO/IEC 10646 ( Unicode Latin ), продолжили определять 26 × 2 буквы английского алфавита как базовый латинский алфавит с расширениями для обработки других букв в других языках.
Стандарт DIN DIN 91379 определяет подмножество букв Unicode, специальных символов и последовательностей букв и диакритических знаков, чтобы обеспечить правильное представление имен и упростить обмен данными в Европе. Эта спецификация поддерживает все официальные языки стран Европейского Союза и Европейской ассоциации свободной торговли (таким образом, также греческий и кириллический алфавиты), а также немецкие языки меньшинств . [ необходимо разъяснение ] Чтобы разрешить транслитерацию имен в других системах письма в латинский алфавит в соответствии с соответствующими стандартами ISO, предоставляются все необходимые комбинации базовых букв и диакритических знаков. [26] Предпринимаются усилия по его дальнейшей разработке в европейский стандарт CEN . [27]
В ходе своего использования латинский алфавит был адаптирован для использования в новых языках, иногда представляя фонемы, не встречающиеся в языках, которые уже были записаны латинскими буквами. Поэтому для представления этих новых звуков были созданы расширения, будь то добавление диакритических знаков к существующим буквам , объединение нескольких букв вместе для создания лигатур , создание совершенно новых форм или назначение специальной функции парам или тройкам букв. Этим новым формам отводится место в алфавите путем определения алфавитного порядка или последовательности сопоставления, которая может варьироваться в зависимости от конкретного языка.
Некоторые примеры новых букв в стандартном латинском алфавите — рунические буквы wynn ⟨Ƿ ƿ⟩ и thorn ⟨Þ þ⟩ , а также буква eth ⟨Ð/ð⟩ , которые были добавлены в алфавит древнеанглийского языка . Другая ирландская буква, островная g , развилась в yogh ⟨Ȝ ȝ⟩ , используемую в среднеанглийском языке . Позднее Wynn была заменена новой буквой ⟨w⟩ , eth и thorn на ⟨ th ⟩ , а yogh на ⟨ gh ⟩ . Хотя эти четыре буквы больше не являются частью английского или ирландского алфавитов, eth и thorn по-прежнему используются в современном исландском алфавите , в то время как eth также используется в фарерском алфавите .
Некоторые западные, центральные и южноафриканские языки используют несколько дополнительных букв, которые имеют звуковые значения, схожие с их эквивалентами в МФА. Например, в языке адангме используются буквы ⟨Ɛ ɛ⟩ и ⟨Ɔ ɔ⟩ , а в языке га — ⟨Ɛ ɛ⟩ , ⟨Ŋ ŋ⟩ и ⟨Ɔ ɔ⟩ . В языке хауса для имплозивных согласных используются ⟨Ɓ ɓ⟩ и ⟨Ɗ ɗ⟩ , а для абруптивных — ⟨Ƙ ƙ⟩ . Африканисты стандартизировали их в африканский справочный алфавит .
Буква I с точкой и без точки — ⟨İ i⟩ и ⟨I ı⟩ — две формы буквы I, используемые в турецком , азербайджанском и казахском алфавитах. [28] В азербайджанском языке также есть буква ⟨Ə ə⟩ , которая представляет собой почти открытый передний неогубленный гласный .
Диграф — это пара букв, используемых для записи одного звука или комбинации звуков, которая не соответствует написанным буквам в последовательности. Примерами являются ⟨ ch ⟩ , ⟨ ng ⟩ , ⟨ rh ⟩ , ⟨ sh ⟩ , ⟨ ph ⟩ , ⟨ th ⟩ в английском языке и ⟨ ij ⟩ , ⟨ee⟩ , ⟨ ch ⟩ и ⟨ei⟩ в голландском языке. В голландском языке ⟨ij⟩ пишется с заглавной буквы ⟨IJ⟩ или лигатура ⟨IJ⟩ , но никогда не ⟨Ij⟩ , и часто принимает вид лигатуры ⟨ij⟩ , очень похожей на букву ⟨ÿ⟩ в рукописном письме .
Триграф состоит из трех букв, как, например, немецкий ⟨ sch ⟩ , бретонский ⟨ c'h ⟩ или миланский ⟨oeu⟩ . В орфографиях некоторых языков диграфы и триграфы рассматриваются как независимые буквы алфавита. Капитализация диграфов и триграфов зависит от языка , так как заглавной может быть только первая буква или все составляющие буквы одновременно (даже для слов, написанных заглавными буквами, где буквы после диграфа или триграфа остаются строчными).
Лигатура — это слияние двух или более обычных букв в новый глиф или символ. Примерами являются ⟨ Æ æ⟩ (от ⟨AE⟩ , называемого ash ), ⟨ Œ œ⟩ (от ⟨OE⟩ , иногда называемого oethel или eðel ), сокращение ⟨ & ⟩ (от латинского et , букв. « и», называемого амперсандом ), и ⟨ ẞ ß ⟩ (от ⟨ſʒ⟩ или ⟨ſs⟩ , архаичной срединной формы ⟨s⟩ , за которой следует ⟨ ʒ ⟩ или ⟨s⟩ , называемого диезом S или eszett ).
Диакритический знак, в некоторых случаях также называемый ударением, представляет собой небольшой символ, который может появляться над или под буквой, или в какой-либо другой позиции, например, знак умлаута, используемый в немецких символах ⟨ ä ⟩ , ⟨ ö ⟩ , ⟨ ü ⟩ или румынских символах ă , â , î , ș , ț . Его основная функция — изменять фонетическое значение буквы, к которой он добавляется, но он также может изменять произношение целого слога или слова, указывать на начало нового слога или различать омографы, такие как голландские слова een ( произносится [ən] ), что означает «a» или «an», и één , ( произносится [e:n] ), что означает «один». Как и в случае с произношением букв, эффект диакритических знаков зависит от языка.
Английский язык — единственный из современных крупных европейских языков , которому не требуются диакритические знаки для его родного словаря [примечание 1] . Исторически сложилось так, что в официальном письме диэрезис иногда использовался для обозначения начала нового слога в последовательности букв, которые в противном случае могли бы быть неверно истолкованы как одна гласная (например, «coöperative», «reëlect»), но современные стили письма либо опускают такие знаки, либо используют дефис для обозначения разрыва слога (например, «co-operative», «re-elect»). [примечание 2] [29]
Некоторые измененные буквы, такие как символы ⟨ å ⟩ , ⟨ ä ⟩ и ⟨ ö ⟩ , могут рассматриваться как новые отдельные буквы сами по себе и им может быть назначено определенное место в алфавите для целей сопоставления , отдельное от места буквы, на которой они основаны, как это сделано в шведском языке . В других случаях, например, с ⟨ ä ⟩ , ⟨ ö ⟩ , ⟨ ü ⟩ в немецком языке, этого не делается; буквенно-диакритические комбинации идентифицируются с их базовой буквой. То же самое относится к диграфам и триграфам. Различные диакритические знаки могут по-разному рассматриваться при сопоставлении в пределах одного языка. Например, в испанском языке символ ⟨ ñ ⟩ считается буквой и в словарях располагается между ⟨ n ⟩ и ⟨ o ⟩ , но ударные гласные ⟨ á ⟩ , ⟨ é ⟩ , ⟨ í ⟩ , ⟨ ó ⟩ , ⟨ ú ⟩ , ⟨ ü ⟩ не отделены от безударных гласных ⟨ a ⟩ , ⟨ e ⟩ , ⟨ i ⟩ , ⟨ o ⟩ , ⟨ u ⟩ .
В языках, использующих латинский алфавит сегодня, обычно используются заглавные буквы для начала абзацев и предложений, а также собственные имена . Правила написания заглавных букв со временем менялись, и разные языки различались в своих правилах написания заглавных букв. Например, в древнеанглийском языке даже собственные имена редко писались с заглавной буквы; в то время как в современном английском языке 18 века все существительные часто писались с заглавной буквы, так же, как и в современном немецком языке сегодня, например ‹См. Tfd› Немецкий : Alle Schwestern der alten Stadt hatten die Vögel gesehen , буквально «Все сестры старого города видели птиц».
Слова из языков, изначально использующих другие виды письма , например, арабского или китайского , обычно транслитерируются или транскрибируются при включении в текст с латинским алфавитом или в многоязычную международную коммуникацию. Этот процесс называется романизацией .
Хотя латинизация таких языков используется в основном на неофициальном уровне, она была особенно заметна в компьютерных сообщениях, где на старых системах доступен только ограниченный семибитный код ASCII . Однако с введением Unicode латинизация становится менее необходимой. Клавиатуры, используемые для ввода такого текста, могут по-прежнему ограничивать пользователей латинизированным текстом, поскольку могут быть доступны только символы ASCII или латинского алфавита.