stringtranslate.com

Буквенный регистр

Строчная «а» и заглавная «А» — это два варианта регистра первой буквы английского алфавита .

Регистр букв — это различие между буквами, которые находятся в большем верхнем регистре или капитале (более формально маюскул ) и меньшем нижнем регистре (более формально минускул ) в письменном представлении некоторых языков. Системы письма , которые различают верхний и нижний регистр, имеют два параллельных набора букв: каждый в наборе маюскул имеет аналог в наборе минускул. Некоторые буквы-аналоги имеют одинаковую форму и отличаются только размером (например, ⟨C, c⟩ или ⟨S, s⟩ ), но для других формы отличаются (например, ⟨A, a⟩ или ⟨G, g⟩ ). Два варианта регистра являются альтернативными представлениями одной и той же буквы: они имеют одинаковое название и произношение и обычно обрабатываются одинаково при сортировке в алфавитном порядке .

Буквенный регистр обычно применяется в смешанном регистре, когда в тексте для удобства чтения используются как заглавные, так и строчные буквы. Выбор регистра часто определяется грамматикой языка или соглашениями определенной дисциплины. В орфографии заглавные буквы зарезервированы для особых целей, например, в качестве первой буквы предложения или имени собственного (так называемая капитализация или заглавные слова), что делает строчные буквы более распространенными в обычном тексте.

В некоторых контекстах принято использовать только один регистр. Например, чертежи инженерного проекта обычно маркируются полностью заглавными буквами, которые легче различать по отдельности, чем строчные, когда ограничения пространства требуют очень маленьких букв. В математике , с другой стороны, заглавные и строчные буквы обозначают, как правило, разные математические объекты , которые могут быть связаны, когда используются два случая одной и той же буквы ; например, x может обозначать элемент множества X.

Терминология

Термины верхний регистр и нижний регистр могут быть написаны как два последовательных слова, соединенных дефисом ( верхний регистр и нижний регистр  – особенно если они предварительно модифицируют другое существительное), [1] или как одно слово ( верхний регистр и нижний регистр ). Эти термины произошли от общих макетов неглубоких ящиков, называемых футлярами для набора , которые использовались для хранения подвижного шрифта для высокой печати . ​​Традиционно заглавные буквы хранились в отдельном неглубоком лотке или «футляре», который располагался над футляром, в котором находились строчные буквы. [2] [3] [4]

Majuscule

Маюскуль ( / ˈ m æ ə s k juː l / , реже / m ə ˈ ʌ s k juː l / ), для палеографов , технически любой шрифт, буквы которого имеют очень мало или очень короткие выносные и нисходящие элементы, или вообще не имеют их (например, маюскульные шрифты, используемые в Codex Vaticanus Graecus 1209 или Келлской книге ). Благодаря своему визуальному воздействию, это сделало термин маюскуль подходящим описанием того, что гораздо позже стало более широко называться заглавными буквами.

Крохотный

Minuscule относится к строчным буквам . Слово часто пишется как minscule , по ассоциации с неродственным словом miniature и префиксом mini- . Это традиционно считалось орфографической ошибкой (так как minuscule произошло от слова minus [5] ), но сейчас настолько распространено, что некоторые словари склонны принимать это как нестандартное или вариантное написание. [6] Однако слово miniscule все еще менее вероятно будет использоваться по отношению к строчным буквам.

Типографские соображения

Глифы строчных букв могут напоминать меньшие формы прописных глифов, ограниченных базовой полосой (например, «C/c» и «S/s», ср. малые заглавные буквы ) или могут выглядеть едва связанными (например, «D/d» и «G/g»). Вот сравнение вариантов верхнего и нижнего регистра каждой буквы, включенной в английский алфавит (точное представление будет меняться в зависимости от гарнитуры и используемого шрифта ):

(Некоторые строчные буквы имеют вариации, например a/ɑ.)

С точки зрения типографики основное различие между маюскулами и минускулами заключается не в том, что маюскул большой, а минускулы маленький, а в том, что маюскул, как правило, имеет одинаковую высоту (хотя, в зависимости от гарнитуры, могут быть некоторые исключения, в частности, Q и иногда J, имеющие нисходящий элемент; кроме того, различные диакритические знаки могут увеличивать обычную высоту буквы).

Выносные элементы (как в «h») и подносные элементы (как в «p») изменяют высоту строчных букв.

Высота минускулов может быть разной, так как некоторые из них имеют части выше ( восходящие ) или ниже ( нисходящие ), чем типичный размер. Обычно b, d, f, h, k, l, t [примечание 1] — это буквы с восходящими элементами, а g, j, p, q, y — с нисходящими. Кроме того, в некоторых традиционных или классических шрифтах все еще используются цифры старого стиля , 6 и 8 составляют набор восходящих элементов, а 3, 4, 5, 7 и 9 — набор нисходящих элементов.

Двухпалатный алфавит

Рукописный кириллический шрифт
Адыгейский латинский алфавит, использовавшийся в период с 1927 по 1938 год, был основан на латинской графике, но не имел заглавных букв, будучи однопалатным ( к малым заглавным буквам относятся ᴀ, ʙ, ᴣ, ʀ, , ᴘ и.

Меньшинство систем письма используют два отдельных случая. Такие системы письма называются двухпалатными . К этим системам письма относятся латинское , кириллическое , греческое , коптское , армянское , глаголическое , адламское , варанг-сити , гарайское , загава , осейджское , виткуки и дезеретское письмо. Языки, написанные этими системами письма, используют регистры букв для ясности. Грузинский алфавит имеет несколько вариантов, и были попытки использовать их в качестве разных случаев, но современный письменный грузинский язык не различает регистры. [8]

Все остальные системы письма не делают различий между маюскулями и минускулами – система, называемая однопалатным письмом или уникасом . Сюда входит большинство слоговых и других неалфавитных письменностей.

В сценариях с разделением регистров строчные буквы обычно используются для большей части текста; заглавные буквы используются для заглавных букв и выделения , когда полужирный шрифт недоступен. Акронимы (и особенно инициалы) часто пишутся полностью заглавными буквами , в зависимости от различных факторов .

Капитализация

Капитализация — это написание слова с первой буквой в верхнем регистре и остальными буквами в нижнем. Правила капитализации различаются в зависимости от языка и часто довольно сложны, но в большинстве современных языков, в которых есть капитализация, первое слово каждого предложения пишется с большой буквы, как и все собственные имена существительные . [ необходима цитата ]

Капитализация в английском языке, с точки зрения общих правил орфографии, не зависящих от контекста (например, title vs. heading vs. text), повсеместно стандартизирована для официального письма. Заглавные буквы используются в качестве первой буквы предложения, имени собственного или прилагательного собственного . Названия дней недели и месяцев также пишутся с заглавной буквы, как и местоимение первого лица «I» [9] и звательная частица «O». Существует несколько пар слов с разными значениями, единственным отличием которых является заглавная буква первой буквы. Почетные и личные титулы, показывающие ранг или престиж, пишутся с заглавной буквы, когда используются вместе с именем человека (например, «Mr. Smith», «Bishop Gorman», «Professor Moore») или как прямое обращение, но обычно не когда используются отдельно и в более общем смысле. [10] [11] Также можно считать общепринятым писать с заглавной буквы любое слово – в некоторых контекстах даже местоимение [12]  – относящееся к божеству монотеистической религии .

Другие слова обычно начинаются со строчной буквы. Однако существуют ситуации, когда для придания дополнительного акцента может использоваться дополнительная заглавная буква, например, в заголовках и названиях публикаций (см. ниже). В некоторых традиционных формах поэзии заглавные буквы традиционно использовались в качестве маркера для обозначения начала строки стиха независимо от какой-либо грамматической особенности. В политических сочинениях, пародиях и сатире неожиданный акцент, создаваемый в противном случае необоснованным заглавными буквами, часто используется для достижения большого стилистического эффекта, например, в случае с произведением Джорджа Оруэлла « Большой брат» .

Другие языки различаются в использовании заглавных букв. Например, в немецком языке все существительные пишутся с заглавной буквы (ранее это было распространено и в английском языке, в основном в 17 и 18 веках), в то время как в романских и большинстве других европейских языков названия дней недели, названия месяцев и прилагательные национальности, религии и т. д. обычно начинаются со строчной буквы. [13] С другой стороны, в некоторых языках принято писать с заглавной буквы формальные вежливые местоимения , например De , Dem ( датский ), Sie , Ihnen (немецкий) и Vd или Ud (сокращение от usted в испанском ).

Неформальное общение, такое как текстовые сообщения , мгновенные сообщения или рукописные заметки , может не требовать соблюдения правил использования заглавных букв, но это происходит потому, что пользователи обычно не ожидают, что оно будет формальным. [9]

Исключительные буквы и диграфы

Связанные особенности

Аналогичные орфографические и графостилистические правила используются для акцентирования или следования специфическим языковым или другим правилам, в том числе:

Стилистическое или специализированное использование

Чередование заглавных букв и стилей заголовков в начале репортажа New York Times , опубликованного в ноябре 1919 года. (Событие, о котором сообщается, — проверка Артуром Эддингтоном общей теории относительности Эйнштейна .)

В английском языке в различных обстоятельствах используются различные падежные стили:

Приговор
" The quick brown fox jumps over the lazy dog ​​"
Стиль со смешанным регистром, в котором первое слово предложения пишется с заглавной буквы, а также собственные имена и другие слова, требуемые более конкретным правилом. Это, как правило, эквивалентно базовому универсальному стандарту формальной английской орфографии.
В компьютерном программировании начальную заглавную букву автоматизировать проще, чем другие правила. Например, в англоязычной Википедии первый символ в заголовках страниц по умолчанию пишется с заглавной буквы. Поскольку другие правила более сложны, подстроки для конкатенации в предложения обычно пишутся в "середине предложения", применяя все правила предложения, за исключением начальной заглавной буквы.
Заглавная буква (заглавная, стиль заголовка)
"The Quick Brown Fox Jumps over the Lazy Dog"
Стиль со смешанным регистром, в котором все слова пишутся с заглавной буквы, за исключением некоторых подмножеств (в частности, артиклей и коротких предлогов и союзов ), определяемых правилами, которые не являются универсально стандартизированными. Стандартизация осуществляется только на уровне внутренних стилей и индивидуальных руководств по стилям . (См. более подробное объяснение ниже в § Заголовки и названия публикаций.)
Начинать с регистра (первая буква каждого слова заглавная)
"The Quick Brown Fox Jumps Over The Lazy Dog"
Начальный регистр, начальные заглавные буквы или собственный регистр — это упрощенный вариант заглавного регистра. В текстовой обработке начальный регистр обычно подразумевает использование заглавных букв во всех словах независимо от их части речи .
Все заглавные буквы (все заглавные)
"THE QUICK BROWN FOX JUMPS OVER THE LAZY DOG"
Стиль unicase, использующий только заглавные буквы. Его можно использовать в заголовках и особых ситуациях, например, для типографского выделения текста, набранного на пишущей машинке. С появлением Интернета стиль all-caps чаще используется для выделения; однако некоторые считают плохим сетевым этикетом печатать все заглавными буквами и говорят, что это равносильно крику. [21] Длинные фрагменты текста на латинском алфавите, написанные полностью заглавными буквами, труднее читать из-за отсутствия верхних и нижних выносных элементов , которые есть в строчных буквах, что способствует распознаванию и разборчивости. В некоторых культурах принято писать фамилии заглавными буквами, чтобы отличать их от настоящих имен, особенно в документах, удостоверяющих личность, таких как паспорта. Некоторые музыканты, такие как Марина и Финнеас , которые оба известны под одним именем, и некоторые группы, такие как Haim и Kiss , стилизованы под заглавные буквы. Кроме того, для групп с названиями без гласных (процесс, красочно известный как « расгласовка ») характерно использование заглавных букв, яркими примерами являются STRFKR , MSTRKRFT , PWR BTTM , SBTRKT , JPNSGRLS (теперь известный как Hotel Mira), BLK JKS , MNDR и DWNTWN .
Малые заглавные буквы
" Быстрая коричневая лиса перепрыгивает через ленивую собаку " По форме похожие на заглавные буквы, но примерно размером со строчную "x", малые заглавные буквы могут использоваться вместо строчных букв и комбинироваться с обычными заглавными буквами в смешанном регистре. Это особенность некоторых шрифтов, таких как Copperplate Gothic . Согласно различным типографским традициям, высота малых заглавных букв может быть равна или немного больше высоты x гарнитуры шрифта (меньший вариант иногда называют маленькими заглавными буквами , и их также можно смешивать с большим вариантом). [22] Малые заглавные буквы могут использоваться для аббревиатур, имен, математических сущностей, компьютерных команд в печатном тексте, деловых или личных печатных бланках и в других ситуациях, когда заданную фразу необходимо отличить от основного текста.
Все строчные буквы
«быстрая коричневая лиса перепрыгивает через ленивую собаку»
Стиль unicase без заглавных букв. Иногда используется для художественного эффекта, например, в поэзии. Также часто встречается в компьютерных языках и в неформальных электронных коммуникациях, таких как язык SMS и мгновенные сообщения (избегая клавиши shift , чтобы печатать быстрее). Примеры в музыке относительно распространены. Например, несколько альбомов Тейлор Свифт , включая Reputation , Folklore и Evermore , были стилизованы в нижнем регистре. Такие группы, как Weezer и Silverchair, также были стилизованы в нижнем регистре для нескольких альбомов в течение своей карьеры, причем первая постоянно использовала нижний регистр в своем логотипе с момента своего первого студийного альбома . Дебютный студийный альбом Билли Айлиш — When We All Fall Asleep, Where Do We Go? — содержит все свои треки стилизованные в нижнем регистре. Некоторые люди, такие как автор Bell Hooks , пишут свои имена полностью строчными.

Заголовки и названия публикаций

В англоязычных публикациях используются различные соглашения для написания заглавных букв в названиях и заголовках публикаций , включая заголовки глав и разделов. Правила существенно различаются между отдельными стилями издательств.

Соглашение, которому следуют многие британские издатели (включая научные издательства, такие как Nature и New Scientist , журналы, такие как The Economist , и газеты, такие как The Guardian и The Times ), а также многие американские газеты, заключается в использовании заглавных букв в стиле предложений в заголовках, т. е. использование заглавных букв следует тем же правилам, которые применяются к предложениям. Это соглашение обычно называется case предложения . Оно также может применяться к названиям публикаций, особенно в библиографических ссылках и библиотечных каталогах. Примером глобального издательства, чей фирменный стиль на английском языке предписывает использование заглавных букв в стиле предложений и заголовков, является Международная организация по стандартизации (ISO). [ необходима цитата ]

Однако для заголовков публикаций общепринятой типографской практикой как среди британских [23], так и среди американских издателей является написание значимых слов с заглавной буквы (а в Соединенных Штатах это часто применяется и к заголовкам). Это семейство типографских соглашений обычно называется title case . Например, Oxford Manual of Style Р. М. Риттера (2002) предлагает писать с заглавной буквы «первое слово и все существительные, местоимения, прилагательные, глаголы и наречия, но, как правило, не артикли, союзы и краткие предлоги». [24] Это старая форма выделения , похожая на более современную практику использования более крупного или жирного шрифта для заголовков. Правила, которые предписывают, какие слова следует писать с заглавной буквы, не основаны на каком-либо грамматически присущем правильном-неправильном различии и не являются универсально стандартизированными; они различаются в разных руководствах по стилю, хотя большинство руководств по стилю, как правило, следуют нескольким строгим соглашениям, а именно:

Заглавный регистр широко используется во многих англоязычных публикациях, особенно в Соединенных Штатах. Однако его правила иногда не соблюдаются строго – особенно в неформальном письме.

В творческой типографике, например, на обложках музыкальных пластинок и других художественных материалах, обычно встречаются все стили, включая строчные буквы и особые стили, такие как studly caps (см. ниже). Например, в товарных знаках видеоигр нередко используются стилизованные заглавные буквы в начале и конце заголовка, а промежуточные буквы — в малых заглавных или строчных буквах (например, ArcaniA , ArmA и DmC ).

Многословные имена собственные

В официальном письменном английском языке имена собственные, состоящие из одного слова, пишутся с заглавной буквы, если только имя не стилизовано намеренно, чтобы нарушить это правило (например, ee cummings , bell hooks , eden ahbez и danah boyd ).

Многословные собственные имена включают названия организаций, изданий и людей. Часто к этим названиям применяются правила для «заглавного регистра» (описанные в предыдущем разделе), так что не начальные артикли, союзы и краткие предлоги пишутся строчными буквами, а все остальные слова — заглавными. Например, краткий предлог «of» и артикль «the» пишутся строчными буквами в «Steering Committee of the Finance Department». Обычно для формирования варианта аббревиатуры названия используются только заглавные слова, хотя в этом есть некоторые вариации.

С личными именами эта практика может варьироваться (иногда все слова пишутся с заглавной буквы, независимо от длины или функции), но не ограничивается английскими именами. Примерами служат английские имена Тамар Грузинская и Екатерина Великая , « van » и «der» в голландских именах , « von » и «zu» в немецких , «de», «los» и «y» в испанских именах , «de» или «d'» во французских именах и «ibn» в арабских именах .

Некоторые префиксы фамилий также влияют на заглавные буквы следующих внутренних букв или слов, например, «Mac» в кельтских именах и «Al» в арабских именах.

Обозначения единиц и префиксы в метрической системе

Из семи основных единиц СИ , «А» ( ампер для электрического тока ) и «К» ( кельвин для температуры ), оба названные в честь людей, всегда пишутся заглавными буквами, тогда как «с» ( секунда для времени ), «м» ( метр для длины ), «кг» ( килограмм для массы ), «кд» ( кандела для силы света ) и «моль» ( моль для количества вещества ) пишутся строчными буквами.

В Международной системе единиц (СИ) буква обычно имеет разные значения в верхнем и нижнем регистре, когда используется в качестве символа единицы. Обычно символы единиц пишутся строчными буквами, но если название единицы получено от имени собственного, первая буква символа пишется с заглавной буквы. Тем не менее, название единицы , если оно написано, всегда считается нарицательным и пишется соответственно строчными буквами. [26] Например:

Для ясности символ литра может быть написан заглавными буквами, даже если название не является производным от имени собственного. [26] Например, «один литр» может быть записан как:

Регистр букв префиксного символа определяется независимо от символа единицы, к которому он присоединен. Нижний регистр используется для всех дольных префиксных символов и малых кратных префиксных символов до "k" (для кило , что означает множитель 10 3 = 1000), тогда как верхний регистр используется для больших множителей: [26]

Использование в языках программирования

Некоторые стили падежей не используются в стандартном английском языке, но распространены в компьютерном программировании , брендинге продукции и других специализированных областях.

Использование происходит от того, как языки программирования анализируются программно. Они обычно разделяют свои синтаксические токены простыми пробелами , включая символы пробела , табуляции и новой строки . Когда токены, такие как имена функций и переменных, начинают множиться в сложной разработке программного обеспечения , и все еще есть необходимость сохранить исходный код понятным для человека, соглашения об именовании делают это возможным. Так, например, функция, имеющая дело с умножением матриц, может формально называться:

В каждом случае заглавные буквы или их отсутствие поддерживают разные функции. В первом случае совместимость с FORTRAN требует нечувствительного к регистру именования и коротких имен функций. Во втором случае поддерживаются легко различимые имена и типы функций и аргументов в контексте императивного, строго типизированного языка. В третьем случае поддерживаются макровозможности LISP и его тенденция рассматривать программы и данные минималистично и как взаимозаменяемые. Четвертая идиома требует гораздо меньше синтаксического сахара в целом, поскольку большая часть семантики подразумевается, но из-за своей краткости и, таким образом, отсутствия необходимости в заглавных буквах или многосоставных словах вообще может также сделать код слишком абстрактным и перегруженным для понимания обычным программистом.

Понятно, что такие соглашения о кодировании весьма субъективны и могут привести к довольно субъективным дебатам, например, в случае войны редакторов или споров о стиле отступа . Заглавные буквы не являются исключением.

Дело верблюда

"theQuickBrownFoxJumpsOverTheLazyDog" или "TheQuickBrownFoxJumpsOverTheLazyDog"

Пробелы и знаки препинания удаляются, а первая буква каждого слова пишется с заглавной буквы. Если это включает первую букву первого слова (CamelCase, " PowerPoint ", "TheQuick..." и т. д.), такой регистр иногда называют заглавным верблюжьим регистром (или, в качестве иллюстрации, CamelCase ), регистром Паскаля в отношении языка программирования Паскаль [28] или бугристым регистром .

Когда первая буква первого слова строчная (« iPod », « eBay », «theQuickBrownFox...»), такой регистр обычно называют нижним верблюжьим или дромадерным (например: dromedaryCase ). Этот формат стал популярным в брендинге продуктов и услуг в сфере информационных технологий , с начальной «i», означающей « Интернет » или «интеллектуальный», [ требуется цитата ] как в iPod , или начальной «e», означающей «электронный», как в email (электронная почта) или e-commerce (электронная коммерция).

Дело о змее

"быстрая_коричневая_лиса_перепрыгивает_через_ленивую_собаку"

Пунктуация удаляется, а пробелы заменяются одинарными подчеркиваниями . Обычно буквы имеют одинаковый регистр (например, "UPPER_CASE_EMBEDDED_UNDERSCORE" или "lower_case_embedded_underscore"), но регистр может быть смешанным, как в конструкторах вариантов OCaml (например, "Upper_then_lowercase"). [29] Стиль также может называться pothole case , особенно в программировании на Python , в котором это соглашение часто используется для именования переменных. Иллюстративно, он может отображаться как snake_case , pothole_case и т. д. Когда все заглавные буквы, он может называться screaming snake case (или SCREAMING_SNAKE_CASE ) или hazard case . [30]

Дело о кебаб

"быстрая-коричневая-лиса-перепрыгивает-через-ленивую-собаку"

Подобно случаю змеи, указанному выше, за исключением того, что вместо пробелов используются дефисы , а не подчеркивания. Он также известен как случай спины , случай параметров , случай Лиспа в отношении языка программирования Лисп или случай тире (или, в качестве иллюстрации, как случай кебаба , похожий на шампур, который протыкает кебаб ). Если каждое слово пишется с заглавной буквы, стиль называется случай поезда ( TRAIN-CASE ). [31]

В CSS все имена свойств и большинство значений ключевых слов в основном форматируются в кебабном регистре.

Колпачки Studly

"tHeqUicKBROWNFoXJUMPSOWERTHElAzydOG"

Смешанный регистр без семантического или синтаксического значения использования заглавных букв. Иногда заглавными являются только гласные , в других случаях заглавные и строчные буквы чередуются, но часто это просто случайность. Название происходит от саркастического или иронического намека на то, что оно использовалось в попытке автора выразить свою собственную крутость (studliness). [ требуется ссылка ] Оно также используется для насмешки над нарушением стандартных английских правил регистра маркетологами при наименовании пакетов компьютерного программного обеспечения, даже если для этого нет технических требований — например, наименование оконной системы Sun Microsystems NeWS . Иллюстративное наименование стиля, естественно, случайно: stUdlY capAps , StUdLy CaPs и т. д.

Складывание и переделка кейса

В наборах символов, разработанных для вычислений , каждая заглавная и строчная буква кодируется как отдельный символ. Чтобы включить сворачивание и преобразование регистра, программное обеспечение должно связать вместе два символа, представляющих варианты регистра буквы. (Некоторые старые системы кодирования символов, такие как код Бодо , ограничены одним набором букв, обычно представленных вариантами в верхнем регистре.)

Можно сказать, что операции , нечувствительные к регистру , сворачивают регистр, исходя из идеи сворачивания таблицы кодов символов так, чтобы заглавные и строчные буквы совпадали. Преобразование регистра букв в строке является обычной практикой в ​​компьютерных приложениях, например, для выполнения сравнений без учета регистра. Многие языки программирования высокого уровня предоставляют простые методы для преобразования регистра, по крайней мере для набора символов ASCII .

То, считаются ли варианты регистра эквивалентными друг другу, зависит от компьютерной системы и контекста. Например, пароли пользователей , как правило, чувствительны к регистру, чтобы обеспечить большее разнообразие и сделать их более сложными для взлома. Напротив, регистр часто игнорируется при поиске ключевых слов , чтобы игнорировать незначительные изменения в капитализации ключевых слов как в запросах, так и в запрашиваемом материале.

Сворачивание регистра Unicode и идентификация сценариев

Unicode определяет фолдинг регистра через три свойства отображения регистра каждого символа : верхний регистр, нижний регистр и заглавный регистр (в этом контексте «заглавный регистр» относится к лигатурам и диграфам, закодированным как смешанные одиночные символы , в которых первый компонент находится в верхнем регистре, а второй компонент — в нижнем). [32] Эти свойства связывают все символы в письменностях с различными регистрами с другими вариантами регистра символа.

Как кратко обсуждается в Техническом примечании Unicode № 26, [33] «С точки зрения проблем реализации любая попытка объединения латиницы, греческого и кириллицы посеет хаос [и] превратит операции с регистром в невообразимый беспорядок, фактически делая все операции с регистром контекстно-зависимыми […]». Другими словами, в то время как формы букв, таких как A , B , E , H , K , M , O , P , T , X , Y и так далее, являются общими для латинского, греческого и кириллического алфавитов (и небольшие различия в их канонических формах можно считать чисто типографскими ), для многоязычного набора символов или шрифта все равно было бы проблематично предоставить только одну кодовую точку , скажем, для заглавной буквы B , поскольку это сделало бы довольно сложным для текстового процессора изменение этой единственной заглавной буквы на один из трех различных вариантов для строчной буквы, латинской b (U+0062), греческой β (U+03B2) или кириллической в ​​(U+0432). Поэтому соответствующие латинские, греческие и кириллические заглавные буквы (U+0042, U+0392 и U+0412 соответственно) также кодируются как отдельные символы, несмотря на то, что их внешний вид идентичен. Без учета регистра букв «единый европейский алфавит» — такой как ABБCГDΔΕЄЗFΦGHIИJ ... Z , с соответствующим подмножеством для каждого языка — возможен; но если учесть регистр букв, становится совершенно ясно, что эти алфавиты представляют собой довольно разные наборы символов.

Методы обработки текста

Большинство современных текстовых процессоров обеспечивают автоматическое преобразование регистра простым щелчком или нажатием клавиши. Например, в Microsoft Office Word есть диалоговое окно для переключения выделенного текста с ЗАГЛАВНОГО на строчный, затем на Заглавный регистр (фактически начинаются с заглавных букв; слова-исключения должны быть переведены в нижний регистр по отдельности). Нажатие клавиши ⇧ Shift+ F3делает то же самое.

Методы программирования

В некоторых формах BASIC существует два метода преобразования регистра:

UpperA$ = UCASE$ ( «a» ) LowerA$ = LCASE$ ( «A» )    

C и C++ , а также любой C-подобный язык, соответствующий своей стандартной библиотеке , предоставляют следующие функции в файле ctype.h :

char upperA = toupper ( 'a' ); char lowerA = tolower ( 'A' );      

Преобразование регистра отличается в зависимости от набора символов . В ASCII или EBCDIC регистр может быть преобразован следующим образом на языке C:

int toupper ( int c ) { return islower ( c ) ? c 'a' + 'A' : c ; } int tolower ( int c ) { return isupper ( c ) ? c 'A' + 'a' : c ; }                            

Это работает только потому, что буквы верхнего и нижнего регистра расположены на одинаковом расстоянии друг от друга. В ASCII они последовательны, тогда как в EBCDIC — нет; тем не менее, заглавные буквы расположены по той же схеме и с теми же промежутками, что и строчные буквы, так что этот метод все еще работает.

Некоторые языки программирования предлагают возможности для преобразования текста в форму, в которой все слова пишутся с заглавной буквы. Visual Basic называет это «правильным регистром»; Python называет это «заглавным регистром». Это отличается от обычных соглашений о регистре заголовков , таких как английское соглашение, в котором второстепенные слова не пишутся с заглавной буквы.

История

Первоначально алфавиты писались полностью маюскульными буквами, расположенными между четко определенными верхней и нижней границами. При быстром письме пером они , как правило, принимали более округлые и гораздо более простые формы. Именно из них развились первые минускульные почерки, полуунциалы и курсивный минускул, которые больше не оставались связанными между парой строк. [34] Они, в свою очередь, легли в основу каролингского минускульного письма, разработанного Алкуином для использования при дворе Карла Великого , которое быстро распространилось по всей Европе. Преимущество минускула над маюскулом заключалось в улучшении, более быстрой читаемости. [ необходима цитата ]

На латыни были найдены папирусы из Геркуланума, датируемые до 79 г. н. э. (когда он был разрушен), написанные старым римским курсивом , где ранние формы минускульных букв «d», «h» и «r», например, уже можно распознать. По словам папиролога Кнута Клеве , «теория о том, что строчные буквы были разработаны из унциалов пятого века и каролингских минускулов девятого века, кажется неверной». [35] Существовали как маюскульные, так и минускульные буквы, но разница между этими двумя вариантами изначально была стилистической, а не орфографической, и система письма по-прежнему была в основном однопалатной: в рукописном документе мог использоваться либо один стиль, либо другой, но они не смешивались. Европейские языки, за исключением древнегреческого и латыни, не делали различий по регистру до примерно 1300 года. [ необходима цитата ]

Хронологию развития письменности в Западной Европе можно разделить на четыре эпохи: [ необходима цитата ]

Традиционно некоторые буквы передавались по-разному в соответствии с набором правил. В частности, те буквы, которые начинали предложения или существительные, делались крупнее и часто писались особым шрифтом. До начала 18 века не существовало фиксированной системы заглавных букв. Английский язык в конечном итоге отказался от этого правила для существительных, в то время как немецкий язык сохранил его.

Похожие изменения произошли и в других алфавитах. Строчное письмо для греческого алфавита берет свое начало в VII веке и приобрело свою четырехлинейную форму (то есть, характеризующуюся выносными и нисходящими элементами) [36] в VIII веке. Со временем в письмо все больше вмешивались унциальные формы букв. Самый ранний датированный греческий строчный текст — это Успенское Евангелие (MS 461) в 835 году. [37] Современная практика написания заглавной первой буквы каждого предложения, по-видимому, была импортирована (и редко используется при печати древнегреческих материалов даже сегодня). [ необходима цитата ]

Упрощенные отношения между различными шрифтами привели к развитию современных строчных букв стандартного латинского алфавита и современных вариантов Fraktur (использовался в Германии до 1940-х годов ) и гэльского (использовался в Ирландии). Сосуществовало несколько шрифтов, таких как полуунциал и унциал , которые произошли от римского курсива и греческого унциала , а также вестготский , меровингский (вариант Люксёй здесь) и беневентанский . Каролингский шрифт стал основой для готического письма и гуманистического минускула . ​​То, что обычно называют «готическим письмом», технически называется готическим письмом (здесь textualis quadrata ) и совершенно не связано с вестготским письмом. Буква j — это i с росчерком , u и v — это одна и та же буква в ранних шрифтах, и они использовались в зависимости от их положения в островном полуунциале и каролинском минускуле, а также в более поздних шрифтах, w — лигатура vv, в островном шрифте руна wynn используется как aw (три другие используемые руны — thorn (þ), ʻféʼ (ᚠ) как сокращение для крупного рогатого скота/товаров и maðr (ᛘ) для человека). Буквы y и z использовались очень редко, в частности, þ писалась идентично y, поэтому y ставилась с точкой, чтобы избежать путаницы, точка была принята для i только после позднего каролинского (протоготического) шрифта, в беневентанском шрифте сокращение макрон имело точку над собой. Утраченные варианты, такие как r rotunda , лигатуры и знаки сокращения писцов опущены; Длинная s отображается, когда в данном письме не сохранилось ни одной конечной s (единственный вариант, используемый сегодня). Гуманистическое письмо было основой для венецианских шрифтов , которые мало изменились до наших дней, таких как Times New Roman ( шрифт с засечками ).

Тип корпуса

Отдельные шрифтовые блоки, используемые при ручном наборе, хранятся в неглубоких деревянных или металлических ящиках, известных как « шрифтовые шкафы ». Каждый из них подразделяется на ряд отсеков («коробок») для хранения различных отдельных букв. [ необходима цитата ]

В Оксфордском универсальном словаре исторических передовых пропорциональных принципов (переизданном в 1952 году) указано, что термин «регистр» в этом смысле (относящийся к рамке или ящику, используемому наборщиком в печатном деле) впервые был использован в английском языке в 1588 году. Первоначально для каждой гарнитуры шрифта использовался один большой регистр, затем в регионе современной Бельгии к 1563 году были введены «разделенные регистры» — пары регистров для прописных и минускульных букв, к 1588 году в Англии и до 1723 года во Франции.

Термины верхний и нижний регистр происходят от этого разделения. По соглашению, когда два корпуса были вынуты из стойки для хранения и помещены на стойку на столе наборщика , корпус с заглавными и строчными буквами стоял под более крутым углом к ​​задней части стола, а корпус для строчных букв, знаков препинания и пробелов был более доступен под более пологим углом к ​​передней части стола, отсюда верхний и нижний регистр. [38]

Хотя в англоязычных странах и многих европейских странах в XVII веке использовались пары падежей, в Германии и Скандинавии продолжал использоваться один падеж. [38]

Доступны различные образцы корпусов, часто с отделениями для строчных букв, различающимися по размеру в зависимости от частоты использования букв, так что самые распространенные буквы группируются вместе в более крупных коробках в центре корпуса. [38] Наборщик берет блоки букв из отделений и помещает их в наборную палочку , работая слева направо и размещая буквы вверх ногами, зарубкой вверх, затем устанавливает собранный шрифт в гранку . [38]

Смотрите также

Примечания

  1. В Roman Antiqua или других вертикальных шрифтах несуществующая длинная s (ſ) была бы выносным элементом; однако в курсиве это была бы одна из двух букв в английском алфавите (и большинстве других алфавитов с латинским шрифтом ), имеющих как выносной, так и подстрочный элемент, вторая — f . [7]

Ссылки

  1. ^ "The School's Manual of Style". Джонс Хопкинс, Школа общественного здравоохранения Блумберга . Получено 9 ноября 2018 г.
  2. ^ Хансард, Томас Керсон (1825). Typographia, an Historical Sketch of the Origin and Progress of the Art of Printing. С. 408, 4806. Получено 12 августа 2015 г.
  3. ^ Марк Дрогин (1980). Средневековая каллиграфия: ее история и техника. Courier Corporation. стр. 37. ISBN 9780486261423.
  4. ^ Музей истории Сакраменто. Вы когда-нибудь задумывались, откуда взялись заглавные и строчные буквы?.
  5. ^ Чарльтон Т. Льюис (1890). «Minusculus». Элементарный латинский словарь . Нью-Йорк, Цинциннати и Чикаго: American Book Company.
  6. Американский словарь наследия английского языка (4-е изд.). Бостон и Нью-Йорк: Houghton Mifflin. 2000. ISBN 978-0-395-82517-4.
  7. ^ Несбитт, Александр (1957). История и техника письма (1-е изд.). Нью-Йорк: Dover Publications. ISBN 0-486-20427-8.
  8. ^ Бржезина, Дэвид (2012), Проблемы многоязычного дизайна шрифтов , стр. 14 – через кафедру типографики и дизайна Университета Рединга
  9. ^ ab Деннис Оливер. "Использование заглавных букв (#1)". Dave's ESL Cafe . Получено 19 февраля 2017 г.
  10. ^ Нэнси Эдмондс Хансон (25 августа 2008 г.). «Стиль AP: вежливость и профессиональные титулы». Университет штата Миннесота . Архивировано из оригинала 1 декабря 2016 г. Получено 19 февраля 2017 г.
  11. ^ "Capitalizing Titles of People". English Plus . 1997–2006 . Получено 19 февраля 2017 г.
  12. ^ "Capitalization". The Chicago Manual of Style Online . Получено 19 февраля 2017 г.
  13. ^ "Citing Sources: Capitalization and Personal Names in Foreign Languages". Библиотека Вайднера-Шпара . Дикинсон . Получено 30 марта 2017 г.
  14. ^ См. Гютерт, Керстин (2017), PRESSEMITTEILUNG 29.6.2017 Amtliches Regelwerk der deutschen Rechtschreibung aktualisiert (PDF) , Совет по немецкой орфографии , стр. 1 , получено 29 июня 2017 г..
  15. ^ "Эйсланд / Эйсланд" . Таалуни . Проверено 9 марта 2014 г.
  16. ^ "Latin Extended-B" (PDF) . Unicode. U+01C4, U+01C5, U+01C6, U+01C7, U+01C8, U+01C9, U+01CA, U+01CB, U+01CC . Получено 5 февраля 2017 г. .
  17. ^ «Почему я пишу Hawai'i, а не Hawaii, и почему вы должны так же». Blond Voyage . Получено 6 августа 2017 г.
  18. ^ "Hawaiian Language Online". Гавайский университет . Получено 6 августа 2017 г.
  19. ^ "Буквы-модификаторы интервалов" (PDF) . Unicode. U+02BB . Получено 6 августа 2017 г. .
  20. ^ "'Ōlelo Hawai'i в WWW: AKA, How To Give Good 'Okina". KeolaDonaghy.com . Архивировано из оригинала 6 августа 2017 г. . Получено 6 августа 2017 г. .
  21. ^ RFC 1855 «Руководство по сетевому этикету»
  22. ^ "Зарегистрированные функции – определения и реализации". Реестр тегов OpenType Layout . Microsoft. Тег: 'pcap', Тег: 'smcp' . Получено 24 марта 2017 г.
  23. ^ "The Guardian and Observer Style Guide". TheGuardian.com . Получено 10 июня 2014 г.
  24. ^ RM Ritter, ред. (2002). Oxford Manual of Style . Oxford University Press .
  25. ^ Каррин Бердин. «Что писать с заглавной буквы в названии». AdminSecret . Получено 23 февраля 2014 г.
  26. ^ abc Bureau International des Poids et Mesures (2006). «Международная система единиц» (PDF) . Межправительственная организация по метрической конвенции. стр. 121, 130–131 . Проверено 12 января 2014 г.
  27. ^ "Letterlike symbols". Charts (Beta) . Unicode Consortium . Получено 28 июля 2017 г. .
  28. ^ «История вокруг регистров Pascal и Camel». 3 февраля 2004 г.
  29. ^ "Руководство по программированию Caml". caml.inria.fr . Получено 2017-03-31 .
  30. ^ "Ruby Style Guide". GitHub . Получено 11 ноября 2013 г.
  31. ^ "Programming naming conventions". Pluralsight . 15 января 2023 г. 11. Train case . Получено 16 ноября 2024 г.
  32. ^ "Свойства символов, сопоставления регистров и часто задаваемые вопросы о именах". Unicode . Получено 19 февраля 2017 г. .
  33. ^ "Техническое примечание Unicode № 26: О кодировании латиницы, греческого, кириллицы и ханьского алфавита" . Получено 23 апреля 2007 г.
  34. ^ Дэвид Харрис (2003). Библия каллиграфа . Hauppauge, NY: Barron's. ISBN 0-7641-5615-2.
  35. ^ Кнут Клеве (1994). «Латинские папирусы в Геркулануме». Труды 20-го Международного конгресса папирологов, Копенгаген, 23–29 августа 1992 г. Копенгаген: Museum Tusculanum Press.
  36. ^ "Римские системы письма – средневековые рукописи" . Получено 2019-07-03 .
  37. Самая ранняя известная библейская рукопись — палимпсест Исайи на сирийском языке, написанный в 459/460 г. Брюс М. Мецгер и Барт Д. Эрман , Текст Нового Завета ( Oxford University Press : 2005), стр. 92.
  38. ^ abcd Дэвид Болтон (1997). "Type Cases". The Alembic Press. Архивировано из оригинала 16 июля 2007 года . Получено 23 апреля 2007 года .

Дальнейшее чтение