Базовый латинский алфавит ISO

Базовый латинский алфавит ISO — это международный стандарт (начиная с ISO/IEC 646 ) для алфавита латинского алфавита , который состоит из двух наборов ( прописных и строчных) из 26 букв, кодифицированных в ^[1] различных национальных и международных стандартах и широко используемых. в международном общении . Это те же самые буквы, которые составляют нынешний английский алфавит . Со времен средневековья это также те же буквы современного латинского алфавита . Порядок также важен для сортировки слов в алфавитном порядке .

Два набора содержат по 26 букв каждый: ^[1]

История

К 1960-м годам в компьютерной и телекоммуникационной отраслях стран Первого мира стало очевидно , что необходим непатентованный метод кодирования символов. Международная организация по стандартизации (ISO) инкапсулировала латинский алфавит в свой ( ISO/IEC 646 ) 7-битный стандарт кодировки символов. Чтобы добиться широкого признания, эта инкапсуляция была основана на популярном использовании. Стандарт был основан на уже опубликованном американском стандартном коде обмена информацией , более известном как ASCII , который включал в набор символов 26×2 буквы английского алфавита . Более поздние стандарты, выпущенные ISO, например ISO/IEC 8859 (8-битная кодировка символов) и ISO/IEC 10646 ( Unicode Latin ), продолжают определять буквы английского алфавита размером 26 × 2 как базовый латинский алфавит с расширениями. для обработки других букв на других языках. ^[1]

Терминология

Блок Unicode , содержащий алфавит, называется « C0 Controls and Basic Latin ». Существует два подзаголовка: ^[2]

«Прописной латинский алфавит»: буквы начинаются с U + 0041 и в своих описаниях содержат строку ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
«Строчный латинский алфавит»: буквы начинаются с U+0061 и в своих описаниях содержат строку LATIN SMALL LETTER.

В блоке «Формы половинной и полной ширины» есть еще два набора : ^[3]

Прописные буквы: буквы начинаются с U+FF21 и в своих описаниях содержат строку ПОЛНАЯ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
Нижний регистр: буквы начинаются с U+FF41 и в своих описаниях содержат строку FULLWIDTH LATIN SMALL LETTER.

Хронология стандартов кодирования

1865 г. Международный код Морзе был стандартизирован на Международном телеграфном конгрессе в Париже, а позже стал стандартом Международного союза электросвязи (ITU).
Орфографический алфавит радиотелефонии 1950-х годов , разработанный ИКАО ^[4]

Хронология широко используемых компьютерных кодов, поддерживающих алфавит

1963: ASCII (стандарт 7-битной кодировки символов Американской ассоциации стандартов , которая в 1969 году стала Американским национальным институтом стандартов ).
1963/1964: EBCDIC (разработан IBM и поддерживает те же буквенные символы, что и ASCII, но с другими значениями кода)
1965-04-30: Ратифицирован ECMA как ECMA-6 ^[5] на основе работы Технического комитета TC1 ECMA, проведенной с декабря 1960 года. ^[5]
1972: ISO 646 ( стандарт 7-битной кодировки символов ISO , использующий те же значения буквенного кода, что и ASCII, пересмотренный во втором издании ISO 646:1983 и третьем издании ISO/IEC 646:1991 в качестве совместного стандарта ISO/IEC )
1983: Рек. МСЭ-Т. Т.51 | ISO/IEC 6937 (многобайтовое расширение ASCII)
1987: ISO/IEC 8859-1 :1987 (8-битная кодировка символов).
- Впоследствии были опубликованы другие версии и части ISO/IEC 8859.
Середина-конец 1980-х: Windows-1250 , Windows-1252 и другие кодировки, используемые в Microsoft Windows (некоторые из них примерно похожи на ISO/IEC 8859-1).
1990: Unicode 1.0 (разработан Консорциумом Unicode ), ^[6]^[7] содержится в блоке « C0 Controls and Basic Latin » с использованием тех же значений буквенного кода, что и ASCII и ISO/IEC 646.
- Впоследствии были опубликованы другие версии Unicode, и позже он также стал совместным стандартом ISO/IEC , как указано ниже.
1993: ISO/IEC 10646-1 :1993, стандарт ISO/IEC для символов в Юникоде 1.1.
- Впоследствии были опубликованы другие версии ISO/IEC 10646-1 и одна версия ISO/IEC 10646-2. С 2003 года стандарты публикуются под названием «ISO/IEC 10646» без разделения на две части.
1997: Список глифов Windows 4

Представление

Прописные буквы основного латинского алфавита ISO на 16-сегментном дисплее (плюс арабские цифры ).

В ASCII буквы относятся к печатным символам , а в Юникоде, начиная с версии 1.0, они относятся к блоку « Элементы управления C0 и базовая латиница ». В обоих случаях, а также в ISO/IEC 646 , ISO/IEC 8859 и ISO/IEC 10646 они занимают позиции в шестнадцатеричной системе счисления от 41 до 5A для верхнего регистра и от 61 до 7A для нижнего регистра.

Не чувствителен к регистру, все буквы имеют кодовые слова в орфографическом алфавите ИКАО и могут быть представлены азбукой Морзе .

Применение

Все строчные буквы используются в Международном фонетическом алфавите (IPA). В X-SAMPA и SAMPA эти буквы имеют то же звуковое значение, что и в IPA.

Алфавиты, содержащие одинаковый набор букв

В список ниже включены только алфавиты, в которых отсутствуют :

буквы, диакритические знаки которых делают их отдельными буквами.
мультиграфы , состоящие из отдельных букв.
лигатуры , которые представляют собой отдельные буквы

Заметные упущения из-за этих правил включают испанский , эсперанто , филиппинский и немецкий языки . Иногда по традиции считается, что немецкий алфавит содержит только 26 букв (при этом ä, ö, ü считаются вариантами, а ß считается лигатурой), но текущие немецкие орфографические правила включают ä, ö, ü, ß в алфавите, расположенном после Z; однако этот порядок обычно не используется при сопоставлении: обычно ä, ö, ü сопоставляются как a, o, u (или иногда как ae, oe, ue), ß как ss.

* Созданные языки

Английский — один из немногих современных европейских языков, не требующих диакритических знаков для родных слов (хотя некоторые американские издатели используют диакритику в таких словах, как « сотрудничество »). ^[с]^[9]
Интерлингва , искусственный язык, никогда не использует диакритические знаки, за исключением неассимилированных заимствованных слов. Однако их можно удалить, если они не используются для изменения гласной (например, cafe , от французского : cafe ). ^[10]
Latino sine flexione , также известный как «Интерлингва Пеано», позволяет, но не требует размещения акцента для необычного ударения . (Он предшествует другому «Интерлингва» примерно на четыре десятилетия.)
Малайский и индонезийский (основанный на малайском языке) — единственные языки за пределами Европы, в которых используется весь латинский алфавит и не требуются диакритические знаки и лигатуры. ^[d] Многие из более чем 700 языков Индонезии также используют индонезийский алфавит для написания своих языков: некоторые, например яванский , добавляют диакритические знаки é и è, а некоторые опускают q, x и z.

Нумерация столбцов

Римский (латинский) алфавит обычно используется для нумерации столбцов в таблице или диаграмме. Это позволяет избежать путаницы с номерами строк, использующими арабские цифры . Например, таблица 3х3 будет содержать столбцы A, B и C, сопоставленные со строками 1, 2 и 3. Если необходимо больше столбцов, чем Z (обычно это последняя буква алфавита), столбец немедленно после Z идет AA, за ним следует AB и так далее (см. биективную систему с основанием 26 ). Это можно увидеть, прокрутив вправо в программе для работы с электронными таблицами, такой как Microsoft Excel или LibreOffice Calc .

Это двузначные «буквы» для столбцов таблицы, точно так же, как числа от 10 до 99 являются двузначными числами. Греческий алфавит имеет аналогичную расширенную форму, в которой при необходимости используются такие двузначные буквы, но он используется для глав братства, а не для столбцов таблицы.

Такими двузначными буквами для пунктов списка являются AA, BB, CC и т. д., в отличие от числовой системы разрядов, описанной выше для столбцов таблицы.

Смотрите также

Еврейский алфавит
Греческий алфавит
Латинский алфавит
- Латинский алфавит для звукового соответствия.
- Список алфавитов латинского алфавита
Ранняя кириллица , Кириллические алфавиты
Кодовые страницы Windows

Примечания

^ Традиционно считается, что итальянский алфавит состоит только из 21 буквы, не считая j , k , w , x , y . Однако на практике эти буквы встречаются во многих заимствованных словах. J также встречается в некоторых коренных итальянских именах собственных как вариант полугласного написания i .
^ Примечание для португальского языка: k и y (но не w ) были частью алфавита до нескольких реформ орфографии в 20 веке, целью которых было изменить этимологическое португальское написание на более простое фонетическое написание. Эти буквы были заменены другими буквами, имеющими то же звучание: так Psychologia стала psicologia , kioske стала quiosque , martyr стала mártir и т. д. В настоящее время k , w и y встречаются только в иностранных словах и производных от них терминах, а также в научных сокращениях (например, k, w и y). км , байронизм ). Эти буквы снова считаются частью алфавита после Орфографического соглашения на португальском языке 1990 года , которое вступило в силу 1 января 2009 года в Бразилии. См. Реформы португальской орфографии .
^ В качестве примера статьи, содержащей диарезис в слове «сотрудничать», а также акценты на заимствованных словах в английском языке, таких как седиль в слове «фасады» и циркумфлекс в слове «креп», см. Графтон, Энтони (23 октября). , 2006). «Книги: Чокнутые профессора, История академической харизмы». Житель Нью-Йорка .
^ Однако в учебных материалах на малайском и индонезийском языках может использоваться ⟨é⟩ (E с акутом) для уточнения произношения буквы E; в этом случае ⟨e⟩ произносится /ə/, тогда как ⟨é⟩ произносится /e/, а (è) произносится /ɛ/.