К 1960-м годам в компьютерной и телекоммуникационной отраслях стран Первого мира стало очевидно , что необходим непатентованный метод кодирования символов. Международная организация по стандартизации (ISO) инкапсулировала латинский алфавит в свой ( ISO/IEC 646 ) 7-битный стандарт кодировки символов. Чтобы добиться широкого признания, эта инкапсуляция была основана на популярном использовании. Стандарт был основан на уже опубликованном американском стандартном коде обмена информацией , более известном как ASCII , который включал в набор символов 26×2 буквы английского алфавита . Более поздние стандарты, выпущенные ISO, например ISO/IEC 8859 (8-битная кодировка символов) и ISO/IEC 10646 ( Unicode Latin ), продолжают определять буквы английского алфавита размером 26 × 2 как базовый латинский алфавит с расширениями. для обработки других букв на других языках. [1]
Прописные буквы: буквы начинаются с U+FF21 и в своих описаниях содержат строку ПОЛНАЯ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
Нижний регистр: буквы начинаются с U+FF41 и в своих описаниях содержат строку FULLWIDTH LATIN SMALL LETTER.
Хронология стандартов кодирования
1865 г. Международный код Морзе был стандартизирован на Международном телеграфном конгрессе в Париже, а позже стал стандартом Международного союза электросвязи (ITU).
1963/1964: EBCDIC (разработан IBM и поддерживает те же буквенные символы, что и ASCII, но с другими значениями кода)
1965-04-30: Ратифицирован ECMA как ECMA-6 [5] на основе работы Технического комитета TC1 ECMA, проведенной с декабря 1960 года. [5]
1972: ISO 646 ( стандарт 7-битной кодировки символов ISO , использующий те же значения буквенного кода, что и ASCII, пересмотренный во втором издании ISO 646:1983 и третьем издании ISO/IEC 646:1991 в качестве совместного стандарта ISO/IEC )
1983: Рек. МСЭ-Т. Т.51 | ISO/IEC 6937 (многобайтовое расширение ASCII)
1990: Unicode 1.0 (разработан Консорциумом Unicode ), [6] [7] содержится в блоке « C0 Controls and Basic Latin » с использованием тех же значений буквенного кода, что и ASCII и ISO/IEC 646.
Впоследствии были опубликованы другие версии Unicode, и позже он также стал совместным стандартом ISO/IEC , как указано ниже.
1993: ISO/IEC 10646-1 :1993, стандарт ISO/IEC для символов в Юникоде 1.1.
Впоследствии были опубликованы другие версии ISO/IEC 10646-1 и одна версия ISO/IEC 10646-2. С 2003 года стандарты публикуются под названием «ISO/IEC 10646» без разделения на две части.
лигатуры , которые представляют собой отдельные буквы
Заметные упущения из-за этих правил включают испанский , эсперанто , филиппинский и немецкий языки . Иногда по традиции считается, что немецкий алфавит содержит только 26 букв (при этом ä, ö, ü считаются вариантами, а ß считается лигатурой), но текущие немецкие орфографические правила включают ä, ö, ü, ß в алфавите, расположенном после Z; однако этот порядок обычно не используется при сопоставлении: обычно ä, ö, ü сопоставляются как a, o, u (или иногда как ae, oe, ue), ß как ss.
* Созданные языки
Английский — один из немногих современных европейских языков, не требующих диакритических знаков для родных слов (хотя некоторые американские издатели используют диакритику в таких словах, как « сотрудничество »). [с] [9]
Интерлингва , искусственный язык, никогда не использует диакритические знаки, за исключением неассимилированных заимствованных слов. Однако их можно удалить, если они не используются для изменения гласной (например, cafe , от французского : cafe ). [10]
Малайский и индонезийский (основанный на малайском языке) — единственные языки за пределами Европы, в которых используется весь латинский алфавит и не требуются диакритические знаки и лигатуры. [d] Многие из более чем 700 языков Индонезии также используют индонезийский алфавит для написания своих языков: некоторые, например яванский , добавляют диакритические знаки é и è, а некоторые опускают q, x и z.
Нумерация столбцов
Римский (латинский) алфавит обычно используется для нумерации столбцов в таблице или диаграмме. Это позволяет избежать путаницы с номерами строк, использующими арабские цифры . Например, таблица 3х3 будет содержать столбцы A, B и C, сопоставленные со строками 1, 2 и 3. Если необходимо больше столбцов, чем Z (обычно это последняя буква алфавита), столбец немедленно после Z идет AA, за ним следует AB и так далее (см. биективную систему с основанием 26 ). Это можно увидеть, прокрутив вправо в программе для работы с электронными таблицами, такой как Microsoft Excel или LibreOffice Calc .
Это двузначные «буквы» для столбцов таблицы, точно так же, как числа от 10 до 99 являются двузначными числами. Греческий алфавит имеет аналогичную расширенную форму, в которой при необходимости используются такие двузначные буквы, но он используется для глав братства, а не для столбцов таблицы.
Такими двузначными буквами для пунктов списка являются AA, BB, CC и т. д., в отличие от числовой системы разрядов, описанной выше для столбцов таблицы.
^ Традиционно считается, что итальянский алфавит состоит только из 21 буквы, не считая j , k , w , x , y . Однако на практике эти буквы встречаются во многих заимствованных словах. J также встречается в некоторых коренных итальянских именах собственных как вариант полугласного написания i .
^ Примечание для португальского языка: k и y (но не w ) были частью алфавита до нескольких реформ орфографии в 20 веке, целью которых было изменить этимологическое португальское написание на более простое фонетическое написание. Эти буквы были заменены другими буквами, имеющими то же звучание: так Psychologia стала psicologia , kioske стала quiosque , martyr стала mártir и т. д. В настоящее время k , w и y встречаются только в иностранных словах и производных от них терминах, а также в научных сокращениях (например, k, w и y). км , байронизм ). Эти буквы снова считаются частью алфавита после Орфографического соглашения на португальском языке 1990 года , которое вступило в силу 1 января 2009 года в Бразилии. См. Реформы португальской орфографии .
^ В качестве примера статьи, содержащей диарезис в слове «сотрудничать», а также акценты на заимствованных словах в английском языке, таких как седиль в слове «фасады» и циркумфлекс в слове «креп», см. Графтон, Энтони (23 октября). , 2006). «Книги: Чокнутые профессора, История академической харизмы». Житель Нью-Йорка .
^ Однако в учебных материалах на малайском и индонезийском языках может использоваться ⟨é⟩ (E с акутом) для уточнения произношения буквы E; в этом случае ⟨e⟩ произносится /ə/, тогда как ⟨é⟩ произносится /e/, а (è) произносится /ɛ/.
Рекомендации
^ abc «Интернационализация стандартизации 7-битных кодов, ISO 646». Трансъевропейская ассоциация исследовательских и образовательных сетей (TERENA) . Проверено 3 октября 2010 г.
^ «Элементы управления C0 и базовая латиница» (PDF) . Юникод.орг . Проверено 8 августа 2016 г.
^ «Формы половинной и полной ширины» (PDF) . Юникод.орг . Проверено 8 августа 2016 г.
^ «Почтовая история ИКАО». www.icao.int . Архивировано из оригинала 12 февраля 2019 года . Проверено 17 февраля 2019 г.
^ ab Стандарт ECMA-6: 7-битный набор кодированных символов (PDF) (5-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Март 1985 г. Архивировано из оригинала (PDF) 29 мая 2016 г. . Проверено 29 мая 2016 г. Технический комитет TC1 ECMA впервые собрался в декабре 1960 года для подготовки стандартных кодов для целей ввода/вывода. 30 апреля 1965 года стандарт ECMA-6 был принят Генеральной ассамблеей ECMA.
^ «База данных символов Юникода» . Стандарт Юникод . Проверено 22 марта 2013 г.
^ Стандарт Unicode, версия 1.0, том 1 . Addison-Wesley Publishing Company, Inc., 1990. ISBN.0-201-56788-1.
^ Не «письма», согласно: Агер, Саймон . «Латиноамериканское сгибание». Омниглот . Латиноамериканский алфавит sine Flexione . Проверено 14 апреля 2023 г.
^ "Странная отметка жителя Нью-Йорка - диэрезис" . 16 декабря 2010 г. Архивировано из оригинала 16 декабря 2010 г.
^ «Введение в СВУ (на английском языке)» . www.interlingua.com . Проверено 21 сентября 2020 г.