stringtranslate.com

В алфавитном порядке

Флаги некоторых стран в Елисейском дворце в Париже на мирной конференции по Ливии, 2011 г. Национальные флаги (кроме флага принимающей стороны, Франции) расположены во французском алфавитном порядке: Allemagne , Belgique , Canada , Danemark , Émirats Arabes Unis. , Испания , Штаты-Университет , Греция , Ирак , Италия , Жордани , Марокко , Норвегия , Пай-Ба , Полонь , Катар , Руайом-Университет .

Алфавитный порядок — это система, в которой строки символов располагаются в порядке, основанном на положении символов в общепринятом порядке алфавита . Это один из методов сортировки . В математике лексикографический порядок — это обобщение алфавитного порядка на другие типы данных, такие как последовательности чисел или другие упорядоченные математические объекты .

Применительно к строкам или последовательностям , которые могут содержать цифры, числа или более сложные типы элементов, в дополнение к буквенным символам, алфавитный порядок обычно называется лексикографическим порядком .

Чтобы определить, какая из двух строк символов идет первой при расположении в алфавитном порядке, сравниваются их первые буквы . Если они различаются, то строка, первая буква которой идет раньше в алфавите, идет перед другой строкой. Если первые буквы одинаковы, то сравниваются вторые буквы и т. д. Если достигнута позиция, когда в одной строке больше нет букв для сравнения, а в другой есть, то первая (более короткая) строка считается первой в алфавитном порядке.

Заглавные или прописные буквы обычно считаются идентичными соответствующим им строчным буквам для целей алфавитного упорядочения, хотя соглашения могут быть приняты для обработки ситуаций, когда две строки отличаются только регистром. Существуют также различные соглашения для обработки строк, содержащих пробелы , измененные буквы, например, с диакритическими знаками , и небуквенные символы, такие как знаки препинания .

Результатом размещения набора слов или строк в алфавитном порядке является то, что все строки, начинающиеся с одной и той же буквы, группируются вместе; внутри этой группы все слова, начинающиеся с одной и той же двухбуквенной последовательности, группируются вместе; и т. д. Таким образом, система стремится максимизировать количество общих начальных букв между соседними словами.

История

Алфавитный порядок был впервые использован в первом тысячелетии до н. э. северо-западными семитскими писцами, использовавшими систему абджад . [1] Однако ряд других методов классификации и упорядочения материалов, включая географический, хронологический , иерархический и по категориям , на протяжении столетий предпочитали алфавитному порядку. [2]

Части Библии датируются 7–6 веками до н.э. В Книге Иеремии пророк использует шифр замены Атбаш , основанный на алфавитном порядке. Аналогично, библейские авторы использовали акростихи, основанные на (упорядоченном) еврейском алфавите . [3]

Первое эффективное использование алфавитного порядка в качестве каталогизационного устройства среди ученых, возможно, имело место в древней Александрии, [4] в Большой Александрийской библиотеке , которая была основана около 300 г. до н. э. Поэт и ученый Каллимах , работавший там, как полагают, создал первый в мире библиотечный каталог , известный как Пинакес , со свитками, расположенными на полках в алфавитном порядке первых букв имен авторов. [2]

В I веке до нашей эры римский писатель Варрон составил алфавитные списки авторов и названий. [5] Во II веке нашей эры Секст Помпей Фест написал энциклопедическое изложение трудов Веррия Флакка , De verborum significatu , с записями в алфавитном порядке. [6] В III веке нашей эры Гарпократион написал гомеровский словарь, в котором все буквы были расположены в алфавитном порядке. [7] В X веке автор Суды использовал алфавитный порядок с фонетическими вариациями.

Алфавитный порядок как помощь в консультациях начал входить в основное русло западноевропейской интеллектуальной жизни во второй половине XII века, когда были разработаны алфавитные инструменты, помогающие проповедникам анализировать библейский словарь. Это привело к составлению алфавитных конкордансов Библии монахами -доминиканцами в Париже в XIII веке под руководством Гуго Сен-Шера . Более старые справочные работы, такие как «Толкования еврейских имен » Святого Иеронима, были алфавитизированы для удобства консультаций. Использование алфавитного порядка изначально встречало сопротивление со стороны ученых, которые ожидали, что их студенты будут осваивать свою область изучения в соответствии с ее собственными рациональными структурами; его успех был обусловлен такими инструментами, как указатель Роберта Килвордби к трудам Святого Августина , который помогал читателям получать доступ к полному оригинальному тексту вместо того, чтобы зависеть от компиляций отрывков , которые стали заметными в схоластике XII века . Принятие алфавитного порядка было частью перехода от главенства памяти к главенству письменных работ. [8] Идея упорядочивания информации в алфавитном порядке также встретила сопротивление со стороны составителей энциклопедий в XII и XIII веках, которые все были набожными церковниками. Они предпочитали организовывать свой материал теологически – в порядке творения Бога, начиная с Deus (что означает Бог). [2]

В 1604 году Роберт Кодри должен был объяснить в Table Alphabeticall , первом одноязычном английском словаре : «Если слово, которое ты желаешь найти, начинается с (a), то смотри в начало этой таблицы, но если с (v), то смотри в конец». [9] Хотя еще в 1803 году Сэмюэл Тейлор Кольридж осуждал энциклопедии за «расположение, определяемое случайностью начальных букв», [10] многие списки сегодня основаны на этом принципе.

Заказ в латинском алфавите

Основной порядок и примеры

Стандартный порядок современного базового латинского алфавита ISO следующий:

ABCDEFGHIJKLMNOPQRSTU-VWXYZ

Ниже приведен пример простого алфавитного порядка:

Другой пример:

Вышеуказанные слова упорядочены в алфавитном порядке. As идет перед Aster, потому что они начинаются с тех же двух букв, и после него у As больше нет букв, в то время как у Aster есть. Следующие три слова идут после Aster , потому что их четвертая буква (первая отличающаяся) — r , которая идет после e (четвертая буква Aster ) в алфавите. Сами эти слова упорядочены на основе их шестых букв ( l , n и p соответственно). Затем идет At , который отличается от предыдущих слов второй буквой ( t идет после s ). Ataman идет после At по той же причине, по которой Aster идет после As . Attack следует за Ataman на основе сравнения их третьих букв, а Baa идет после всех остальных, потому что у него другая первая буква.

Обработка многословных строк

Когда некоторые из упорядочиваемых строк состоят из более чем одного слова, т. е. содержат пробелы или другие разделители, такие как дефисы , то могут быть использованы два основных подхода. В первом подходе все строки изначально упорядочиваются в соответствии с их первым словом, как в последовательности:

Во втором подходе строки располагаются в алфавитном порядке, как если бы они не содержали пробелов, что дает следующую последовательность:

Второй подход обычно используется в словарях [ требуется ссылка ] , и поэтому издатели часто называют его словарным порядком . Первый подход часто использовался в книжных индексах , хотя каждый издатель традиционно устанавливал свои собственные стандарты того, какой подход использовать; до 1975 года не существовало стандарта ISO для книжных индексов ( ISO 999 ).

Особые случаи

Измененные буквы

Во французском языке измененные буквы (например, с диакритическими знаками ) обрабатываются так же, как и базовая буква для целей алфавитного упорядочивания. Например, rôle находится между rock и rose , как если бы она была написана role . Однако языки, которые используют такие буквы систематически, как правило, имеют свои собственные правила упорядочивания. См. § Соглашения, специфичные для языка, ниже.

Сортировка по фамилии

В большинстве культур, где фамилии пишутся после имен , все равно желательно сортировать списки имен (как в телефонных справочниках) сначала по фамилии. В этом случае имена необходимо переупорядочить для правильной сортировки. Например, Хуан Эрнандес и Брайан О'Лири следует сортировать как "Эрнандес, Хуан" и "О'Лири, Брайан", даже если они не написаны таким образом. Зафиксировать это правило в компьютерном алгоритме сопоставления сложно, и простые попытки не увенчаются успехом. Например, если алгоритм не имеет в своем распоряжении обширного списка фамилий, нет способа решить, является ли "Джиллиан Люсиль ван дер Ваал" "ван дер Ваал, Джиллиан Люсиль", "Ваал, Джиллиан Люсиль ван дер" или даже "Люсиль ван дер Ваал, Джиллиан".

Упорядочивание по фамилии часто встречается в академических контекстах. В рамках одной статьи с несколькими авторами упорядочивание авторов в алфавитном порядке по фамилии, а не другими методами, такими как обратный старшинство или субъективная степень вклада в статью, рассматривается как способ «признания схожих вкладов» или «избежания дисгармонии в сотрудничающих группах». [11] Было обнаружено, что практика в некоторых областях упорядочивания ссылок в библиографиях по фамилиям их авторов создает предвзятость в пользу авторов с фамилиями, которые появляются раньше в алфавите, в то время как этот эффект не проявляется в областях, в которых библиографии упорядочены в хронологическом порядке. [12]

Theи другие общие слова

Если фраза начинается с очень распространенного слова (например, «the», «a» или «an», называемого в грамматике артиклями), это слово иногда игнорируется или перемещается в конец фразы, но это не всегда так. Например, книга « The Shining » может рассматриваться как «Shining» или «Shining, The» и, следовательно, перед названием книги « Summer of Sam ». Однако ее также можно рассматривать как просто «The Shining» и после «Summer of Sam». Аналогично, « A Wrinkle in Time » может рассматриваться как «Wrinkle in Time», «Wrinkle in Time, A» или «A Wrinkle in Time». Все три метода алфавитизации довольно легко создать с помощью алгоритма, но многие программы вместо этого полагаются на простое лексикографическое упорядочение .

Макпрефиксы

Префиксы M и Mc в ирландских и шотландских фамилиях являются сокращениями от Mac и иногда располагаются в алфавитном порядке, как если бы фамилия была написана полностью Mac . Таким образом, McKinley может быть указана перед Mackintosh (как это было бы, если бы она была написана как "MacKinley"). С появлением сортированных компьютером списков этот тип алфавитного порядка встречается реже, хотя он все еще используется в британских телефонных справочниках.

Св.префикс

Префикс St или St. является сокращением от "Saint" и традиционно располагается в алфавитном порядке, как будто это полностью Saint . Таким образом, в справочнике St John's может быть указан перед Salem (как будто это было бы, если бы он был написан как "Saint John's"). С появлением сортированных компьютером списков этот тип алфавитного порядка встречается реже, хотя иногда все еще используется.

Лигатуры

Лигатуры (две или более букв, объединенных в один символ), которые не считаются отдельными буквами, например, Æ и Œ в английском языке, обычно сопоставляются так, как если бы буквы были отдельными — «æther» и «aether» будут упорядочены одинаково относительно всех других слов. Это верно даже тогда, когда лигатура не является чисто стилистической, например, в заимствованных словах и названиях брендов.

Для сортировки строк, которые различаются только тем, соединены ли две буквы лигатурой, могут потребоваться специальные правила.

Обработка чисел

Когда некоторые строки содержат цифры (или другие небуквенные символы), возможны различные подходы. Иногда такие символы обрабатываются так, как если бы они были до или после всех букв алфавита. Другой метод заключается в сортировке чисел в алфавитном порядке, как они были бы написаны: например, 1776 будет отсортировано так, как если бы оно было написано как «семнадцать семьдесят шесть», а 24 heures du Mans — как если бы оно было написано как «vingt-quatre...» (по-французски «двадцать четыре»). Когда цифры или другие символы используются в качестве специальных графических форм букв, как 1337 для leet или фильма Seven (который был стилизован как Se7en ), они могут быть отсортированы так, как если бы они были этими буквами. Естественный порядок сортировки упорядочивает строки в алфавитном порядке, за исключением того, что многозначные числа обрабатываются как один символ и упорядочиваются по значению числа, закодированного цифрами.

В случае монархов и пап , хотя их номера указаны римскими цифрами и напоминают буквы, они обычно располагаются в числовом порядке: так, например, несмотря на то, что V идет после I, датский король Кристиан IX идет после своего предшественника Кристиана VIII .

Конвенциональные соглашения, специфичные для конкретного языка

Языки, использующие расширенный латинский алфавит, как правило, имеют свои собственные соглашения по обработке дополнительных букв. Кроме того, в некоторых языках определенные диграфы обрабатываются как отдельные буквы для целей сопоставления. Например, испанский алфавит обрабатывает ñ как основную букву, следующую за n , а ранее обрабатывал диграфы ch и ll как основные буквы, следующие за c и l , соответственно. Теперь ch и ll располагаются в алфавитном порядке как двухбуквенные комбинации. Новое правило алфавитизации было выпущено Королевской испанской академией в 1994 году. Эти диграфы по-прежнему формально обозначались как буквы, но с 2010 года они больше таковыми не являются. С другой стороны, диграф rr следует за rqu, как и ожидалось (и делал это даже до правила алфавитизации 1994 года), в то время как гласные с острым ударением ( á, é, í, ó, ú ) всегда располагались параллельно своим базовым буквам, как и буква ü .

В некоторых случаях, например, в арабском языке и языке кайова , алфавит был полностью изменен.

Ниже перечислены правила алфавитного упорядочивания, применяемые в различных языках.

А, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, H, M, N

Автоматизация

Алгоритмы сортировки (в сочетании с алгоритмами сортировки ) используются в компьютерном программировании для размещения строк в алфавитном порядке. Стандартным примером является алгоритм сортировки Unicode , который может использоваться для размещения строк, содержащих любые символы Unicode , в (расширение) алфавитном порядке. [14] Его можно заставить соответствовать большинству языковых соглашений, описанных выше, настроив его таблицу сортировки по умолчанию. Несколько таких настроек собраны в Common Locale Data Repository .

Похожие заказы

Принцип алфавитного порядка может применяться и в языках, которые, строго говоря, не используют алфавит (например, они могут быть записаны с помощью слоговой азбуки или абугиды ), при условии, что используемые символы имеют установленный порядок.

Для логографических систем письма, таких как китайская ханзи или японская кандзи , метод сортировки радикалов и черт часто используется как способ определения порядка символов. Японцы иногда используют порядок произношения, чаще всего с порядком Годзюон , но иногда и с более старым порядком Ироха .

В математике лексикографический порядок — это способ упорядочивания последовательностей способом, аналогичным тому, который используется для создания алфавитного порядка. [16]

Некоторые компьютерные приложения используют версию алфавитного порядка, которая может быть достигнута с помощью очень простого алгоритма , основанного исключительно на кодах ASCII или Unicode для символов. Это может иметь нестандартные эффекты, такие как размещение всех заглавных букв перед строчными. См. ASCIIbetical order .

Словарь рифм основан на сортировке слов в алфавитном порядке, начиная с последней буквы слова и заканчивая первой.

Смотрите также

Примечания

  1. ^ Есть исключение: в китайско-английском словаре ABC порядок тонов следующий: «нулевой тон (нейтральный тон), первый тон (ровный тон), второй тон (восходящий тон), третий тон (нисходящий-восходящий тон) и четвертый тон (нисходящий тон)».

Ссылки

  1. Рейнхард Г. Леманн: «27-30-22-26. Сколько букв нужно в алфавите? Случай семитских языков», в: Идея письма: письмо через границы , под редакцией Алекса де Фогта и Иоахима Фридриха Квака, Лейден: Brill 2012, стр. 11–52.
  2. ^ abc Street, Джули (10 июня 2020 г.). «От А до Я — удивительная история алфавитного порядка» (текст и аудио) . ABC News (ABC Radio National) . Australian Broadcasting Corporation. Архивировано из оригинала 2 июля 2020 г. . Получено 6 июля 2020 г. .
  3. ^ например, Псалмы 25, 34, 37, 111, 112, 119 и 145 еврейской Библии
  4. ^ Дейли, Ллойд. Вклад в историю алфавитизации в античности и средние века . Брюссель, 1967. С. 25.
  5. ^ О'Хара, Джеймс (1989). «Мессап, Кикн и алфавитный порядок Каталога итальянских героев Вергилия». Феникс . 43 (1): 35–38. дои : 10.2307/1088539. JSTOR  1088539.
  6. ^ LIVRE XI – texte latin – traduction + commentaires. Архивировано из оригинала 9 июня 2012 года . Получено 8 мая 2012 года .
  7. ^ Гибсон, Крейг (2002). Интерпретация классики: Демосфен и его древние комментаторы .
  8. ^ Рауз, Мэри А.; Рауз, Ричард М. (1991), « Statim invenire : Schools, Preachers and New Attitudes to the Page», Authentic Witnesses: Approaches to Medieval Texts and Manuscripts , University of Notre Dame Press, стр. 201–219, ISBN 0-268-00622-9
  9. Кодри, Роберт (1604). Таблица алфавита . Лондон. стр. [A4]v.
  10. Письма Кольриджа, № 507.
  11. ^ Tscharntke, Teja; Hochberg, Michael E; Rand, Tatyana A; Resh, Vincent H; Krauss, Jochen (январь 2007 г.). "Последовательность авторов и кредит за вклад в многоавторские публикации". PLOS Biol . 5 (1): e18. doi : 10.1371/journal.pbio.0050018 . PMC 1769438. PMID  17227141 . 
  12. ^ Стивенс, Джеффри Р.; Дуке, Хуан Ф. (2018). «Порядок имеет значение: алфавитное расположение внутритекстовых цитат смещает показатели цитирования» (PDF) . Психономический бюллетень и обзор . 26 (3): 1020–1026. doi : 10.3758/s13423-018-1532-8 . PMID  30288671. S2CID  52922399. Архивировано (PDF) из оригинала 10 ноября 2018 г. . Получено 10 ноября 2018 г. .
    • Краткое содержание: Колин Флаэрти (22 октября 2018 г.). «Дело против алфавитного именования авторов». Inside Higher Ed .
  13. ^ "Арабские математические алфавитные символы" (PDF) . Стандарт Unicode. Архивировано (PDF) из оригинала 30 октября 2022 г. Получено 26 ноября 2022 г.
  14. ^ ab "Технический стандарт Unicode № 10: Алгоритм сопоставления Unicode". Unicode, Inc. (unicode.org). 20 марта 2008 г. Архивировано из оригинала 27 августа 2008 г. Получено 27 августа 2008 г.
  15. ^ Мидгли, Ральф. "Словарь волапюк-английский" (PDF) . Архивировано из оригинала (PDF) 1 сентября 2012 года . Получено 24 сентября 2019 года .
  16. ^ Франц Баадер; Тобиас Нипков (1999). Переписывание терминов и все такое . Cambridge University Press. С. 18–19. ISBN 978-0-521-77920-3.

Дальнейшее чтение