stringtranslate.com

Алфавитный порядок

Алфавитный порядок — это система, при которой строки символов располагаются в порядке, основанном на положении символов в обычном порядке алфавита . Это один из методов сопоставления . В математике лексикографический порядок — это обобщение алфавитного порядка на другие типы данных, такие как последовательности чисел или другие упорядоченные математические объекты .

Применительно к строкам или последовательностям , которые могут содержать цифры, числа или более сложные типы элементов, помимо буквенных символов, алфавитный порядок обычно называют лексикографическим порядком .

Чтобы определить, какая из двух строк символов стоит первой при расположении в алфавитном порядке, сравниваются их первые буквы . Если они различаются, то строка, первая буква которой стоит раньше в алфавите, стоит перед другой строкой. Если первые буквы одинаковые, то сравниваются вторые и так далее. Если достигнута позиция, в которой в одной строке больше нет букв для сравнения, а в другой есть, то первая (более короткая) строка считается первой в алфавитном порядке.

Заглавные или прописные буквы обычно считаются идентичными соответствующим строчным буквам для целей алфавитного порядка, хотя могут быть приняты соглашения для обработки ситуаций, когда две строки различаются только заглавными буквами. Также существуют различные соглашения для обработки строк, содержащих пробелы , измененные буквы, например, с диакритическими знаками , и небуквенные символы, такие как знаки препинания .

Результатом размещения набора слов или строк в алфавитном порядке является то, что все строки, начинающиеся с одной и той же буквы, группируются вместе; внутри этой группы группируются все слова, начинающиеся с одной и той же двухбуквенной последовательности; и так далее. Таким образом, система стремится максимизировать количество общих начальных букв между соседними словами.

История

Алфавитный порядок был впервые использован в I тысячелетии до нашей эры северо-западными семитскими писцами с использованием системы абджад . [1] Однако ряд других методов классификации и упорядочения материала, в том числе географических, хронологических , иерархических и по категориям , на протяжении веков отдавали предпочтение алфавитному порядку. [2]

Части Библии датируются VII–VI веками до нашей эры. В Книге Иеремии пророк использует шифр замены Атбаш , основанный на алфавитном порядке. Точно так же библейские авторы использовали акростихи , основанные на (упорядоченном) еврейском алфавите . [3]

Первое эффективное использование алфавитного порядка в качестве инструмента каталогизации среди ученых, возможно, было в древней Александрии, [4] в Великой Александрийской библиотеке , которая была основана около 300 г. до н.э. Считается, что работавший там поэт и ученый Каллимах создал первый в мире библиотечный каталог , известный как Пинакес , в котором свитки разложены по полкам в алфавитном порядке по первым буквам имен авторов. [2]

В I веке до нашей эры римский писатель Варрон составил алфавитные списки авторов и названий. [5] Во 2-м веке нашей эры Секст Помпей Фест написал энциклопедическое изложение произведений Верриуса Флакка , De verborum Significatu , с записями в алфавитном порядке. [6] В III веке нашей эры Гарпократион написал гомеровский лексикон, упорядоченный по алфавиту всех букв. [7] В X веке автор Суда использовал алфавитный порядок с фонетическими вариациями.

Алфавитный порядок как средство консультирования начал входить в основное русло интеллектуальной жизни Западной Европы во второй половине XII века, когда были разработаны алфавитные инструменты, помогающие проповедникам анализировать библейскую лексику. Это привело к составлению алфавитных согласований Библии монахами- доминиканцами в Париже в 13 веке под руководством Хью Сен-Шер . Старые справочные издания, такие как «Толкования еврейских имен» Св. Иеронима, были расположены в алфавитном порядке для удобства использования. Использованию алфавитного порядка первоначально сопротивлялись ученые, которые ожидали, что их ученики освоят свою область обучения в соответствии с ее собственными рациональными структурами; его успех был обусловлен такими инструментами, как указатель Роберта Килвордби к произведениям Св. Августина , который помогал читателям получить доступ к полному оригинальному тексту, а не зависеть от компиляций отрывков , которые стали заметными в схоластике XII века . Принятие алфавитного порядка было частью перехода от примата памяти к первенству письменных произведений. [8] Идея упорядочить информацию по алфавиту также встретила сопротивление со стороны составителей энциклопедий XII и XIII веков, которые все были набожными церковниками. Они предпочитали организовывать свой материал богословски – в порядке творения Бога, начиная с Деуса (что означает Бог). [2]

В 1604 году Роберту Кодри пришлось объяснять в «Алфавитной таблице» , первом одноязычном английском словаре : «Теперь, если слово, которое вы хотите найти, начинается с (а), тогда посмотрите в начало этой таблицы, но если с (v) смотри в конец». [9] Хотя еще в 1803 году Сэмюэл Тейлор Кольридж осудил энциклопедии с «расположением, определяемым случайностью начальных букв», [10] многие списки сегодня основаны на этом принципе.

Расположение в алфавитном порядке можно рассматривать как силу демократизации доступа к информации, поскольку оно не требует обширных предварительных знаний, чтобы найти то, что необходимо. [2]

Заказ латиницей

Основной заказ и примеры

Стандартный порядок современного базового латинского алфавита ISO :

АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЫЭЮЯ

Ниже приведен пример простого алфавитного порядка:

Другой пример:

Вышеуказанные слова расположены в алфавитном порядке. As стоит перед Астером, потому что они начинаются с одних и тех же двух букв, и после этого в Ас больше нет букв, тогда как у Астер есть. Следующие три слова идут после Астер , потому что их четвертая буква (первая отличающаяся) — это r , которая идет после е (четвертая буква Астер ) в алфавите. Сами эти слова упорядочены по шестым буквам ( l , n и p соответственно). Затем идет At , который отличается от предыдущих слов второй буквой ( t идет после s ). Атаман идет после Ата по той же причине, по которой Астер идет после Ас . Атака следует за Атаманом на основе сравнения их третьих букв, а Баа идет после всех остальных, потому что у него другая первая буква.

Обработка строк из нескольких слов

Когда некоторые из упорядочиваемых строк состоят из более чем одного слова, т. е. содержат пробелы или другие разделители, например дефисы , можно использовать два основных подхода. При первом подходе все строки изначально упорядочиваются по первому слову, как в последовательности:

Во втором подходе строки располагаются в алфавитном порядке, как если бы в них не было пробелов, что дает последовательность:

Второй подход обычно используется в словарях [ нужна ссылка ] , и поэтому издатели часто называют его порядком словаря . Первый подход часто использовался в книжных указателях , хотя каждое издательство традиционно устанавливает свои собственные стандарты того, какой подход использовать в них; До 1975 года не существовало стандарта ISO для книжных указателей ( ISO 999 ).

Особые случаи

Модифицированные буквы

Во французском языке измененные буквы (например, с диакритическими знаками ) обрабатываются так же, как базовая буква, для целей алфавитного порядка. Например, роль стоит между роком и розой , как если бы это была написанная роль . Однако языки, в которых такие буквы используются систематически, обычно имеют свои собственные правила упорядочения. См. § Соглашения, специфичные для языка, ниже.

Заказ по фамилии

В большинстве культур, где фамилии пишутся после имен , по-прежнему желательно сначала сортировать списки имен (как в телефонных справочниках) по фамилии. В этом случае для правильной сортировки имена необходимо переупорядочить. Например, Хуан Эрнандес и Брайан О'Лири следует сортировать как «Эрнандес, Хуан» и «О'Лири, Брайан», даже если они написаны иначе. Зафиксировать это правило в компьютерном алгоритме сортировки сложно, и простые попытки потерпят неудачу. Например, если в распоряжении алгоритма нет обширного списка фамилий, невозможно решить, является ли «Джиллиан Люсиль ван дер Ваал» «ван дер Ваал, Джиллиан Люсиль», «Ваал, Джиллиан Люсиль ван дер», или даже «Люсиль ван дер Ваал, Джиллиан».

Заказ по фамилии часто встречается в академическом контексте. В рамках одной статьи нескольких авторов упорядочение авторов в алфавитном порядке по фамилиям, а не с использованием других методов, таких как обратный старшинство или субъективная степень вклада в статью, рассматривается как способ «признания аналогичного вклада» или «избежания [ing] дисгармония в сотрудничающих группах». [11] Было обнаружено , что в некоторых областях практика упорядочивания цитат в библиографиях по фамилиям их авторов создает предвзятость в пользу авторов с фамилиями, которые появляются раньше в алфавите, тогда как этот эффект не проявляется в областях, в которых библиографии упорядочены в хронологическом порядке. [12]

The и другие распространенные слова

Если фраза начинается с очень распространенного слова (например, «the», «a» или «an», которые в грамматике называются артиклями), это слово иногда игнорируется или перемещается в конец фразы, но это не всегда правильно. случай. Например, книгу « Сияние » можно трактовать как «Сияние» или «Сияние» и, следовательно, перед названием книги « Лето Сэма ». Однако его также можно рассматривать просто как «Сияние» и после «Лета Сэма». Точно так же « Трещину во времени » можно трактовать как «Трещину во времени», «Трещину во времени, А» или «Трещину во времени». Все три метода алфавитизации довольно легко создать с помощью алгоритма, но многие программы вместо этого полагаются на простое лексикографическое упорядочение .

Префиксы Mac

Префиксы M и Mc в ирландских и шотландских фамилиях являются аббревиатурами от Mac и иногда располагаются в алфавитном порядке, как если бы полное написание было Mac . Таким образом , Мак-Кинли мог бы быть указан перед Макинтошем (как это было бы, если бы оно было написано как «Мак-Кинли»). С появлением списков, отсортированных компьютером, этот тип алфавитного расположения встречается реже, хотя он все еще используется в британских телефонных справочниках.

префикс ул

Префикс St или St. является аббревиатурой слова «Святой» и традиционно располагается в алфавитном порядке, как если бы полное написание было «Святой» . Таким образом, в справочнике собор Святого Иоанна может быть указан перед Салемом (как если бы он был написан как «Сент-Джонс»). С появлением списков, отсортированных компьютером, этот тип алфавитного расположения встречается реже, хотя иногда все же используется.

Лигатуры

Лигатуры (две или более буквы, объединенные в один символ), которые не считаются отдельными буквами, например Æ и Œ в английском языке, обычно сопоставляются так, как если бы буквы были отдельными — «эфир» и «эфир» будут располагаться одинаково относительно все остальные слова. Это верно, даже если лигатура не является чисто стилистической, например, в заимствованных словах и названиях брендов.

Для сортировки строк могут потребоваться специальные правила, которые различаются только в зависимости от того, соединены ли две буквы лигатурой.

Обработка цифр

Когда некоторые строки содержат цифры (или другие небуквенные символы), возможны различные подходы. Иногда такие символы рассматриваются так, как будто они идут до или после всех букв алфавита. Другой метод заключается в сортировке чисел в алфавитном порядке, как если бы они были написаны: например, 1776 будет отсортирован так, как если бы оно было написано как «семнадцать семьдесят шесть», а 24 часа в Мане , как если бы они писались как «vingt-quatre...» (французский). для «двадцать четыре»). Когда цифры или другие символы используются в качестве особых графических форм букв, например, 1337 для leet или фильма «Семь » (который был стилизован под Se7en ), они могут быть отсортированы так, как если бы они были этими буквами. Естественный порядок сортировки упорядочивает строки в алфавитном порядке, за исключением того, что многозначные числа обрабатываются как один символ и упорядочиваются по значению числа, закодированного цифрами.

В случае монархов и пап , хотя их номера указаны римскими цифрами и напоминают буквы, они обычно располагаются в числовом порядке: так, например, хотя V идет после I, датский король Кристиан IX идет после своего предшественника Кристиана VIII . .

Соглашения, специфичные для языка

Языки, использующие расширенный латинский алфавит, обычно имеют свои собственные правила обращения с дополнительными буквами. Кроме того, в некоторых языках определенные орграфы для целей сопоставления рассматриваются как отдельные буквы. Например, в испанском алфавите ñ рассматривается как основная буква, следующая за n , а раньше орграфы ch и ll рассматривались как основные буквы, следующие за c и l соответственно. Теперь сh и ll расположены в алфавитном порядке в виде двухбуквенных комбинаций. Новое правило алфавитизации было издано Королевской испанской академией в 1994 году. Эти орграфы по-прежнему формально обозначались буквами, но с 2010 года они уже не являются таковыми. С другой стороны, орграф rr следует за rqu , как и ожидалось (и делал это еще до того, как правило алфавитизации 1994 года), в то время как гласные с острыми ударениями ( á, é, í, ó, ú ) всегда располагались параллельно своим основным буквам, как и буква ü .

В некоторых случаях, например, в арабском и кайова , порядок алфавита был полностью изменен.

Правила алфавитизации, применяемые на разных языках, перечислены ниже.

A, AU, E, I, O, U, B, F, P, V, D, J, T, TH, G, C, K, Q, CH, X, S, Z, L, Y, W, Ч, М, Н

Автоматизация

Алгоритмы сопоставления (в сочетании с алгоритмами сортировки ) используются в компьютерном программировании для размещения строк в алфавитном порядке. Стандартным примером является алгоритм сопоставления Unicode , который можно использовать для размещения строк, содержащих любые символы Unicode , в алфавитном порядке (расширении). [14] Его можно привести в соответствие с большинством описанных выше соглашений, специфичных для языка, путем адаптации таблицы сопоставления по умолчанию. Несколько таких доработок собраны в Common Locale Data Repository .

Похожие заказы

Принцип алфавитного порядка по-прежнему может применяться в языках, которые, строго говоря, не используют алфавит ( например, они могут быть написаны с использованием слоговой азбуки или абугиды ) при условии, что используемые символы имеют установленный порядок.

В логографических системах письма, таких как китайский ханзи или японский кандзи , метод радикальной и штриховой сортировки часто используется как способ определения порядка символов. Японцы иногда используют порядок произношения, чаще всего порядок произношения Годзюон , но иногда и более старый порядок Ироха .

В математике лексикографический порядок — это средство упорядочивания последовательностей способом, аналогичным тому, который используется для создания алфавитного порядка. [16]

Некоторые компьютерные приложения используют версию алфавитного порядка, которого можно достичь с помощью очень простого алгоритма , основанного исключительно на кодах символов ASCII или Unicode . Это может иметь нестандартные последствия, например размещение всех заглавных букв перед строчными. См. ASCII-бетический порядок .

Словарь рифм основан на сортировке слов в алфавитном порядке, начиная с последней и заканчивая первой буквой слова.

Смотрите также

Примечания

  1. ^ Есть исключение: в китайско-английском словаре ABC порядок тонов следующий: «нулевой тон (нейтральный тон), первый тон (ровный тон), второй тон (восходящий тон), третий тон (нисходящий-восходящий тон) и четвертый тон ( падающий тон)».

Рекомендации

  1. ^ Рейнхард Г. Леманн: «27-30-22-26. Сколько букв нужно в алфавите? Случай семитского языка», в: Идея письма: письмо через границы , под редакцией Алекса де Фогта и Иоахима Фридриха Квака, Лейден : Brill 2012, стр. 11–52.
  2. ↑ abcd Street, Джули (10 июня 2020 г.). «От А до Я – удивительная история алфавитного порядка» (текст и аудио) . Новости ABC (национальное радио ABC) . Австралийская радиовещательная корпорация. Архивировано из оригинала 2 июля 2020 года . Проверено 6 июля 2020 г.
  3. ^ например, Псалмы 25, 34, 37, 111, 112, 119 и 145 еврейской Библии.
  4. ^ Дейли, Ллойд. Вклад в историю алфавитизации в древности и средневековье . Брюссель, 1967. с. 25.
  5. ^ О'Хара, Джеймс (1989). «Мессап, Кикн и алфавитный порядок Каталога итальянских героев Вергилия». Феникс . 43 (1): 35–38. дои : 10.2307/1088539. JSTOR  1088539.
  6. ^ LIVRE XI – латинский текст – перевод + комментарии. Архивировано из оригинала 9 июня 2012 года . Проверено 8 мая 2012 г.
  7. ^ Гибсон, Крейг (2002). Интерпретация классика: Демосфен и его античные комментаторы .
  8. ^ Роуз, Мэри А.; Роуз, Ричард М. (1991), « Statim invenire : школы, проповедники и новое отношение к странице», « Подлинные свидетели: подходы к средневековым текстам и рукописям» , University of Notre Dame Press, стр. 201–219, ISBN 0-268-00622-9
  9. ^ Кодри, Роберт (1604). Таблица по алфавиту . Лондон. п. [А4]в.
  10. ^ Письма Кольриджа, № 507.
  11. ^ Чарнтке, Тея; Хохберг, Майкл Э; Рэнд, Татьяна А; Реш, Винсент Х; Краусс, Йохен (январь 2007 г.). «Последовательность авторов и заслуги за вклад в публикации с участием нескольких авторов». ПЛОС Биол . 5 (1): е18. doi : 10.1371/journal.pbio.0050018 . ПМК 1769438 . ПМИД  17227141. 
  12. ^ Стивенс, Джеффри Р.; Дуке, Хуан Ф. (2018). «Порядок имеет значение: расположение в алфавитном порядке цитирования в тексте снижает уровень цитируемости» (PDF) . Психономический бюллетень и обзор . 26 (3): 1020–1026. дои : 10.3758/s13423-018-1532-8 . PMID  30288671. S2CID  52922399. Архивировано (PDF) из оригинала 10 ноября 2018 г. . Проверено 10 ноября 2018 г.
    • Краткое содержание опубликовано в: Коллин Флаэрти (22 октября 2018 г.). «Дело против алфавитного именования авторов». Внутри высшего образования .
  13. ^ «Арабские математические алфавитные символы» (PDF) . Стандарт Юникод. Архивировано (PDF) из оригинала 30 октября 2022 года . Проверено 26 ноября 2022 г.
  14. ^ ab «Технический стандарт Unicode № 10: Алгоритм сопоставления Unicode» . Unicode, Inc. (unicode.org). 20 марта 2008 г. Архивировано из оригинала 27 августа 2008 г. Проверено 27 августа 2008 г.
  15. ^ Миджли, Ральф. «Волапюк-английский словарь» (PDF) . Архивировано из оригинала (PDF) 1 сентября 2012 года . Проверено 24 сентября 2019 г.
  16. ^ Франц Баадер; Тобиас Нипков (1999). Переписывание терминов и все такое . Издательство Кембриджского университета. стр. 18–19. ISBN 978-0-521-77920-3.

дальнейшее чтение