Индекс ( мн. ч .: обычно индексы , реже индексы ) — это список слов или фраз («заголовки») и связанных с ними указателей («локаторы»), указывающих, где можно найти полезный материал, относящийся к этому заголовку, в документе или сборнике документов. Примерами являются индекс в конце книги и индекс , который служит библиотечным каталогом . Индекс отличается от индекса слов или конкорданса тем, что фокусируется на теме текста, а не на точных словах в тексте, и он отличается от оглавления, поскольку индекс упорядочен по теме, независимо от того, находится ли он в начале или в конце книги, в то время как перечисленные элементы в оглавлении располагаются в том же порядке, что и книга. [1]
В традиционном индексе в конце книги заголовки будут включать имена людей, мест, событий и концепций, выбранных как релевантные и представляющие интерес для возможного читателя книги. Индексатор, выполняющий выбор, может быть автором, редактором или профессиональным индексатором, работающим в качестве третьей стороны. Указатели обычно представляют собой номера страниц, номера абзацев или номера разделов.
В библиотечном каталоге словами являются авторы, заголовки, предметные рубрики и т. д., а указатели — это номера вызовов . Поисковые системы в Интернете (например, Google ) и полнотекстовый поиск помогают обеспечить доступ к информации, но не столь избирательны, как индекс, поскольку они предоставляют нерелевантные ссылки и могут упустить релевантную информацию, если она не сформулирована именно так, как ожидается. [2]
Возможно, наиболее продвинутое исследование проблем, связанных с индексами книг, было сделано в разработке тематических карт , которые начинались как способ представления структур знаний, присущих традиционным индексам в конце книги. Концепция, воплощенная в индексах книг, дала свое название индексам баз данных , которые аналогичным образом предоставляют сокращенный способ поиска информации в более крупной коллекции, хотя и для использования компьютером, а не человеком.
В английском языке индексы упоминаются уже в 1593 году, о чем свидетельствуют строки в произведении Кристофера Марло « Герой и Леандер» того года:
Поэтому, даже как указатель к книге,
Так вспоминал он облик молодого Леандра.
Аналогичное упоминание индексов содержится в строках Шекспира из « Троила и Крессиды» (I.3.344), написанных девятью годами позже:
И в таких индексах, хотя и небольших,
К их последующим томам, видна
детская фигура гигантской массы
Вещей, которые должны появиться на свет.
Но, по словам Г. Нормана Найта, «в тот период под «индексом к книге» чаще всего подразумевалось то, что мы сейчас назвали бы оглавлением». [3] Примерно до конца девятнадцатого века книги, как художественные, так и научно-популярные, иногда имели очень подробные названия глав, которые могли состоять из нескольких предложений.
Среди первых указателей — в современном смысле — к книге на английском языке была [4] «Книга об искусстве и манере, как сажать и разводить все виды деревьев» Леонарда Масколла, напечатанная в 1575 году. Другой был в « Параллельных жизнеописаниях » Плутарха в переводе сэра Томаса Норта 1595 года. [3] Раздел под названием «Алфавитная таблица наиболее существенного содержания всей книги» можно найти в « Актах и постановлениях парламента» Генри Скобелла 1658 года. Этот раздел идет после «Указателя общих названий, включенных в следующую таблицу». [3] Оба эти указателя предшествуют указателю к «Конкордансу » Александра Крудена (1737), который ошибочно считается самым ранним указателем, найденным в английской книге. [3]
Слово происходит от латинского index , в котором оно означает «тот, кто указывает», «указание» или « указательный палец ».
В латыни множественное число этого слова — indexes . В английском языке множественное число «indices» обычно используется в математических и вычислительных контекстах , а иногда и в библиографических контекстах — например, в 17-томной книге Women in World History: A Biographical Encyclopedia (1999–2002). [5] Однако эта форма сейчас рассматривается как архаизм многими писателями и комментаторами, которые предпочитают англизированное множественное число «indexes». «Indexes» широко используется в издательской индустрии; в Международном стандарте ISO 999 , Информация и документация — Руководство по содержанию, организации и представлению индексов ; и предпочтительна в Оксфордском руководстве по стилю . [6] Чикагское руководство по стилю допускает обе формы. [7]
Дж. Норман Найт цитирует строки Шекспира из «Троила и Крессиды» (I.3.344) – «И в таких указателях…» – и комментирует:
«Но истинная важность этого отрывка в том, что он устанавливает на все времена правильное литературное множественное число; латинскую форму «indices» мы можем оставить математикам (а «appendices» — анатомам)». [3]
Индексатор читает текст, выявляя индексируемые концепции (те, для которых текст предоставляет полезную информацию и которые будут иметь значение для читательской аудитории текста). Индексатор создает заголовки индекса для представления этих концепций, которые сформулированы таким образом, что их можно найти, если они расположены в алфавитном порядке (например, можно написать «процесс индексирования», а не «как создать индекс»). Эти заголовки и связанные с ними локаторы (индикаторы для размещения в тексте) вводятся в специализированное программное обеспечение для индексирования , которое обрабатывает форматирование индекса и облегчает фазу редактирования. Затем индекс редактируется для обеспечения согласованности во всем индексе.
Индексаторы должны анализировать текст, чтобы обеспечить представление концепций и идей в индексе, которые могут не быть названы в тексте. Индекс предназначен для того, чтобы помочь читателю, исследователю или специалисту по информации, а не автору, найти информацию, поэтому профессиональный индексатор должен выступать в качестве связующего звена между текстом и его конечным пользователем.
В Соединенных Штатах, согласно традиции, индексирование научно-популярной книги является обязанностью автора, но большинство авторов на самом деле этого не делают. Большая часть индексирования выполняется фрилансерами, нанятыми авторами, издателями или независимым бизнесом, который управляет выпуском книги, [8] издателями или упаковщиками книг . Некоторые издательства и компании, работающие с базами данных, нанимают индексаторов.
До появления программного обеспечения для индексирования индексы создавались с помощью полосок бумаги или, позднее, карточек . После заполнения сотен таких полосок или карточек (по мере того, как индексатор просматривал страницы корректуры книги), их можно было вручную перетасовать в алфавитном порядке, после чего они служили рукописью для набора в печатный индекс.
Доступно программное обеспечение, помогающее индексатору в создании индекса книги. [9] [10] Существует несколько специализированных программ индексирования, которые помогают решать особые задачи сортировки и копирования, связанные с подготовкой индекса.
Встроенная индексация подразумевает включение заголовков индекса в сам текст, но окруженных кодами, чтобы они обычно не отображались. Затем автоматически генерируется пригодный для использования индекс из встроенного текста с использованием положения встроенных заголовков для определения локаторов. Таким образом, при изменении пагинации индекс может быть сгенерирован заново с новыми локаторами.
Документы LaTeX поддерживают встроенные индексы в первую очередь через пакет MakeIndex . Несколько широко используемых XML DTD , включая DocBook и TEI , имеют элементы, которые позволяют создавать индексы непосредственно в файлах XML. Большинство текстовых процессоров , таких как StarWriter / OpenOffice.org Writer , Microsoft Word и WordPerfect , а также некоторые настольные издательские системы (например, FrameMaker и InDesign ), а также другие инструменты (например, Flare от MadCap Software ) также имеют некоторые возможности для встроенной индексации. TExtract и IndexExploit поддерживают встроенную индексацию документов Microsoft Word. [9]
Встроенный индекс требует больше времени для создания, чем обычный статический индекс; однако встроенный индекс может сэкономить время в долгосрочной перспективе, когда материал обновляется или переразбивается на страницы. Это связано с тем, что при статическом индексе, если даже несколько страниц меняются, весь индекс должен быть пересмотрен или создан заново, в то время как при встроенном индексе только измененные страницы нуждаются в обновлении или индексировании.
Индексы также предназначены для того, чтобы помочь читателю быстро и легко находить информацию. Полный и действительно полезный индекс — это не просто список слов и фраз, используемых в публикации (который правильно называется конкордансом ) , а организованная карта ее содержания, включая перекрестные ссылки , группировку схожих концепций и другой полезный интеллектуальный анализ.
Пример выдержки из индекса в конце книги:
В книгах индексы обычно располагаются ближе к концу (это обычно известно как «BoB» или индексация в конце книги). Они дополняют оглавление , предоставляя доступ к информации по конкретной теме, тогда как списки содержания предоставляют доступ через широкие разделы текста, расположенные в том порядке, в котором они встречаются. Было отмечено, что, хотя «на первый взгляд это самая сухая часть книги, при более внимательном рассмотрении индекс может время от времени представлять как интерес, так и развлечение». [11]
Некоторые принципы хорошей индексации включают в себя: [12]
Подводные камни индексации:
Некоторые индексаторы специализируются на определенных форматах, таких как научные книги, микроформы, веб-индексация (применение индекса в стиле «на обороте книги» к веб-сайту или интрасети ), индексация поисковых систем , индексация баз данных (применение заранее определенного контролируемого словаря, такого как MeSH, к статьям для включения в базу данных) и периодическая индексация [13] (индексация газет, журналов, газетных статей).
Некоторые индексаторы, имеющие опыт работы с контролируемыми словарями, также работают таксономистами и онтологами .
Некоторые индексаторы специализируются на определенных предметных областях, таких как антропология, бизнес, компьютеры, экономика, образование, правительственные документы, история, право, математика, медицина, психология и технологии. Индексатор можно найти для любой темы.
В рассказе Хорхе Луиса Борхеса « Вавилонская библиотека » есть индекс индексов, который каталогизирует все книги в библиотеке, включающей все возможные книги.
В романе Курта Воннегута «Колыбель для кошки » есть персонаж, который является профессиональным индексатором и считает, что «индексирование — это то, что только самый непрофессиональный автор [берется] делать для своей собственной книги». Она утверждает, что может прочитать характер автора по индексу, который он создал для своего собственного исторического текста, и предупреждает рассказчика, автора: «Никогда не индексируйте свою собственную книгу».
Роман Владимира Набокова «Бледный огонь» включает пародию на индекс, отражающую безумие рассказчика.
Роман Марка Даниелевски «Дом из листьев» содержит исчерпывающий указатель слов из романа на 41 странице, включая даже большие списки несущественных слов, таких как , и , и в .
«Индекс» Дж. Г. Балларда — это короткая история, рассказанная в форме индекса к «неопубликованной и, возможно, запрещенной» автобиографии. [14]
Американское общество индексирования (ASI) — национальная ассоциация, основанная в 1968 году для продвижения передового опыта в индексировании и повышения осведомленности о ценности хорошо разработанных индексов. ASI обслуживает индексаторов, библиотекарей, референтов, редакторов, издателей, производителей баз данных, поисковиков данных, разработчиков продуктов, технических писателей, академических специалистов, исследователей и читателей, а также других лиц, заинтересованных в индексировании. Это единственная профессиональная организация в Соединенных Штатах, которая занимается исключительно развитием индексирования, реферирования и связанных с ними методов поиска информации.
Другие подобные общества включают: