В библиотечном деле и информатике документы (такие как книги, статьи и изображения) классифицируются и ищутся по предмету , а также по другим атрибутам, таким как автор, жанр и тип документа. Это делает «предмет» основополагающим термином в этой области. Специалисты по библиотечному делу и информатике присваивают документам метки предметов, чтобы их можно было найти . Существует много способов сделать это, и в целом не всегда существует консенсус относительно того, какой предмет следует присвоить данному документу. [1] Для оптимизации индексации и поиска предметов нам необходимо иметь более глубокое понимание того, что такое предмет. Вопрос: «что следует понимать под утверждением «документ A принадлежит к категории предметов X»?» обсуждается в этой области более 100 лет (см. ниже)
Для Каттера стабильность субъектов зависит от социального процесса, в котором их значение стабилизируется в имени или обозначении. Субъект «относится [...] к тем интеллектам [...], которые получили имя, которое само по себе представляет отчетливый консенсус в использовании» (Miksa, 1983a, p. 60) [2] и: «систематическая структура установленных субъектов» «находится в публичной сфере» (Miksa, 1983a, p. 69); «[с]убъекты по своей природе являются местами в классификационной структуре публично накопленных знаний (Miksa, 1983a, p. 61). Бернд Фроманн добавляет:
«Стабильность публичной сферы, в свою очередь, опирается на естественные и объективные ментальные структуры, которые при надлежащем образовании управляют естественным прогрессом от частных к общим концепциям. Поскольку для Каттера разум, общество и SKO [Системы организации знаний] стоят друг за другом, каждая из которых поддерживает друг друга, все проявляя одну и ту же структуру, его дискурсивное построение субъектов приглашает к связям с дискурсами разума, образования и общества. Десятичная классификация Дьюи (DDC), напротив, разрывает эти связи. Мелвил Дьюи не раз подчеркивал, что его система не отображает никакой структуры за пределами своей собственной; нет ни «трансцендентальной дедукции» ее категорий, ни какой-либо ссылки на объективную структуру социального консенсуса Каттера. Она лишена содержания: Дьюи презирал любые философские измышления о значении своих классовых символов, предоставляя работу по поиску словесных эквивалентов другим. Его новаторство и суть системы заключаются в нотации. DDC — это плохо семиотическая система расширяющихся гнезд из десяти цифр, лишенная какого-либо референта за пределами Сам по себе. В нем субъект полностью конституируется в терминах его положения в системе. Существенной характеристикой субъекта является классовый символ, который относится только к другим символам. Его словесный эквивалент случаен, это просто прагматическая характеристика... .... Конфликт интерпретаций по поводу "субъектов" стал явным в битвах между "библиографией" (подход к субъектам, имеющий много общего с Каттером) и "близкой классификацией" Дьюи. Уильям Флетчер говорил от имени ученого библиографа.... "Субъекты" Флетчера, как и Каттер, относились к категориям воображаемого, стабильного социального порядка, тогда как субъекты Дьюи были элементами семиологической системы стандартизированного, техно-бюрократического административного программного обеспечения для библиотеки в ее корпоративном, а не высококультурном воплощении". (Фроманн, 1994, 112–113). [3]
Ранний взгляд Каттера на то, что такое субъект, вероятно, мудрее большинства представлений, которые доминировали в 20 веке, а также представлений, отраженных в цитируемом ниже стандарте ISO. Ранние утверждения, цитируемые Фроманом, указывают на то, что субъекты каким-то образом формируются в социальных процессах. Когда это сказано, следует добавить, что они не особенно подробны или ясны. Мы получаем лишь смутное представление о социальной природе субъектов.
Система классификации с явной теоретической основой — это классификация толстой кишки Ранганатана . Ранганатан дал четкое определение понятия «субъект»:
Предмет – организованная совокупность идей, объем и содержание которых, вероятно, будут последовательно вписываться в сферу интересов и удобно входить в интеллектуальную компетентность и сферу неизбежной специализации обычного человека. [4]
Похожее определение дает один из учеников Ранганатана:
Предмет — это организованная и систематизированная совокупность идей. Она может состоять из одной идеи или из комбинации нескольких... [5]
Определение Ранганатана «субъекта» находится под сильным влиянием его системы классификации двоеточия. Система двоеточия основана на сочетании отдельных элементов от граней до обозначения субъекта. Вот почему так сильно подчеркивается комбинированная природа субъектов. Однако это приводит к абсурдам, таким как утверждение, что золото не может быть субъектом (но альтернативно называется «изолят»). Этот аспект теории подвергся критике со стороны Меткалфа (1973, стр. 318). [6] Скептицизм Меткалфа относительно теории Ранганатана сформулирован в жестких словах (op. cit., стр. 317): «Эта псевдонаука навязала себя британским ученикам примерно с 1950 года...».
Кажется неприемлемым, что Ранганатан определяет слово субъект таким образом, который благоприятствует его собственной системе. Научное понятие, такое как «субъект», должно позволить сравнивать различные способы установления доступа к информации. Объединены ли субъекты или нет, должно быть рассмотрено после того, как было дано их определение, это не должно определяться априори, в определении.
Помимо акцента на объединенной, организующей и систематизирующей природе субъектов, определение субъекта Ранганатаном содержит прагматическое требование, что субъект должен быть определен таким образом, который соответствует компетенции или специализации обычного человека. Опять же, мы видим странный вид желаемого за действительное, смешивающего общее понимание концепции с требованиями, предъявляемыми его собственной конкретной системой. Одно дело в том, что означает слово субъект, совсем другой вопрос в том, как предоставить описания субъекта, которые удовлетворяют таким требованиям, как специфика данного языка поиска информации, которые удовлетворяют требованиям, предъявляемым к системе, таким как точность и отзыв . Если исследователи слишком часто определяют термины способами, которые благоприятствуют определенным видам систем, то такие определения бесполезны для предоставления более общих теорий о субъектах, анализе субъекта и IR. Среди прочего, сравнительные исследования различных видов систем затруднены.
На основании этих аргументов, а также дополнительных аргументов, которые были использованы в литературе, мы можем сделать вывод, что определение Ранганатана понятия «субъект» не подходит для научного использования. Подобно определению «субъекта», данному стандартом ISO для тематических карт , определение Ранганатана может быть полезным в его собственной закрытой системе. Целью научной и академической области, однако, является изучение относительной плодотворности таких систем, как тематические карты и классификация Colon. Для этой цели необходимо другое понимание «субъекта».
В своей книге Уилсон (1968) [7] исследовал – в частности, с помощью мысленных экспериментов – пригодность различных методов изучения предмета документа. Методы были:
Патрик Уилсон убедительно показывает, что каждый из этих методов недостаточен для определения предмета документа, и приходит к выводу ( [7] с. 89): «Понятие предмета письма неопределенно...» или, на с. 92 (о том, что пользователи могут ожидать найти, используя определенную позицию в библиотечной системе классификации): «Ибо ничего определенного нельзя ожидать от вещей, найденных в любой данной позиции». В связи с последней цитатой Уилсон приводит интересную сноску, в которой он пишет, что авторы документов часто используют термины двусмысленно (в качестве примера приводится «враждебность»). Даже если бы библиотекарь мог лично разработать очень точное понимание концепции, он не смог бы использовать ее в своей классификации, потому что ни один из документов не использует этот термин таким же точным образом. Основываясь на этой аргументации, Уилсон приходит к выводу: «Если люди пишут о том, что для них является плохо определенными явлениями, правильное описание их предметов должно отражать плохо определенность».
Концепция субъекта Уилсона обсуждалась Хьёрландом (1992), который обнаружил, что проблематично отказаться от точного понимания такого базового термина в LIS. Аргументы Уилсона привели его к агностической позиции, которую Хьёрланд счел неприемлемой и ненужной. Что касается использования авторами неоднозначных терминов, роль анализа субъекта заключается в определении того, какие документы будут плодотворными для пользователей, чтобы определить, используют ли документы тот или иной термин или используется ли данный термин в документе в том или ином значении. Четкие и релевантные концепции и различия в системах классификации и контролируемых словарях могут быть плодотворными, даже если они применяются к документам с неоднозначной терминологией.
Индексация, ориентированная на запрос, — это индексация, в которой ожидаемый запрос от пользователей влияет на то, как индексируются документы. Индексатор спрашивает себя: «Под какими дескрипторами должна быть найдена эта сущность?» и «продумать все возможные запросы и решить, для каких из них данная сущность является релевантной» (Soergel, 1985, стр. 230). [8]
Индексация, ориентированная на запрос, может быть индексацией, нацеленной на определенную аудиторию или группу пользователей. Например, библиотека или база данных для феминистских исследований могут индексировать документы, отличные от исторической библиотеки. Однако, вероятно, лучше понимать индексацию, ориентированную на запрос, как индексацию, основанную на политике: индексация выполняется в соответствии с некоторыми идеалами и отражает цель библиотеки или базы данных, выполняющей индексацию. Таким образом, это не обязательно разновидность индексации, основанная на исследованиях пользователей. Только если применяются эмпирические данные об использовании или пользователях, индексацию, ориентированную на запрос, следует рассматривать как подход, основанный на пользователях.
Роули и Хартли (2008, стр. 109) [9] написали: «Чтобы добиться хорошей последовательной индексации, индексатор должен иметь полное представление о структуре предмета и характере вклада, который документ вносит в развитие знаний в рамках конкретной дисциплины». Это соответствует определению Хьёрланда, данному выше.
В стандарте ISO для тематических карт понятие предмета определяется следующим образом:
«Предмет. Что угодно, независимо от того, существует ли оно или имеет ли оно какие-либо другие особые характеристики, о котором может быть заявлено что угодно каким бы то ни было образом». ISO 13250-1, здесь цитируется по проекту: http://www1.y12.doe.gov/capabilities/sgml/sc34/document/0446.htm#overview)
Это определение может хорошо работать с закрытой системой понятий, предоставляемых стандартом тематических карт. Однако в более широком контексте оно не является плодотворным, поскольку не содержит никаких указаний на то, что следует идентифицировать в документе или в дискурсе при приписывании ему терминов или символов идентификации субъекта. Если различные методы анализа субъекта подразумевают разные результаты, какой из этих результатов можно тогда назвать отражением (истинного) субъекта? (Учитывая, что выражение «истинное назначение субъекта» вообще имеет смысл, что является важной частью проблемы). Разные люди могут иметь разные мнения о том, что является субъектом конкретного документа. Как теоретическое понимание термина «субъект» может быть полезным при принятии решений о принципах анализа субъекта?
Предложение о различии между индексацией понятий и индексацией предметов было выдвинуто Бернье (1980). [10] По его мнению, индексы предметов отличаются от индексов понятий, тем и слов и могут быть противопоставлены им. Предметы — это то, над чем работают и о чем сообщают авторы. Документ может иметь предмет хроматографии, если это то, о чем автор хочет сообщить. Статьи, использующие хроматографию как метод исследования или обсуждающие ее в подразделе, не имеют хроматографии в качестве предмета. Индексаторы могут легко перейти к индексации понятий и слов, а не предметов, но это нехорошее индексирование. Бернье, однако, не различает предметы автора от предметов искателя информации. Пользователь может захотеть документ о предмете, который отличается от того, который задумал его автор. С точки зрения информационных систем предмет документа связан с вопросами, на которые документ может ответить для пользователей (ср. различие между подходом, ориентированным на содержание, и подходом, ориентированным на запрос).
«Рабочая группа FRSAR осознает, что некоторые контролируемые словари предоставляют терминологию для выражения других аспектов произведений в дополнение к предмету (таких как форма, жанр и целевая аудитория ресурсов). Хотя эти аспекты очень важны и находятся в центре внимания многих запросов пользователей, они описывают сущность или класс, к которому принадлежит произведение, на основе формы или жанра (например, роман, пьеса, поэма, эссе, биография, симфония, концерт, соната, карта, рисунок, картина, фотография и т. д.), а не то, о чем произведение» (IFLA, 2010, стр. 10).
«Те авторы LIS, которые сосредоточились на предметах визуальных ресурсов, таких как произведения искусства и фотографии, часто были обеспокоены тем, как различать «описание» и «описание» (как конкретное, так и общее изображение или репрезентацию) таких работ (Shatford, 1986). В этом смысле «описание» имеет более узкое значение, чем то, которое использовалось выше. Картина заката над Сан-Франциско, например, может быть проанализирована как (в общем) «о» закатах и (в частности) «о» Сан-Франциско, но также «о» течении времени». (IFLA, 2010, стр. 11). См. также: Baca & Harpring (2000) [11] и Shatford (1986). [12]