Тема (документы)

В библиотечном деле и информатике документы (такие как книги, статьи и изображения) классифицируются и ищутся по предмету , а также по другим атрибутам, таким как автор, жанр и тип документа. Это делает «предмет» основополагающим термином в этой области. Специалисты по библиотечному делу и информатике присваивают документам метки предметов, чтобы их можно было найти . Существует много способов сделать это, и в целом не всегда существует консенсус относительно того, какой предмет следует присвоить данному документу. ^[1] Для оптимизации индексации и поиска предметов нам необходимо иметь более глубокое понимание того, что такое предмет. Вопрос: «что следует понимать под утверждением «документ A принадлежит к категории предметов X»?» обсуждается в этой области более 100 лет (см. ниже)

Теоретический взгляд

Чарльз Эмми Каттер(1837–1903)

Для Каттера стабильность субъектов зависит от социального процесса, в котором их значение стабилизируется в имени или обозначении. Субъект «относится [...] к тем интеллектам [...], которые получили имя, которое само по себе представляет отчетливый консенсус в использовании» (Miksa, 1983a, p. 60) ^[2] и: «систематическая структура установленных субъектов» «находится в публичной сфере» (Miksa, 1983a, p. 69); «[с]убъекты по своей природе являются местами в классификационной структуре публично накопленных знаний (Miksa, 1983a, p. 61). Бернд Фроманн добавляет:

«Стабильность публичной сферы, в свою очередь, опирается на естественные и объективные ментальные структуры, которые при надлежащем образовании управляют естественным прогрессом от частных к общим концепциям. Поскольку для Каттера разум, общество и SKO [Системы организации знаний] стоят друг за другом, каждая из которых поддерживает друг друга, все проявляя одну и ту же структуру, его дискурсивное построение субъектов приглашает к связям с дискурсами разума, образования и общества. Десятичная классификация Дьюи (DDC), напротив, разрывает эти связи. Мелвил Дьюи не раз подчеркивал, что его система не отображает никакой структуры за пределами своей собственной; нет ни «трансцендентальной дедукции» ее категорий, ни какой-либо ссылки на объективную структуру социального консенсуса Каттера. Она лишена содержания: Дьюи презирал любые философские измышления о значении своих классовых символов, предоставляя работу по поиску словесных эквивалентов другим. Его новаторство и суть системы заключаются в нотации. DDC — это плохо семиотическая система расширяющихся гнезд из десяти цифр, лишенная какого-либо референта за пределами Сам по себе. В нем субъект полностью конституируется в терминах его положения в системе. Существенной характеристикой субъекта является классовый символ, который относится только к другим символам. Его словесный эквивалент случаен, это просто прагматическая характеристика... .... Конфликт интерпретаций по поводу "субъектов" стал явным в битвах между "библиографией" (подход к субъектам, имеющий много общего с Каттером) и "близкой классификацией" Дьюи. Уильям Флетчер говорил от имени ученого библиографа.... "Субъекты" Флетчера, как и Каттер, относились к категориям воображаемого, стабильного социального порядка, тогда как субъекты Дьюи были элементами семиологической системы стандартизированного, техно-бюрократического административного программного обеспечения для библиотеки в ее корпоративном, а не высококультурном воплощении". (Фроманн, 1994, 112–113). ^[3]

Ранний взгляд Каттера на то, что такое субъект, вероятно, мудрее большинства представлений, которые доминировали в 20 веке, а также представлений, отраженных в цитируемом ниже стандарте ISO. Ранние утверждения, цитируемые Фроманом, указывают на то, что субъекты каким-то образом формируются в социальных процессах. Когда это сказано, следует добавить, что они не особенно подробны или ясны. Мы получаем лишь смутное представление о социальной природе субъектов.

SR Ранганатан(1892–1972)

Система классификации с явной теоретической основой — это классификация толстой кишки Ранганатана . Ранганатан дал четкое определение понятия «субъект»:

Предмет – организованная совокупность идей, объем и содержание которых, вероятно, будут последовательно вписываться в сферу интересов и удобно входить в интеллектуальную компетентность и сферу неизбежной специализации обычного человека. ^[4]

Похожее определение дает один из учеников Ранганатана:

Предмет — это организованная и систематизированная совокупность идей. Она может состоять из одной идеи или из комбинации нескольких... ^[5]

Определение Ранганатана «субъекта» находится под сильным влиянием его системы классификации двоеточия. Система двоеточия основана на сочетании отдельных элементов от граней до обозначения субъекта. Вот почему так сильно подчеркивается комбинированная природа субъектов. Однако это приводит к абсурдам, таким как утверждение, что золото не может быть субъектом (но альтернативно называется «изолят»). Этот аспект теории подвергся критике со стороны Меткалфа (1973, стр. 318). ^[6] Скептицизм Меткалфа относительно теории Ранганатана сформулирован в жестких словах (op. cit., стр. 317): «Эта псевдонаука навязала себя британским ученикам примерно с 1950 года...».

Кажется неприемлемым, что Ранганатан определяет слово субъект таким образом, который благоприятствует его собственной системе. Научное понятие, такое как «субъект», должно позволить сравнивать различные способы установления доступа к информации. Объединены ли субъекты или нет, должно быть рассмотрено после того, как было дано их определение, это не должно определяться априори, в определении.

Помимо акцента на объединенной, организующей и систематизирующей природе субъектов, определение субъекта Ранганатаном содержит прагматическое требование, что субъект должен быть определен таким образом, который соответствует компетенции или специализации обычного человека. Опять же, мы видим странный вид желаемого за действительное, смешивающего общее понимание концепции с требованиями, предъявляемыми его собственной конкретной системой. Одно дело в том, что означает слово субъект, совсем другой вопрос в том, как предоставить описания субъекта, которые удовлетворяют таким требованиям, как специфика данного языка поиска информации, которые удовлетворяют требованиям, предъявляемым к системе, таким как точность и отзыв . Если исследователи слишком часто определяют термины способами, которые благоприятствуют определенным видам систем, то такие определения бесполезны для предоставления более общих теорий о субъектах, анализе субъекта и IR. Среди прочего, сравнительные исследования различных видов систем затруднены.

На основании этих аргументов, а также дополнительных аргументов, которые были использованы в литературе, мы можем сделать вывод, что определение Ранганатана понятия «субъект» не подходит для научного использования. Подобно определению «субъекта», данному стандартом ISO для тематических карт , определение Ранганатана может быть полезным в его собственной закрытой системе. Целью научной и академической области, однако, является изучение относительной плодотворности таких систем, как тематические карты и классификация Colon. Для этой цели необходимо другое понимание «субъекта».

Патрик Уилсон(1927–2003)

В своей книге Уилсон (1968) ^[7] исследовал – в частности, с помощью мысленных экспериментов – пригодность различных методов изучения предмета документа. Методы были:

определение цели автора при написании документа,
взвешивание относительного доминирования и подчинения различных элементов в картине, которые чтение навязывает читателю,
группировка или подсчет использования концепций и ссылок в документе,
разработка набора правил для выбора элементов, которые считаются необходимыми (в отличие от ненужных) для работы в целом.

Патрик Уилсон убедительно показывает, что каждый из этих методов недостаточен для определения предмета документа, и приходит к выводу ( ^[7] с. 89): «Понятие предмета письма неопределенно...» или, на с. 92 (о том, что пользователи могут ожидать найти, используя определенную позицию в библиотечной системе классификации): «Ибо ничего определенного нельзя ожидать от вещей, найденных в любой данной позиции». В связи с последней цитатой Уилсон приводит интересную сноску, в которой он пишет, что авторы документов часто используют термины двусмысленно (в качестве примера приводится «враждебность»). Даже если бы библиотекарь мог лично разработать очень точное понимание концепции, он не смог бы использовать ее в своей классификации, потому что ни один из документов не использует этот термин таким же точным образом. Основываясь на этой аргументации, Уилсон приходит к выводу: «Если люди пишут о том, что для них является плохо определенными явлениями, правильное описание их предметов должно отражать плохо определенность».

Концепция субъекта Уилсона обсуждалась Хьёрландом (1992), который обнаружил, что проблематично отказаться от точного понимания такого базового термина в LIS. Аргументы Уилсона привели его к агностической позиции, которую Хьёрланд счел неприемлемой и ненужной. Что касается использования авторами неоднозначных терминов, роль анализа субъекта заключается в определении того, какие документы будут плодотворными для пользователей, чтобы определить, используют ли документы тот или иной термин или используется ли данный термин в документе в том или ином значении. Четкие и релевантные концепции и различия в системах классификации и контролируемых словарях могут быть плодотворными, даже если они применяются к документам с неоднозначной терминологией.

«Ориентированные на контент» и «ориентированные на запрос» представления

Индексация, ориентированная на запрос, — это индексация, в которой ожидаемый запрос от пользователей влияет на то, как индексируются документы. Индексатор спрашивает себя: «Под какими дескрипторами должна быть найдена эта сущность?» и «продумать все возможные запросы и решить, для каких из них данная сущность является релевантной» (Soergel, 1985, стр. 230). ^[8]

Индексация, ориентированная на запрос, может быть индексацией, нацеленной на определенную аудиторию или группу пользователей. Например, библиотека или база данных для феминистских исследований могут индексировать документы, отличные от исторической библиотеки. Однако, вероятно, лучше понимать индексацию, ориентированную на запрос, как индексацию, основанную на политике: индексация выполняется в соответствии с некоторыми идеалами и отражает цель библиотеки или базы данных, выполняющей индексацию. Таким образом, это не обязательно разновидность индексации, основанная на исследованиях пользователей. Только если применяются эмпирические данные об использовании или пользователях, индексацию, ориентированную на запрос, следует рассматривать как подход, основанный на пользователях.

Взгляд на предмет знания

Роули и Хартли (2008, стр. 109) ^[9] написали: «Чтобы добиться хорошей последовательной индексации, индексатор должен иметь полное представление о структуре предмета и характере вклада, который документ вносит в развитие знаний в рамках конкретной дисциплины». Это соответствует определению Хьёрланда, данному выше.

Другие взгляды и определения

В стандарте ISO для тематических карт понятие предмета определяется следующим образом:

«Предмет. Что угодно, независимо от того, существует ли оно или имеет ли оно какие-либо другие особые характеристики, о котором может быть заявлено что угодно каким бы то ни было образом». ISO 13250-1, здесь цитируется по проекту: http://www1.y12.doe.gov/capabilities/sgml/sc34/document/0446.htm#overview)

Это определение может хорошо работать с закрытой системой понятий, предоставляемых стандартом тематических карт. Однако в более широком контексте оно не является плодотворным, поскольку не содержит никаких указаний на то, что следует идентифицировать в документе или в дискурсе при приписывании ему терминов или символов идентификации субъекта. Если различные методы анализа субъекта подразумевают разные результаты, какой из этих результатов можно тогда назвать отражением (истинного) субъекта? (Учитывая, что выражение «истинное назначение субъекта» вообще имеет смысл, что является важной частью проблемы). Разные люди могут иметь разные мнения о том, что является субъектом конкретного документа. Как теоретическое понимание термина «субъект» может быть полезным при принятии решений о принципах анализа субъекта?

Связанные концепции

Индексация слов, концепций и предметов

Предложение о различии между индексацией понятий и индексацией предметов было выдвинуто Бернье (1980). ^[10] По его мнению, индексы предметов отличаются от индексов понятий, тем и слов и могут быть противопоставлены им. Предметы — это то, над чем работают и о чем сообщают авторы. Документ может иметь предмет хроматографии, если это то, о чем автор хочет сообщить. Статьи, использующие хроматографию как метод исследования или обсуждающие ее в подразделе, не имеют хроматографии в качестве предмета. Индексаторы могут легко перейти к индексации понятий и слов, а не предметов, но это нехорошее индексирование. Бернье, однако, не различает предметы автора от предметов искателя информации. Пользователь может захотеть документ о предмете, который отличается от того, который задумал его автор. С точки зрения информационных систем предмет документа связан с вопросами, на которые документ может ответить для пользователей (ср. различие между подходом, ориентированным на содержание, и подходом, ориентированным на запрос).

Существование

«Рабочая группа FRSAR осознает, что некоторые контролируемые словари предоставляют терминологию для выражения других аспектов произведений в дополнение к предмету (таких как форма, жанр и целевая аудитория ресурсов). Хотя эти аспекты очень важны и находятся в центре внимания многих запросов пользователей, они описывают сущность или класс, к которому принадлежит произведение, на основе формы или жанра (например, роман, пьеса, поэма, эссе, биография, симфония, концерт, соната, карта, рисунок, картина, фотография и т. д.), а не то, о чем произведение» (IFLA, 2010, стр. 10).

Оффнесс

«Те авторы LIS, которые сосредоточились на предметах визуальных ресурсов, таких как произведения искусства и фотографии, часто были обеспокоены тем, как различать «описание» и «описание» (как конкретное, так и общее изображение или репрезентацию) таких работ (Shatford, 1986). В этом смысле «описание» имеет более узкое значение, чем то, которое использовалось выше. Картина заката над Сан-Франциско, например, может быть проанализирована как (в общем) «о» закатах и (в частности) «о» Сан-Франциско, но также «о» течении времени». (IFLA, 2010, стр. 11). См. также: Baca & Harpring (2000) ^[11] и Shatford (1986). ^[12]

Смотрите также

Ссылки

^ Сарацевич, Тефко (2008). «Влияние противоречивых суждений о релевантности на результаты теста поиска информации: историческая перспектива» (PDF) . Library Trends . 56 (4): 763–783. doi :10.1353/lib.0.0000. hdl :2142/9492. S2CID 13982665. Архивировано из оригинала (PDF) 5 апреля 2012 г. . Получено 18 сентября 2022 г. .
^ Микса, Ф. (1983a): Мелвин Дьюи и корпоративный идеал. С. 49–100 IN: Мелвин Дьюи: Человек и классификация. Ред. Г. Стивенсона и Дж. Крамера-Грина. Олбани, Нью-Йорк: Forest Press.
^ Фроманн, Б. (1994). Социальное построение организации знаний: случай Мелвина Дьюи. Достижения в организации знаний, 4, 109–117.
^ Ранганатан, SR (1967). Пролегомены к библиотечной классификации (стр. 82). Лондон: Asia Publishing House
^ Gopinath, MA (1976). Классификация толстой кишки. В: A.Maltby (ред.): Классификация в 1970-х годах: второй взгляд (пересмотренное издание; стр. 51–80). Лондон: Clive Bingly.
^ Меткалф, Дж. (1973). Когда субъект не является субъектом? В: К теории библиотечного дела. Ред. Конрад Х. Равски. Нью-Йорк: Scarecrow Press.
^ ab Wilson, Patrick (1968). Два вида власти. Эссе о библиографическом контроле. Беркли: Издательство Калифорнийского университета.
^ Soergel, Dagobert (1985). Организация информации: принципы баз данных и поисковых систем. Орландо, Флорида: Academic Press.
^ Роули, Дженнифер и Хартли, Ричард (2008). Организация знаний. Введение в управление доступом к информации. 4-е издание. Олдершот: Ashgate Publishing Limited.
^ Бернье, CL (1980). Предметные указатели. В: Кент, А.; Ланкур, Х. и Дейли, Дж. Э. (ред.), Энциклопедия библиотековедения и информационной науки: том 29. Нью-Йорк, Нью-Йорк: Marcel Dekker, Inc.: 191–205.
^ Бака, Мурта; Харпринг, Патрисия (2000). «Категории для описания произведений искусства». Фонд Дж. Пола Гетти и Ассоциация колледжей искусств . Архивировано из оригинала 12 октября 2003 г. Получено 18 сентября 2022 г.
^ Шэтфорд, Сара (1986). «Анализ предмета изображения: теоретический подход». Cataloging & Classification Quarterly . 6 (3): 39–62. doi :10.1300/J104v06n03_04. Архивировано из оригинала 15 июля 2017 г. Получено 18 сентября 2022 г.

Дальнейшее чтение

Drake, CL (1960). Что такое предмет? Australian Library Journal, 9, 34–41.

Энглбрецен, Джордж (1987). Предметы. Студия Лейбнитиана, Bd. 19, ч. 1, стр. 85–90. Издатель: Франц Штайнер Верлаг. JSTOR 40694071

IFLA (2010). Функциональные требования к данным предметной авторитетности (FRSAD): концептуальная модель. Рабочая группа IFLA по функциональным требованиям к записям предметной авторитетности (FRSAR). Под редакцией Марсии Лей Цзэн, Майи Умер, Афины Салаба. Международная федерация библиотечных ассоциаций и учреждений. Берлин: De Gruyter. Получено 14 сентября 2011 г. с сайта: http://www.ifla.org/files/classification-and-indexing/functional-requirements-for-subject-authority-data/frsad-final-report.pdf

Микса, Ф. (1983b): Предмет в каталоге словаря от Каттера до наших дней. Чикаго: Американская библиотечная ассоциация.

Welty, CA (1998). Онтологическая природа предметных таксономий. IN: N. Guarino (ред.), Труды первой конференции по формальной онтологии и информационным системам, Амстердам, IOS Press. http://www.cs.vassar.edu/faculty/welty/papers/fois-98/fois-98-1.html