Библиографическое сопряжение , как и совместное цитирование , является мерой сходства , которая использует анализ цитирования для установления отношения сходства между документами. Библиографическое сопряжение происходит, когда две работы ссылаются на общую третью работу в своих библиографиях . Это показатель того, что существует вероятность того, что две работы рассматривают связанную тему. [1]
Два документа библиографически связаны, если они оба ссылаются на один или несколько общих документов. «Сила связи» двух данных документов тем выше, чем больше ссылок на другие документы, которые они разделяют. Рисунок справа иллюстрирует концепцию библиографической связи. На рисунке документы A и B оба ссылаются на документы C, D и E. Таким образом, документы A и B имеют библиографическую силу связи 3 — количество элементов на пересечении их двух списков литературы.
Аналогично, два автора библиографически связаны , если кумулятивные списки ссылок их соответствующих произведений содержат ссылку на общий документ, и их сила связи также увеличивается с цитатами из других документов, которые они разделяют. Если кумулятивный список ссылок произведения автора определяется как мультимножественное объединение документов, которые автор написал в соавторстве, то сила библиографической связи автора двух авторов (или, точнее, их произведений) определяется как размер мультимножественного пересечения их кумулятивных списков ссылок. [2]
Библиографическое сопряжение может быть полезным в самых разных областях, поскольку оно помогает исследователям находить связанные исследования, выполненные в прошлом. С другой стороны, два документа считаются совместно цитируемыми , если они оба независимо цитируются одним или несколькими документами.
История
Концепция библиографической связи была введена М. М. Кесслером из Массачусетского технологического института в статье, опубликованной в 1963 году [3] , и была принята в работе ученого-информатика Юджина Гарфилда . [4] Это один из самых ранних методов анализа цитирования для вычисления сходства документов, и некоторые подвергают сомнению его полезность, указывая на то, что две работы могут ссылаться на совершенно не связанные между собой темы в третьей. Кроме того, библиографическая связь является ретроспективной мерой сходства, [5] что означает, что информация, используемая для установления отношения сходства между документами, находится в прошлом и является статичной, т. е. сила библиографической связи не может меняться со временем, поскольку исходящие счетчики цитирования фиксированы.
Подход к анализу совместного цитирования, представленный Генри Смоллом и опубликованный в 1973 году, устранял этот недостаток библиографической связи, рассматривая входящие цитирования документа для оценки сходства, меры, которая может меняться со временем. Кроме того, мера совместного цитирования отражает мнение многих авторов и, таким образом, представляет собой лучший индикатор предметного сходства. [6]
В 1972 году Роберт Амслер опубликовал статью [7], в которой описывалась мера определения предметного сходства между двумя документами путем объединения библиографической связи и анализа совместного цитирования. [8]
В 1981 году Говард Уайт и Белвер Гриффит представили анализ совместного цитирования авторов (ACA). [9] Только в 2008 году Данжи Чжао и Андреас Штротманн объединили свою работу и работу М. М. Кесслера, чтобы определить анализ библиографического сопряжения авторов (ABCA), отметив, что пока авторы активны, эта метрика не является статичной и что она особенно полезна в сочетании с ACA. [2]
Совсем недавно, в 2009 году, Гипп и Бил представили новый подход, названный анализом близости ко-цитирования (CPA). CPA основан на концепции совместного цитирования, но представляет собой усовершенствование меры Смолла в том смысле, что CPA дополнительно учитывает размещение и близость цитат в полном тексте документа. Предполагается, что цитаты, находящиеся ближе друг к другу, с большей вероятностью будут демонстрировать более сильную связь сходства. [10]
Подводя итог, хронологический обзор методов анализа цитирования включает:
- Библиографическая связь (1963)
- Анализ совместного цитирования (опубликовано в 1973 г.)
- Мера Амслера (1972)
- Анализ совместного цитирования авторов (1981)
- Анализ библиографического сопряжения авторов (2008)
- Анализ близости коцитирования (CPA) (2009)
Приложения
Онлайн-сайты, использующие библиографическую связь, включают The Collection of Computer Science Bibliographies Archived 2011-06-07 at Wayback Machine и CiteSeer.IST.
Смотрите также
Примечания
- ^ Мартин, Дж. (1964). «Библиографическая связь». Журнал документации . 20 (4): 236. doi :10.1108/eb026352.
- ^ ab Zhao, D.; Strotmann, A. (2008). «Эволюция исследовательской деятельности и интеллектуальных влияний в информационной науке 1996–2005: Введение в анализ библиографической связи авторов». Журнал Американского общества информационной науки и технологий . 59 (13): 2070–2086. doi : 10.1002/asi.20910 .
- ^ «Библиографическая связь между научными работами», American Documentation 24 (1963), стр. 123-131.
- ↑ См., например, «Множественные независимые открытия и творчество в науке», Current Contents , 3 ноября 1980 г., стр. 5–10, перепечатано в Essays of an Information Scientist, т. 4 (1979–1980 гг.), стр. 660–665.
- ^ Гарфилд Юджин, 2001. От библиографической связи к анализу совместного цитирования с помощью алгоритмической историко-библиографии, представлено в Университете Дрекселя, Филадельфия, Пенсильвания
- ^ Генри Смолл, 1973. "Совместное цитирование в научной литературе: новая мера взаимосвязи между двумя документами" Архивировано 2012-12-02 в Wayback Machine . Журнал Американского общества по информатике (JASIS), том 24(4), стр. 265-269. doi = 10.1002/asi.4630240406
- ↑ Роберт Амслер, декабрь 1972 г. «Применение автоматической классификации на основе цитирования», Центр лингвистических исследований Техасского университета в Остине, Технический отчет 72-14.
- ^ Класс Амслер, написанный Бруно Мартинсом и разработанный группой XLDB кафедры информатики факультета естественных наук Лиссабонского университета в Португалии.
- ^ Уайт, Ховард Д.; Гриффит, Белвер К. (1981). «Авторское цитирование: литературная мера интеллектуальной структуры». Журнал Американского общества информационной науки . 32 (3): 163–171. doi :10.1002/asi.4630320302.
- ^ Бела Гипп и Джоран Бил, 2009 Анализ близости цитирования (CPA) – новый подход к выявлению связанных работ на основе анализа совместного цитирования в Трудах 12-й международной конференции по наукометрии и информетрии (issi'09), Рио-де-Жанейро (Бразилия), 2009, стр. 571-575.
Ссылки
Библиографическая связь
- Кесслер, ММ (1963). «Библиографическая связь между научными работами». Американская документация . 14 (1): 10–25. doi :10.1002/asi.5090140103.
- Кесслер, ММ (1963). "Экспериментальное исследование библиографической связи между техническими статьями". Труды IEEE по теории информации . 9 (1): 49. doi :10.1109/tit.1963.1057800.
Авторская библиографическая связь
- Чжао, Д.; Штротманн, А. (2008). «Эволюция исследовательской деятельности и интеллектуальных влияний в информатике 1996–2005: Введение в анализ библиографической связи авторов». Журнал Американского общества информационной науки и технологий . 59 (13): 2070–2086. doi : 10.1002/asi.20910 .
Анализ совместного цитирования
- Смолл, Генри (1973). «Совместное цитирование в научной литературе: новая мера связи между двумя документами». Журнал Американского общества информационной науки . 24 (4): 265–269. doi :10.1002/asi.4630240406. S2CID 17845928.
- Смолл, Генри; Гриффит, BC (1974). «Структура научной литературы (I) Определение и графическое отображение специальностей». Science Studies . 4 (1): 17–40. doi :10.1177/030631277400400102. S2CID 146684402.
- Гриффит, BC; и др. (1974). «Структура научной литературы (II) К макро- и микроструктуре науки». Science Studies . 4 (4): 339–365. doi :10.1177/030631277400400402. S2CID 145811357.
- Коллинз, Х. М. (1974). «Набор TEA: неявное знание и научные сети». Science Studies . 4 (2): 165–186. doi :10.1177/030631277400400203. S2CID 26917303.
Анализ близости совместного цитирования (CPA)
- Бела Гипп, Анализ близости (совместного) цитирования – мера выявления связанных работ , февраль 2006 г. Докторское предложение, VLBA-Lab, Университет Отто фон Герике, Магдебург, научный руководитель: проф. Клаус Раутенштраух
- Гипп, Бела; Бил, Джоран (2006). «Анализ близости цитирования (CPA) – новый подход к выявлению связанных работ на основе анализа совместного цитирования» (PDF) . Труды 12-й Международной конференции по наукометрии и информетрике (ISSI'09) . Рио-де-Жанейро, Бразилия, 2009.
- Гипп, Бела; Тейлор, Адриана; Бил, Джоран (2010). «Анализ близости ссылок — кластеризация веб-сайтов путем изучения близости ссылок» (PDF) . В Lalmas M.; Jose J.; Rauber A.; Sebastiani F.; Frommholz I. (ред.). Исследования и передовые технологии для цифровых библиотек. ECDL 2010 . Конспект лекций по информатике. Том 6273. Springer.
Анализ совместного цитирования авторов (ACA)
- Уайт, HD; Гриффит, BC (1981). «Совместное цитирование авторов: литературная мера интеллектуальной структуры». Журнал Американского общества информационной науки . 32 (3): 163–171. doi :10.1002/asi.4630320302.
- Маккейн, К. У. (1986). «Соотнесение социтированных авторов как допустимое представление интеллектуальной структуры». Журнал Американского общества информационной науки . 37 (3): 111–122. doi :10.1002/(sici)1097-4571(198605)37:3<111::aid-asi2>3.0.co;2-d.
- Калнан, М. Дж. (1987). «Картирование интеллектуальной структуры MIS, 1980-1985: анализ совместного цитирования». MIS Quarterly . 11 (3): 341–353. doi :10.2307/248680. JSTOR 248680.
- Маккейн, К. У. (1990). «Картографирование авторов в интеллектуальном пространстве: технический обзор». Журнал Американского общества информационной науки . 41 (6): 433–443. doi :10.1002/(sici)1097-4571(199009)41:6<433::aid-asi11>3.0.co;2-q.
- Хоффман, Д.Л.; Холбрук, М.Б. (1993). «Интеллектуальная структура исследований потребителей: библиометрическое исследование социтирований авторов за первые 15 лет журнала исследований потребителей». Журнал исследований потребителей . 19 (4): 505–517. doi :10.1086/209319.
- Eom, SB (1996). «Картирование интеллектуальной структуры исследований в системах поддержки принятия решений посредством анализа авторского цитирования (1971-1993)». Системы поддержки принятия решений . 16 (4): 315–338. doi :10.1016/0167-9236(95)00026-7.
Исследования цитирования в более общем контексте
- Смолл, Генри (1978). «Цитируемые документы как концептуальные символы» (PDF) . Социальные исследования науки . 8 (3): 327–340. doi :10.1177/030631277800800305. S2CID 145538259.
- Генри Смолл (1982). «Анализ контекста цитирования». В: Бренда Дервин и М. Дж. Фойгт, ред., Прогресс в коммуникационных науках , том 3, стр. 287–310. Ablex Publishing, 1982.
- Блэр, Дэвид К.; Марон, М. Э. (1985). «Оценка эффективности поиска для системы поиска полнотекстовых документов». Сообщения ACM . 28 (3): 289–299. doi :10.1145/3166.3197. hdl : 2027.42/35415 . S2CID 5144091.
- Брин, Сергей ; Пейдж, Лоуренс (1998). «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете». Компьютерные сети и системы ISDN . 30 (1–7): 107–117. CiteSeerX 10.1.1.115.5930 . doi :10.1016/s0169-7552(98)00110-x. S2CID 7587743.
- Хе, Юйлань; Чунг Хуэй, Сиу (2002). «Изучение базы данных веб-цитирования для анализа совместного цитирования авторов». Обработка и управление информацией . 38 (4): 491–508. doi :10.1016/s0306-4573(01)00046-2.
- Брэдшоу, Шеннон (2003). «Индексирование, направленное на ссылки: восстановление релевантности для предметного поиска в индексах цитирования». Исследования и передовые технологии для цифровых библиотек . Конспект лекций по информатике. Том 2769. С. 499–510. doi :10.1007/978-3-540-45175-4_45. ISBN 978-3-540-40726-3.
- Ритчи, Анна; Тойфель, Симона; Робертсон, Стивен (2006). «Создание тестовой коллекции для экспериментов по IR на основе цитирования». Труды основной конференции по технологиям человеческого языка Конференции североамериканского отделения Ассоциации компьютерной лингвистики - . стр. 391–398. doi :10.3115/1220835.1220885. S2CID 16879847.
- Иваяма, Макото; Фуджи, Ацуши; Кандо, Норико; Марукава, Ёзо (2006). «Оценка поиска патентов на третьем семинаре NTCIR». Обработка информации и управление . 42 (1): 207–221. дои : 10.1016/j.ipm.2004.08.012.
- Фудзи, Ацуши (2007). «Улучшение поиска патентов с помощью анализа цитирования». Труды 30-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области поиска информации - SIGIR '07 . стр. 793–794. doi :10.1145/1277741.1277912. ISBN 9781595935977. S2CID 12433507.
- Строман, Тревор; Крофт, В. Брюс; Дженсен, Дэвид (2007). "Рекомендация ссылок для научных статей". Труды 30-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска - SIGIR '07 . стр. 705–706. doi :10.1145/1277741.1277868. ISBN 9781595935977. S2CID 11304924.
- Ричи, Анна; Робертсон, Стивен; Тойфель, Симона (2008). «Сравнение контекстов цитирования для поиска информации». Труды 17-й конференции ACM по добыче информации и знаний - CIKM '08 . С. 213–222. doi :10.1145/1458082.1458113. ISBN 9781595939913. S2CID 15585395.
- Шварцер, Мальте; Шуботц, Мориц; Мойшке, Норман; Брайтингер, Коринна; Маркл, Фолькер ; Гипп, Бела (2016). "Оценка рекомендаций на основе ссылок для Википедии" (PDF) . Труды 16-й конференции ACM/IEEE-CS по объединенной конференции по цифровым библиотекам - JCDL '16. стр. 191–200. doi :10.1145/2910896.2910908. ISBN 9781450342292. S2CID 2597308.
Дальнейшее чтение
Для интересного обзора хода изучения цитирования см. [1] Статья представляет собой скорее мемуары, чем исследовательскую работу, наполненную решениями, исследовательскими ожиданиями, интересами и мотивами, включая историю о том, как Генри Смолл обратился к Белверу Гриффиту с идеей совместного цитирования, и они стали соавторами, картографируя науку в целом.
Внешние ссылки
- ^ Смолл, Генри (2001). «Белвер и Генри». Наукометрия . 51 (3): 489–497. doi :10.1023/a:1019690918490. S2CID 5962665.
- ^ Бела Гипп, Норман Мойшке и Марио Липински, 2015. «CITREC: Структура оценки мер сходства на основе цитирования на основе TREC Genomics и PubMed Central» в Трудах конференции iConference 2015, Ньюпорт-Бич, Калифорния, 2015.