stringtranslate.com

Анализ цитирования

Анализ цитирования — это изучение частоты, закономерностей и графиков цитирования в документах. Он использует направленный граф цитирования — ссылки из одного документа в другой — для выявления свойств документов. Типичной целью является выявление наиболее важных документов в коллекции. Классическим примером являются цитирования между научными статьями и книгами. [1] [2] В качестве другого примера судьи подтверждают свои суждения , ссылаясь на суждения, вынесенные в более ранних делах (см. анализ цитирования в юридическом контексте). Дополнительным примером являются патенты, которые содержат предшествующий уровень техники , цитирование более ранних патентов, имеющих отношение к текущему иску. Оцифровка патентных данных и увеличение вычислительной мощности привели к появлению сообщества практиков, которые используют эти данные цитирования для измерения атрибутов инноваций, отслеживания потоков знаний и картирования инновационных сетей. [3]

Документы могут быть связаны со многими другими характеристиками в дополнение к цитатам, такими как авторы, издатели, журналы, а также их фактические тексты. Общий анализ коллекций документов известен как библиометрия , и анализ цитирования является ключевой частью этой области. Например, библиографическое связывание и совместное цитирование являются мерами ассоциации, основанными на анализе цитирования (общих цитирований или общих ссылок). Цитаты в коллекции документов также могут быть представлены в таких формах, как график цитирования , как указал Дерек Дж. де Солла Прайс в своей статье 1965 года «Сети научных статей». [4] Это означает, что анализ цитирования опирается на аспекты анализа социальных сетей и сетевой науки .

Ранним примером автоматизированной индексации цитирования был CiteSeer , который использовался для цитирования между научными работами, в то время как Web of Science является примером современной системы, которая включает в себя больше, чем просто научные книги и статьи, отражающие более широкий спектр источников информации. Сегодня автоматизированная индексация цитирования [5] изменила характер исследований анализа цитирования, позволяя анализировать миллионы цитирований для крупномасштабных моделей и открытия знаний . Инструменты анализа цитирования могут использоваться для вычисления различных мер воздействия для ученых на основе данных из индексов цитирования . [6] [7] [примечание 1] Они имеют различные приложения, от определения экспертов-рецензентов для рецензирования статей и предложений о грантах до предоставления прозрачных данных в поддержку обзора академических заслуг, пребывания в должности и решений о продвижении по службе. Эта конкуренция за ограниченные ресурсы может привести к этически сомнительному поведению для увеличения цитирования. [8] [9]

Много критики было высказано в отношении практики наивного использования анализа цитирования для сравнения влияния различных научных статей без учета других факторов, которые могут влиять на модели цитирования. [10] Среди этих критических замечаний повторяющееся внимание уделяется «факторам, зависящим от области», что относится к тому факту, что практика цитирования различается от одной области науки к другой и даже между областями исследований в пределах одной дисциплины. [11]

Обзор

Хотя индексы цитирования изначально были разработаны для поиска информации , они все чаще используются для библиометрии и других исследований, связанных с оценкой исследований. Данные о цитировании также являются основой популярного импакт-фактора журнала .

Существует большой объем литературы по анализу цитирования, иногда называемому наукометрией , термин, изобретенный Василием Налимовым , или, более конкретно, библиометрией . Область расцвела с появлением Индекса научного цитирования , который теперь охватывает исходную литературу с 1900 года. Ведущими журналами в этой области являются Scientometrics , Informetrics и Journal of the Association for Information Science and Technology . ASIST также размещает электронный список рассылки под названием SIGMETRICS в ASIST. [12] Этот метод переживает возрождение на основе широкого распространения баз данных подписки Web of Science и Scopus во многих университетах, а также общедоступных бесплатных инструментов цитирования, таких как CiteBase, CiteSeerX , Google Scholar и бывший Windows Live Academic (теперь доступный с дополнительными функциями как Microsoft Academic ). Методы исследования анализа цитирования включают качественные, количественные и вычислительные подходы. Основными направлениями таких наукометрических исследований были сравнение производительности, рейтинги институциональных исследований, рейтинги журналов [13] , установление стандартов производительности труда преподавателей и стажа работы, [14] оценка влияния ведущих научных статей, [15] отслеживание траектории развития области науки или технологий, [16] и разработка профилей ведущих авторов и учреждений с точки зрения эффективности исследований. [17]

Анализ юридических цитат — это метод анализа цитат для анализа юридических документов с целью облегчения понимания взаимосвязанных нормативных документов путем изучения ссылок, которые связывают положения с другими положениями в одном и том же документе или между разными документами. Анализ юридических цитат использует график цитат, извлеченный из нормативного документа, который может дополнять E-discovery — процесс, который использует технологические инновации в аналитике больших данных . [18] [19] [20] [21]

История

В статье 1965 года Дерек Дж. де Солла Прайс описал неотъемлемую характеристику связей SCI как «Сети научных статей». [4] Связи между цитированием и цитируемыми статьями стали динамичными, когда SCI начал публиковаться в Интернете. Индекс цитирования социальных наук стал одной из первых баз данных, смонтированных в системе Dialog [22] в 1972 году. С появлением издания на CD-ROM связывание стало еще проще и позволило использовать библиографическую связь для поиска связанных записей. В 1973 году Генри Смолл опубликовал свою классическую работу по анализу совместного цитирования, которая стала самоорганизующейся системой классификации, которая привела к экспериментам по кластеризации документов и в конечном итоге к «Атласу науки», позже названному «Обзоры исследований».

Внутренняя топологическая и графическая природа всемирной сети цитирования, которая является неотъемлемым свойством научной литературы, была описана Ральфом Гарнером ( Университет Дрекселя ) в 1965 году. [23]

Использование количества цитирований для ранжирования журналов было методом, использовавшимся в начале девятнадцатого века, но систематическое постоянное измерение этих показателей для научных журналов было инициировано Юджином Гарфилдом из Института научной информации, который также был пионером использования этих показателей для ранжирования авторов и статей . В знаковой статье 1965 года он и Ирвинг Шер показали корреляцию между частотой цитирования и известностью, продемонстрировав, что лауреаты Нобелевской премии опубликовали в пять раз больше статей, чем в среднем, в то время как их работы цитировались в 30-50 раз больше среднего. В длинной серии эссе о Нобелевской и других премиях Гарфилд описал это явление. Обычная сводная мера известна как импакт-фактор , количество ссылок на журнал за предыдущие два года, деленное на количество статей, опубликованных в эти годы. Она широко используется как в надлежащих, так и в ненадлежащих целях — в частности, использование только этой меры для ранжирования авторов и статей поэтому является довольно спорным.

В раннем исследовании 1964 года использования анализа цитирования при написании истории ДНК Гарфилд и Шер продемонстрировали потенциал для создания историографов , топологических карт наиболее важных шагов в истории научных тем. Эта работа была позже автоматизирована Э. Гарфилдом, А. И. Пудовкиным из Института биологии моря Российской академии наук и В. С. Истоминым из Центра преподавания, обучения и технологий Университета штата Вашингтон и привела к созданию программного обеспечения HistCite [24] около 2002 года.

Автоматическая индексация цитирования была введена в 1998 году Ли Джайлсом , Стивом Лоуренсом и Куртом Боллакером [25] и позволила автоматическое алгоритмическое извлечение и группировку цитат для любого цифрового академического и научного документа. Если ранее извлечение цитат было ручным процессом, то теперь меры цитирования можно масштабировать и вычислять для любой научной области и места размещения документа, а не только для тех, которые выбраны такими организациями, как ISI. Это привело к созданию новых систем для публичной и автоматизированной индексации цитирования, первой из которых была CiteSeer (теперь CiteSeerX , вскоре за ней последовала Cora, которая в первую очередь фокусировалась на области компьютерных наук и информационных наук . Позднее за ними последовали крупномасштабные академические доменные системы цитирования, такие как Google Scholar и Microsoft Academic. Такая автономная индексация цитирования пока не идеальна в извлечении цитат или кластеризации цитат с уровнем ошибок, оцениваемым примерно в 10 %, хотя тщательная статистическая выборка еще не проводилась. Это привело к тому, что таким авторам, как Энн Арбор , Милтон Кейнс и Уолтон Холл, приписывают обширные академические результаты. [26] SCI утверждает, что создает автоматическую индексацию цитирования с помощью чисто программных методов. Даже старые записи имеют схожую величину ошибок.

Влияние цитирования

Влияние цитирования или уровень цитирования — это мера того, сколько раз статья в академическом журнале, книга или автор цитируются другими статьями, книгами или авторами. [27] [28] [29] [30] [31] [32] Количество цитирований интерпретируется как мера влияния или воздействия академической работы и дало начало области библиометрии или наукометрии , [33] [34] специализирующейся на изучении закономерностей академического влияния посредством анализа цитирования. Важность журналов можно измерить по среднему уровню цитирования, [35] [32]

отношение количества цитирований к количеству статей, опубликованных в течение определенного периода времени и в определенном индексе, таком как импакт-фактор журнала или citescore . Он используется академическими учреждениями при принятии решений о сроке пребывания в должности , продвижении по службе и найме, а также используется авторами при принятии решения о том, в каком журнале публиковаться. Подобные цитированию меры также используются в других областях, где выполняется ранжирование , таких как алгоритм PageRank Google , метрики программного обеспечения , рейтинги колледжей и университетов и показатели эффективности бизнеса .

Анализ цитирования юридических документов

Анализ цитирования для юридических документов — это подход, облегчающий понимание и анализ взаимосвязанных документов по соблюдению нормативных требований путем изучения цитат, которые связывают положения с другими положениями в одном и том же документе или между разными документами. Анализ цитирования использует график цитирования, извлеченный из нормативного документа, который может дополнять E-discovery — процесс, который использует технологические инновации в аналитике больших данных . [20] [21] [36]

Анализ цитирования для обнаружения плагиата

Обнаружение плагиата на основе цитирования (CbPD) [37] основано на анализе цитирования и является единственным подходом к обнаружению плагиата, который не опирается на текстовое сходство. [38] CbPD проверяет цитирование и справочную информацию в текстах, чтобы выявить схожие закономерности в последовательностях цитирования. Таким образом, этот подход подходит для научных текстов или других академических документов, содержащих цитаты. Анализ цитирования для обнаружения плагиата является относительно молодой концепцией. Он не был принят коммерческим программным обеспечением, но существует первый прототип системы обнаружения плагиата на основе цитирования. [39] Подобный порядок и близость цитат в исследованных документах являются основными критериями, используемыми для вычисления сходства закономерностей цитирования. Закономерности цитирования представляют собой подпоследовательности, не эксклюзивно содержащие цитаты, общие для сравниваемых документов. [38] [40] Факторы, включая абсолютное число или относительную долю общих ссылок в шаблоне, а также вероятность того, что ссылки встречаются в документе одновременно, также учитываются для количественной оценки степени сходства шаблонов. [38] [40] [41] [42]

Анализ цитирования для обработки естественного языка

Обработка естественного языка (NLP), область на стыке искусственного интеллекта и лингвистики, готова существенно повлиять на общество посредством различных инноваций, таких как большие языковые модели . Влияние на NLP и NLP широко изучалось с помощью цитирования. Исследователи проанализировали различные факторы, такие как межотраслевое влияние между различными областями, [43] влияние отрасли, [44] временные закономерности цитирования, [45] плагиат, [46] географическое положение, [47] и пол. [48] Многие исследования показывают, что область становится более изолированной, с сужением фокуса, уменьшением междисциплинарности и концентрацией финансирования среди нескольких участников отрасли.

Споры

Смотрите также

Примечания

  1. ^ Примерами служат инструменты на основе подписки, основанные на собственных данных, такие как Web of Science и Scopus , а также бесплатные инструменты, основанные на открытых данных, такие как Scholarometer Филиппо Менцера и его команды.

Ссылки

  1. ^ Рубин, Ричард (2010). Основы библиотечного дела и информационной науки (3-е изд.). Нью-Йорк: Neal-Schuman Publishers. ISBN 978-1-55570-690-6.
  2. ^ Гарфилд, Э. Индексация цитирования — ее теория и применение в науке, технике и гуманитарных науках Филадельфия: ISI Press, 1983.
  3. ^ Джаффе, Адам; де Рассенфосс, Гаэтан (2017). «Данные о цитировании патентов в исследованиях в области социальных наук: обзор и передовой опыт». Журнал Ассоциации информационной науки и технологий . 68 (6): 1360–1374. doi :10.1002/asi.23731.
  4. ^ ab Derek J. de Solla Price (30 июля 1965 г.). "Networks of Scientific Papers" (PDF) . Science . 149 (3683): ​​510–515. Bibcode :1965Sci...149..510D. doi :10.1126/science.149.3683.510. PMID  14325149.
  5. ^ Джайлс, К. Ли; Боллакер, Курт Д.; Лоуренс, Стив (1998), «CiteSeer», Труды третьей конференции ACM по цифровым библиотекам — DL '98 , Нью-Йорк: Ассоциация вычислительной техники, стр. 89–98, doi :10.1145/276675.276685, ISBN 978-0-89791-965-4, S2CID  514080
  6. ^ Каур, Джаслин; Диеп Ти Хоанг; Сяолин Сан; Лино Поссамай; Мохсен Джафари Асбаг; Снехал Патил; Филиппо Менцер (2012). «Scholarometer: социальная структура для анализа воздействия по дисциплинам». PLOS ONE . 7 (9): e43235. Bibcode : 2012PLoSO...743235K. doi : 10.1371/journal.pone.0043235 . PMC 3440403. PMID  22984414. 
  7. ^ Хоанг, Д.; Каур, Дж.; Менцер, Ф. (2010), «Краудсорсинг научных данных», Труды WebSci10: Расширение границ общества в режиме онлайн, 26-27 апреля 2010 г., Роли, Северная Каролина: США , заархивировано из оригинала 2015-04-17 , извлечено 2015-08-09
  8. ^ Андерсон, М. С. ван; Роннинг, Э. А. ван; де Врис, Р.; Мартисон, Б. С. (2007). «Порочные эффекты конкуренции на работу и отношения ученых». Научная и инженерная этика . 4 (13): 437–461. doi :10.1007/s11948-007-9042-5. PMID  18030595. S2CID  2994701.
  9. ^ Везель, М. ван (2016). «Оценка по цитированию: тенденции в поведении публикаций, критерии оценки и стремление к публикациям с высоким влиянием». Научная и инженерная этика . 22 (1): 199–225. doi :10.1007/s11948-015-9638-0. PMC 4750571. PMID  25742806 . 
  10. ^ Борнманн, Л.; Дэниел, HD (2008). «Что измеряют счетчики цитирования? Обзор исследований по поведению цитирования». Журнал документации . 64 (1): 45–80. doi :10.1108/00220410810844150. hdl : 11858/00-001M-0000-0013-7A94-3 . S2CID  17260826.
  11. ^ Анауати, Мария Виктория и Галиани, Себастьян и Гальвес, Рамиро Х., Количественная оценка жизненного цикла научных статей в различных областях экономических исследований (11 ноября 2014 г.). Доступно на SSRN: https://ssrn.com/abstract=2523078
  12. ^ "Американское общество информационной науки и технологий". Информационное общество для информационной эпохи . Получено 21 мая 2006 г.
  13. ^ Lowry, Paul Benjamin; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; and Wilson, David W. (2013). «Оценка качества журнала и корзины журналов старших ученых Ассоциации информационных систем (AIS) с помощью библиометрических показателей: добавляют ли экспертные оценки журналов ценность?», MIS Quarterly, т. 37(4), 993–1012. Также видеорассказ об этой статье: TheAISChannel (22 октября 2014 г.). «Рейтинг журналов по информационным системам MISQ 2013». YouTube . Архивировано из оригинала 2 ноября 2023 г.
  14. ^ Дин, Дуглас Л.; Лоури, Пол Бенджамин; и Хамферис, Шон (2011). «Профилирование исследовательской продуктивности штатных преподавателей информационных систем в учреждениях США», MIS Quarterly, т. 35(1), стр. 1–15 ( ISSN  0276-7783).
  15. ^ Каруга, Гилберт Г.; Лоури, Пол Бенджамин; и Ричардсон, Вернон Дж. (2007). «Оценка влияния ведущих исследований информационных систем с течением времени», Сообщения Ассоциации информационных систем, т. 19(7), стр. 115–131 (http://aisel.aisnet.org/cais/vol19/iss1/7)
  16. ^ Лю, Джон С.; Лу, Луис YY (2012-03-01). «Комплексный подход к анализу основного пути: разработка индекса Хирша в качестве примера». Журнал Американского общества информационной науки и технологий . 63 (3): 528–542. doi :10.1002/asi.21692. ISSN  1532-2890.
  17. ^ Лоури, Пол Бенджамин; Каруга, Гилберт Г.; и Ричардсон, Вернон Дж. (2007). «Оценка ведущих учреждений, факультетов и статей в ведущих журналах по исследованию информационных систем», Communications of the Association for Information Systems, т. 20(16), стр. 142–203 (http://aisel.aisnet.org/cais/vol20/iss1/16).
  18. ^ Хаму-Лхадж, Абдельвахаб; Хамдака, Мохаммад (2009). «Анализ цитирования: подход к облегчению понимания и анализа документов о соответствии нормативным требованиям». Шестая международная конференция по информационным технологиям: новые поколения , 2009 г. стр. 278–283. doi :10.1109/ITNG.2009.161. ISBN 978-1-4244-3770-2. S2CID  10083351.
  19. ^ Мохаммад Хамдака и А. Хаму-Лхадж, «Анализ цитирования: подход к облегчению понимания и анализа документов по соблюдению нормативных требований», в материалах 6-й Международной конференции по информационным технологиям, Лас-Вегас, США.
  20. ^ ab "E-Discovery Special Report: The Rising Tide of Nonlinear Review". Hudson Legal. Архивировано из оригинала 3 июля 2012 г. Получено 1 июля 2012 г.Кэт Кейси и Алехандра Перес
  21. ^ ab "Чему электронные открытия с помощью технологий учат нас о роли людей в технологиях - обзор Re-Humanizing Technology-Assisted". Forbes . Получено 1 июля 2012 г.
  22. ^ "Dialog, A Thomson Business". Dialog изобрел онлайн-информационные сервисы . Получено 21.05.2006 .
  23. ^ Гарнер, Ральф; Лунин, Лоис; Бейкер, Лоис (1967). "Три исследования по информационной науке Дрекселя" (PDF) . Drexel Press. Архивировано из оригинала (PDF) 27 марта 2022 г. . Получено 14 августа 2022 г. .
  24. ^ Юджин Гарфилд; А. И. Пудовкин; В. С. Истомин (2002). «Алгоритмическая историография, связанная с цитированием — картирование научной литературы». Представлено ASIS&T 2002: информация, связи и сообщество. 65-я ежегодная встреча ASIST в Филадельфии, штат Пенсильвания. 18–21 ноября 2002 г. Получено 21 мая 2006 г.
  25. ^ CL Giles, K. Bollacker, S. Lawrence, «CiteSeer: автоматическая система индексации цитирования», DL'98 Digital Libraries, 3-я конференция ACM по цифровым библиотекам, стр. 89-98, 1998.
  26. ^ Postellon DC (март 2008 г.). «Холл и Кейнс присоединяются к Арбору в индексах цитирования». Nature . 452 (7185): 282. Bibcode :2008Natur.452..282P. doi : 10.1038/452282b . PMID  18354457.
  27. ^ Гарфилд, Э. (1955). «Индексы цитирования для науки: новое измерение в документации через ассоциацию идей». Science . 122 (3159): 108–111. Bibcode :1955Sci...122..108G. doi :10.1126/science.122.3159.108. PMID  14385826.
  28. ^ Гарфилд, Э. (1973). «Частота цитирования как мера исследовательской активности и производительности» (PDF) . Очерки ученого-информатика . 1 : 406–408.
  29. ^ Гарфилд, Э. (1988). «Могут ли исследователи рассчитывать на анализ цитирования?» (PDF) . Очерки специалиста по информации . 11 : 354.
  30. ^ Гарфилд, Э. (1998). «Использование импакт-факторов журналов и анализа цитирования при оценке науки». 41-е ежегодное заседание Совета редакторов биологических журналов .
  31. ^ Moed, Henk F. (2005). Анализ цитирования в оценке исследований . Springer . ISBN 978-1-4020-3713-9.
  32. ^ ab Haustein, S. (2012). Многомерная оценка журнала: анализ научных периодических изданий за пределами импакт-фактора. Знания и информация. De Gruyter. ISBN 978-3-11-025555-3. Получено 2023-06-06 .
  33. ^ Лейдесдорф, Л. и Милоевич, С. (2012). Наукометрия. Препринт arXiv arXiv:1208.4566.
  34. ^ Харнад, С. (2009). Открытый доступ к наукометрии и британская программа оценки исследований. Наукометрия, 79(1), 147-156.
  35. ^ Гарфилд, Юджин (1972-11-03). «Анализ цитирования как инструмент оценки журнала». Science . 178 (4060). Американская ассоциация содействия развитию науки (AAAS): 471–479. Bibcode :1972Sci...178..471G. doi :10.1126/science.178.4060.471. ISSN  0036-8075. PMID  5079701.
  36. ^ Хамдака, М.; А Хаму-Лхадж (2009). «Анализ цитирования: подход к облегчению понимания и анализа документов о соответствии нормативным требованиям». 2009 Шестая международная конференция по информационным технологиям: Новые поколения . 2009 Шестая международная конференция по информационным технологиям: Новые поколения. Лас-Вегас, Невада: IEEE. стр. 278–283. doi :10.1109/ITNG.2009.161. ISBN 978-1-4244-3770-2. S2CID  10083351.
  37. ^ Гипп, Бела (2014), Обнаружение плагиата на основе цитирования, Springer Vieweg Research, ISBN 978-3-658-06393-1
  38. ^ abc Гипп, Бела; Беел, Йоран (июнь 2010 г.), «Обнаружение плагиата на основе цитирования — новый подход к независимому выявлению плагиатного языка в работах», Труды 21-й конференции ACM по гипертексту и гипермедиа (HT'10) (PDF) , ACM, стр. 273–274, doi :10.1145/1810617.1810671, ISBN 978-1-4503-0041-4, S2CID  2668037, архивировано из оригинала (PDF) 25 апреля 2012 г. , извлечено 21 октября 2011 г.
  39. ^ Гипп, Бела; Мойшке, Норман; Брайтингер, Коринна; Липински, Марио; Нюрнбергер, Андреас (28 июля 2013 г.), «Демонстрация анализа шаблонов цитирования для обнаружения плагиата», Труды 36-й Международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска (PDF) , ACM, стр. 1119, doi :10.1145/2484028.2484214, ISBN 9781450320344, S2CID  2106222
  40. ^ ab Gipp, Bela; Meuschke, Norman (сентябрь 2011 г.), «Алгоритмы сопоставления шаблонов цитирования для обнаружения плагиата на основе цитирования: жадное цитирование, фрагментация цитирования и самая длинная общая последовательность цитирования», Труды 11-го симпозиума ACM по проектированию документов (DocEng2011) (PDF) , ACM, стр. 249–258, doi : 10.1145/2034691.2034741, ISBN 978-1-4503-0863-2, S2CID  207190305, архивировано из оригинала (PDF) 25 апреля 2012 г. , извлечено 7 октября 2011 г.
  41. ^ Гипп, Бела; Мойшке, Норман; Бил, Йоран (июнь 2011 г.), «Сравнительная оценка подходов к обнаружению плагиата на основе текста и цитирования с использованием GuttenPlag», Труды 11-й совместной конференции ACM/IEEE-CS по цифровым библиотекам (JCDL'11) (PDF) , ACM, стр. 255–258, CiteSeerX 10.1.1.736.4865 , doi :10.1145/1998076.1998124, ISBN  978-1-4503-0744-4, S2CID  3683238, заархивировано из оригинала (PDF) 25 апреля 2012 г. , извлечено 7 октября 2011 г.
  42. ^ Гипп, Бела; Бил, Йоран (июль 2009 г.), «Анализ близости цитирования (CPA) — новый подход к выявлению связанных работ на основе анализа совместного цитирования», Труды 12-й Международной конференции по наукометрии и информетрии (ISSI'09) (PDF) , Международное общество наукометрии и информетрии, стр. 571–575, ISSN  2175-1935, архивировано из оригинала (PDF) 13 сентября 2012 г. , извлечено 7 октября 2011 г.
  43. ^ Вахле, Ян Филип; Руас, Терри; Абдалла, Мохамед; Гипп, Бела; Мохаммад, Саиф (декабрь 2023 г.). «Мы те, кого мы цитируем: мосты влияния между обработкой естественного языка и другими академическими областями». В Bouamor, Houda; Pino, Juan; Bali, Kalika (ред.). Труды конференции 2023 года по эмпирическим методам в обработке естественного языка . Сингапур: Ассоциация компьютерной лингвистики. стр. 12896–12913. doi :10.18653/v1/2023.emnlp-main.797.
  44. ^ Абдалла, Мохамед; Вахле, Ян Филип; Руас, Терри; Невеоль, Орели; Дюсель, Фанни; Мохаммад, Саиф; Форт, Карен (июль 2023 г.). Роджерс, Анна; Бойд-Грабер, Джордан; Окадзаки, Наоаки (ред.). «Слон в комнате: анализ присутствия крупных технологий в исследованиях обработки естественного языка». Труды 61-го ежегодного собрания Ассоциации компьютерной лингвистики (том 1: длинные статьи) . Торонто, Канада: Ассоциация компьютерной лингвистики: 13141–13160. arXiv : 2305.02797 . doi :10.18653/v1/2023.acl-long.734.
  45. ^ Сингх, Джанвиджай; Рунгта, Мукунд; Янг, Дийи; Мохаммад, Саиф (июль 2023 г.). Роджерс, Анна; Бойд-Грабер, Джордан; Оказаки, Наоаки (ред.). «Забытые знания: исследование цитационной амнезии в НЛП». Труды 61-го ежегодного собрания Ассоциации компьютерной лингвистики (том 1: длинные статьи) . Торонто, Канада: Ассоциация компьютерной лингвистики: 6192–6208. arXiv : 2305.18554 . doi :10.18653/v1/2023.acl-long.341.
  46. ^ Вахле, Ян Филип; Руас, Терри; Кирстейн, Фредерик; Гипп, Бела (декабрь 2022 г.). «Как большие языковые модели преобразуют плагиат машинного парафраза». В Голдберг, Йоав; Козарева, Зорница; Чжан, Юэ (ред.). Труды конференции 2022 года по эмпирическим методам обработки естественного языка . Абу-Даби, Объединенные Арабские Эмираты: Ассоциация компьютерной лингвистики. стр. 952–963. doi :10.18653/v1/2022.emnlp-main.62.
  47. ^ Рунгта, Мукунд; Сингх, Джанвиджай; Мохаммад, Саиф М.; Янг, Дийи (декабрь 2022 г.). «Географические пробелы в цитировании в исследованиях НЛП». В Голдберг, Йоав; Козарева, Зорница; Чжан, Юэ (ред.). Труды конференции 2022 года по эмпирическим методам обработки естественного языка . Абу-Даби, Объединенные Арабские Эмираты: Ассоциация компьютерной лингвистики. стр. 1371–1383. doi :10.18653/v1/2022.emnlp-main.89.
  48. ^ Мохаммад, Саиф М. (июль 2020 г.). Джурафски, Дэн; Чай, Джойс; Шлютер, Натали; Тетро, ​​Джоэл (ред.). «Гендерный разрыв в исследованиях обработки естественного языка: различия в авторстве и цитировании». Труды 58-го ежегодного собрания Ассоциации компьютерной лингвистики . Онлайн: Ассоциация компьютерной лингвистики: 7860–7870. arXiv : 2005.00962 . doi : 10.18653/v1/2020.acl-main.702.
  49. ^ Чжао, Лиза. «Как библиотекарь использовал электронные ресурсы — анализ цитат в CCQ». Cataloging & Classification Quarterly 42(1) (2006): 117-131.
  50. ^ Лоуренс, Стив. Бесплатная доступность в Интернете существенно увеличивает влияние статьи. Nature, том 411 (номер 6837) (2001): 521. Также в Интернете по адресу http://citeseer.ist.psu.edu/online-nature01/
  51. ^ Gálvez RH (март 2017 г.). «Оценка самоцитирования автора как механизма распространения релевантных знаний». Scientometrics . 111 (3): 1801–1812. doi :10.1007/s11192-017-2330-1. S2CID  6863843.
  52. ^ Сингх Чавла, Далмит (5 июля 2016 г.). «Мужчины цитируют себя чаще, чем женщины». Nature . 535 (7611): 212. doi : 10.1038/nature.2016.20176 . PMID  27414239. S2CID  4395779.
  53. ^ Ван дер Вальт, Винанд; Виллемс, Крис; Фридрих, Вернер; Хацу, Сильвестр; Кирстин, Краусс (2020). «Отозванные статьи о COVID-19 и уровни «загрязнения цитированием»: предварительный анализ и направления дальнейших исследований». Cahiers de la Documentation - Bladen voor Documentatie . 3 (4). hdl :10962/167732 . Получено 13 января 2021 г. .
  54. ^ Пол, Памела (2023-05-04). «Статья, в которой говорится, что наука должна быть беспристрастной, была отклонена крупными журналами. Этого не придумаешь». The New York Times . ISSN  0362-4331 . Получено 2023-05-06 .