Google Scholar — это свободно доступная поисковая система в Интернете , которая индексирует полный текст или метаданные научной литературы по множеству издательских форматов и дисциплин. Выпущенный в бета-версии в ноябре 2004 года, индекс Google Scholar включает рецензируемые академические онлайн- журналы и книги, статьи конференций, тезисы и диссертации , препринты , рефераты , технические отчеты и другую научную литературу, включая судебные решения и патенты . [1]
Google Scholar использует веб-сканер или веб-робота для идентификации файлов для включения в результаты поиска. [2] Чтобы контент был проиндексирован в Google Scholar, он должен соответствовать определенным критериям. [3] Более ранняя статистическая оценка, опубликованная в PLOS One с использованием метода отметки и повторного захвата, оценивала охват примерно 79–90% всех статей, опубликованных на английском языке, с оценкой в 100 миллионов. [4] Эта оценка также определила, сколько документов было в свободном доступе в Интернете. Google Scholar подвергся критике за то, что он не проверяет журналы и включает в свой индекс журналы-хищники . [5]
Библиотека Мичиганского университета и другие библиотеки, чьи коллекции Google отсканировал для Google Books и Google Scholar, сохранили копии сканов и использовали их для создания цифровой библиотеки HathiTrust . [6] [7]
Google Scholar возникла в результате дискуссии между Алексом Верстаком и Анурагом Ачарья [8] , оба из которых тогда работали над созданием основного веб-индекса Google. [9] [10] Их цель заключалась в том, чтобы «сделать мировые решения проблем на 10% более эффективными» [11] , обеспечив более простой и точный доступ к научным знаниям. Эта цель отражена в рекламном слогане Google Scholar « Встаньте на плечи гигантов », который был взят из идеи, приписываемой Бернару Шартрскому и цитируемой Исааком Ньютоном, и является данью уважения ученым, которые внесли свой вклад в свои области на протяжении более века, создавая основу для новых интеллектуальных достижений. [12] Одним из первоисточников текстов в Google Scholar является коллекция печатных изданий Мичиганского университета. [6]
Со временем Scholar приобрел ряд функций. В 2006 году была реализована функция импорта цитат с поддержкой менеджеров библиографии , таких как RefWorks , RefMan , EndNote и BibTeX . В 2007 году Ачарья объявил, что Google Scholar запустила программу по оцифровке и размещению журнальных статей по согласованию с их издателями, инициативу, отдельную от Google Books , чьи сканы старых журналов не включают метаданные, необходимые для идентификации конкретных статей по конкретным вопросам. [13] В 2011 году Google удалил Scholar из панелей инструментов на своих страницах поиска, [14] сделав его менее доступным и менее заметным для пользователей, еще не знающих о его существовании. Примерно в этот период были разработаны сайты с похожими функциями, такие как CiteSeer , Scirus и поиск Microsoft Windows Live Academic . Некоторые из них сейчас несуществуют; В 2016 году Microsoft запустила нового конкурента — Microsoft Academic . [15]
В 2012 году было реализовано значительное усовершенствование: отдельные ученые получили возможность создавать личные «профили цитирования ученых». [16] Функция, представленная в ноябре 2013 года, позволяет вошедшим в систему пользователям сохранять результаты поиска в «Библиотеке Google Scholar», личной коллекции, в которой пользователь может искать отдельно и систематизировать по тегам. [17] С помощью кнопки «Показатели» отображаются ведущие журналы в интересующей области, а также можно получить доступ к статьям, оказывающим влияние на эти журналы. Функция показателей теперь поддерживает просмотр влияния целых областей науки, а также академических журналов. [18]
Google Scholar позволяет пользователям искать цифровые или физические копии статей в Интернете или в библиотеках. [19] Он индексирует «полнотекстовые журнальные статьи, технические отчеты, препринты, диссертации , книги и другие документы, включая избранные веб-страницы, которые считаются «научными». [20] Потому что многие из результатов поиска Google Scholar ссылаются на Что касается статей в коммерческих журналах, большинство людей смогут получить доступ только к аннотации и сведениям о цитировании статьи, и им придется заплатить плату за доступ ко всей статье. [20] Наиболее релевантные результаты по ключевым словам будут перечислены первыми в порядке рейтинга автора, количества связанных с ним ссылок и их релевантности другой научной литературе, а также рейтинга публикации, в которой появляется журнал. дюйм [21]
Используя функцию «группа», он показывает доступные ссылки на журнальные статьи. В версии 2005 года эта функция предоставляла ссылку как на версии статьи с доступом по подписке, так и на бесплатные полнотекстовые версии статей; на протяжении большей части 2006 года ссылки предоставлялись только на версии издателей. С декабря 2006 года он предоставляет ссылки как на опубликованные версии, так и на основные репозитории с открытым доступом , включая все те, которые размещены на веб-страницах отдельных факультетов, а также на другие неструктурированные источники, идентифицированные по сходству. С другой стороны, Google Scholar не позволяет явно фильтровать между платным и открытым доступом к ресурсам — функция, предлагаемая Unpaywall , и инструменты, встраивающие ее данные, такие как Web of Science , Scopus и Unpaywall Journals , используемые библиотеками для расчета реальная стоимость и стоимость их коллекций. [22]
Благодаря функции «цитируется» Google Scholar предоставляет доступ к рефератам статей, в которых цитируется просматриваемая статья. [23] В частности, именно эта функция обеспечивает индексацию цитирования, ранее встречавшуюся только в CiteSeer , Scopus и Web of Science . Google Scholar также предоставляет ссылки, поэтому цитаты можно копировать в различных форматах или импортировать в выбранные пользователем менеджеры ссылок , такие как Zotero .
«Профили цитирования ученых» — это общедоступные профили авторов, которые сами авторы могут редактировать. [16] Люди, вошедшие в систему через учетную запись Google с реальным адресом, обычно связанным с академическим учреждением, теперь могут создать свою собственную страницу, указав свои области интересов и цитаты. Google Scholar автоматически рассчитывает и отображает общее количество цитирований человека, индекс Хирша и индекс i10 . По данным Google, по состоянию на август 2014 года «три четверти страниц результатов поиска Scholar… содержат ссылки на общедоступные профили авторов» .
С помощью функции «Похожие статьи» Google Scholar представляет список тесно связанных статей, ранжированных в первую очередь по тому, насколько эти статьи похожи на исходный результат, но также с учетом релевантности каждой статьи. [24]
Юридическая база данных Google Scholar по делам в США обширна. Пользователи могут искать и читать опубликованные заключения по делам апелляционных и верховных судов штатов США с 1950 года, федеральных окружных, апелляционных, налоговых судов и судов по делам о банкротстве США с 1923 года, а также дел Верховного суда США с 1791 года. [23] Google Scholar встраивает кликабельные ссылки для цитирования в Вкладка «Как цитируется» позволяет юристам изучать предыдущую судебную практику и последующие ссылки на судебные решения. [25]
В то время как большинство академических баз данных и поисковых систем позволяют пользователям выбирать один фактор (например, релевантность, количество цитирований или дату публикации) для ранжирования результатов, Google Scholar ранжирует результаты с помощью комбинированного алгоритма ранжирования «так, как это делают исследователи, взвешивая полный текст каждого статью, автора, публикацию, в которой опубликована статья, и то, как часто эта статья цитируется в другой научной литературе». [21] Исследования показали, что Google Scholar уделяет большое внимание количеству цитирований , [26] а также словам, включенным в заголовок документа. [27] При поиске по автору или году первыми результатами поиска часто являются высокоцитируемые статьи, поскольку количество цитирований имеет решающее значение, тогда как при поиске по ключевым словам количество цитирований, вероятно, является фактором с наибольшим весом, но и другие факторы также участвовать. [28]
Некоторые пользователи обнаружили, что Google Scholar по качеству и полезности сравним с базами данных на основе подписки, просматривая цитирования статей в некоторых конкретных журналах. [29] [30] В обзорах признается, что функция «цитируется», в частности, представляет собой серьезную конкуренцию Scopus и Web of Science . Исследование, посвященное биомедицинской области, показало, что информация о цитировании в Google Scholar «иногда неадекватна и реже обновляется». [31] Охват Google Scholar может варьироваться в зависимости от дисциплины по сравнению с другими общими базами данных. [32] Google Scholar стремится включать как можно больше журналов, включая журналы-хищники , которым может не хватать академической строгости. Специалисты по журналам-хищникам говорят, что такого рода журналы «загрязнили глобальную научную базу лженаукой» и «которые Google Scholar послушно и, возможно, слепо включает в свой центральный индекс». [33]
Google Scholar не публикует список просканированных журналов или включенных в него издателей, и частота его обновлений неизвестна. Библиометрические данные свидетельствуют о том, что освещение естественных и социальных наук в Google Scholar конкурентоспособно по сравнению с другими академическими базами данных; по состоянию на 2017 год освещение Ученым искусства и гуманитарных наук не исследовалось эмпирически, и полезность Ученого для дисциплин в этих областях остается неоднозначной. [34] Некоторые издатели, особенно на раннем этапе, не позволяли Scholar сканировать свои журналы. Журналы Elsevier были включены в список с середины 2007 года, когда Elsevier начал предоставлять большую часть своего контента ScienceDirect для Google Scholar и веб-поиска Google. [35] Тем не менее, по оценкам исследования 2014 года [4], Google Scholar может найти в Интернете почти 90% (около 100 миллионов) всех научных документов, написанных на английском языке. Крупномасштабные продольные исследования показали, что от 40 до 60 процентов научных статей доступны в полном тексте по ссылкам Google Scholar. [36]
Google Scholar придает большое значение количеству цитирований в своем алгоритме ранжирования и поэтому подвергается критике за усиление эффекта Мэтью ; [26] поскольку высокоцитируемые статьи занимают верхние позиции, они получают больше цитирований, в то время как новые статьи почти не появляются на верхних позициях и, следовательно, привлекают меньше внимания пользователей Google Scholar и, следовательно, меньше цитирований. Эффект Google Scholar — это явление, когда некоторые исследователи выбирают и цитируют работы, появляющиеся в верхних результатах Google Scholar, независимо от их вклада в цитирующую публикацию, поскольку они автоматически предполагают достоверность этих работ и полагают, что редакторы, рецензенты и читатели ожидают их увидеть. цитаты. [37] У Google Scholar возникают проблемы с правильной идентификацией публикаций на сервере препринтов arXiv . Знаки препинания в названиях приводят к неверным результатам поиска, а авторам присваиваются не те статьи, что приводит к ошибочным дополнительным результатам поиска. Некоторые результаты поиска даже выдаются без какой-либо понятной причины. [38] [39]
Google Scholar уязвим для спама . [40] [41] Исследователи из Калифорнийского университета в Беркли и Университета Отто-фон-Герике в Магдебурге продемонстрировали, что количеством цитирований в Google Scholar можно манипулировать, а полные бессмысленные статьи, созданные с помощью SCIgen , индексируются в Google Scholar. [42] Эти исследователи пришли к выводу, что количество цитирований Google Scholar следует использовать с осторожностью, особенно когда оно используется для расчета показателей эффективности, таких как индекс Хирша или импакт -фактор , который сам по себе является плохим предиктором качества статьи. [43] Google Scholar начала рассчитывать индекс Хирша в 2012 году с появлением отдельных страниц Scholar. Некоторые последующие пакеты, такие как Harzing's Publish или Perish, также используют его данные. [44] Практичность манипулирования калькуляторами индекса Хирша путем подмены Google Scholar была продемонстрирована в 2010 году Сирилом Лаббе из Университета Джозефа Фурье , которому удалось поставить «Айка Анткара» впереди Альберта Эйнштейна с помощью большого набора документов, созданных SCIgen . цитирование друг друга (фактически академическая ферма ссылок ). [45] По состоянию на 2010 год Google Scholar не могла классифицировать прецедентное право, как это могла делать Lexis . [46] В отличие от других индексов академической работы, таких как Scopus и Web of Science , Google Scholar не поддерживает интерфейс прикладного программирования , который можно использовать для автоматизации поиска данных. Использование веб-скраперов для получения содержимого результатов поиска также строго ограничено внедрением CAPTCHA. Google Scholar не отображает и не экспортирует цифровые идентификаторы объектов (DOI) — [47] фактический стандарт, внедренный всеми крупными академическими издательствами для уникальной идентификации и ссылки на отдельные фрагменты академической работы. [48]
Поисковая оптимизация (SEO) для традиционных поисковых систем, таких как Google, популярна уже много лет. В течение нескольких лет SEO также применялось в академических поисковых системах, таких как Google Scholar. [49] SEO для академических статей также называется «академической поисковой оптимизацией» (ASEO) и определяется как «создание, публикация и модификация научной литературы таким образом, чтобы академическим поисковым системам было легче как сканировать ее, так и индексировать». это". [49] ASEO был принят несколькими организациями, в том числе Elsevier , [50] OpenScience, [51] Mendeley , [52] и SAGE Publishing , [53] для оптимизации рейтинга своих статей в Google Scholar. У ASEO есть и отрицательные стороны. [42]
[Сотрудничество Мичиганского университета с Google включает ряд мероприятий и продуктов Google (например, Google Scholar).
{{cite web}}
: CS1 maint: неподходящий URL ( ссылка )