Семантический ученый

Semantic Scholar — это исследовательский инструмент для научной литературы, работающий на основе искусственного интеллекта . Он разработан в Институте Аллена по искусственному интеллекту и был публично выпущен в ноябре 2015 года. ^[2] Semantic Scholar использует современные методы обработки естественного языка для поддержки исследовательского процесса, например, предоставляя автоматически сгенерированные резюме научных статей. ^[3] Команда Semantic Scholar активно исследует использование искусственного интеллекта в обработке естественного языка , машинном обучении , взаимодействии человека с компьютером и поиске информации . ^[4]

Semantic Scholar начинался как база данных по темам компьютерных наук , наук о Земле и нейронауки . ^[5] В 2017 году система начала включать в свой корпус биомедицинскую литературу . ^[5] По состоянию на сентябрь 2022 года ^{[обновлять]}она включает более 200 миллионов публикаций из всех областей науки. ^[6]

Технологии

Semantic Scholar предоставляет краткое изложение научной литературы в одном предложении . Одной из его целей было решение проблемы чтения многочисленных названий и длинных аннотаций на мобильных устройствах. ^[7] Он также стремится обеспечить, чтобы три миллиона научных статей, публикуемых ежегодно, достигли читателей, поскольку, по оценкам, только половина этой литературы когда-либо читается. ^[8]

Искусственный интеллект используется для захвата сути статьи, генерируя ее с помощью «абстрактной» техники. ^[3] Проект использует комбинацию машинного обучения , обработки естественного языка и машинного зрения , чтобы добавить слой семантического анализа к традиционным методам анализа цитирования и извлечь соответствующие рисунки, таблицы , сущности и места проведения из статей. ^[9]^[10]

Еще одна ключевая функция на базе ИИ — Research Feeds, адаптивный исследовательский рекомендатель, который использует ИИ для быстрого изучения того, какие статьи интересны пользователям, и рекомендует последние исследования, чтобы помочь ученым оставаться в курсе событий. Он использует современную модель встраивания статей, обученную с помощью контрастного обучения, чтобы находить статьи, похожие на те, что находятся в каждой папке библиотеки. ^[11]

Semantic Scholar также предлагает Semantic Reader — расширенный ридер, способный произвести революцию в научном чтении, сделав его более доступным и контекстуально насыщенным. ^[12] Semantic Reader предоставляет встроенные карточки цитат, которые позволяют пользователям видеть цитаты с TLDR (сокращение от Too Long, Didn't Read), автоматически генерируемыми краткими резюме по мере чтения и беглого просмотра основных моментов, которые охватывают ключевые моменты статьи, чтобы пользователи могли быстрее ее усваивать.

В отличие от Google Scholar и PubMed , Semantic Scholar предназначен для выделения наиболее важных и влиятельных элементов статьи. ^[13] Технология ИИ предназначена для выявления скрытых связей и связей между темами исследований. ^[14] Как и ранее упомянутые поисковые системы, Semantic Scholar также использует графовые структуры, которые включают Microsoft Academic Knowledge Graph , Springer Nature's SciGraph и Semantic Scholar Corpus (первоначально корпус из 45 миллионов статей по информатике, нейронауке и биомедицине). ^[15]^[16]

Идентификатор статьи

Каждой статье, размещенной на Semantic Scholar, присваивается уникальный идентификатор , называемый Semantic Scholar Corpus ID (сокращенно S2CID). Следующая запись является примером:

Лю, Ин; Гейл, Альберт А; Уайлдер-Смит, Аннелис; Роклов, Йоаким (март 2020 г.). «Репродуктивное число COVID-19 выше по сравнению с коронавирусом SARS». Журнал медицины путешествий . 27 (2). doi : 10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.

Индексация

Semantic Scholar бесплатен в использовании и в отличие от аналогичных поисковых систем (например, Google Scholar ) не ищет материалы, находящиеся за платной подпиской . ^[5]^{[ требуется ссылка ]}

В одном исследовании сравнивался охват индексов Semantic Scholar и Google Scholar, и было обнаружено, что для статей, цитируемых во вторичных исследованиях по информатике, оба индекса имели сопоставимый охват, каждый из которых пропускал лишь несколько статей. ^[17]

Количество пользователей и публикаций

По состоянию на январь 2018 года, после проекта 2017 года, в который были добавлены биомедицинские статьи и тематические резюме, корпус Semantic Scholar включал более 40 миллионов статей из области компьютерных наук и биомедицины . ^[18] В марте 2018 года Дуг Рэймонд, который разработал инициативы машинного обучения для платформы Amazon Alexa , был нанят для руководства проектом Semantic Scholar. ^[19] По состоянию на август 2019 года ^{[обновлять]}количество включенных метаданных статей (не реальных PDF-файлов) выросло до более чем 173 миллионов ^[20] после добавления записей Microsoft Academic Graph . ^[21] В 2020 году партнерство между Semantic Scholar и University of Chicago Press Journals сделало все статьи, опубликованные в University of Chicago Press, доступными в корпусе Semantic Scholar. ^[22] К концу 2020 года Semantic Scholar проиндексировал 190 миллионов статей. ^[23] В 2020 году число пользователей Semantic Scholar достигло семи миллионов в месяц. ^[7]

Смотрите также

Анализ цитирования – изучение частоты, закономерностей и графиков цитирования в документах.
Индекс цитирования – Индекс цитирования между публикациями
Извлечение знаний – создание знаний из структурированных и неструктурированных источников.
Список академических баз данных и поисковых систем
Наукометрия – Количественное исследование научной литературы

Ссылки

^ Джонс, Никола (2015). «Институт искусственного интеллекта запускает бесплатную научную поисковую систему». Nature . doi : 10.1038/nature.2015.18703 . ISSN 1476-4687. S2CID 182440976.
^ Eunjung Cha, Ariana (3 ноября 2015 г.). «Исследовательская группа ИИ Пола Аллена представила программу, которая нацелена на то, чтобы встряхнуть наш способ поиска научных знаний. Попробуйте». The Washington Post . Архивировано из оригинала 6 ноября 2019 г. Получено 3 ноября 2015 г.
^ ab Hao, Karen (18 ноября 2020 г.). «ИИ помогает вам обобщить последние новости об ИИ». MIT Technology Review . Получено 16.02.2021 .
^ "Semantic Scholar Research". research.semanticscholar.org . Получено 2021-11-22 .
^ abc Фрике, Сюзанна (2018-01-12). "Semantic Scholar". Журнал Медицинской библиотечной ассоциации . 106 (1): 145–147. doi : 10.5195/jmla.2018.280 . ISSN 1558-9439. PMC 5764585. S2CID 45802944 .
^ Мэтьюз, Дэвид (1 сентября 2021 г.). «Тонете в литературе? Эти умные программные инструменты могут помочь». Nature . Получено 5 сентября 2022 г. . ...общедоступный корпус, составленный Semantic Scholar — инструментом, созданным в 2015 году Институтом искусственного интеллекта Аллена в Сиэтле, штат Вашингтон, — насчитывающий около 200 миллионов статей, включая препринты.
^ ab Grad, Peter (24 ноября 2020 г.). «Инструмент ИИ суммирует длинные статьи в предложении». Tech Xplore . Получено 16.02.2021 .
^ "Semantic Scholar Института Аллена теперь осуществляет поиск по 175 миллионам научных статей". VentureBeat . 2019-10-23 . Получено 2021-02-16 .
^ Боханнон, Джон (11 ноября 2016 г.). «Компьютерная программа только что составила рейтинг самых влиятельных ученых-исследователей мозга современной эпохи». Science . doi :10.1126/science.aal0371. Архивировано из оригинала 29 апреля 2020 г. Получено 12 ноября 2016 г.
^ Кристофер Кларк; Сантош Диввала (2016), PDFFigures 2.0: Извлечение рисунков из исследовательских статей, Труды 16-й совместной конференции ACM/IEEE-CS по цифровым библиотекам - JCDL '16, Wikidata Q108172042
^ "Semantic Scholar | Часто задаваемые вопросы". Архивировано из оригинала 15 июля 2023 г.
^ "Semantic Scholar | Semantic Reader". Semantic Scholar . Архивировано из оригинала 15 июля 2023 г.
^ "Semantic Scholar". Международный журнал языковых и литературных исследований . Получено 2021-11-09 .
^ Байкучева, Светла (2021). Driving Science Information Discovery in the Digital Age . Chandos Publishing. стр. 91. ISBN 978-0-12-823724-3. OCLC 1241441806.
^ Хосе, Джоемон М.; Йылмаз, Эмине; Магальяйнс, Жуан; Кастельс, Пабло; Ферро, Никола; Сильва, Марио Х.; Мартинс, Флавио (2020). Достижения в области информационного поиска: 42-я Европейская конференция по IR-исследованиям, ECIR 2020, Лиссабон, Португалия, 14–17 апреля 2020 г., Материалы, Часть I. Чам, Швейцария: Springer Nature. п. 254. ИСБН 978-3-030-45438-8. OCLC 1164658107.
^ Аммар, Валид (2019). "Open Research Corpus". Semantic Scholar Lab Open Research Corpus . Архивировано из оригинала 29.03.2019 . Получено 05.08.2024 .
^ Ханнусс, Абдельхаким (2021). «Поиск соответствующих статей для вторичных исследований по программной инженерии: охват Semantic Scholar и роль идентификации». IET Software . 15 (1): 126–146. doi :10.1049/sfw2.12011. ISSN 1751-8814. S2CID 234053002.
^ "AI2 расширяет поисковую систему Semantic Scholar, чтобы охватить биомедицинские исследования". GeekWire . 2017-10-17. Архивировано из оригинала 2018-01-19 . Получено 2018-01-18 .
^ "Tech Moves: Allen Institutitue нанимает руководителя подразделения машинного обучения Amazon Alexa; председатель Microsoft принимает на себя роль нового инвестора; и многое другое". GeekWire. 2018-05-02. Архивировано из оригинала 2018-05-10 . Получено 2018-05-09 .
^ "Semantic Scholar". Semantic Scholar . Архивировано из оригинала 11 августа 2019 . Получено 11 августа 2019 .
^ "AI2 объединяет усилия с Microsoft Research для обновления инструментов поиска для научных исследований". GeekWire . 2018-12-05. Архивировано из оригинала 2019-08-25 . Получено 2019-08-25 .
^ "Издательство Чикагского университета присоединяется к более чем 500 издательствам, работающим с Semantic Scholar для улучшения поиска и обнаружения". RCNi Company Limited . Получено 22.11.2021 .
^ Данн, Адриана (14 декабря 2020 г.). «Semantic Scholar добавляет 25 миллионов научных статей в 2020 году благодаря новым партнерствам с издателями» (PDF) . Semantic Scholar . Получено 22 ноября 2021 г. .

Внешние ссылки

Wikidata обладает следующими свойствами:

Идентификатор темы Semantic Scholar (P6611) (см. использование )
Идентификатор автора Semantic Scholar (P4012) (см. использование )
Идентификатор корпуса Semantic Scholar (P8299) (см. использование )
Идентификатор статьи Semantic Scholar (P4011) (см. использование )

Официальный сайт