stringtranslate.com

Семантический ученый

Semantic Scholar — это исследовательский инструмент для научной литературы, работающий на основе искусственного интеллекта . Он разработан в Институте Аллена по искусственному интеллекту и был публично выпущен в ноябре 2015 года. [2] Semantic Scholar использует современные методы обработки естественного языка для поддержки исследовательского процесса, например, предоставляя автоматически сгенерированные резюме научных статей. [3] Команда Semantic Scholar активно исследует использование искусственного интеллекта в обработке естественного языка , машинном обучении , взаимодействии человека с компьютером и поиске информации . [4]

Semantic Scholar начинался как база данных по темам компьютерных наук , наук о Земле и нейронауки . [5] В 2017 году система начала включать в свой корпус биомедицинскую литературу . [5] По состоянию на сентябрь 2022 года она включает более 200 миллионов публикаций из всех областей науки. [6]

Технологии

Semantic Scholar предоставляет краткое изложение научной литературы в одном предложении . Одной из его целей было решение проблемы чтения многочисленных названий и длинных аннотаций на мобильных устройствах. [7] Он также стремится обеспечить, чтобы три миллиона научных статей, публикуемых ежегодно, достигли читателей, поскольку, по оценкам, только половина этой литературы когда-либо читается. [8]

Искусственный интеллект используется для захвата сути статьи, генерируя ее с помощью «абстрактной» техники. [3] Проект использует комбинацию машинного обучения , обработки естественного языка и машинного зрения , чтобы добавить слой семантического анализа к традиционным методам анализа цитирования и извлечь соответствующие рисунки, таблицы , сущности и места проведения из статей. [9] [10]

Еще одна ключевая функция на базе ИИ — Research Feeds, адаптивный исследовательский рекомендатель, который использует ИИ для быстрого изучения того, какие статьи интересны пользователям, и рекомендует последние исследования, чтобы помочь ученым оставаться в курсе событий. Он использует современную модель встраивания статей, обученную с помощью контрастного обучения, чтобы находить статьи, похожие на те, что находятся в каждой папке библиотеки. [11]

Semantic Scholar также предлагает Semantic Reader — расширенный ридер, способный произвести революцию в научном чтении, сделав его более доступным и контекстуально насыщенным. [12] Semantic Reader предоставляет встроенные карточки цитат, которые позволяют пользователям видеть цитаты с TLDR (сокращение от Too Long, Didn't Read), автоматически генерируемыми краткими резюме по мере чтения и беглого просмотра основных моментов, которые охватывают ключевые моменты статьи, чтобы пользователи могли быстрее ее усваивать.

В отличие от Google Scholar и PubMed , Semantic Scholar предназначен для выделения наиболее важных и влиятельных элементов статьи. [13] Технология ИИ предназначена для выявления скрытых связей и связей между темами исследований. [14] Как и ранее упомянутые поисковые системы, Semantic Scholar также использует графовые структуры, которые включают Microsoft Academic Knowledge Graph , Springer Nature's SciGraph и Semantic Scholar Corpus (первоначально корпус из 45 миллионов статей по информатике, нейронауке и биомедицине). [15] [16]

Идентификатор статьи

Каждой статье, размещенной на Semantic Scholar, присваивается уникальный идентификатор , называемый Semantic Scholar Corpus ID (сокращенно S2CID). Следующая запись является примером:

Лю, Ин; Гейл, Альберт А; Уайлдер-Смит, Аннелис; Роклов, Йоаким (март 2020 г.). «Репродуктивное число COVID-19 выше по сравнению с коронавирусом SARS». Журнал медицины путешествий . 27 (2). doi : 10.1093/jtm/taaa021. PMID  32052846. S2CID  211099356.

Индексация

Semantic Scholar бесплатен в использовании и в отличие от аналогичных поисковых систем (например, Google Scholar ) не ищет материалы, находящиеся за платной подпиской . [5] [ требуется ссылка ]

В одном исследовании сравнивался охват индексов Semantic Scholar и Google Scholar, и было обнаружено, что для статей, цитируемых во вторичных исследованиях по информатике, оба индекса имели сопоставимый охват, каждый из которых пропускал лишь несколько статей. [17]

Количество пользователей и публикаций

По состоянию на январь 2018 года, после проекта 2017 года, в который были добавлены биомедицинские статьи и тематические резюме, корпус Semantic Scholar включал более 40 миллионов статей из области компьютерных наук и биомедицины . [18] В марте 2018 года Дуг Рэймонд, который разработал инициативы машинного обучения для платформы Amazon Alexa , был нанят для руководства проектом Semantic Scholar. [19] По состоянию на август 2019 года количество включенных метаданных статей (не реальных PDF-файлов) выросло до более чем 173 миллионов [20] после добавления записей Microsoft Academic Graph . [21] В 2020 году партнерство между Semantic Scholar и University of Chicago Press Journals сделало все статьи, опубликованные в University of Chicago Press, доступными в корпусе Semantic Scholar. [22] К концу 2020 года Semantic Scholar проиндексировал 190 миллионов статей. [23] В 2020 году число пользователей Semantic Scholar достигло семи миллионов в месяц. [7]

Смотрите также

Ссылки

  1. ^ Джонс, Никола (2015). «Институт искусственного интеллекта запускает бесплатную научную поисковую систему». Nature . doi : 10.1038/nature.2015.18703 . ISSN  1476-4687. S2CID  182440976.
  2. ^ Eunjung Cha, Ariana (3 ноября 2015 г.). «Исследовательская группа ИИ Пола Аллена представила программу, которая нацелена на то, чтобы встряхнуть наш способ поиска научных знаний. Попробуйте». The Washington Post . Архивировано из оригинала 6 ноября 2019 г. Получено 3 ноября 2015 г.
  3. ^ ab Hao, Karen (18 ноября 2020 г.). «ИИ помогает вам обобщить последние новости об ИИ». MIT Technology Review . Получено 16.02.2021 .
  4. ^ "Semantic Scholar Research". research.semanticscholar.org . Получено 2021-11-22 .
  5. ^ abc Фрике, Сюзанна (2018-01-12). "Semantic Scholar". Журнал Медицинской библиотечной ассоциации . 106 (1): 145–147. doi : 10.5195/jmla.2018.280 . ISSN  1558-9439. PMC 5764585. S2CID 45802944  . 
  6. ^ Мэтьюз, Дэвид (1 сентября 2021 г.). «Тонете в литературе? Эти умные программные инструменты могут помочь». Nature . Получено 5 сентября 2022 г. . ...общедоступный корпус, составленный Semantic Scholar — инструментом, созданным в 2015 году Институтом искусственного интеллекта Аллена в Сиэтле, штат Вашингтон, — насчитывающий около 200 миллионов статей, включая препринты.
  7. ^ ab Grad, Peter (24 ноября 2020 г.). «Инструмент ИИ суммирует длинные статьи в предложении». Tech Xplore . Получено 16.02.2021 .
  8. ^ "Semantic Scholar Института Аллена теперь осуществляет поиск по 175 миллионам научных статей". VentureBeat . 2019-10-23 . Получено 2021-02-16 .
  9. ^ Боханнон, Джон (11 ноября 2016 г.). «Компьютерная программа только что составила рейтинг самых влиятельных ученых-исследователей мозга современной эпохи». Science . doi :10.1126/science.aal0371. Архивировано из оригинала 29 апреля 2020 г. Получено 12 ноября 2016 г.
  10. ^ Кристофер Кларк; Сантош Диввала (2016), PDFFigures 2.0: Извлечение рисунков из исследовательских статей, Труды 16-й совместной конференции ACM/IEEE-CS по цифровым библиотекам - JCDL '16, Wikidata  Q108172042
  11. ^ "Semantic Scholar | Часто задаваемые вопросы". Архивировано из оригинала 15 июля 2023 г.
  12. ^ "Semantic Scholar | Semantic Reader". Semantic Scholar . Архивировано из оригинала 15 июля 2023 г.
  13. ^ "Semantic Scholar". Международный журнал языковых и литературных исследований . Получено 2021-11-09 .
  14. ^ Байкучева, Светла (2021). Driving Science Information Discovery in the Digital Age . Chandos Publishing. стр. 91. ISBN 978-0-12-823724-3. OCLC  1241441806.
  15. ^ Хосе, Джоемон М.; Йылмаз, Эмине; Магальяйнс, Жуан; Кастельс, Пабло; Ферро, Никола; Сильва, Марио Х.; Мартинс, Флавио (2020). Достижения в области информационного поиска: 42-я Европейская конференция по IR-исследованиям, ECIR 2020, Лиссабон, Португалия, 14–17 апреля 2020 г., Материалы, Часть I. Чам, Швейцария: Springer Nature. п. 254. ИСБН 978-3-030-45438-8. OCLC  1164658107.
  16. ^ Аммар, Валид (2019). "Open Research Corpus". Semantic Scholar Lab Open Research Corpus . Архивировано из оригинала 29.03.2019 . Получено 05.08.2024 .
  17. ^ Ханнусс, Абдельхаким (2021). «Поиск соответствующих статей для вторичных исследований по программной инженерии: охват Semantic Scholar и роль идентификации». IET Software . 15 (1): 126–146. doi :10.1049/sfw2.12011. ISSN  1751-8814. S2CID  234053002.
  18. ^ "AI2 расширяет поисковую систему Semantic Scholar, чтобы охватить биомедицинские исследования". GeekWire . 2017-10-17. Архивировано из оригинала 2018-01-19 . Получено 2018-01-18 .
  19. ^ "Tech Moves: Allen Institutitue нанимает руководителя подразделения машинного обучения Amazon Alexa; председатель Microsoft принимает на себя роль нового инвестора; и многое другое". GeekWire. 2018-05-02. Архивировано из оригинала 2018-05-10 . Получено 2018-05-09 .
  20. ^ "Semantic Scholar". Semantic Scholar . Архивировано из оригинала 11 августа 2019 . Получено 11 августа 2019 .
  21. ^ "AI2 объединяет усилия с Microsoft Research для обновления инструментов поиска для научных исследований". GeekWire . 2018-12-05. Архивировано из оригинала 2019-08-25 . Получено 2019-08-25 .
  22. ^ "Издательство Чикагского университета присоединяется к более чем 500 издательствам, работающим с Semantic Scholar для улучшения поиска и обнаружения". RCNi Company Limited . Получено 22.11.2021 .
  23. ^ Данн, Адриана (14 декабря 2020 г.). «Semantic Scholar добавляет 25 миллионов научных статей в 2020 году благодаря новым партнерствам с издателями» (PDF) . Semantic Scholar . Получено 22 ноября 2021 г. .

Внешние ссылки