stringtranslate.com

AMiner (база данных)

AMiner (ранее ArnetMiner ) — бесплатный онлайн-сервис, используемый для индексации, поиска и добычи больших научных данных .

Обзор

AMiner (ArnetMiner) предназначен для поиска и выполнения операций по извлечению данных из академических публикаций в Интернете , используя анализ социальных сетей для выявления связей между исследователями, конференциями и публикациями. [1] Это позволяет ему предоставлять такие услуги, как поиск экспертов, географический поиск, анализ тенденций, рекомендации рецензентов, поиск ассоциаций, поиск курсов, оценка академической успеваемости и моделирование тем.

AMiner был создан как исследовательский проект по анализу социального влияния, ранжированию социальных сетей и извлечению социальных сетей. В результате разработки системы был опубликован ряд рецензируемых статей. Она работает уже более трех лет и проиндексировала 130 000 000 исследователей и более 265 миллионов публикаций. [2] Исследование финансировалось Китайской национальной программой исследований и разработок в области высоких технологий и Национальным научным фондом Китая .

AMiner обычно используется в академических кругах для выявления связей и построения статистических корреляций между исследованиями и исследователями. Он привлек более 10 миллионов независимых IP-доступов из 220 стран и регионов. Продукт использовался на платформе SciVerse компании Elsevier [3] и на таких академических конференциях, как SIGKDD, ICDM, PKDD, WSDM.

Операция

AMiner автоматически извлекает профиль исследователя из сети. Он собирает и идентифицирует соответствующие страницы, затем использует унифицированный подход для извлечения данных из идентифицированных документов. Он также извлекает публикации из онлайн-цифровых библиотек, используя эвристические правила.

Он объединяет извлеченные профили исследователей и извлеченные публикации. Он использует имя исследователя в качестве идентификатора. Была предложена вероятностная структура для решения проблемы неоднозначности имени при интеграции. Интегрированные данные хранятся в базе знаний исследовательской сети (RNKB).

Другими основными продуктами в этой области являются Google Scholar, Scirus от Elsevier и проект с открытым исходным кодом CiteSeer.

История

Он был инициирован и создан профессором Цзе Таном из Университета Цинхуа , Китай. Впервые он был запущен в марте 2006 года. Ниже приведен список обновлений за последние годы:

Ресурсы

AMiner опубликовал несколько наборов данных для академических исследовательских целей, включая Open Academic Graph, [6] DBLP+citation [7] (набор данных, дополняющий цитаты в данных DBLP из проекта Digital Bibliography & Library ), Name Disambiguation, [8] Social Tie Analysis. [9] Для получения дополнительных доступных наборов данных и исходных кодов для исследований, пожалуйста, обратитесь к. [10]

Смотрите также

Ссылки

  1. ^ Jie Tang; Jing Zhang; Limin Yao; Juanzi Li; Li Zhang; Zhong Su (2008). "ArnetMiner". Труды 14-й международной конференции ACM SIGKDD по обнаружению знаний и добыче данных . Нью-Йорк: ACM. С. 990–998. doi :10.1145/1401890.1402008. ISBN 9781605581934. S2CID  3348552.
  2. ^ "Arnetminer: введение" . Получено 17 декабря 2020 г. .
  3. ^ "SciVerse - HUB - Home". Архивировано из оригинала 9 сентября 2012 года . Получено 24 апреля 2012 года .
  4. ^ "Анализ тенденций" . Получено 24 декабря 2018 г.
  5. ^ Ютао Чжан; Фаньцзинь Чжан; Пэйран Яо; Цзе Тан (2018). «Устранение неоднозначности имен в AMiner». Труды 24-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Лондон: ACM. С. 1002–1011. doi : 10.1145/3219819.3219859. ISBN 9781450355520. S2CID  207579405.
  6. ^ "Open Academic Graph" . Получено 24 декабря 2018 г.
  7. ^ "DBLP Papers + Citation Relationship" . Получено 24 декабря 2018 г. .
  8. ^ "Name Disambiguation" . Получено 24 апреля 2012 г. .
  9. ^ "Вывод социальных связей в крупных сетях" . Получено 24 апреля 2012 г.
  10. ^ "Открытые данные и коды ArnetMiner" . Получено 24 апреля 2012 г.

Внешние ссылки

Дальнейшее чтение