stringtranslate.com

Граф знаний

Пример концептуальной диаграммы

В представлении знаний и рассуждениях граф знаний — это база знаний , которая использует графоструктурированную модель данных или топологию для представления и работы с данными . Графы знаний часто используются для хранения взаимосвязанных описаний сущностей  — объектов, событий, ситуаций или абстрактных концепций — при этом кодируя свободную форму семантики или отношений, лежащих в основе этих сущностей. [1] [2]

С момента развития семантической паутины графы знаний часто ассоциировались с проектами связанных открытых данных , фокусируясь на связях между концепциями и сущностями. [3] [4] Они также исторически связаны и используются поисковыми системами , такими как Google , Bing , Yext и Yahoo ; системами знаний и службами ответов на вопросы, такими как WolframAlpha , Siri от Apple и Amazon Alexa ; и социальными сетями, такими как LinkedIn и Facebook .

Недавние разработки в области науки о данных и машинного обучения, особенно в области нейронных сетей графов и обучения представлений, а также в области машинного обучения, расширили сферу применения графов знаний за пределы их традиционного использования в поисковых системах и рекомендательных системах. Они все чаще используются в научных исследованиях, с заметными приложениями в таких областях, как геномика, протеомика и системная биология. [5]

История

Термин был придуман еще в 1972 году австрийским лингвистом Эдгаром В. Шнайдером в ходе обсуждения того, как строить модульные обучающие системы для курсов. [6] В конце 1980-х годов Университет Гронингена и Университет Твенте совместно начали проект под названием «Графы знаний», сосредоточившись на проектировании семантических сетей с ребрами, ограниченными ограниченным набором отношений, для упрощения алгебр на графе . В последующие десятилетия различие между семантическими сетями и графами знаний было размыто.

Некоторые ранние графы знаний были тематически-специфичными. В 1985 году был основан Wordnet , фиксирующий семантические связи между словами и значениями — приложение этой идеи к самому языку. В 2005 году Марк Вирк основал Geonames для фиксации связей между различными географическими названиями и локациями и связанными с ними сущностями. В 1998 году Эндрю Эдмондс из Science in Finance Ltd в Великобритании создал систему ThinkBase, которая предлагала рассуждения на основе нечеткой логики в графическом контексте. [7]

В 2007 году были основаны DBpedia и Freebase как графовые репозитории знаний для общих целей. DBpedia сосредоточилась исключительно на данных, извлеченных из Wikipedia, в то время как Freebase также включала ряд публичных наборов данных. Ни один из них не называл себя «графом знаний», но разрабатывал и описывал связанные концепции.

В 2012 году Google представил свой Knowledge Graph [8] , основанный на DBpedia и Freebase среди других источников. Позже они включили RDFa , Microdata , JSON-LD контент, извлеченный из индексированных веб-страниц, включая CIA World Factbook , Wikidata и Wikipedia . [8] [9] Типы сущностей и отношений, связанные с этим Knowledge graph, были дополнительно организованы с использованием терминов из словаря schema.org [10] . Google Knowledge Graph стал успешным дополнением к поиску на основе строк в Google, и его популярность в Интернете сделала этот термин более распространенным. [10]

С тех пор несколько крупных транснациональных корпораций рекламировали использование своих графов знаний, еще больше популяризируя этот термин. К ним относятся Facebook, LinkedIn, Airbnb , Microsoft , Amazon , Uber и eBay . [11]

В 2019 году IEEE объединил свои ежегодные международные конференции по «Большим знаниям» и «Интеллектуальному анализу данных и интеллектуальным вычислениям» в Международную конференцию по графу знаний. [12]

Определения

Не существует единого общепринятого определения графа знаний. Большинство определений рассматривают тему через призму семантической паутины и включают следующие особенности: [13]

Однако существует множество представлений графа знаний, для которых некоторые из этих функций не являются релевантными. Для таких графов знаний это более простое определение может быть более полезным:

Реализации

В дополнение к приведенным выше примерам, этот термин использовался для описания проектов открытых знаний, таких как YAGO и Wikidata; федераций, таких как облако Linked Open Data; [19] ряда коммерческих инструментов поиска, включая семантический поисковый помощник Spark от Yahoo, Knowledge Graph от Google и Satori от Microsoft; а также графов сущностей LinkedIn и Facebook. [3]

Этот термин также используется в контексте программных приложений для создания заметок , которые позволяют пользователю создавать персональный график знаний . [20]

Популяризация графов знаний и сопутствующих им методов привела к разработке графовых баз данных, таких как Neo4j [21] и GraphDB. [22] Эти графовые базы данных позволяют пользователям легко хранить данные в виде сущностей и их взаимосвязей, а также облегчают такие операции, как обоснование данных, встраивание узлов и разработка онтологий в базах знаний.

Использование графа знаний для рассуждений на основе данных

Граф знаний формально представляет семантику, описывая сущности и их отношения. [23] Графы знаний могут использовать онтологии как слой схемы. Делая это, они допускают логический вывод для извлечения неявных знаний , а не только разрешают запросы, запрашивающие явные знания. [24]

Для того чтобы разрешить использование графов знаний в различных задачах машинного обучения, было разработано несколько методов получения скрытых представлений признаков сущностей и отношений. Эти вложения графов знаний позволяют подключать их к методам машинного обучения, которые требуют векторов признаков, таких как вложения слов . Это может дополнять другие оценки концептуального сходства. [25] [26]

Модели для генерации полезных вложений графов знаний обычно являются областью графовых нейронных сетей (GNN). [27] GNN представляют собой архитектуры глубокого обучения, которые включают ребра и узлы, которые хорошо соответствуют сущностям и отношениям графов знаний. Топология и структуры данных, предоставляемые GNN, обеспечивают удобную область для полуконтролируемого обучения, в котором сеть обучается предсказывать значение вложения узла (при условии группы смежных узлов и их ребер) или ребра (при условии пары узлов). Эти задачи служат фундаментальными абстракциями для более сложных задач, таких как рассуждения и выравнивание графов знаний. [28]

Выравнивание сущностей

Два гипотетических графа знаний, представляющих разнородные темы, содержат узел, который соответствует одной и той же сущности в реальном мире. Выравнивание сущностей — это процесс идентификации таких узлов в нескольких графах.

Поскольку новые графы знаний создаются в различных областях и контекстах, одна и та же сущность неизбежно будет представлена ​​в нескольких графах. Однако, поскольку не существует единого стандарта для построения или представления графа знаний, решение того, какие сущности из разрозненных графов соответствуют одному и тому же предмету реального мира, является нетривиальной задачей. Эта задача известна как выравнивание сущностей графа знаний и является активной областью исследований. [29]

Стратегии выравнивания сущностей обычно стремятся идентифицировать схожие подструктуры, семантические отношения, общие атрибуты или комбинации всех трех между двумя различными графами знаний. Методы выравнивания сущностей используют эти структурные сходства между обычно неизоморфными графами для прогнозирования того, какие узлы соответствуют одной и той же сущности. [30]

Недавние успехи больших языковых моделей (LLM), в частности их эффективность в создании синтаксически значимых вложений, стимулировали использование LLM в задачах выравнивания сущностей. [31]

По мере роста объема данных, хранящихся в графах знаний, разработка надежных методов выравнивания сущностей графа знаний становится все более важным шагом в интеграции и согласовании данных графа знаний.

Смотрите также

Ссылки

  1. ^ «Что такое сеть знаний?». 2018.
  2. ^ «Что определяет граф знаний?». 2020.
  3. ^ abc Эрлингер, Лиза; Вёсс, Вольфрам (2016). К определению графов знаний (PDF) . SEMANTiCS2016. Лейпциг: Совместные труды секции постеров и демонстраций 12-й Международной конференции по семантическим системам – SEMANTiCS2016 и 1-го Международного семинара по семантическим изменениям и развивающейся семантике (SuCCESS16). стр. 13–16.
  4. ^ Сойлу, Ахмет (2020). «Улучшение государственных закупок в Европейском союзе путем построения и использования интегрированного графа знаний». Семантическая паутина – ISWC 2020. Конспект лекций по информатике. Том 12507. С. 430–446. doi :10.1007/978-3-030-62466-8_27. ISBN 978-3-030-62465-1. S2CID  226229398.
  5. ^ Мохамед, Самех К.; Ноуну, Ааях; Новачек, Вит (2021). «Биологические приложения моделей встраивания графов знаний». Briefings in Bioinformatics . 22 (2): 1679–1693. doi : 10.1093/bib/bbaa012 . hdl : 1983/919db5c6-6e10-4277-9ff9-f86bbcedcee8 . PMID  32065227 – через Oxford Academic.
  6. ^ Эдвард В. Шнайдер. 1973. Прикладная модуляризация курса: система интерфейса и ее значение для управления последовательностью и анализа данных. Ассоциация по разработке систем обучения (ADIS), Чикаго, Иллинойс, апрель 1972 г.
  7. ^ "Торговая марка США № 75589756".
  8. ^ ab Singhal, Amit (16 мая 2012 г.). «Представляем Knowledge Graph: things, not strings». Официальный блог Google . Получено 21 марта 2017 г.
  9. ^ Шварц, Барри (17 декабря 2014 г.). «Freebase от Google закроется после перехода на Wikidata: влияние Knowledge Graph?». Круглый стол по поисковым системам . Получено 10 декабря 2017 г.
  10. ^ ab Маккаскер, Джеймс П.; МакГиннесс, Дебора Л. «Что такое граф знаний?». www.authorea.com . Получено 21 марта 2017 г. .
  11. ^ «Предприятия графа знаний». 2020.
  12. ^ "2021 IEEE International Conference on Knowledge Graph (ICKG)*". KMedu Hub . 2017-07-09 . Получено 2021-03-22 .
  13. ^ Хоган, Эйдан; Бломквист, Ева; Кочез, Майкл; д'Амато, Клаудия; де Мело, Жерар; Гутьеррес, Клаудио; Лабра Гайо, Хосе Эмилио; Кирран, Сабрина; Ноймайер, Себастьян; Поллерес, Аксель; Навильи, Роберто; Нгонга Нгомо, Аксель-Сирил; Рашид, Саббир М.; Рула, Аниса; Шмельцайзен, Лукас; Секеда, Хуан; Стааб, Штеффен; Циммерманн, Антуан (24 января 2021 г.). «График знаний». Обзоры вычислительной техники ACM . 54 (4): 1–37. arXiv : 2003.02320 . дои : 10.1145/3447772. ISSN  0360-0300. S2CID  235716181.
  14. ^ Paulheim, Heiko (2017). «Уточнение графа знаний: обзор подходов и методов оценки» (PDF) . Semantic Web : 489–508 . Получено 21 марта 2017 г. .
  15. ^ Krötsch, Markus; Weikum, Gerhard (март 2016 г.). «Редакционная статья специального выпуска о графах знаний». Journal of Web Semantics . 37–38: 53–54. doi :10.1016/j.websem.2016.04.002 . Получено 10 февраля 2021 г. .
  16. ^ "Что такое граф знаний?|Ontotext". Ontotext . Получено 2020-07-01 .
  17. ^ Пэн, Циюань; Фэн, Ся; Насерипарса, Мехди; Осборн, Франческо (2023). «Графики знаний: возможности и проблемы». Обзор искусственного интеллекта . 56 (11): 13071–13102. arXiv : 2303.13948 . дои : 10.1007/s10462-023-10465-9. ISSN  1573-7462. ПМК 10068207 . ПМИД  37362886. 
  18. ^ «Схема знаний о схемах знаний». 2020.
  19. ^ "Облако связанных открытых данных". lod-cloud.net . Получено 30.06.2020 .
  20. ^ Пайн, Иветт; Стюарт, Стюарт (март 2022 г.). «Метаработа: как мы исследуем, так же важно, как и то, что мы исследуем». British Journal of General Practice . 72 (716): 130–131. doi :10.3399/bjgp22X718757. PMC 8884432. PMID  35210247 . 
  21. ^ "Neo4j Graph Database & Analytics | Система управления графическими базами данных". Neo4j . Получено 8 ноября 2023 г. .
  22. ^ "Ontotext GraphDB". Ontotext . Получено 8 ноября 2023 г. .
  23. ^ "Как работают графы знаний?". Stardog . 2022-04-05 . Получено 2022-04-05 .
  24. ^ «Раскрытие возможностей панели знаний Google: как получить и заявить о себе в 2023 году – RH Razu». rhrazu.com . 2023-09-01 . Получено 2023-09-05 .
  25. ^ Хунвэй Ван (октябрь 2018 г.). «RippleNet: распространение пользовательских предпочтений на графе знаний для рекомендательных систем». Труды 27-й Международной конференции ACM по управлению информацией и знаниями . стр. 417–426. arXiv : 1803.03467 . doi :10.1145/3269206.3271739. ISBN 9781450360142. S2CID  3766110.
  26. ^ Ристоски, Петар; Паульхейм, Хайко (2016), «RDF2Vec: Вложения RDF-графов для интеллектуального анализа данных» (PDF) , Семантическая паутина – ISWC 2016 , Конспект лекций по информатике, т. 9981, стр. 498–514, doi : 10.1007/978-3-319-46523-4_30 , ISBN 978-3-319-46522-7
  27. ^ Чжоу, Цзе и др. (2020). «Графовые нейронные сети: обзор методов и приложений». AI Open . 1 (1): 57–81. arXiv : 1812.08434 . doi : 10.1016/j.aiopen.2021.01.001 . S2CID  56517517 – через Elsevier Science Direct.
  28. ^ Йе, Зи; Кумар, Йоган Джая; Синг, Го Онг; Сонг, Фэнъянь; Ван, Джунсонг (2022). «Комплексный обзор графовых нейронных сетей для графов знаний». IEEE Access . 10 : 75729–7574. Bibcode : 2022IEEEA..1075729Y. doi : 10.1109/ACCESS.2022.3191784 . S2CID  250654689 – через IEEE Xplore.
  29. ^ Беррендорф, Макс; Фаерман, Евгений; Мельничук, Валентин; Тресп, Волкер; Зайдль, Томас (14–17 апреля 2020 г.). Выравнивание сущностей графа знаний с помощью сверточных сетей графов: извлеченные уроки . Достижения в области поиска информации: 42-я Европейская конференция по исследованиям в области информационных технологий, ECIR 2020, Лиссабон, Португалия. Заметки лекций по информатике. Том. Труды, часть II. стр. 3–11. arXiv : 1911.08342 . doi :10.1007/978-3-030-45442-5_1. ISBN 978-3-030-45441-8. S2CID  208158314 – через Springer International Publishing.
  30. ^ Чаурасия, Дипак; Сурисетти, Анил; Кумар, Нитиш; Сингх, Алок; Дей, Викрант; Малхотра, Аакарш; Дхама, Гаурав; Арора, Анкур (2022). «Выравнивание сущностей для графов знаний: прогресс, проблемы и эмпирические исследования». arXiv : 2205.08777 [cs.AI].
  31. ^ Хоган, Эйдан; Липполис, Анна София; Клирономос, Антонис; Милон-Флорес, Даниэла Ф.; Чжэн, Хэн; Жуглар, Алексан; Норузи, Эбрахим (2023). «Улучшение согласования сущностей между Wikidata и ArtGraph с использованием LLM» (PDF) . Труды Международного семинара по семантической паутине и проектированию онтологий для культурного наследия – через Международный семинар по семантической паутине и проектированию онтологий для культурного наследия (SWODCH), Афины, Греция.

Внешние ссылки