stringtranslate.com

Связанные данные

Сеть из более чем тысячи кругов, объединенных в группы и связанных линиями в паутину.
Wikidata в облаке Linked Open Data. Базы данных обозначены кружками (wikidata обозначены как «WD»), серые линии связывают базы данных в сети, если их данные выровнены. Сгенерировано из https://lod-cloud.net/datasets .
DBpedia как наиболее взаимосвязанный набор данных LOD и точка кристаллизации Linked Open Data Cloud с 2008 года
DBpedia как наиболее взаимосвязанный набор данных LOD и точка кристаллизации Linked Open Data Cloud с 2008 года, изображение 2021 года, сгенерированное с https://lod-cloud.net.

В вычислительной технике связанные данные — это структурированные данные, которые взаимосвязаны с другими данными, поэтому они становятся более полезными через семантические запросы . Они основаны на стандартных веб- технологиях, таких как HTTP , RDF и URI , но вместо того, чтобы использовать их для обслуживания веб-страниц только для людей-читателей, они расширяют их для обмена информацией таким образом, чтобы ее могли автоматически читать компьютеры. Частью видения связанных данных является то, что Интернет должен стать глобальной базой данных . [1]

Тим Бернерс-Ли , директор Консорциума Всемирной паутины (W3C), ввел этот термин в 2006 году в проектную записку о проекте Semantic Web . [2]

Связанные данные также могут быть открытыми данными , в этом случае их обычно называют связанными открытыми данными. [3]

Принципы

В своей заметке «Связанные данные» 2006 года Тим Бернерс-Ли изложил четыре принципа связанных данных, перефразировав их следующим образом: [2]

  1. Для именования и идентификации отдельных объектов следует использовать унифицированные идентификаторы ресурсов (URI).
  2. Для того чтобы эти данные можно было искать, интерпретировать и впоследствии «разыменовывать», следует использовать HTTP URI.
  3. Полезная информация о том, что идентифицирует имя, должна предоставляться посредством открытых стандартов, таких как RDF , SPARQL и т. д.
  4. При публикации данных в Интернете следует ссылаться на другие объекты, используя их имена на основе HTTP URI.

Тим Бернерс-Ли позднее перефразировал эти принципы на конференции TED в 2009 году , снова перефразировав их следующим образом: [4]

  1. Все концептуальные вещи должны иметь имя, начинающееся с HTTP .
  2. Поиск HTTP-имени должен возвращать полезные данные о рассматриваемом объекте в стандартном формате.
  3. Всему остальному, с чем эта же вещь связана посредством своих данных, также следует дать имя, начинающееся с HTTP.

Компоненты

Таким образом, мы можем выделить следующие компоненты, которые являются существенными для глобальной системы связанных данных, как она задумана, и для любого фактического подмножества связанных данных в ее составе:

Связанные открытые данные

Связанные открытые данные — это связанные данные, которые являются открытыми данными . [5] [6] [7] Тим Бернерс-Ли дает наиболее четкое определение связанных открытых данных в отличие от связанных данных.

Связанные открытые данные (LOD) — это связанные данные, которые выпускаются по открытой лицензии, что не препятствует их бесплатному повторному использованию.

—  Тим Бернерс-Ли, Связанные данные [2] [8]

Крупные связанные открытые наборы данных включают DBpedia , Wikibase , Wikidata и Open ICEcat  [uk; nl] .

5-звездочные связанные открытые данные

Схема развертывания связанных открытых данных [9]

В 2010 году Тим Бернерс-Ли предложил 5-звездочную схему оценки качества открытых данных в Интернете, в которой наивысший рейтинг имеют связанные открытые данные: [10]

История

Термин «связанные открытые данные» используется по крайней мере с февраля 2007 года, когда был создан список рассылки «Связывание открытых данных» [11] . [12] Первоначально список рассылки поддерживался проектом SIMILE [ 13] в Массачусетском технологическом институте .

Связывание проекта сообщества Open Data

На приведенной выше диаграмме показано, какие наборы данных Linking Open Data связаны по состоянию на август 2014 года. Это было создано в рамках проекта Linked Open Data Cloud, который был запущен в 2007 году. Некоторые наборы могут включать защищенные авторским правом данные, которые находятся в свободном доступе. [14]
Та же диаграмма, что и выше, но за февраль 2017 года, показывающая рост всего за два с половиной года

Целью проекта сообщества Linking Open Data группы W3C Semantic Web Education and Outreach является расширение сети с помощью общих данных путем публикации различных открытых наборов данных в виде RDF в сети и установки ссылок RDF между элементами данных из разных источников данных. В октябре 2007 года наборы данных состояли из более чем двух миллиардов RDF- триплетов , которые были связаны между собой более чем двумя миллионами ссылок RDF. [15] [16] К сентябрю 2011 года это число выросло до 31 миллиарда RDF-триплетов, связанных между собой примерно 504 миллионами ссылок RDF. Подробная статистическая разбивка была опубликована в 2014 году. [17]

Проекты Европейского Союза

Существует ряд проектов Европейского Союза , связанных с связанными данными. К ним относятся проект связанных открытых данных круглосуточно (LATC), [18] проект AKN4EU для машиночитаемых законодательных данных, [19] проект PlanetData, [20] проект DaPaaS (Data-and-Platform-as-a-Service) [21] и проект Linked Open Data 2 (LOD2). [22] [23] [24] Связывание данных является одной из основных целей портала открытых данных ЕС , который делает доступными тысячи наборов данных для повторного использования и связывания.

Онтологии

Онтологии — это формальные описания структур данных. Некоторые из наиболее известных онтологий:

Наборы данных

Отношения между экземпляром набора данных и классом

Доступны интерактивные диаграммы, которые показывают отдельные наборы данных и их взаимосвязи в созданном DBpedia облаке LOD (как на рисунках справа). [29] [30]

Смотрите также

Ссылки

  1. ^ "Связанные данные как JSON". Связанные данные как JSON . Получено 2020-12-04 .
  2. ^ abc Тим Бернерс-Ли (2006-07-27). "Связанные данные". Проблемы проектирования . W3C . Получено 2010-12-18 .
  3. ^ "Что такое связанные данные и связанные открытые данные?". Ontotext . Получено 2019-05-08 .
  4. ^ "Тим Бернерс-Ли о следующем Интернете". Архивировано из оригинала 2011-04-10 . Получено 2009-03-15 .
  5. ^ "Часто задаваемые вопросы (FAQ) - Связанные данные - Подключение распределенных данных через Интернет". Архивировано из оригинала 2015-11-18 . Получено 2014-12-29 .
  6. ^ "COAR » 7 вещей, которые вы должны знать о… связанных данных". Архивировано из оригинала 2015-11-18 . Получено 2015-12-29 .
  7. ^ "Основы связанных данных для технарей". Архивировано из оригинала 2021-05-05 . Получено 2015-12-29 .
  8. ^ «5 звезд открытых данных».
  9. ^ "5-звездочные открытые данные". 5stardata.info . Получено 2021-03-07 .
  10. ^ «Что такое 5-звездочные связанные данные? | Группа сообщества Webize Everything». www.w3.org . Получено 07.03.2021 .
  11. ^ "Архивы почты [email protected]".
  12. ^ "SweoIG/TaskForces/CommunityProjects/LinkingOpenData/NewsArchive".
  13. ^ «Проект SIMILE — Списки рассылки».
  14. ^ Диаграмма облака открытых данных 2014 г., Макс Шмахтенберг, Кристиан Бизер, Аня Йенцш и Ричард Циганиак. http://lod-cloud.net/
  15. ^ "SweoIG/TaskForces/CommunityProjects/LinkingOpenData - W3C Wiki". esw.w3.org . Получено 22 марта 2018 г. .
  16. ^ Фензель, Дитер; Факка, Федерико Микеле; Симперл, Елена; Иоан, Тома (2011). Семантические веб-службы . Спрингер. п. 99. ИСБН 978-3642191923.
  17. ^ Макс. «Состояние облака LOD». linkeddatacatalog.dws.informatik.uni-mannheim.de . Получено 22 марта 2018 г. .
  18. ^ "Связанные открытые данные круглосуточно (LATC)". latc-project.eu . Архивировано из оригинала 19 сентября 2018 года . Получено 22 марта 2018 года .
  19. ^ Флэтт, Амели; Лангнер, Арне; Лепс, Олоф (2022), «Разработка профилей приложений AKN на основе моделей: предпосылки и требования», Разработка профилей приложений Akoma Ntoso на основе моделей , Cham: Springer International Publishing, стр. 5–12, doi : 10.1007/978-3-031-14132-4_2, ISBN 978-3-031-14131-7, получено 2023-01-07
  20. ^ "Welcome to PlanetData! - PlanetData". planet-data.eu . Архивировано из оригинала 21 апреля 2021 г. . Получено 22 марта 2018 г. .
  21. ^ "DaPaaS". project.dapaas.eu . Архивировано из оригинала 18 декабря 2020 г. Получено 22 марта 2018 г.
  22. ^ Связывание открытых данных 2 (LOD2)
  23. ^ "CORDIS FP7 ICT Projects – LOD2". Европейская комиссия. 2010-04-20.
  24. ^ "Информационный лист проекта LOD2 – Резюме проекта" (PDF) . 2010-09-01. Архивировано из оригинала (PDF) 2011-07-20 . Получено 2010-12-18 .
  25. ^ "Статистика GRID". grid.ac/stats . Получено 2018-10-26 .
  26. ^ "Политики GRID". grid.ac . Получено 2018-10-26 .
  27. ^ "KnowWhereGraph". knowwheregraph.org . Получено 2022-05-16 .
  28. ^ Кшиштоф Янович; Паскаль Хитцлер ; Вэньвэнь Ли; Дин Рехбергер; Марк Шильдхауэр; Руй Чжу; Коган Шимизу; Колби К. Фишер; Лин Кай; Гэнчэнь Май; Джозеф Залевски; Лу Чжоу; Ширли Стивен; Сейла Гонсалес Эстреча; Брайс Д. Мекум; Анна Лопес-Карр; Эндрю Шредер; Дэйв Смит; Дон Дж. Райт; Сычжэ Ван; Юаньюань Тянь; Цзылун Лю; Мейлинь Ши; Энтони Д'Онофрио; Чжинин Г; Китти Карриер (2022). «Знай, знай где, знай гдеграф: плотно связанный, междоменный граф знаний и стек геообогащения для приложений в области экологической разведки». Журнал AI . 43 (1): 30–39. дои : 10.1609/aimag.v43i1.19120 . hdl : 1983/be176aba-9dec-456c-9615-01a0e8556b7b .
  29. ^ "Связи экземпляров между наборами данных". fu-berlin.de . Архивировано из оригинала 2012-10-17 . Получено 22 марта 2018 .
  30. ^ "Связи классов между наборами данных". Архивировано из оригинала 28 августа 2011 г. Получено 22 марта 2018 г.

Дальнейшее чтение

Внешние ссылки