stringtranslate.com

Связанные данные

Сеть из более чем тысячи кругов, сгруппированных в группы и связанных линиями в паутину.
Викиданные в связанном облаке открытых данных. Базы данных обозначены кружками (викиданные обозначены буквой «WD»), а серые линии соединяют базы данных в сети, если их данные выровнены.
DBpedia как наиболее взаимосвязанный набор данных LOD и точка кристаллизации связанного облака открытых данных с 2008 года.
DBpedia как наиболее взаимосвязанный набор данных LOD и точка кристаллизации связанного облака открытых данных с 2008 года, созданная по адресу https://lod-cloud.net/.

В вычислениях связанные данные — это структурированные данные, которые взаимосвязаны с другими данными, поэтому они становятся более полезными посредством семантических запросов . Он основан на стандартных веб- технологиях, таких как HTTP , RDF и URI , но вместо того, чтобы использовать их для обслуживания веб-страниц только для читателей-людей, он расширяет их возможности для обмена информацией таким образом, чтобы ее могли автоматически читать компьютеры. Частью концепции связанных данных является превращение Интернета в глобальную базу данных . [1]

Тим Бернерс-Ли , директор Консорциума Всемирной паутины (W3C), ввёл этот термин в заметку о дизайне проекта Semantic Web в 2006 году . [2]

Связанные данные также могут быть открытыми данными , и в этом случае их обычно называют связанными открытыми данными. [3]

Принципы

В своей заметке «Связанные данные» 2006 года Тим Бернерс-Ли изложил четыре принципа связанных данных, перефразировав их следующим образом: [2]

  1. Единые идентификаторы ресурсов (URI) следует использовать для именования и идентификации отдельных объектов.
  2. HTTP URI должны использоваться для того, чтобы эти вещи можно было искать, интерпретировать и впоследствии «разыменовывать».
  3. Полезная информация о том, что идентифицирует имя, должна предоставляться через открытые стандарты, такие как RDF , SPARQL и т. д.
  4. При публикации данных в Интернете следует ссылаться на другие объекты, используя их имена на основе HTTP URI.

Тим Бернерс-Ли позже подтвердил эти принципы на конференции TED в 2009 году , снова перефразировав их следующим образом: [4]

  1. Все концептуальные вещи должны иметь имя, начинающееся с HTTP .
  2. Поиск по имени HTTP должен возвращать полезные данные о рассматриваемом объекте в стандартном формате.
  3. Все остальное, с чем эта же вещь связана через свои данные, также должно иметь имя, начинающееся с HTTP.

Компоненты

Таким образом, мы можем определить следующие компоненты как важные для глобальной системы связанных данных, как это предполагалось, и для любого фактического подмножества связанных данных в ней:

Связанные открытые данные

Связанные открытые данные — это связанные данные, которые являются открытыми данными . [5] [6] [7] Тим Бернерс-Ли дает самое четкое определение связанных открытых данных в отличие от связанных данных.

Связанные открытые данные (LOD) — это связанные данные, которые выпускаются по открытой лицензии, что не препятствует их бесплатному повторному использованию.

-  Тим Бернерс-Ли, Связанные данные [2] [8]

Большие связанные наборы открытых данных включают DBpedia , Wikibase , Wikidata и Open ICEcat  [uk; нл] .

5-звездочные связанные открытые данные

Схема развертывания связанных открытых данных [9]

В 2010 году Тим Бернерс-Ли предложил 5-звездочную схему оценки качества открытых данных в сети, по которой наивысший рейтинг имеет «Связанные открытые данные»: [10]

История

Термин «связанные открытые данные» используется как минимум с февраля 2007 года, когда был создан список рассылки «Связывание открытых данных» [11] . [12] Список рассылки первоначально был организован проектом SIMILE [13] в Массачусетском технологическом институте .

Связывание проекта сообщества открытых данных

На приведенной выше диаграмме показано, какие наборы данных Linking Open Data связаны между собой по состоянию на август 2014 года. Она была создана в рамках проекта Linked Open Data Cloud, который был начат в 2007 году. Некоторые наборы могут включать данные, защищенные авторским правом, которые находятся в свободном доступе. [14]
Та же диаграмма, что и выше, но за февраль 2017 года, показывающая рост всего за два с половиной года.

Целью проекта сообщества Linking Open Data группы W3C Semantic Web Education and Outreach является расширение Интернета за счет общего доступа к данным путем публикации различных открытых наборов данных в формате RDF в Интернете и установки связей RDF между элементами данных из разных источников данных. В октябре 2007 года наборы данных состояли из более чем двух миллиардов троек RDF , которые были связаны между собой более чем двумя миллионами ссылок RDF. [15] [16] К сентябрю 2011 года это число выросло до 31 миллиарда троек RDF, связанных между собой примерно 504 миллионами ссылок RDF. Подробная статистическая разбивка была опубликована в 2014 году. [17]

Проекты Европейского Союза

Существует ряд проектов Европейского Союза , в которых используются связанные данные. К ним относятся проект связанных открытых данных круглосуточно (LATC), [18] проект AKN4EU для машиночитаемых законодательных данных, [19] проект PlanetData, [20] DaPaaS (данные и платформа как Service), [21] и проект Linked Open Data 2 (LOD2). [22] [23] [24] Объединение данных является одной из основных целей Портала открытых данных ЕС , который делает доступными тысячи наборов данных, которые каждый может повторно использовать и связывать.

Онтологии

Онтологии — это формальные описания структур данных. Некоторые из наиболее известных онтологий:

Наборы данных

Экземпляр набора данных и отношения классов

Доступны кликабельные диаграммы, показывающие отдельные наборы данных и их взаимосвязи в облаке LOD, созданном DBpedia (как показано на рисунках справа). [29] [30]

Смотрите также

Рекомендации

  1. ^ «Связанные данные в формате JSON» . Связанные данные в формате JSON . Проверено 4 декабря 2020 г.
  2. ^ abc Тим Бернерс-Ли (27 июля 2006 г.). «Связанные данные». Проблемы дизайна . W3C . Проверено 18 декабря 2010 г.
  3. ^ «Что такое связанные данные и связанные открытые данные?». Онтотекст . Проверено 8 мая 2019 г.
  4. ^ «Тим Бернерс-Ли в следующей сети» . Архивировано из оригинала 10 апреля 2011 г. Проверено 15 марта 2009 г.
  5. ^ «Часто задаваемые вопросы (FAQ) - Связанные данные - Подключение распределенных данных через Интернет» . Архивировано из оригинала 18 ноября 2015 г. Проверено 29 декабря 2014 г.
  6. ^ «COAR »7 вещей, которые вам следует знать о… Связанных данных» . Архивировано из оригинала 18 ноября 2015 г. Проверено 29 декабря 2015 г.
  7. ^ «Основы связанных данных для технических специалистов». Архивировано из оригинала 5 мая 2021 г. Проверено 29 декабря 2015 г.
  8. ^ «5 звезд открытых данных» .
  9. ^ «5-звездочные открытые данные» . 5stardata.info . Проверено 7 марта 2021 г.
  10. ^ «Что такое 5-звездочные связанные данные? | Группа сообщества Webize Everything» . www.w3.org . Проверено 7 марта 2021 г.
  11. ^ "Почтовые архивы [email protected]" .
  12. ^ "SweoIG/TaskForces/CommunityProjects/LinkingOpenData/NewsArchive" .
  13. ^ «Проект SIMILE - Списки рассылки» .
  14. ^ Связывание диаграммы облака открытых данных 2014 года, авторы Макс Шмахтенберг, Кристиан Бизер, Аня Йенч и Ричард Циганиак. http://lod-cloud.net/
  15. ^ "SweoIG/TaskForces/CommunityProjects/LinkingOpenData - W3C Wiki" . esw.w3.org . Проверено 22 марта 2018 г.
  16. ^ Фензель, Дитер; Факка, Федерико Микеле; Симперл, Елена; Иоан, Тома (2011). Семантические веб-службы . Спрингер. п. 99. ИСБН 978-3642191923.
  17. ^ Макс. «Состояние LOD-облака». linkeddatacatalog.dws.informatik.uni-mannheim.de . Проверено 22 марта 2018 г.
  18. ^ «Связанные открытые данные круглосуточно (LATC)» . latc-project.eu . Архивировано из оригинала 19 сентября 2018 года . Проверено 22 марта 2018 г.
  19. ^ Флатт, Амели; Лангнер, Арне; Лепс, Олоф (2022), «Разработка профилей приложений AKN на основе моделей: предыстория и требования», Разработка профилей приложений Akoma Ntoso на основе моделей , Cham: Springer International Publishing, стр. 5–12, doi : 10.1007/978- 3-031-14132-4_2, ISBN 978-3-031-14131-7, получено 7 января 2023 г.
  20. ^ «Добро пожаловать в PlanetData! - PlanetData» . Planet-data.eu . Архивировано из оригинала 21 апреля 2021 года . Проверено 22 марта 2018 г.
  21. ^ "ДаПааС". project.dapaas.eu . Архивировано из оригинала 18 декабря 2020 года . Проверено 22 марта 2018 г.
  22. ^ Связывание открытых данных 2 (LOD2)
  23. ^ «Проекты ИКТ CORDIS FP7 – LOD2» . Европейская комиссия. 20 апреля 2010 г.
  24. ^ «Информационный бюллетень о проекте LOD2 - Краткое описание проекта» (PDF) . 01 сентября 2010 г. Архивировано из оригинала (PDF) 20 июля 2011 г. Проверено 18 декабря 2010 г.
  25. ^ «Статистика GRID». Grid.ac/stats . Проверено 26 октября 2018 г.
  26. ^ «Политика GRID». сетка.ac . Проверено 26 октября 2018 г.
  27. ^ "ЗнатьГдеГраф" . Knowwheregraph.org . Проверено 16 мая 2022 г.
  28. ^ Кшиштоф Янович; Паскаль Хитцлер ; Венвен Ли; Дин Ребергер; Марк Шильдхауэр; Руй Чжу; Коган Симидзу; Колби К. Фишер; Лин Цай; Генгчен Май; Джозеф Залевски; Лу Чжоу; Ширли Стивен; Сейла Гонсалес Эстреча; Брайс Д. Мекам; Анна Лопес-Карр; Эндрю Шредер; Дэйв Смит; Дон Дж. Райт; Сижэ Ван; Юаньюань Тянь; Цзилун Лю; Мэйлин Ши; Энтони Д'Онофрио; Жинин Г; Китти Карриер (2022). «Знать, знать где, знать, где граф: плотно связанный междоменный граф знаний и стек сервисов географического обогащения для приложений в области экологической разведки». Журнал ИИ . 43 (1): 30–39. дои : 10.1609/aimag.v43i1.19120 . hdl : 1983/be176aba-9dec-456c-9615-01a0e8556b7b .
  29. ^ «Отношения экземпляров между наборами данных». fu-berlin.de . Архивировано из оригинала 17 октября 2012 г. Проверено 22 марта 2018 г.
  30. ^ «Классовые отношения между наборами данных». Архивировано из оригинала 28 августа 2011 года . Проверено 22 марта 2018 г.

дальнейшее чтение

Внешние ссылки