stringtranslate.com

Пространство данных

Участники пространства данных

Пространство данных — это абстракция в управлении данными , которая направлена ​​на преодоление некоторых проблем, возникающих в системе интеграции данных . Пространство данных определяется как набор «участников» или источников данных и отношений между ними: например, набор данных A является дубликатом набора данных B. [1] Он может содержать все источники данных организации независимо от их формата, физического местоположения или модели данных . [1] Затем пространство данных предоставляет унифицированный интерфейс для запроса данных независимо от формата, иногда в режиме «наилучших усилий», и способы дальнейшей интеграции данных при необходимости. [1] Это сильно отличается от традиционной реляционной базы данных , которая требует, чтобы все данные были в одном формате. [1] Цель концепции — сократить усилия, необходимые для настройки системы интеграции данных, полагаясь на существующие методы сопоставления и генерации карт, [ необходимо разъяснение ] и улучшить систему в режиме «оплаты по мере использования». [2] [3] Трудоемкие аспекты интеграции данных откладываются до тех пор, пока они не станут абсолютно необходимыми. [4]

Традиционно системы интеграции данных и обмена данными были нацелены на предложение многих предполагаемых услуг систем пространств данных. Пространства данных можно рассматривать как следующий шаг в эволюции архитектур интеграции данных, но они отличаются от текущих систем интеграции данных, поскольку требуют семантической интеграции до предоставления каких-либо услуг. Следовательно, хотя не существует единой схемы , которой соответствуют все данные, и данные находятся во множестве хост-систем, система интеграции данных знает точные отношения между терминами, используемыми в каждой схеме. В результате для настройки системы интеграции данных требуются значительные предварительные усилия. [5]

Пространства данных смещают акцент на подход сосуществования данных, предоставляя базовую функциональность по всем источникам данных, независимо от того, насколько они интегрированы. Например, платформа поддержки DataSpace (DSSP) может обеспечить поиск по ключевым словам по всем своим источникам данных, аналогично тому, который предоставляют существующие системы поиска на рабочем столе. Когда требуются более сложные операции, такие как запросы в реляционном стиле, интеллектуальный анализ данных или мониторинг определенных источников, то можно приложить дополнительные усилия для более тесной интеграции этих источников в инкрементном режиме. Аналогично, с точки зрения традиционных гарантий баз данных, изначально система пространства данных может предоставить только более слабые гарантии согласованности и долговечности. Поскольку требуются более сильные гарантии, можно приложить больше усилий для заключения соглашений между различными владельцами источников данных и открытия определенных интерфейсов (например, для протоколов фиксации). [6] [7]

История

Согласно циклической модели развития технологий, новые технологии развиваются, сначала проходя через фазу конкуренции проектов, где технология исследуется и проводятся эксперименты, пока отрасль не остановится на доминирующем проекте и не прекратит так много итераций. [1] По словам Эдварда, в 2019 году пространства данных уже прошли «первую волну» принятия, состоящую из исследовательских и концептуальных проектов, и начали «вторую волну», в которой они адаптируются для более общих и менее приятных вариантов использования. [1]

Европейская комиссия работает над разработкой общих пространств данных для различных отраслей промышленности под названием «Общие европейские пространства данных» с февраля 2020 года. [8] Планируется создание пространств данных для сельского хозяйства, энергетики, финансов, здравоохранения, СМИ, производства, мобильности и туризма, а также для Европейского зеленого соглашения , языков, государственного управления, исследований и инноваций, а также навыков. [8] [9] [ необходимо разъяснение ] Первыми конкретными шагами стали ряд исследовательских и инновационных инициатив, финансируемых в рамках Европейского государственно-частного партнерства по ценности больших данных (ГЧП по ценности больших данных). [10]

Смотрите также

Ссылки

  1. ^ abcdef Карри, Эдвард (2020), Карри, Эдвард (ред.), «Пространства данных: основы, принципы и методы», Связанные в реальном времени пространства данных: поддержка экосистем данных для интеллектуальных систем , Cham: Springer International Publishing, стр. 45–62, doi : 10.1007/978-3-030-29665-0_3 , ISBN 978-3-030-29665-0
  2. ^ Belhajjame, K.; Paton, NW ; Embury, SM; Fernandes, AAA; Hedeler, C. (2013). «Постепенное улучшение пространств данных на основе отзывов пользователей». Information Systems . 38 (5): 656. CiteSeerX 10.1.1.303.1957 . doi :10.1016/j.is.2013.01.006. 
  3. ^ Belhajjame, K.; Paton, NW ; Embury, SM; Fernandes, AAA; Hedeler, C. (2010). "Аннотация на основе обратной связи, выбор и уточнение отображений схем для пространств данных". Труды 13-й Международной конференции по расширению технологий баз данных - EDBT '10 . стр. 573. CiteSeerX 10.1.1.298.3519 . doi :10.1145/1739041.1739110. ISBN  9781605589459.
  4. ^ Донг, X.; Халеви, А. (2007). "Индексирование пространств данных". Труды международной конференции ACM SIGMOD 2007 года по управлению данными - SIGMOD '07 . стр. 43. doi :10.1145/1247480.1247487. ISBN 9781595936868. S2CID  1184444.
  5. ^ Howe, B.; Maier, D.; Rayner, N.; Rucker, J. (2008). "Quarrying dataspaces: Schemaless profiling of unfamilar information sources". 2008 IEEE 24th International Conference on Data Engineering Workshop . стр. 270. doi :10.1109/ICDEW.2008.4498331. ISBN 978-1-4244-2161-9. S2CID  14039616.
  6. ^ Сарма, А.Д.; Донг, X. (Л.; Халеви, А.Ю. (2009). «Моделирование данных в платформах поддержки пространств данных». Концептуальное моделирование: основы и приложения . Конспект лекций по информатике. Том 5600. С. 122–138. doi :10.1007/978-3-642-02463-4_8. ISBN 978-3-642-02462-7.
  7. ^ Франклин, М.; Халеви, А.; Майер, Д. (2005). «От баз данных к пространствам данных». ACM SIGMOD Record . 34 (4): 27. doi :10.1145/1107499.1107502. S2CID  14092111.
  8. ^ ab "Формирование цифрового будущего Европы: общие европейские пространства данных". Европейская комиссия . Получено 24.08.2024 .
  9. ^ "Взгляд из Брюсселя: Европейская стратегия в отношении данных обретает форму". Международная ассоциация профессионалов в области конфиденциальности . 11 января 2024 г. Получено 24 августа 2024 г.
  10. ^ Шерри, Саймон; Туикка, Туомо; де Вальехо, Ирен Лопес; Карри, Эдвард (2022), Карри, Эдвард; Шерри, Саймон; Туикка, Туомо (ред.), «Общие европейские пространства данных: проблемы и возможности», Пространства данных: проектирование, развертывание и будущие направления , Cham: Springer International Publishing, стр. 337–357, doi : 10.1007/978-3-030-98636-0_16 , ISBN 978-3-030-98636-0

Дальнейшее чтение