Публикация метаданных — это процесс предоставления доступа к элементам метаданных внешним пользователям (как людям, так и машинам) с использованием формального процесса проверки и обязательств по контролю изменений.
Публикация метаданных — это фундамент, на котором строятся передовые функции распределенных вычислений . Но, как и при построении фундамента, необходимо проявлять осторожность в системах публикации метаданных, чтобы обеспечить структурную целостность систем, построенных на них.
Определение публикации метаданных
Опубликованные метаданные имеют следующие характеристики:
- Структуры метаданных доступны широкой публике на общедоступном веб-сайте или путем загрузки
- Существует документированный процесс проверки и утверждения для добавления или обновления элементов данных в систему.
- Новые релизы становятся доступными без нарушения предыдущих версий.
- Издательская организация, которая берет на себя обязательство изменить процесс контроля
Преимущества публикации метаданных
При классификации преимуществ публикации метаданных обычно рассматриваются две группы. Внешние стороны обычно являются потребителями информации, которые не являются частью организации-публикатора. Внутренние стороны обычно являются различными бизнес-подразделениями или отделами внутри организации.
Преимущества для внешних сторон
- Позволяет внешним системам (как людям, так и агентам) иметь четкое представление о семантике элементов данных в системе.
- Позволяет третьим сторонам создавать семантические карты между моделями данных , а также импортировать и экспортировать данные между системами.
- Продвигает сервисно-ориентированные архитектуры и обеспечивает горизонтальный обмен информацией между традиционными информационными хранилищами
- Позволяет системам участвовать в точно индексированных и объединенных процессах поиска .
Преимущества для внутренних сторон
- позволяет сторонам из разных бизнес-подразделений согласовывать общие определения данных и отдельные определения для конкретных отделов или функций
- делает операции извлечения, преобразования, загрузки (ETL) более точными для хранилищ данных
- позволяет разработчикам пользовательского интерфейса получать доступ к общему пулу меток заголовков экранов и отчетов
- продвижение архитектуры, основанной на моделях
Возражения против публикации метаданных
- Организации, публикующие свои метаданные, могут облегчить неавторизованным лицам поиск конфиденциальных данных в случае нарушения ими межсетевого экрана организации.
- Поставщики, публикующие свои метаданные, подвергают клиентов риску создания инструментов, которые позволят им экспортировать свои данные из компьютерных систем, тем самым упрощая миграцию из системы поставщика.
Основной процесс публикации метаданных
Ниже приведены некоторые основные процессы публикации метаданных.
- Сбор требований к метаданным
- Выбор реестра метаданных и инструментов публикации метаданных
- Обучение участников проекта концепциям метаданных
- Формирование группы заинтересованных сторон
- Сбор метаданных
- Консолидация глоссария
- Начальное построение верхней онтологии (абстрактные элементы данных)
- Загрузка элемента данных проекта
- Процесс проверки элементов данных
- Публикация утвержденных элементов метаданных в различных выходных форматах (см. ниже)
- Создание и поддержка версий и амортизация неиспользуемых или избыточных элементов данных
Публикация метаданных формата файла
Организации, создающие приложения, хранящие данные в файловых системах, также могут публиковать определения метаданных. Одним из распространенных способов сделать это является хранение данных приложения в сжатом формате XML-файла. XML-файлы могут быть распакованы и проверены по внешней XML-схеме. Примером этого является инструмент Open Source FreeMind .
Форматы публикации метаданных
- HTML — используется для просмотра веб-сайта и индексации текстовыми поисковыми системами.
- Язык веб-онтологии (OWL) — используется поисковыми системами метаданных, такими как Swoogle.
- XML Metadata Interchange (XMI) — стандарт OMG для обмена метаданными
- Common Warehouse Metamodel (CMW) — стандарт OMG для метаданных хранилища данных
- Тематические карты — стандарт ISO для представления и обмена знаниями с упором на возможность поиска информации.
- KM3 или Kernel Meta Meta Model , используемая в Metamodel Zoos. AtlanticZoo — это библиотека с открытым исходным кодом, содержащая более 100 метамоделей по лицензии EPL. KM3 [ постоянная мертвая ссылка ] — это простой предметно-ориентированный язык для указания метамоделей. Для перевода из KM3 в другие нотации, такие как XMI, доступно несколько преобразований.
Смотрите также
Внешние ссылки