Витрина данных — это структура/шаблон доступа, характерный для сред хранилищ данных . Витрина данных — это подмножество хранилища данных, которое обычно ориентировано на определенную бизнес-линию или команду. В то время как хранилища данных имеют глубину в масштабах всего предприятия, информация в витринах данных относится к одному отделу. В некоторых развертываниях каждый отдел или бизнес-подразделение считается владельцем своей витрины данных, включая все оборудование , программное обеспечение и данные . [1] Это позволяет каждому отделу изолировать использование, обработку и разработку своих данных. В других развертываниях, где используются согласованные измерения, этот владелец бизнес-подразделения не будет верен для общих измерений, таких как клиент, продукт и т. д.
Склады и витрины данных создаются, потому что информация в базе данных не организована таким образом, чтобы к ней был легкий доступ. Такая организация требует слишком сложных запросов, к которым трудно получить доступ или которые требуют больших ресурсов.
В то время как транзакционные базы данных предназначены для обновления, хранилища данных или витрины предназначены только для чтения . Хранилища данных предназначены для доступа к большим группам связанных записей. Витрины данных сокращают время отклика конечного пользователя, позволяя пользователям иметь доступ к определенному типу данных, которые им нужно просматривать чаще всего, предоставляя данные таким образом, который поддерживает коллективное представление группы пользователей.
Витрина данных — это, по сути, сжатая и более сфокусированная версия хранилища данных, которая отражает правила и спецификации процессов каждого бизнес-подразделения в организации. [2] Каждая витрина данных предназначена для определенной бизнес-функции или региона. Этот подмножество данных может охватывать многие или все функциональные предметные области предприятия. Обычно несколько витрин данных используются для обслуживания потребностей каждого отдельного бизнес-подразделения (различные витрины данных могут использоваться для получения определенной информации для различных отделов предприятия, таких как бухгалтерия, маркетинг, продажи и т. д.).
Связанный термин spreadmart является уничижительным и описывает ситуацию, которая возникает, когда один или несколько бизнес-аналитиков разрабатывают систему связанных электронных таблиц для выполнения бизнес-анализа, а затем увеличивают ее до размера и степени сложности, которые делают ее практически невозможной для поддержки. Термин для этого состояния - "Excel Hell". [3]
Хранилище данных:
Витрина данных:
Согласно школе хранилищ данных Инмона , зависимая витрина данных — это логическое подмножество ( представление ) или физическое подмножество (выдержка) более крупного хранилища данных , изолированное по одной из следующих причин:
По мнению школы хранилищ данных Инмона, недостатками, присущими витринам данных, являются ограниченная масштабируемость , дублирование данных , несогласованность данных с другими хранилищами информации и невозможность использовать корпоративные источники данных.
Альтернативная школа хранилищ данных — школа Ральфа Кимбалла . По его мнению, хранилище данных — это не что иное, как объединение всех витрин данных. Такой взгляд помогает сократить расходы и обеспечивает быструю разработку, но может создать несогласованное хранилище данных, особенно в крупных организациях. Поэтому подход Кимбалла больше подходит для малых и средних корпораций. [4]