Центрированные на данных вычисления — это новая концепция, которая имеет отношение к информационной архитектуре и проектированию центров обработки данных . Она описывает информационную систему, в которой данные хранятся независимо от приложений, которые можно модернизировать без дорогостоящей и сложной миграции данных. Это радикальный сдвиг в информационных системах, который будет необходим для удовлетворения организационных потребностей в хранении, извлечении, перемещении и обработке экспоненциально растущих наборов данных. [1]
Традиционные архитектуры информационных систем основаны на мышлении, ориентированном на приложения. Традиционно приложения устанавливались, поддерживались относительно статичными, обновлялись нечасто и использовали фиксированный набор вычислительных, хранилищных и сетевых элементов для обработки относительно небольшого набора структурированных данных. [2]
Этот подход хорошо функционировал в течение десятилетий, но за последнее десятилетие рост данных, особенно неструктурированных, оказал новое давление на организации, информационные архитектуры и инфраструктуру центров обработки данных. 90% новых данных неструктурированы, и, согласно отчету за 2018 год, 59% организаций управляют более чем 10 миллиардами файлов и объектов [3], распределенных по большому количеству серверов и узлов хранения. Организации изо всех сил пытаются справиться с экспоненциальным ростом данных, одновременно пытаясь найти лучшие подходы к извлечению информации из этих данных с помощью таких сервисов, как аналитика больших данных и машинное обучение . Однако существующие архитектуры не рассчитаны на удовлетворение требований к обслуживанию в масштабах петабайтов и более без существенных ограничений производительности. [4]
Традиционные архитектуры не в состоянии в полной мере хранить, извлекать, перемещать и использовать эти данные из-за ограничений аппаратной инфраструктуры, а также проектирования, разработки и управления системами, ориентированными на приложения. [5]
Рабочие нагрузки, ориентированные на данные
Центрированные на данных вычисления призваны решить две проблемы.
Вычисления, ориентированные на данные
Центрированные на данных вычисления — это подход, который объединяет инновационное оборудование и программное обеспечение для обработки данных, а не приложений, как постоянного источника ценности. [8] Центрированные на данных вычисления направлены на переосмысление как оборудования, так и программного обеспечения для извлечения как можно большей ценности из существующих и новых источников данных. Они повышают гибкость, отдавая приоритет передаче данных и вычислению данных над статической производительностью и устойчивостью приложений.
Аппаратное и программное обеспечение, ориентированное на данные
Для достижения целей вычислений, ориентированных на данные, аппаратная инфраструктура центров обработки данных будет развиваться с учетом огромных масштабов, быстрого роста, необходимости высокопроизводительного перемещения данных и обширных требований к вычислениям.
Что касается программного обеспечения, то ориентированные на данные вычисления ускоряют исчезновение традиционных статических приложений. [12] Приложения становятся недолговечными, постоянно добавляются, обновляются или удаляются по мере того, как алгоритмы приходят и уходят. Программное обеспечение перепроектируется для проведения анализа всех доступных данных вместо подмножеств. Микросервисы посещают данные, проводят вычисления и выражают результаты своего процесса со скоростью, превышающей обычные подходы.
{{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка )