stringtranslate.com

Вычисления, ориентированные на данные

Центрированные на данных вычисления — это новая концепция, которая имеет отношение к информационной архитектуре и проектированию центров обработки данных . Она описывает информационную систему, в которой данные хранятся независимо от приложений, которые можно модернизировать без дорогостоящей и сложной миграции данных. Это радикальный сдвиг в информационных системах, который будет необходим для удовлетворения организационных потребностей в хранении, извлечении, перемещении и обработке экспоненциально растущих наборов данных. [1]

Фон

Традиционные архитектуры информационных систем основаны на мышлении, ориентированном на приложения. Традиционно приложения устанавливались, поддерживались относительно статичными, обновлялись нечасто и использовали фиксированный набор вычислительных, хранилищных и сетевых элементов для обработки относительно небольшого набора структурированных данных. [2]

Этот подход хорошо функционировал в течение десятилетий, но за последнее десятилетие рост данных, особенно неструктурированных, оказал новое давление на организации, информационные архитектуры и инфраструктуру центров обработки данных. 90% новых данных неструктурированы, и, согласно отчету за 2018 год, 59% организаций управляют более чем 10 миллиардами файлов и объектов [3], распределенных по большому количеству серверов и узлов хранения. Организации изо всех сил пытаются справиться с экспоненциальным ростом данных, одновременно пытаясь найти лучшие подходы к извлечению информации из этих данных с помощью таких сервисов, как аналитика больших данных и машинное обучение . Однако существующие архитектуры не рассчитаны на удовлетворение требований к обслуживанию в масштабах петабайтов и более без существенных ограничений производительности. [4]

Традиционные архитектуры не в состоянии в полной мере хранить, извлекать, перемещать и использовать эти данные из-за ограничений аппаратной инфраструктуры, а также проектирования, разработки и управления системами, ориентированными на приложения. [5]

Рабочие нагрузки, ориентированные на данные

Центрированные на данных вычисления призваны решить две проблемы.

  1. Организациям необходимо использовать все доступные данные, но традиционные приложения недостаточно гибкие и подвижные. Новые сдвиги в сторону постоянных инноваций в сфере услуг, поддерживаемые новыми подходами к предоставлению услуг (включая микросервисы и контейнеры), открывают новые возможности, которые отходят от традиционного мышления, ориентированного на приложения.
  2. Существующие ограничения оборудования центра обработки данных также ограничивают полное перемещение, управление и использование неструктурированных наборов данных. Обычные процессоры снижают производительность, поскольку не включают специализированные возможности, необходимые для хранения, работы в сети и анализа. [6] Медленное хранилище, включая жесткие диски и твердотельные накопители SAS/SATA по сети, может снизить производительность и ограничить доступность данных. [7] Необходимы новые аппаратные возможности.

Вычисления, ориентированные на данные

Центрированные на данных вычисления — это подход, который объединяет инновационное оборудование и программное обеспечение для обработки данных, а не приложений, как постоянного источника ценности. [8] Центрированные на данных вычисления направлены на переосмысление как оборудования, так и программного обеспечения для извлечения как можно большей ценности из существующих и новых источников данных. Они повышают гибкость, отдавая приоритет передаче данных и вычислению данных над статической производительностью и устойчивостью приложений.

Аппаратное и программное обеспечение, ориентированное на данные

Для достижения целей вычислений, ориентированных на данные, аппаратная инфраструктура центров обработки данных будет развиваться с учетом огромных масштабов, быстрого роста, необходимости высокопроизводительного перемещения данных и обширных требований к вычислениям.

Что касается программного обеспечения, то ориентированные на данные вычисления ускоряют исчезновение традиционных статических приложений. [12] Приложения становятся недолговечными, постоянно добавляются, обновляются или удаляются по мере того, как алгоритмы приходят и уходят. Программное обеспечение перепроектируется для проведения анализа всех доступных данных вместо подмножеств. Микросервисы посещают данные, проводят вычисления и выражают результаты своего процесса со скоростью, превышающей обычные подходы.

Ссылки

  1. ^ "The Data-Centric Revolution". TDAN.com . Сентябрь 2015. Получено 2019-12-07 .
  2. ^ Бхагешпур, Киран (2016-10-06). "Появление вычислений, ориентированных на данные". Следующая платформа . Получено 2019-12-07 .
  3. ^ Бхагешпур, Киран. "Состояние управления неструктурированными данными в 2018 году" (PDF) . Igneous . Архивировано из оригинала (PDF) 18 июля 2020 г. . Получено 7 декабря 2019 г. .
  4. ^ «Требования к неструктурированным данным в масштабе петабайта». StorageSwiss.com — Дом хранения данных в Швейцарии . 2019-10-14 . Получено 2019-12-07 .
  5. ^ Джордж С. Дэвидсон, Кевин В. Бояк, Рон А. Захарски, Стивен С. Хельмрайх и Джим Р. Коуи (апрель 2006 г.). «Data-Centric Computing with the Netezza Architecture» (PDF) . sandia.gov . Получено 7 декабря 2019 г. .{{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ Почему нам нужны открытые, ориентированные на данные вычислительные архитектуры , получено 2019-12-07
  7. ^ Штаты, Остин TX United (2016-11-10). «Сеть — новое узкое место в системе хранения». Datanami . Получено 2019-12-07 .
  8. ^ «Data-Centric Manifesto». datacentricmanifesto.org . Получено 2019-12-07 .
  9. ^ Саймонит, Том. «Основа инноваций в компьютерной отрасли шатается. Что может ее заменить?». MIT Technology Review . Получено 07.12.2019 .
  10. ^ "DPU: Data Processing Unit Programmable Processor". Взаимозаменяемый . Архивировано из оригинала 2020-08-05 . Получено 2019-12-07 .
  11. ^ Киран, Майк (21.03.2019). «Когда вы внедряете NVMe через Fabrics, Fabric действительно имеет значение». Блог NetApp . Получено 07.12.2019 .
  12. ^ "Microservices Momentum Accelerates". DevOps.com . 2018-05-10 . Получено 2019-12-07 .