stringtranslate.com

Распределенная база данных

Распределенная база данных — это база данных , в которой данные хранятся в разных физических местах. [1] Он может храниться на нескольких компьютерах , расположенных в одном физическом месте (например, в центре обработки данных); или, возможно, рассредоточены по сети взаимосвязанных компьютеров. В отличие от параллельных систем , в которых процессоры тесно связаны и составляют единую систему баз данных, распределенная система баз данных состоит из слабосвязанных сайтов, не имеющих общих физических компонентов.

Системные администраторы могут распределять наборы данных (например, в базе данных) по нескольким физическим местам. Распределенная база данных может располагаться на организованных сетевых серверах или децентрализованных независимых компьютерах в Интернете , в корпоративных интрасетях или экстрасетях или в сетях других организаций . Поскольку распределенные базы данных хранят данные на нескольких компьютерах, распределенные базы данных могут повысить производительность на рабочих местах конечных пользователей , позволяя обрабатывать транзакции на многих машинах, а не ограничиваться одной. [2]

Два процесса гарантируют актуальность и актуальность распределенных баз данных: репликация [3] и дублирование .

  1. Репликация предполагает использование специализированного программного обеспечения, которое ищет изменения в дистрибутивной базе данных. После того как изменения идентифицированы, процесс репликации приводит все базы данных в одинаковый вид. Процесс репликации может быть сложным и трудоемким в зависимости от размера и количества распределенных баз данных. Этот процесс также может потребовать много времени и ресурсов компьютера.
  2. С другой стороны, дублирование имеет меньшую сложность. Он идентифицирует одну базу данных как главную , а затем дублирует эту базу данных. Процесс дублирования обычно выполняется в установленное время в нерабочее время. Это необходимо для того, чтобы в каждом распределенном местоположении были одни и те же данные. В процессе дублирования пользователи могут изменять только основную базу данных. Это гарантирует, что локальные данные не будут перезаписаны.

Как репликация, так и дублирование могут поддерживать актуальность данных во всех местах распространения. [2]

Помимо репликации и фрагментации распределенных баз данных, существует множество других технологий проектирования распределенных баз данных. Например, технологии локальной автономии, синхронных и асинхронных распределенных баз данных. Реализация этих технологий может зависеть и действительно зависит от потребностей бизнеса, а также от чувствительности/ конфиденциальности данных, хранящихся в базе данных, а также от цены, которую бизнес готов потратить на обеспечение безопасности , согласованности и целостности данных .

При обсуждении доступа к распределенным базам данных Microsoft предпочитает термин « распределенный запрос» , который определяется в зависимости от протокола как «любой оператор SELECT, INSERT, UPDATE или DELETE, который ссылается на таблицы и наборы строк из одного или нескольких внешних данных OLE DB. источники». [4] Oracle предоставляет более ориентированное на язык представление, в котором распределенные запросы и распределенные транзакции являются частью распределенного SQL . [5]

Архитектура

Существует три основных типа архитектуры распределенных баз данных:

В архитектурах с общей памятью и общим диском данные не секционируются , но они должны быть в архитектуре без общего доступа.

Архитектура общего диска более распространена для облачных баз данных , чем для локальных. [6]

Исторически сложилось так, что несовместное использование ресурсов было первой архитектурой, реализованной в облаке, до того, как появление общего облачного хранилища сделало возможным использование общего диска.

На практике разные уровни базы данных могут иметь разную архитектуру. В настоящее время общепринятым является наличие уровня вычислений с архитектурой без общего доступа и уровня хранения с архитектурой общего диска. Так обстоит дело, например, со Snowflake [7] и AWS Aurora . [8]

Список баз данных без общего доступа

Список баз данных на общих дисках

Смотрите также

Рекомендации

  1. ^ «Определение: распределенная база данных» . www.its.bldrdoc.gov .
  2. ^ аб О'Брайен, Дж. и Маракас, GM (2008) Информационные системы управления (стр. 185-189). Нью-Йорк, штат Нью-Йорк: МакГроу-Хилл Ирвин
  3. ^ Озсу, Монтана; Вальдурье, П. (1991). «Системы распределенных баз данных: где мы сейчас?». Компьютер . 24 (8): 68–78. дои : 10.1109/2.84879. ISSN  1558-0814. S2CID  5898169.
  4. ^ "Глоссарий TechNet". Майкрософт. 28 января 2010 года . Проверено 16 июля 2013 г. распределенный запрос[:] Любой оператор SELECT, INSERT, UPDATE или DELETE, который ссылается на таблицы и наборы строк из одного или нескольких внешних источников данных OLE DB.
  5. ^ Эшдаун, Лэнс; Кайт, Том (сентябрь 2011 г.). «Концепции базы данных Oracle, 11g, выпуск 2 (11.2)». Корпорация Оракл. Архивировано из оригинала 15 июля 2013 г. Проверено 17 июля 2013 г. Распределенный SQL синхронно получает доступ и обновляет данные, распределенные по нескольким базам данных. [...] Распределенный SQL включает распределенные запросы и распределенные транзакции.
  6. ^ Аб Гаррод, Чарли (2023). «Лекция № 21: Введение в распределенные базы данных» (PDF) . Университет Карнеги-Меллон – Школа компьютерных наук . Проверено 12 марта 2023 г.
  7. ^ Кошик, Арун (14 февраля 2020 г.). «Что делает Snowflake таким мощным — это гибрид архитектуры общего диска и архитектуры без общего доступа». Середина . Проверено 12 марта 2024 г.
  8. ^ Брахмадесам, Мурали; Тернстрем, Тобиас (2019). «Хранилище Amazon Aurora раскрыто: как все это работает» (PDF) . Проверено 12 марта 2024 г.