Распределенная база данных

Распределенная база данных — это база данных , в которой данные хранятся в разных физических местах. ^[1] Он может храниться на нескольких компьютерах , расположенных в одном физическом месте (например, в центре обработки данных); или, возможно, рассредоточены по сети взаимосвязанных компьютеров. В отличие от параллельных систем , в которых процессоры тесно связаны и составляют единую систему баз данных, распределенная система баз данных состоит из слабосвязанных сайтов, не имеющих общих физических компонентов.

Системные администраторы могут распределять наборы данных (например, в базе данных) по нескольким физическим местам. Распределенная база данных может располагаться на организованных сетевых серверах или децентрализованных независимых компьютерах в Интернете , в корпоративных интрасетях или экстрасетях или в сетях других организаций . Поскольку распределенные базы данных хранят данные на нескольких компьютерах, распределенные базы данных могут повысить производительность на рабочих местах конечных пользователей , позволяя обрабатывать транзакции на многих машинах, а не ограничиваться одной. ^[2]

Два процесса гарантируют актуальность и актуальность распределенных баз данных: репликация ^[3] и дублирование .

Репликация предполагает использование специализированного программного обеспечения, которое ищет изменения в дистрибутивной базе данных. После того как изменения идентифицированы, процесс репликации приводит все базы данных в одинаковый вид. Процесс репликации может быть сложным и трудоемким в зависимости от размера и количества распределенных баз данных. Этот процесс также может потребовать много времени и ресурсов компьютера.
С другой стороны, дублирование имеет меньшую сложность. Он идентифицирует одну базу данных как главную , а затем дублирует эту базу данных. Процесс дублирования обычно выполняется в установленное время в нерабочее время. Это необходимо для того, чтобы в каждом распределенном местоположении были одни и те же данные. В процессе дублирования пользователи могут изменять только основную базу данных. Это гарантирует, что локальные данные не будут перезаписаны.

Как репликация, так и дублирование могут поддерживать актуальность данных во всех местах распространения. ^[2]

Помимо репликации и фрагментации распределенных баз данных, существует множество других технологий проектирования распределенных баз данных. Например, технологии локальной автономии, синхронных и асинхронных распределенных баз данных. Реализация этих технологий может зависеть и действительно зависит от потребностей бизнеса, а также от чувствительности/ конфиденциальности данных, хранящихся в базе данных, а также от цены, которую бизнес готов потратить на обеспечение безопасности , согласованности и целостности данных .

При обсуждении доступа к распределенным базам данных Microsoft предпочитает термин « распределенный запрос» , который определяется в зависимости от протокола как «любой оператор SELECT, INSERT, UPDATE или DELETE, который ссылается на таблицы и наборы строк из одного или нескольких внешних данных OLE DB. источники». ^[4]Oracle предоставляет более ориентированное на язык представление, в котором распределенные запросы и распределенные транзакции являются частью распределенного SQL . ^[5]

Архитектура

Существует три основных типа архитектуры распределенных баз данных:

Общая память : используется очень редко ^[6]
Общий диск
Ничего общего

В архитектурах с общей памятью и общим диском данные не секционируются , но они должны быть в архитектуре без общего доступа.

Архитектура общего диска более распространена для облачных баз данных , чем для локальных. ^[6]

Исторически сложилось так, что несовместное использование ресурсов было первой архитектурой, реализованной в облаке, до того, как появление общего облачного хранилища сделало возможным использование общего диска.

На практике разные уровни базы данных могут иметь разную архитектуру. В настоящее время общепринятым является наличие уровня вычислений с архитектурой без общего доступа и уровня хранения с архитектурой общего диска. Так обстоит дело, например, со Snowflake ^[7] и AWS Aurora . ^[8]

Распределенная база данных

Архитектура

Список баз данных без общего доступа

Список баз данных на общих дисках

Смотрите также

Рекомендации