stringtranslate.com

Кластер высокой доступности

Кластеры высокой доступности (также известные как кластеры высокой доступности , отказоустойчивые кластеры ) — это группы компьютеров , которые поддерживают серверные приложения , которые можно надежно использовать с минимальным временем простоя . Они работают, используя программное обеспечение высокой доступности для объединения резервных компьютеров в группы или кластеры , которые обеспечивают непрерывное обслуживание в случае сбоя компонентов системы. Без кластеризации в случае сбоя сервера, на котором выполняется определенное приложение, приложение будет недоступно до тех пор, пока сбойный сервер не будет исправлен. Кластеризация высокой доступности исправляет эту ситуацию, обнаруживая аппаратные/программные сбои и немедленно перезапуская приложение в другой системе без необходимости административного вмешательства (процесс, известный как аварийное переключение ). В рамках этого процесса программное обеспечение кластеризации может настроить узел перед запуском на нем приложения. Например, может потребоваться импортировать и смонтировать соответствующие файловые системы, настроить сетевое оборудование, а также запустить некоторые вспомогательные приложения. [1]

Кластеры высокой доступности часто используются для критически важных баз данных , совместного использования файлов в сети, бизнес-приложений и служб поддержки клиентов, таких как веб-сайты электронной коммерции . Реализации кластера высокой доступности пытаются создать избыточность в кластере, чтобы исключить отдельные точки отказа, включая множественные сетевые подключения и хранилища данных, которые избыточно подключены через сети хранения данных .

Кластеры высокой доступности обычно используют тактовое частное сетевое соединение, которое используется для мониторинга работоспособности и состояния каждого узла в кластере. Одно тонкое, но серьезное условие, с которым должно справляться все программное обеспечение кластеризации, — это разделение мозга , которое возникает, когда все частные каналы отключаются одновременно, но узлы кластера все еще работают. Если это произойдет, каждый узел в кластере может ошибочно решить, что все остальные узлы вышли из строя, и попытаться запустить службы, которые все еще работают на других узлах. Наличие дублирующихся экземпляров служб может привести к повреждению данных в общем хранилище.

Чтобы избежать этого сценария , кластеры высокой доступности часто также используют хранилище-свидетели кворума (локальное или облачное). Устройство-свидетель не может использоваться совместно двумя половинами разделенного кластера, поэтому в случае, если все члены кластера не могут взаимодействовать друг с другом (например, из-за сбоя контрольного сигнала), если участник не может получить доступ к свидетелю, он не может стать активным.

Требования к дизайну приложения

Не каждое приложение может работать в кластерной среде с высокой доступностью, и необходимые проектные решения необходимо принимать на ранней стадии разработки программного обеспечения. Чтобы работать в кластерной среде высокой доступности, приложение должно удовлетворять как минимум следующим техническим требованиям, последние два из которых имеют решающее значение для его надежной работы в кластере, и их сложнее всего удовлетворить полностью:

Конфигурации узлов

Схема сети кластера высокой доступности с 2 узлами

Наиболее распространенным размером кластера высокой доступности является кластер из двух узлов, поскольку это минимум, необходимый для обеспечения избыточности, но многие кластеры состоят из гораздо большего количества узлов, иногда из десятков.

Прилагаемая диаграмма представляет собой хороший обзор классического кластера высокой доступности с оговоркой, что в ней не упоминается функциональность кворума/свидетеля (см. выше).

Такие конфигурации иногда можно отнести к одной из следующих моделей:

Термины «логический хост» или «логический хост кластера» используются для описания сетевого адреса , который используется для доступа к службам, предоставляемым кластером. Этот логический идентификатор хоста не привязан к одному узлу кластера. На самом деле это сетевой адрес/имя хоста, связанный со службами, предоставляемыми кластером. Если узел кластера с работающей базой данных выйдет из строя, база данных будет перезапущена на другом узле кластера.

Надежность узла

Кластеры высокой доступности обычно используют все доступные методы, чтобы сделать отдельные системы и общую инфраструктуру максимально надежными. К ним относятся:

Эти функции помогают минимизировать вероятность того, что потребуется переключение кластеризации между системами. При таком аварийном переключении предоставляемая услуга недоступна по крайней мере некоторое время, поэтому предпочтительны меры, позволяющие избежать аварийного переключения.

Стратегии аварийного переключения

Системы, обрабатывающие сбои в распределенных вычислениях, имеют разные стратегии устранения сбоев. Например, API Apache Cassandra Hector определяет три способа настройки переключения при отказе:

Смотрите также

Рекомендации

  1. ^ ван Вугт, Сандер (2014), Кластеризация высокой доступности Pro Linux , стр.3, Apress, ISBN  978-1484200803
  2. ^ Борншлегль, Сюзанна (2012). Железнодорожный компьютер 3.0: инновационная конструкция платы может произвести революцию на рынке (pdf) . МЕН Микро Электроник . Проверено 21 сентября 2015 г.

дальнейшее чтение