stringtranslate.com

Кластер высокой доступности

Кластеры высокой доступности (также известные как кластеры HA , отказоустойчивые кластеры ) представляют собой группы компьютеров , которые поддерживают серверные приложения , которые могут надежно использоваться с минимальным количеством простоев . Они работают с использованием программного обеспечения высокой доступности для объединения избыточных компьютеров в группы или кластеры , которые обеспечивают непрерывное обслуживание при выходе из строя компонентов системы. Без кластеризации, если сервер, на котором запущено определенное приложение, выходит из строя, приложение будет недоступно до тех пор, пока не будет исправлен сбойный сервер. Кластеризация HA исправляет эту ситуацию, обнаруживая аппаратные/программные сбои и немедленно перезапуская приложение на другой системе без необходимости административного вмешательства, процесс, известный как отказоустойчивость . В рамках этого процесса программное обеспечение кластеризации может настраивать узел перед запуском приложения на нем. Например, может потребоваться импортировать и смонтировать соответствующие файловые системы, может потребоваться настроить сетевое оборудование, а также может потребоваться запустить некоторые вспомогательные приложения. [1]

Кластеры HA часто используются для критически важных баз данных , обмена файлами в сети, бизнес-приложений и клиентских служб, таких как веб-сайты электронной коммерции . Реализации кластеров HA пытаются встроить избыточность в кластер, чтобы исключить отдельные точки отказа, включая множественные сетевые подключения и хранилище данных, которое избыточно подключено через сети хранения данных .

Кластеры HA обычно используют частное сетевое соединение heartbeat , которое используется для мониторинга работоспособности и статуса каждого узла в кластере. Одно тонкое, но серьезное условие, которое все кластерное программное обеспечение должно уметь обрабатывать, — это split-brain , которое происходит, когда все частные соединения выходят из строя одновременно, но узлы кластера все еще работают. Если это произойдет, каждый узел в кластере может ошибочно решить, что все остальные узлы вышли из строя, и попытаться запустить службы, которые все еще работают на других узлах. Наличие дублирующих экземпляров служб может привести к повреждению данных в общем хранилище.

Кластеры HA часто также используют хранилище свидетелей кворума (локальное или облачное), чтобы избежать этого сценария. Устройство-свидетель не может быть общим для двух половин разделенного кластера, поэтому в случае, если все члены кластера не могут общаться друг с другом (например, сбой heartbeat), если член не может получить доступ к свидетелю, он не может стать активным.

Требования к дизайну приложения

Не каждое приложение может работать в среде кластера высокой доступности, и необходимые решения по проектированию должны быть приняты на ранней стадии проектирования программного обеспечения. Для работы в среде кластера высокой доступности приложение должно удовлетворять по крайней мере следующим техническим требованиям, последние два из которых имеют решающее значение для его надежной работы в кластере и являются наиболее сложными для полного удовлетворения:

Конфигурации узлов

Схема сети кластера высокой доступности из 2 узлов

Наиболее распространенным размером кластера высокой доступности является кластер из двух узлов, поскольку это минимум, необходимый для обеспечения избыточности, но многие кластеры состоят из гораздо большего числа узлов, иногда из десятков.

Прилагаемая диаграмма представляет собой хороший обзор классического кластера высокой доступности, с той оговоркой, что в ней не упоминается функциональность кворума/свидетеля (см. выше).

Такие конфигурации иногда можно отнести к одной из следующих моделей:

Термины логический хост или логический хост кластера используются для описания сетевого адреса , который используется для доступа к службам, предоставляемым кластером. Этот логический идентификатор хоста не привязан к одному узлу кластера. На самом деле это сетевой адрес/имя хоста, который связан с службой(ами), предоставляемыми кластером. Если узел кластера с работающей базой данных выходит из строя, база данных будет перезапущена на другом узле кластера.

Надежность узла

Кластеры HA обычно используют все доступные методы, чтобы сделать отдельные системы и общую инфраструктуру максимально надежными. К ним относятся:

Эти функции помогают минимизировать вероятность того, что потребуется кластеризация отказоустойчивости между системами. При таком отказоустойчивости предоставляемая услуга недоступна по крайней мере некоторое время, поэтому предпочтительны меры по предотвращению отказоустойчивости.

Стратегии отказоустойчивости

Системы, которые обрабатывают сбои в распределенных вычислениях, имеют разные стратегии для устранения сбоя. Например, Apache Cassandra API Hector определяет три способа настройки отказоустойчивости:

Смотрите также

Ссылки

  1. ^ ван Вугт, Сандер (2014), Кластеризация высокой доступности Pro Linux , стр. 3, Apress, ISBN  978-1484200803
  2. ^ Bornschlegl, Susanne (2012). Железнодорожный компьютер 3.0: инновационный дизайн платы может произвести революцию на рынке (pdf) . MEN Mikro Elektronik . Получено 21.09.2015 .

Дальнейшее чтение