В 1990 году мэйнфреймы IBM представили концепцию системного комплекса , обычно называемого Sysplex , с MVS /ESA SPV4.1. Это позволяет авторизованным компонентам в восьми логических разделах (LPAR) общаться и взаимодействовать друг с другом с помощью протокола XCF .
Компоненты Sysplex включают в себя:
Общий источник времени для синхронизации часов всех систем-участников. Это может включать в себя либо таймер Sysplex (модель 9037), либо протокол времени сервера (STP)
Глобальная сериализация ресурсов (GRS), которая позволяет нескольким системам получать доступ к одним и тем же ресурсам одновременно, сериализуя их там, где это необходимо, для обеспечения эксклюзивного доступа.
Средство кросс-системного сопряжения ( XCF ), позволяющее системам обмениваться данными по принципу «равный-равному»
Парные наборы данных (CDS)
Пользователи (базового) Sysplex включают:
Консольные службы — позволяют объединить несколько консолей MCS из разных членов Sysplex, предоставляя единый образ системы для операций.
Автоматический менеджер перезапуска (ARM) — политика для автоматического перезапуска невыполненных заданий или запущенных задач в той же системе, если она доступна, или в другом LPAR в Sysplex
Sysplex Failure Manager (SFM) — политика, которая определяет автоматические действия, которые необходимо предпринять при возникновении определенных сбоев, таких как потеря члена Sysplex или при перенастройке систем.
Workload Manager (WLM) — основанное на политиках управление производительностью гетерогенных рабочих нагрузок в одном или нескольких образах z/OS или даже в AIX
Глобальная сериализация ресурсов (GRS) — связь — позволяет использовать ссылки XCF вместо выделенных каналов для GRS и динамических RNL.
Tivoli OPC – поддержка горячего резерва для контроллера
RACF (программный продукт IBM для обеспечения безопасности мэйнфреймов) – команды RVARY и SETROPTS для всего Sysplex
CICS — использует XCF для обеспечения лучшей производительности и времени отклика, чем при использовании VTAM для маршрутизации транзакций и доставки функций.
zFS – использование XCF-коммуникации для доступа к данным в нескольких LPAR
Параллельный сисплекс
IBM представила [1] Parallel Sysplex с добавлением 9674 [2] Coupling Facility (CF), новых моделей S/390, [3] [4] [5] обновлений существующих моделей, соединительных линий для высокоскоростной связи и поддержки операционной системы MVS/ESA SP V5.1 [6] в апреле 1994 года. [7]
Coupling Facility (CF) может находиться на выделенном автономном сервере, сконфигурированном с процессорами, которые могут запускать управляющий код Coupling Facility (CFCC), как интегральные процессоры на самих мэйнфреймах, сконфигурированных как ICF (Internal Coupling Facilities), или, что менее распространено, как обычные LPAR. CF содержит структуры Lock, List и Cache для помощи с сериализацией, передачей сообщений и согласованностью буфера между несколькими LPAR. [8]
Основная цель Parallel Sysplex — предоставить возможности совместного использования данных, позволяя нескольким базам данных выполнять прямое чтение и запись в общие данные. Это может обеспечить преимущества
Помогите устранить отдельные точки отказа на сервере, LPAR или подсистемах
Доступность приложения
Единый системный образ
Динамическая балансировка сеанса
Динамическая маршрутизация транзакций
Масштабируемая емкость
Базы данных, работающие на сервере System z, которые могут воспользоваться этим преимуществом, включают:
Другие компоненты могут использовать Coupling Facility для помощи в управлении системой, производительности или снижении требований к оборудованию. Называемое «Обмен ресурсами», использование включает:
Каталог – общие каталоги для повышения производительности за счет сокращения ввода-вывода в набор данных каталога на диске.
CICS – использование CF для предоставления возможностей совместного использования и восстановления именованных счетчиков, таблиц данных или временных данных
DFSMShsm – Балансировка рабочей нагрузки для миграции данных
GRS Star – снижение производительности ЦП и времени отклика при распределении наборов данных.
Коммутация лент использует структуру GRS для обеспечения совместного использования ленточных накопителей между образами z/OS.
Динамическое управление CHPID (DCM) и управление приоритетами ввода-вывода
JES2 Checkpoint – обеспечивает улучшенный доступ к многосистемной контрольной точке.
Operlog / Logrec – Объединенные мультисистемные журналы для управления системой
RACF — общий набор данных для упрощения управления безопасностью в Parallel Sysplex
WebSphere MQ – общие очереди сообщений для доступности и гибкости
WLM — обеспечивает поддержку Intelligent Resource Director (IRD) для расширения z/OS Workload Manager для управления ресурсами ЦП и ввода-вывода в нескольких LPAR в Parallel Sysplex. Функции включают управление ЦП LPAR, IRD.
Управление многосистемным анклавом для повышения производительности
XCF Star – сниженные требования к оборудованию и упрощенное управление коммуникационными путями XCF
Основные компоненты Parallel Sysplex включают в себя:
Аппаратное обеспечение Coupling Facility (CF или ICF), позволяющее нескольким процессорам совместно использовать, кэшировать, обновлять и балансировать доступ к данным;
Таймеры Sysplex (в последнее время — протокол серверного времени) для синхронизации часов всех систем-участников;
Coupling Facility может быть либо выделенной внешней системой (небольшой мэйнфрейм, такой как System z9 BC, специально настроенный только с процессорами coupling facility), либо встроенными процессорами на самих мэйнфреймах, настроенными как ICF (Internal Coupling Facilities). [9] Рекомендуется, чтобы в параллельном сисплексе использовался по крайней мере один внешний CF. [10] Рекомендуется, чтобы в параллельном сисплексе было по крайней мере два CF и/или ICF для избыточности, особенно в среде совместного использования производственных данных. Протокол времени сервера (STP) заменил таймеры Sysplex, начиная с 2005 года для моделей мэйнфреймов System z z990 и новее. [11] Таймер Sysplex — это физически отдельная часть оборудования от мэйнфрейма, [12] тогда как STP — это встроенное средство в микрокоде мэйнфрейма. [13]
С помощью STP и ICF можно построить полную установку Parallel Sysplex с двумя подключенными мэйнфреймами. Более того, один мэйнфрейм может содержать внутренний эквивалент полного физического Parallel Sysplex, полезный для тестирования приложений и целей разработки. [14]
Журнал IBM Systems Journal посвятил целый выпуск всем технологическим компонентам. [15]
Протокол времени сервера
Поддержание точного времени важно в компьютерных системах. Например, в системе обработки транзакций процесс восстановления восстанавливает данные транзакций из файлов журнала. Если для регистрации данных транзакций используются временные метки, а временные метки двух связанных транзакций переносятся из фактической последовательности, то реконструкция базы данных транзакций может не соответствовать состоянию до процесса восстановления. Протокол времени сервера (STP) может использоваться для предоставления единого источника времени между несколькими серверами. На основе концепций протокола сетевого времени один из серверов System z назначается HMC в качестве основного источника времени (Stratum 1). Затем он отправляет сигналы синхронизации на серверы Stratum 2 с помощью соединительных линий. Серверы Stratum 2, в свою очередь, отправляют сигналы синхронизации на серверы Stratum 3. Для обеспечения доступности один из серверов может быть назначен резервным источником времени, а третий сервер может быть назначен арбитром для помощи резервному серверу времени в определении того, должен ли он взять на себя роль основного в исключительных ситуациях.
STP доступен на серверах System z с 2005 года.
Более подробную информацию о STP можно найти в «Руководстве по планированию протокола времени сервера». [16]
Географически распределенный параллельный сисплекс ( GDPS ) — это расширение параллельного сисплекса мэйнфреймов, расположенных, возможно, в разных городах. GDPS включает конфигурации для одного сайта или конфигурации нескольких сайтов: [17]
GDPS HyperSwap Manager: основан на технологии синхронного Peer to Peer Remote Copy (PPRC) для использования в одном центре обработки данных. Данные копируются с основного устройства хранения на вторичное устройство хранения. В случае сбоя на основном устройстве хранения система автоматически делает вторичное устройство хранения основным, обычно без прерывания работы приложений.
GDPS Metro: это основано на технологии синхронного зеркалирования данных (PPRC), которая может использоваться на мэйнфреймах на расстоянии 200 километров (120 миль) друг от друга. В двухсистемной модели оба сайта могут администрироваться так, как если бы они были одной системой. В случае сбоя системы или устройства хранения восстановление может происходить автоматически, с ограниченной потерей данных или без нее.
GDPS Global - XRC: это основано на асинхронной технологии Extended Remote Copy (XRC) без ограничений по расстоянию. XRC копирует данные на устройствах хранения между двумя сайтами, так что в случае сбоя могут быть потеряны только несколько секунд данных. Если сбой все же произошел, пользователь должен инициировать процесс восстановления. После запуска процесс автоматически восстанавливается с вторичных устройств хранения и перенастраивает системы.
GDPS Global - GM: Это основано на асинхронной технологии IBM Global Mirror без ограничений по расстоянию. Оно предназначено для восстановления после полного отказа на одном объекте. Оно активирует вторичные устройства хранения и резервные системы.
GDPS Metro Global - GM: Это конфигурация для систем с более чем двумя системами/сайтами, для целей аварийного восстановления. Она основана на GDPS Metro вместе с GDPS Global - GM.
GDPS Metro Global - XRC: Это конфигурация для систем с более чем двумя системами/сайтами для целей аварийного восстановления. Она основана на GDPS Metro вместе с GDPS Global - XRC.
GDPS Continuous Availability: Это решение для аварийного восстановления/непрерывной доступности, основанное на двух или более сайтах, разделенных неограниченным расстоянием, работающих с теми же приложениями и имеющих те же данные для обеспечения балансировки рабочей нагрузки между сайтами. IBM Multi-site Workload Lifeline, благодаря своему мониторингу и маршрутизации рабочей нагрузки, играет неотъемлемую роль в решении GDPS Continuous Availability.
^ "Обзор параллельного сисплекса S/390". Письма-объявления . IBM. 6 апреля 1994 г. 194-080.
^ "IBM S/390 Coupling Facility 9674 Model C01". Письма-объявления . IBM. 6 апреля 1994 г. 194-082.
^ "S/390 Parallel Sysplex Offering". Письма-объявления . IBM. 6 апреля 1994 г. 194-081.
^ "Усовершенствования процессора IBM ES/9000 с водяным охлаждением: новый десятипроцессорный процессор, возможность параллельного сисплекса и дополнительные функции". Письма-объявления . IBM. 6 апреля 1994 г. 194-084.
^ "Процессоры IBM Enterprise System/9000 с воздушным охлаждением, усовершенствованные дополнительными функциями и возможностью параллельного сисплекса". Письма-объявления . IBM. 6 апреля 1994 г. 194-084.
^ "IBM MVS/ESA SP Version 5 Release 1 и улучшения OpenEdition". Письма-объявления . IBM. 6 апреля 1994 г. 294-152.
^ System/390 Parallel Sysplex Performance (PDF) (Четвертое изд.). International Business Machines Corporation. Декабрь 1998 г. SG24-4356-03. Архивировано из оригинала (PDF) 2011-05-18 . Получено 2007-09-17 .
^ Дэвид Рафтен (ноябрь 2019 г.). «Варианты конфигурации соединительного устройства». Позиционный документ . IBM. ZSW01971USEN.
^ "Определение соединительной арматуры". PC Magazine.com. Архивировано из оригинала 2 декабря 2008 г. Получено 13 апреля 2009 г.
^ "Coupling Facility" (PDF) . Архивировано из оригинала (PDF) 17 июля 2011 г. . Получено 13 апреля 2009 г. .
^ "Миграция с таймера Sysplex на STP". IBM . Получено 15 апреля 2009 г.
^ "Sysplex Timer". Symmetricom . Получено 15 апреля 2009 г.
^ "IBM Server Time Protocol (STP)". IBM. Архивировано из оригинала 13 июня 2008 г. Получено 15 апреля 2009 г.
^ Джонсон, Джон Э. "MVS Boot Camp: IBM Health Checker". z/Journal . Получено 15 апреля 2009 г.[ постоянная мертвая ссылка ]
^ "IBM's System Journal on S/390 Parallel Sysplex Clusters". Архивировано из оригинала 9 марта 2012 года . Получено 24 апреля 2017 года .
^ Руководство по планированию протокола времени сервера (PDF) (Четвертое издание). Корпорация International Business Machines. Июнь 2013 г. SG24-7280-03.{{cite book}}: |work=проигнорировано ( помощь )
^ Ахмад, Риаз (5 марта 2009 г.). GDPS 3.6 Обновление и внедрение. Остин, Техас: ПОДЕЛИТЬСЯ . Получено 17 апреля 2009 г.[ постоянная мертвая ссылка ]