Summit , девятый по скорости суперкомпьютер в мире (согласно списку Top500 по состоянию на июнь 2024 года [6] ), основан на POWER9, а также использует графические процессоры Nvidia Tesla в качестве ускорителей. [7]
Дизайн
Основной
Ядро POWER9 поставляется в двух вариантах: четырехпоточном многопоточном , называемом SMT4 , и восьмипоточном, называемом SMT8 . [1] Ядра SMT4 и SMT8 похожи тем, что состоят из ряда так называемых слайсов , питаемых общими планировщиками. Слайс — это элементарное 64-битное однопоточное ядро обработки с модулем загрузки и хранения (LSU), целочисленным модулем (ALU) и векторным скалярным модулем (VSU, выполняющим SIMD и операции с плавающей точкой). Суперслайс — это комбинация двух слайсов. Ядро SMT4 состоит из кэша L1 объемом 32 КБ (1 КБ = 1024 байта), кэша данных L1 объемом 32 КБ, блока выборки инструкций (IFU) и блока последовательности инструкций (ISU), который питает два суперслайса. Ядро SMT8 имеет два набора кэшей L1, а также IFU и ISU для питания четырех суперслайсов. В результате 12-ядерная и 24-ядерная версии POWER9 состоят из одинакового количества секций (по 96 каждая) и одинакового объема кэш-памяти L1.
Ядро POWER9, будь то SMT4 или SMT8, имеет 12-ступенчатый конвейер (на пять ступеней короче, чем у его предшественника POWER8 ), но стремится сохранить тактовую частоту около 4 ГГц. [1] Это будет первое ядро, включающее элементы Power ISA v.3.0 , выпущенного в декабре 2015 года, включая инструкции VSX-3 . [8] Конструкция POWER9 сделана модульной и используется в большем количестве вариантов процессоров и используется для лицензирования, на другом производственном процессе, чем у IBM. [9] На кристалле находятся сопроцессоры для сжатия и криптографии, а также большой кэш eDRAM L3 с низкой задержкой. [3]
POWER9 поставляется с новой архитектурой контроллера прерываний, называемой «eXternal Interrupt Virtualization Engine» (XIVE), которая заменяет гораздо более простую архитектуру, которая использовалась в POWER4 — POWER8. XIVE также будет использоваться в Power10 . [10] [11] [12]
Масштабирование в сторону уменьшения/увеличения
IBM POWER9 SO – масштабируемый вариант, оптимизированный для компьютеров с двумя сокетами , с пропускной способностью до 120 ГБ/с (1 ГБ = 1 миллиард байт) для напрямую подключенной памяти DDR4 [1] [3] [9] (выпуск запланирован на 2017 год)
IBM POWER9 SU – масштабируемый вариант, оптимизированный для четырех сокетов и более, для больших машин NUMA с пропускной способностью до 230 ГБ/с для буферизованной памяти [1] [9] (использует сигнализацию «25,6 ГГц» с интерфейсом PowerAXON 25 ГТ/с Link [13] )
Оба варианта POWER9 могут поставляться в версиях с некоторыми отключенными ядрами из-за проблем с доходностью , поэтому Raptor Computing Systems сначала продавала 4-ядерные чипы, и даже IBM изначально продавала свои системы AC922 не более чем с 22-ядерными чипами, хотя оба типа чипов имеют 24 ядра на своих кристаллах. [14] [4]
Ввод/вывод
На кристалле реализовано множество функций, помогающих увеличить производительность операций ввода -вывода вне кристалла :
Вариант SO имеет интегрированные контроллеры DDR4 для напрямую подключаемой оперативной памяти, в то время как вариант SU будет использовать внечиповую архитектуру Centaur, представленную в POWER8, для включения высокопроизводительного кэша eDRAM L4 и контроллеров памяти для оперативной памяти DDR4. [1] [3]
Межсоединения Bluelink обеспечивают тесное соединение графических сопроцессоров от Nvidia (через NVLink v.2 ) и ускорителей OpenCAPI . [15]
Универсальные соединения PCIe v.4 для подключения обычных микросхем ASIC , FPGA и других периферийных устройств, а также устройств CAPI 2.0 и CAPI 1.0, разработанных для POWER8.
Мультипроцессорные ( симметричные многопроцессорные системы ) соединения для подключения других процессоров POWER9 на той же материнской плате или в других близко расположенных корпусах.
Типы чипов
Чипы POWER9 могут быть изготовлены с двумя типами ядер и в конфигурации Scale Out или Scale Up. Ядра POWER9 — это либо SMT4, либо SMT8, причем ядра SMT8 предназначены для систем PowerVM , тогда как ядра SMT4 предназначены для систем PowerNV, которые не используют PowerVM и в основном работают под управлением Linux. С POWER9 чипы, изготовленные для Scale Out, могут поддерживать напрямую подключенную память, тогда как чипы Scale Up предназначены для использования с машинами с более чем двумя сокетами ЦП и используют буферизованную память. [16] [1]
Модули
На портале IBM для OpenPOWER перечислены три доступных модуля для чипа Nimbus, хотя вариант Scale-Out SMT8 для PowerVM также использует модуль/сокет LaGrange: [17]
Sforza – 50 мм × 50 мм, 4 DDR4, 48 линий PCIe, 1 XBus 4B [18]
Monza – 68,5 мм × 68,5 мм, 8 DDR4, 34 линии PCIe, 1 XBus 4B, 48 линий OpenCAPI [19]
LaGrange – 68,5 мм × 68,5 мм, 8 DDR4, 42 линии PCIe, 2 XBus 4B, 16 линий OpenCAPI [20]
Модули Sforza используют разъем Land Grid Array (LGA) 2601-pin. [21]
Системы
Raptor Computing Systems / Raptor Engineering
Talos II – двухсокетная рабочая станция/серверная платформа с процессорами POWER9 SMT4 Sforza; [22] доступна как сервер 2U, сервер 4U, башня или материнская плата EATX. Позиционируется как безопасная и управляемая владельцем с бесплатным и открытым исходным кодом программным обеспечением и прошивкой. Первоначально поставляется с вариантами чипов 4-ядерными, [23] 8-ядерными, [24] 18-ядерными, [25] и 22-ядерными [26] , пока не появятся чипы с большим количеством ядер. [27] [28]
Talos II Lite – односокетная версия материнской платы Talos II, изготовленная с использованием той же печатной платы. [29]
Blackbird – односокетная платформа microATX с процессорами SMT4 Sforza (вариант до 8 ядер 160 Вт), 4–8 ядер, 2 слота RAM (поддержка до 256 ГиБ в общей сложности) [30]
Партнерство Google–Rackspace
Barreleye G2 / Zaius – двухсокетная серверная платформа с использованием процессоров LaGrange; [22] шасси Barreleye G2 и Zaius используют материнскую плату Zaius POWER9 [31] [32] [33]
ИБМ
Power System AC922 – 2U, 2× POWER9 SMT4 Monza, с 6× графическими процессорами Nvidia Volta, 2× подключенными ускорителями CAPI 2.0 и 1 ТиБ оперативной памяти DDR4. AC здесь – это аббревиатура от Accelerated Computing; эта система также известна как «Witherspoon» или «Newell». [22] [34] [35] [36] [37]
Power System L922 – 2U, 1–2× POWER9 SMT8, 8–12 ядер на процессор, до 4 ТиБ DDR4 RAM (1 ТиБ = 1024 ГиБ), PowerVM под управлением Linux . [38] [39]
Power System S914 – 4U, 1× POWER9 SMT8, 4–8 ядер, до 1 ТиБ оперативной памяти DDR4, PowerVM под управлением AIX / IBM i /Linux. [38] [39]
Power System S922 – 2U, 1–2× POWER9 SMT8, 4–11 ядер на процессор, до 4 ТиБ оперативной памяти DDR4, PowerVM под управлением AIX/IBM i/Linux. [40]
Power System S924 – 4U, 2× POWER9 SMT8, 8–12 ядер на процессор, до 4 ТиБ оперативной памяти DDR4, PowerVM под управлением AIX/IBM i/Linux. [38] [39] [41]
Power System H922 – 2U, 1–2× POWER9 SMT8, 4–10 ядер на процессор, до 4 ТиБ оперативной памяти DDR4, PowerVM под управлением SAP HANA (на Linux) с AIX/IBM i на 25% системы. [38] [39] [42]
Power System H924 – 4U, 2× POWER9 SMT8, 8–12 ядер на процессор, до 4 ТиБ оперативной памяти DDR4, PowerVM с запущенным SAP HANA (на Linux) с AIX/IBM i на 25% системы. [38] [39] [42]
Power System E950 – 4U, 2–4× POWER9 SMT8, 8–12 ядер на процессор, до 16 ТиБ буферизованной памяти DDR4 [43]
Power System E980 – 1–4× 4U, 4–16× POWER9 SMT8, 8–12 ядер на процессор, до 64 ТиБ буферизованной памяти DDR4 [44]
Консоль управления оборудованием 7063-CR2 – 1U, 1× POWER9 SMT8, 6 ядер, 64–128 ГБ оперативной памяти DDR4. [45]
Пингвин Вычислительный
Magna PE2112GTX – 2U, двухсокетный сервер для высокопроизводительных вычислений с использованием процессоров LaGrange. Производитель Wistron. [46]
MareNostrum 4 – Один из трех кластеров в блоке новых технологий четвертого суперкомпьютера MareNostrum – это кластер POWER9 с графическими процессорами Nvidia Volta. Ожидается, что этот кластер обеспечит более 1,5 петафлопс вычислительной мощности после установки. Блок новых технологий MareNostrum 4 существует для проверки того, могут ли новые разработки «подходить для будущих версий MareNostrum». [51]
Поддержка операционной системы
Как и его предшественник, POWER9 поддерживается FreeBSD , [52] IBM AIX , IBM i , Linux (как с PowerVM, так и без него) и OpenBSD . [53]
Реализация поддержки POWER9 в ядре Linux началась с версии 4.6 в марте 2016 года. [54]
Менеджер пакетов GNU Guix также поддерживает POWER9, однако поддержка дистрибутива Guix System находится на этапе предварительной версии Technology Preview. [60] [61]
^ abcdefghijk Big Blue стремится к небу с помощью Power9
^ Аб Шах, Агам (2016-08-23). «24-ядерный чип Power9 от IBM: 5 вещей, которые вам нужно знать». PCWorld.
^ abcdef Маккреди, Брэд (апрель 2016 г.). «OpenPOWER и дорожная карта на будущее» (презентация) . OpenPOWER Foundation .
^ ab Morgan, Timothy Prickett (2017-12-05). "Power9 To The People". Следующая платформа . Чип Nimbus Power9, используемый в AC922, представляет собой однокристальный модуль с 24 ядрами на кристалле. Машины Summit и Sierra на базе AC922 получают 22-ядерные версии чипов... IBM может позже, по мере улучшения показателей Power9, добавить вариант с 24 ядрами.
^ Уильямс, Крис (2016-04-07). «Power9: Google вызывает у Intel головную боль из-за смены чипов, IBM пытается заманить большой бизнес». The Register.
^ «63-е издание списка TOP500 (июнь 2024 г.)».
^ "ORNL запускает суперкомпьютер Summit | ORNL". 8 июня 2018 г.
^ Добавить полную поддержку Power ISA 3.0 / POWER9 binutils
^ abc Перспективы революции власти9
^ Контроллер прерываний POWER9 XIVE
^ IBM Power 9 XIVE обеспечивает повышение производительности ввода-вывода
^ «Микроватт растёт» — Пол Маккеррас (LCA 2021 Online)
^ "Процессор IBM POWER9 Scale Up" (PDF) . AXON @25.6GHz против DDR4 @ 3200 MHz
^ NVLink 2.0 от Nvidia впервые появится на серверах Power9 в следующем году
^ Стюхели, Джефф (26 января 2017 г.). «Вебинар POWER9» (Видеозапись / слайды) . Виртуальная группа пользователей AIX.- Слайды (PDF) - страница AIX VUG содержит ссылки на слайды и видео
^ Гангиди, Ади. «Позвольте мне прокомментировать LaGrange POWER9». Twitter .
^ Портал IBM для OpenPOWER - POWER9 - Модуль Sforza
^ Портал IBM для OpenPOWER - POWER9 - Модуль Monza
^ Портал IBM для OpenPOWER - POWER9 - Модуль LaGrange
^ Зипфель, Джон; Липперт, Роб. «Представляем Zaius, Google и открытый сервер Rackspace под управлением IBM POWER9» (запись в блоге) . Блог Google Cloud Platform . Google.
^ Липперт, Роб; Салливан, Аарон; Гангиди, Ади; Йе, Поли (2016-12-07). «Спецификация шасси Zaius / Barreleye G2, материнская плата, блок питания Lunchbox — версия 0.5.3» (PDF) . Github . Open Compute Project.
^ Салливан, Аарон (2017-03-08). "Последние новости о нашем сервере Zaius /Barreleye G2 Open Compute-OpenPOWER" (запись в блоге) . Официальный блог Rackspace . Rackspace.
^ Дэвид Бейдер - Twitter
^ ab Как можно ускорить работу с помощью OpenCAPI уже сегодня!
^ Сервер IBM Power System AC922 (8335-GTG) поможет вам использовать революционно ускоренную производительность ИИ, HPDA и HPC для более быстрого получения информации
^ "IBM Power System AC922 - Подробности - Соединенные Штаты". IBM Marketplace . 6 декабря 2017 г.
^ abcde https://www.theregister.co.uk/2018/02/14/ibm_power9_servers/ Big Blue повышает уровень секстета серверов с POWER9 для IBM i, AIX, HANA, Linux
^ abcde https://www.nextplatform.com/2018/02/15/ins-outs-ibms-power9-zz-systems/ Подробности систем IBM Power9 ZZ
^ "IBM Power System S922 - Подробности". IBM . 23 апреля 2024 г.
^ Гриффитс, Найджел (14 февраля 2018 г.). "IBM POWER9 Scale-Out S924 First Look" (видео) . YouTube .
^ ab Morgan, Timothy Prickett (14 февраля 2018 г.). «Наконец-то IBM i получает Power9 — IT Jungle». IT Jungle .
^ "Технический паспорт оборудования IBM Systems IBM Power System E950" (PDF) .
^ "Технический паспорт оборудования IBM Systems IBM Power System E980" (PDF) .[ постоянная мертвая ссылка ]
^ IBM Power Systems представляет новую консоль управления оборудованием для серверов на базе технологии IBM POWER
^ @TomJHill35 (2017-11-15). "@PenguinHPC демонстрирует результаты настоящего открытого сотрудничества с их новейшей системой #POWER9 #openpower #hpc…" ( Твит ) . Получено 16 ноября 2017 г. – через Twitter .
^ NVIDIA Volta, IBM POWER9 Land Контракты для новых суперкомпьютеров правительства США
^ Домашняя страница саммита ORNL
↑ Лоуренс Ливермор подписывает контракт с IBM
^ ORNL строит самый умный суперкомпьютер в мире
^ "MareNostrum". BSC-CNS . Barcelona Supercomputing Center . Получено 30 октября 2017 г.
^ "Версия FreeBSD, вводящая в систему идентификатор процессора POWER9". svnweb.freebsd.org . Получено 11 октября 2018 г.
^ "Linux 4.6 начинает закладывать основу для POWER9". Phoronix . 18 марта 2016 г.
^ "Red Hat Enterprise Linux 7.4 для IBM Power LE (POWER9) - Заметки о выпуске - Портал клиентов Red Hat". access.redhat.com . Получено 17 ноября 2017 г.