Системы на базе POWER8 стали доступны от IBM в июне 2014 года. [3] Системы и проекты процессоров POWER8, созданные другими членами OpenPOWER, стали доступны в начале 2015 года.
Дизайн
POWER8 разработан как массивный многопоточный чип, в котором каждое из его ядер способно обрабатывать восемь аппаратных потоков одновременно, что в общей сложности дает 96 потоков, выполняемых одновременно на 12-ядерном чипе. Процессор использует очень большие объемы кэшей eDRAM на чипе и вне его, а контроллеры памяти на чипе обеспечивают очень высокую пропускную способность для памяти и системного ввода-вывода. Для большинства рабочих нагрузок чип, как говорят, работает в два-три раза быстрее своего предшественника POWER7 . [ 4]
Чипы POWER8 выпускаются в 6- или 12-ядерных вариантах; [5] [6] каждая версия изготавливается по 22-нм технологии кремний на изоляторе (SOI) с использованием 15 металлических слоев. 12-ядерная версия состоит из 4,2 миллиарда транзисторов [7] и имеет размер 650 мм 2 , тогда как 6-ядерная версия имеет размер всего 362 мм 2 . [3] Однако 6- и 12-ядерные варианты могут иметь все или только некоторые ядра активными, поэтому процессоры POWER8 поставляются с 4, 6, 8, 10 или 12 активированными ядрами.
КАПИ
В то время как предыдущие процессоры POWER использовали шину GX++ для внешней связи, POWER8 удаляет ее из конструкции и заменяет ее портом CAPI (Coherent Accelerator Processor Interface), который располагается поверх PCI Express 3.0 . Порт CAPI используется для подключения вспомогательных специализированных процессоров, таких как графические процессоры , микросхемы ASIC и ПЛИС . [8] [9] Устройства, подключенные к шине CAPI, могут использовать то же адресное пространство памяти, что и центральный процессор, тем самым сокращая длину вычислительного пути. На конференции ACM/IEEE Supercomputing 2013 года IBM и Nvidia объявили о партнерстве в области инженерии для тесного объединения POWER8 с графическими процессорами Nvidia в будущих системах HPC , [10] причем первый из них был анонсирован как Power Systems S824L.
14 октября 2016 года IBM объявила о создании OpenCAPI — новой организации для распространения внедрения CAPI на другие платформы. Первоначальными членами стали Google, AMD, Xilinx, Micron и Mellanox. [11]
ОСС
POWER8 также содержит так называемый контроллер на кристалле (OCC), который представляет собой микроконтроллер управления питанием и температурой на базе процессора PowerPC 405. Он имеет два универсальных разгрузочных движка (GPE) и 512 КБ встроенной статической оперативной памяти (SRAM) (1 КБ = 1024 байта), а также возможность прямого доступа к основной памяти при запуске прошивки с открытым исходным кодом . OCC управляет рабочей частотой POWER8, напряжением, пропускной способностью памяти и температурным контролем как для процессора, так и для памяти; он может регулировать напряжение через 1764 встроенных регулятора напряжения (IVR) на лету. Кроме того, OCC можно запрограммировать на разгон процессора POWER8 или на снижение его энергопотребления за счет снижения рабочей частоты (что похоже на настраиваемый TDP , обнаруженный в некоторых процессорах Intel и AMD). [12] [13] [14] [15]
Микросхема буфера памяти
POWER8 разделяет функции контроллера памяти, перемещая некоторые из них от процессора и ближе к памяти. Логика планирования, управление энергопотреблением памяти и точка принятия решения RAS перемещаются в так называемый чип буфера памяти (он же Centaur ). [16] Выгрузка определенных процессов памяти в чип буфера памяти позволяет оптимизировать доступ к памяти, экономя полосу пропускания и обеспечивая более быструю связь процессора с памятью. [17] Он также содержит структуры кэширования для дополнительных 16 МБ кэша L4 на чип (до 128 МБ на процессор) (1 МБ = 1024 КБ). В зависимости от архитектуры системы чипы буфера памяти размещаются либо на модулях памяти (Custom DIMM/CDIMM, например, в моделях S824 и E880), либо на плате расширения памяти, содержащей стандартные модули DIMM (например, в моделях S822LC). [18]
Микросхема буфера памяти подключена к процессору с помощью высокоскоростного многоканального последовательного соединения. Канал памяти, соединяющий каждую микросхему буфера, способен записывать 2 байта и считывать 1 байт за раз. Он работает со скоростью 8 ГБ /с в ранних моделях Entry, [17] позже увеличен в моделях high-end и HPC до 9,6 ГБ/с с задержкой 40 нс, [18] [19] [20] для устойчивой пропускной способности 24 ГБ/с и 28,8 ГБ/с на канал соответственно. Каждый процессор имеет два контроллера памяти с четырьмя каналами памяти каждый, а максимальная пропускная способность процессора к буферу памяти составляет 230,4 ГБ/с на процессор. В зависимости от модели может быть включен только один контроллер, [17] или могут использоваться только два канала на контроллер. [18] Для повышения доступности соединение обеспечивает изоляцию и ремонт полос «на лету». [16]
Каждая микросхема буфера памяти имеет четыре интерфейса, позволяющих использовать память DDR3 или DDR4 на частоте 1600 МГц без изменения интерфейса связи процессора. Полученные 32 канала памяти на процессор обеспечивают пиковую скорость доступа 409,6 ГБ/с между микросхемами буфера памяти и банками DRAM. Первоначально поддержка была ограничена 16 ГБ, 32 ГБ и 64 ГБ DIMM, что позволяло процессору обрабатывать до 1 ТБ. Позднее была объявлена поддержка 128 ГБ и 256 ГБ DIMM, [19] [21] что позволило использовать до 4 ТБ на процессор.
Технические характеристики
Ядро POWER8 [22] [23] имеет кэш данных L1 объемом 64 КБ , содержащийся в блоке загрузки-хранения, и кэш инструкций L1 объемом 32 КБ, содержащийся в блоке выборки инструкций, а также тесно интегрированный кэш L2 объемом 512 КБ . За один цикл каждое ядро может извлекать до восьми инструкций, декодировать и отправлять до восьми инструкций, выдавать и выполнять до десяти инструкций и фиксировать до восьми инструкций. [24]
Он имеет большую очередь проблем с 4×16 записями, улучшенные предикторы ветвлений и может обрабатывать вдвое больше промахов кэша. Каждое ядро является восьмипоточным аппаратным многопоточным и может динамически и автоматически разделяться для использования одного, двух, четырех или всех восьми потоков. [1] POWER8 также добавил поддержку аппаратной транзакционной памяти . [26] [27] [28] IBM оценивает, что каждое ядро в 1,6 раза быстрее POWER7 в однопоточных операциях.
Процессор POWER8 представляет собой конструкцию из 6 или 12 чиплетов с вариантами из 4, 6, 8, 10 или 12 активированных чиплетов, в которой один чиплет состоит из одного процессорного ядра, 512 КБ кэша SRAM L2 на 64-байтовой шине (что вдвое шире, чем у его предшественника [1] ), и 8 МБ кэша L3 eDRAM на чиплет, совместно используемого всеми чиплетами. [5] Таким образом, процессор из шести чиплетов будет иметь 48 МБ кэша L3 eDRAM, в то время как процессор из 12 чиплетов будет иметь в общей сложности 96 МБ кэша L3 eDRAM. Чип также может использовать до 128 МБ кэша eDRAM L4 вне чипа с помощью сопутствующих чипов Centaur. Контроллеры памяти на чипе могут обрабатывать 1 ТБ ОЗУ и поддерживаемую пропускную способность памяти 230 ГБ/с. Контроллеры PCI Express на плате могут обрабатывать 48 ГБ/с ввода-вывода для других частей системы. Ядра разработаны для работы на тактовых частотах от 2,5 до 5 ГГц. [15]
Шестиядерные чипы монтируются парами на двухчиповых модулях (DCM) в масштабируемых серверах IBM . В большинстве конфигураций не все ядра активны, что приводит к различным конфигурациям, в которых фактическое количество ядер отличается. 12-ядерная версия используется в моделях высокого класса E880 и E880C.
Однокристальный модуль POWER8 от IBM называется Turismo [29] , а двухкристальный вариант называется Murano. [30] Модифицированная версия PowerCore называется CP1.
POWER8 с NVLink
Это переработанная версия оригинального 12-ядерного POWER8 от IBM, который раньше назывался POWER8+ . Главной новой функцией является поддержка технологии шины NVLink от Nvidia , подключая до четырех устройств NVLink напрямую к чипу. IBM удалила интерфейсы A Bus и PCI для SMP-подключений к другим сокетам POWER8 и заменила их интерфейсами NVLink. Подключение ко второму сокету ЦП теперь осуществляется через X Bus . Помимо этого и небольшого увеличения размера до 659 мм 2 , различия кажутся минимальными по сравнению с предыдущими процессорами POWER8. [31] [32] [33] [34]
Лицензиаты
19 января 2014 года компания Suzhou PowerCore Technology Company объявила о присоединении к OpenPOWER Foundation и лицензировании ядра POWER8 для разработки специализированных процессоров для использования в приложениях больших данных и облачных вычислений . [35] [36]
Варианты
IBM Murano – 12-ядерный процессор с двумя шестиядерными чипами. Масштабируемый процессор доступен в конфигурациях с отключенными ядрами.
IBM Turismo – однокристальный 12-ядерный процессор. Процессор Scale-up доступен для лицензирования и покупки в конфигурациях с отключенными ядрами.
PowerCore CP1 – вариант POWER8 с пересмотренными функциями безопасности из-за экспортных ограничений между США и Китаем, который будет производиться на заводе GlobalFoundries (бывший завод IBM) в Ист-Фишкилле, штат Нью-Йорк . Выпущен в 2015 году. [37] [38]
Системы
ИБМ
Scale Out-серверы , поддерживающие один или два сокета, каждый из которых несет двухчиповый модуль с двумя шестиядерными процессорами POWER8. Они поставляются в форм-факторах 2U или 4U и одной конфигурации tower. Версии "L" работают только под управлением Linux , в то время как другие работают под управлением AIX , IBM i и Linux. Версии "LC" созданы партнерами OpenPOWER. [39] [40] [41]
Power Systems S812L – 1× POWER8 DCM (4, 6 или 8 ядер), 2U
Power Systems S814 – 1× POWER8 DCM (6 или 8 ядер), 4U или башня
Системы питания S822 и S822L – 1× или 2× POWER8 DCM (6, 10, 12 или 20 ядер), 2U
Системы питания S824 и S824L – 1× или 2× POWER8 DCM (6, 8, 12, 16 или 24 ядра), 4U
Power Systems S821LC "Stratton" – 2× POWER8 SCM (8 или 10 ядер), 1U. До 512 ГБ оперативной памяти DDR4, буферизованной четырьмя чипами Centaur L4. Производство Supermicro . [42]
Power Systems S822LC для больших данных "Briggs" – 2× POWER8 SCM (8 или 10 ядер), 2U. До 512 ГБ оперативной памяти DDR4, буферизованной четырьмя чипами Centaur L4. Производство Supermicro. [42]
Корпоративные серверы , поддерживающие узлы с четырьмя сокетами, каждый из которых несет 8-, 10- или 12-ядерные модули, для максимум 16 сокетов, 128 ядер и 16 ТБ оперативной памяти. Эти машины могут работать под управлением AIX , IBM i или Linux . [19]
Power Systems E850 – 2×, 3× или 4× POWER8 DCM (8, 10 или 12 ядер), 4U
Power Systems E870 – 1× или 2× узла 5U, каждый с четырьмя сокетами с 8- или 10-ядерными однокристальными модулями POWER8, всего до 80 ядер
Power Systems E880 – 1x, 2x, 3x или 4x узла 5U, каждый с четырьмя сокетами с 8- или 12-ядерными однокристальными модулями POWER8, всего до 192 ядер
Power Systems S812LC – 1× POWER8 SCM (8 или 10 ядер), 2U. Производитель Tyan. [43]
Power Systems S822LC "Firestone" – 2× POWER8 SCM (8 или 10 ядер), 2U. Два графических процессора Nvidia Tesla K80 и до 1 ТБ оперативной памяти DDR3. Производитель Wistron . [37] [43] [44] [45]
Power Systems S822LC для HPC "Minsky" – 2× POWER8+ SCM (8 или 10 ядер), 2U. До четырех графических процессоров NVLinked Nvidia Tesla P100 и до 1 ТБ оперативной памяти DDR4. Производство Wistron . [42] [46]
7063-CR1 HMC – 1× POWER8 SCM (6 ядер), 1U. На основе дизайна SuperMicro "Stratton". [47]
Тянь
Материнская плата ATX с одним одночиповым разъемом POWER8, называемая SP010GM2NR. [29]
Palmetto GN70-BP010 , референсная система OpenPower. Сервер 2U, с одним четырехъядерным POWER8 SCM, четырьмя разъемами RAM, на базе материнской платы Tyan. [29] [48]
Habanero TN-71-BP012 . 2U, с одним 8-ядерным POWER8 SCM, 32 разъема RAM [37] [45] [48]
GT75-BP012 . 1U, с одним 8- или 10-ядерным POWER8 SCM и 32 разъемами для модулей ОЗУ [49]
Google
Google показала материнскую плату с двумя разъемами, предназначенную только для внутреннего использования. [50] [51]
StackVelocity
Компания StackVelocity разработала высокопроизводительную эталонную платформу Saba.
Inspur
Inspur заключила сделку с IBM на разработку серверного оборудования на базе POWER8 и связанных с ним технологий. [52] [53]
^ abc "Вы не найдете этого в своем телефоне: 12-ядерный Power8 с тактовой частотой 4 ГГц для крутых коробок". The Register .
^ «Руководство пользователя процессора POWER8 для однокристального модуля» (PDF) . IBM. 16 марта 2016 г.
^ ab "IBM POWER8 - Анонс / Планы доступности" (PDF) . Архивировано из оригинала (PDF) 2014-05-24 . Получено 2014-05-23 .
^ "IBM Watson может стать еще умнее с чипом Power8". idgconnect.com . Архивировано из оригинала 2014-12-27 . Получено 17 декабря 2014 .
^ ab Hurlimann, Dan (июнь 2014 г.). "Оборудование POWER8" (PDF) . ibm.com . IBM . Получено 2014-11-05 .
^ "IBM Power System S814". Архивировано из оригинала 4 мая 2014 года . Получено 17 декабря 2014 года .
^ POWER8: 12-ядерный процессор серверного класса в 22 нм SOI с пропускной способностью вне кристалла 7,6 Тбит/с . Международная конференция IEEE по твердотельным схемам 2014 г. doi :10.1109/ISSCC.2014.6757353. S2CID 32988422.
^ Агам Шах (17 декабря 2014 г.). «Новый Power8 от IBM удваивает производительность чипа Watson». PC World . Получено 17 декабря 2014 г.
^ "Подробности о процессоре IBM Power8 — 22-нм дизайн с 12 ядрами, 96 МБ кэш-памяти eDRAM L3 и тактовой частотой 4 ГГц". WCCFtech . 27 августа 2013 г. Получено 17 декабря 2014 г.
^ Альтавилла, Дэйв (18 ноября 2013 г.). «Nvidia представляет ускоритель Tesla K40 и стратегическое партнерство с IBM». Forbes . Получено 18 ноября 2013 г.
^ Гелас, Йохан Де. «OpenCAPI представлен: AMD, IBM, Google, Xilinx, Micron и Mellanox объединяют усилия в эпоху гетерогенных вычислений» . Получено 17 октября 2016 г.
^ Тодд Розедаль (2014-12-20). "OCC Firmware Code is Now Open Source". openpowerfoundation.org . Архивировано из оригинала 2014-12-27 . Получено 2014-12-27 .
^ "Semiconductor Engineering .:. The Good Kind Of Regulation". 13 марта 2014 г. Получено 17 декабря 2014 г.
^ аб Фредерик Ремонд. «ISSCC 2014 — IBM dévoile le Power8» (на французском языке) . Проверено 17 декабря 2014 г.
^ ab "Введение в процессор POWER8". IBM . стр. 22. Архивировано из оригинала 2018-05-06.
^ abc IBM Power System S822 Технический обзор и введение (REDP-5102-00). 30 сентября 2016 г.
^ abc IBM Power System S822LC Технический обзор и введение (REDP-5283-00). 30 сентября 2016 г.
^ abcd Технический обзор и введение IBM Power Systems E870 и E880 (REDP-5137-00). 30 сентября 2016 г.
^ Реализация кластера IBM InfoSphere BigInsights с использованием Linux на Power. 30 сентября 2016 г. SG24-8248-00.
^ "Анонс оборудования IBM для Европы, Ближнего Востока и Африки ZG14-0279, усовершенствования ввода-вывода IBM Power Systems (RPQ 8A2232)" (PDF) . IBM .
^ Синхарой, Б.; Ван Норстранд, JA; Эйкемейер, Р.Дж.; Ле, штаб-квартира; Леенстра, Дж.; Нгуен, DQ; Кенигсбург, Б.; Уорд, К.; Браун, доктор медицины; Морейра, JE; Левитан Д.; Тунг, С.; Грушецкий, Д.; Бишоп, JW; Гшвинд, М.; Боерсма, М.; Кренер, М.; Кальтенбах, М.; Карханис, Т.; Фернслер, К.М. (2015). «Микроархитектура процессорного ядра IBM POWER8». Журнал исследований и разработок IBM . 59 : 2:1–2:21. дои : 10.1147/JRD.2014.2376112.
^ Леонидас Барбоса (21 сентября 2015 г.). «Встроенная криптография POWER8». IBM.
^ Методы оптимизации и настройки производительности для процессоров IBM, включая IBM POWER8 (PDF) . IBM . Июль 2014 г. Получено 2 ноября 2022 г.
↑ Вэй Ли (18 ноября 2014 г.). «Встроенные функции аппаратной транзакционной памяти компилятора IBM XL для IBM AIX в системах на базе процессора IBM POWER8». IBM . Получено 8 февраля 2015 г.
^ Гарольд В. Кейн, Магед М. Майкл, Брэд Фрей, Кэти Мэй, Дерек Уильямс и Хунг Ле. «Надежная архитектурная поддержка транзакционной памяти в архитектуре Power». В ISCA '13 Proceedings of the 40th Annual International Symposium on Computer Architecture, стр. 225-236, ACM, 2013. doi :10.1145/2485922.2485942
^ abc "Tyan Ships First Non-IBM Power8 Server". EnterpriseTech . 8 октября 2014 г. Получено 17 декабря 2014 г.
^ "Power8 Iron составит конкуренцию четырехсокетным Xeon". nextplatform.com . 2015-05-11.
^ "OpenPOWER и дорожная карта на будущее – Брэд МакКреди" (PDF) . Архивировано из оригинала (PDF) 2018-12-28 . Получено 2016-09-09 .
^ "IBM представляет чип Power8 с NVLink и 3 новыми системами". 8 сентября 2016 г.
^ «Технический документ — NVIDIA Tesla P100 — самый передовой ускоритель ЦОД из когда-либо созданных на базе Pascal GP100, самого быстрого в мире графического процессора» (PDF) .
^ Caldeira, Alexandre Bicas; Haug, Volker (2017-09-28). IBM Power System S822LC для высокопроизводительных вычислений Введение и технический обзор (PDF) . IBM Redpaper. ISBN9780738455617.
^ "IBM News room - 2014-01-19 Suzhou PowerCore Technology Co. намерена использовать технологию IBM POWER для разработки микросхем, стимулирующих инновации в Китае - США". 03.ibm.com. Архивировано из оригинала 23 января 2014 г. Получено 2014-01-22 .
^ Крис Максер и Мел Бекман. "Suzhou PowerCore начнет использовать IBM POWER Tech для разработки новых чипов в Китае". PowerITPro . Получено 22.01.2014 .
^ "Фонд представляет ряд новинок OpenPOWER". 18 марта 2015 г.
^ «IBM объявляет о выпуске POWER8 совместно с партнерами OpenPOWER» (PDF) .
^ "IBM News room - 2014-04-23 IBM решает проблемы больших данных с помощью модели инноваций Open Server - Соединенные Штаты". Архивировано из оригинала 24 апреля 2014 года . Получено 17 декабря 2014 года .
^ "Масштабируемое оборудование с технологией POWER8" (PDF) . Архивировано из оригинала (PDF) 2014-05-23.
^ abc "Обновленные системы IBM Power Linux добавляют NVLink". 8 сентября 2016 г.
^ ab "IBM возвращается в HPC с кластерами LC Power Systems". nextplatform.com . 2015-10-08.
^ ab "Первый сервер OpenPOWER от IBM ориентирован на рабочие нагрузки HPC". 20 марта 2015 г.
^ abcd "Лидеры технологий OpenPOWER Foundation представляют аппаратные решения для предоставления новых альтернатив серверам". Архивировано из оригинала 2015-04-02 . Получено 2015-03-21 .
^ «Новый сервер IBM Power8 оснащен высокоскоростным интерфейсом NVLink от Nvidia».
^ "Установка оборудования HMC 7063-CR1 (HMC на базе POWER8)". IBM .
^ ab "Tyan OpenPOWER System".
^ «TYAN представляет новый сервер 1U на базе POWER8 на саммите OpenPOWER 2016».
^ "Внутри Google, Tyan Power8 Server Boards". EnterpriseTech . 29 апреля 2014 г. Получено 17 декабря 2014 г.
^ "Сегодня я рад продемонстрировать материнскую плату сервера Google POWER8 в…" . Получено 17 декабря 2014 г.
^ "IBM поможет китайской Inspur спроектировать серверы". Reuters . 22 августа 2014 г. Получено 17 декабря 2014 г.
^ Алекс Баринка (23 августа 2014 г.). «IBM откладывает соперничество, чтобы стать партнером китайской Inspur». Bloomberg . Получено 17 декабря 2014 г.
^ «14 взглядов на саммит Open Power».
^ «Cirrascale RM4950 / Платформа разработки нескольких устройств POWER8®».
^ ab "Страница продуктов RedPOWER".
^ ab Burt, Jeff (19 марта 2015 г.). «OpenPower Group представляет первые аппаратные продукты». eWeek .
^ "OpenPOWER: Opening The Stack, All The Way Down". Архивировано из оригинала 2015-04-30 . Получено 2015-03-21 .
^ "Rackspace Building OpenPOWER-Based Open Compute Server". 16 декабря 2014 г.
^ "Жизнь на пересечении: OpenPOWER, Open Compute и будущее облачного программного обеспечения и инфраструктуры". Архивировано из оригинала 2015-04-08.
^ Шилов, Антон (2016-04-15). "OpenPOWER получает поддержку, поскольку Inventec, Inspur, Supermicro разрабатывают серверы на базе POWER8" (веб-сайт) . AnandTech . Получено 16 ноября 2017 г.
^ Gelas, Johan De (24.02.2017). «Продолжение саги OpenPOWER: можно ли получить питание внутри 1U?» (веб-сайт) . AnandTech . Получено 16 ноября 2017 г.
^ "Penguin Magna 2001 datasheet" (PDF) . Penguin Computing .
^ "Penguin Magna 1015 datasheet" (PDF) . Penguin Computing .
^ "Penguin Computing объявляет о платформе OpenPOWER Server и партнере по выходу на рынок Mark III Systems - Penguin Computing" (пресс-релиз). Лас-Вегас: Penguin Computing. 2016-09-19. Архивировано из оригинала 2016-10-20 . Получено 16 ноября 2017 .
^ "Penguin Magna 2002 datasheet" (PDF) . Penguin Computing .
^ "Penguin Computing анонсирует новые серверы Magna и Relion с графическими ускорителями NVIDIA Tesla P100 для высокопроизводительных вычислений". Penguin Computing (пресс-релиз). Фримонт, Калифорния. 2016-06-20. Архивировано из оригинала 2017-07-03 . Получено 16 ноября 2017 г.
Внешние ссылки
На Викискладе есть медиафайлы по теме «Системы POWER8» .
Обзор POWER8, IBM Power Systems. Архивировано 06.08.2020 на Wayback Machine (PDF)