stringtranslate.com

Мощность10

Power10 — это семейство суперскалярных , многопоточных , многоядерных микропроцессоров , основанное на открытом исходном коде Power ISA , анонсированное в августе 2020 года на конференции Hot Chips ; системы с процессорами Power10. Доступно с сентября 2021 года в сервере IBM Power10 Enterprise E1080.

Процессор рассчитан на 15 ядер , но в процессе производства будет включено запасное ядро ​​для экономически эффективного решения проблем с выходом продукции .

Процессоры на базе Power10 будут производиться компанией Samsung с использованием 7-нм техпроцесса с 18 слоями металла и 18 миллиардами транзисторов на кремниевом кристалле площадью 602 мм2 . [1] [2] [3] [4]

Основными особенностями Power10 являются более высокая производительность на ватт и улучшенная архитектура памяти и ввода-вывода с упором на рабочие нагрузки искусственного интеллекта (ИИ). [5]

Дизайн

Каждое ядро ​​Power10 удвоило большинство функциональных блоков по сравнению с его предшественником POWER9 . Ядро является восьмипоточным ( SMT8) и имеет 48 КБ инструкций и 32 КБ данных кэша L1 , 2 МБ большого кэша L2 и очень большой буфер трансляции (TLB) с 4096 записями. [3] Циклы задержки для различных стадий кэша и TLB были значительно сокращены. Каждое ядро ​​имеет восемь срезов выполнения, каждый с одним блоком с плавающей точкой (FPU), арифметико-логическим блоком (ALU), предсказателем ветвлений , блоком загрузки-сохранения и SIMD-движком , способным получать 128-битные (64+64) инструкции из новых префиксных/предохранительных инструкций Power ISA v.3.1. Каждый срез выполнения может обрабатывать 20 инструкций каждый, подкрепленных общей таблицей инструкций на 512 записей, и подается в очередь загрузки шириной 128 записей (64 однопоточных) и очередь хранения шириной 80 записей (40 однопоточных). Улучшенные функции предсказания ветвлений удвоили точность. Ядро имеет четыре движка MMA ( матрица математической помощи) [6] для лучшей обработки кода SIMD, особенно для инструкций умножения матриц , где рабочие нагрузки вывода ИИ имеют 20-кратное увеличение производительности. [7]

Процессор имеет два "полушария" с восемью ядрами в каждом, разделяя кэш L3 объемом 64 МБ для общего количества ядер и кэша L3 объемом 128 МБ. Из-за проблем с выходом продукции, по крайней мере, одно ядро ​​всегда отключено, что уменьшает кэш L3 на 8 МБ до общего количества используемых ядер и кэша L3 объемом 120 МБ. Каждый чип также имеет восемь криптоускорителей , разгружающих общие алгоритмы, такие как AES и SHA-3 .

Увеличенное тактовое стробирование и переработанная микроархитектура на каждом этапе, вместе с инструкциями fuse/prefix, позволяющими выполнять больше работы с меньшим количеством рабочих единиц, и более умным кэшем с меньшими задержками памяти и эффективной маркировкой адресов, уменьшающей промахи кэша, позволяют ядру Power10 потреблять вдвое меньше энергии, чем POWER9. В сочетании с улучшениями в вычислительных мощностях до 30% весь процессор работает в 2,6 раза лучше на ватт, чем его предшественник. А в случае установки двух ядер на одном модуле — до 3 раз быстрее при том же бюджете мощности.

Поскольку ядра могут действовать как восемь логических процессоров каждое, 15-ядерный процессор выглядит для операционной системы как 120 ядер . На двухчиповом модуле это становится 240 одновременными потоками на сокет .

Ввод/вывод

Чипы имеют полностью переработанную архитектуру памяти и ввода-вывода, используя открытый интерфейс процессора Coherent Accelerator (OpenCAPI) и открытый интерфейс памяти (OMI). Использование последовательной связи памяти с контроллерами вне чипа уменьшает сигнальные линии к чипу и от него, увеличивает пропускную способность и позволяет процессору быть гибким в своей технологии памяти,. [4]

Power10 поддерживает широкий спектр типов памяти, включая DDR3 через DDR5, GDDR, HBM или Persistent Storage Memory. Эти конфигурации могут быть изменены заказчиком для наилучшего соответствия варианту использования, предназначенному для системы.

Power10 обеспечивает шифрование данных без потери производительности на каждом этапе — от оперативной памяти, ускорителей и узлов кластера до данных в состоянии покоя.

Power10 поставляется с PowerAXON, который обеспечивает шину от чипа к чипу, от системы к системе и OpenCAPI для ускорителей, ввода-вывода и других высокопроизводительных периферийных устройств с когерентным кэшем . Он управляет коммуникациями между узлами в кластере 16-гнездового однокристального модуля (SCM) или кластере 4-гнездового двухкристального модуля (DCM). Он также управляет семантикой памяти для кластеризации систем, обеспечивая доступ к загрузке/хранению из ядра до 2 ПБ оперативной памяти во всем кластере Power10. IBM называет эту функцию Memory Inception .

И OMI, и PowerAXON могут обрабатывать данные со скоростью 1 ТБ/с вне чипа.

Power10 включает PCIe 5. SCM имеет 32x, а DCM — 64x линий PCIe 5. Решение об удалении поддержки NVLink из Power10 было принято из-за пропускной способности PCIe 5.0, делающей поддержку NVLink устаревшей для вариантов использования, для которых был разработан Power10. [3] Поддержка NVLink на чипе ранее была уникальным преимуществом POWER8 и POWER9.

Варианты

Чип Power10 доступен в двух вариантах, определяемых прошивкой в ​​упаковке. Несмотря на то, что чипы физически идентичны, а разница установлена ​​в прошивке, она не может быть изменена пользователем или IBM после производства. [8]

Модули

Power10 выпускается в трех корпусах с пластиковой матрицей перевернутого кристалла (FC-PLGA) : один однокристальный модуль (SCM) и два двухкристальных модуля (DCM и eSCM).

Системы

Предприятие

IBM Power E1080 , кодовое название Denali , является топовым компьютером Power10 от IBM. Он состоит из 1-4 узлов Central Electronics Complex (CEC), каждый из которых занимает 5U пространства. Каждый узел имеет 4 узла Power10 SCM, настраиваемых с 10, 12 или 15 ядрами SMT8 на процессор и до 16 ТБ OMI - DDR4 RAM . Power E1080 изначально запускает PowerVM под управлением AIX , IBM i и little-endian Linux . [12] Для системы E1080 также требуется блок управления системой высотой 2U для мониторинга и настройки.

Power E1080 также поддерживает до шестнадцати секций расширения ввода/вывода, по четыре на узел CEC. Каждая секция расширения подключается к соответствующему узлу CEC двумя модулями PCIe fanout и имеет двенадцать слотов FHFL PCIe. Четыре из этих слотов — PCIe 3.0 x16, а остальные восемь — PCIe 3.0 x8. Максимальная конфигурация спецификации позволяет Power E1080 поддерживать 192 однослотовые карты PCIe в системе с 16 сокетами. [13]

Средний диапазон

Масштабирование

Модели S могут работать под управлением Linux, IBM i и AIX. Модели L созданы для Linux, но им разрешено работать под управлением AIX и IBM i на 25% доступных ядер ЦП. [10]

Поддержка операционной системы

Сравнение с более ранними процессорами POWER

Переход на 7-нм техпроцесс обеспечивает значительное повышение производительности на ватт.

Теперь возможности PowerAXON расширены до 2  ПБ унифицированного кластерного пространства памяти, совместно используемого несколькими узлами кластера , и включают поддержку PCIe 5 .

Новые инструкции SIMD и новые типы данных, включая bfloat16 , INT4(INTEGER) и INT8(BIGINT) [ 16] [17] , направлены на улучшение рабочих нагрузок ИИ.

В отличие от более ранних процессоров POWER9 и POWER8, Power10 требует использования прошивки стороннего производителя с закрытым исходным кодом в уязвимых для безопасности областях модуля процессора, а также дополнительной прошивки стороннего производителя с закрытым исходным кодом в требуемом контроллере памяти вне модуля. [18]

Брендинг

Power10 необычен тем, что его название не пишется заглавными буквами, как POWER9 и все предыдущие процессоры POWER. Это изменение является частью ребрендинга IBM своего предложения Power Systems, которое, начиная с Power10, теперь просто "Power". У Power10 также есть логотип. [19]

Смотрите также

Ссылки

  1. ^ Доктор Катресс, Ян (17 августа 2020 г.). «Живой блог Hot Chips 2020: процессор IBM POWER10 на базе 7-нм техпроцесса Samsung». AnandTech .
  2. ^ Куах, Катянна (17 августа 2020 г.). «IBM переводит процессоры Power10 на 7 нм вместе с Samsung, поставки должны начаться к концу 2021 г.» The Register .
  3. ^ abc Шиллинг, Андреас (17 августа 2020 г.). «IBM Power10 предлагает 30 ядер с SMT8, PCIe 5.0 и DDR5». Hardware LUXX (на немецком языке).
  4. ^ ab Kennedy, Patrick (17 августа 2020 г.). «IBM POWER10 в поисках Святого Грааля вычислений». ServeTheHome .
  5. ^ "IBM представляет процессор IBM POWER10 следующего поколения". IBM . 17 августа 2020 г.
  6. ^ Хосе Морейра, Пунит Бхат АХ и Сатиш Кумар Садасивам (15 апреля 2021 г.). Руководство по передовому опыту использования Matrix-Multiply Assist.
  7. ^ Рассел, Джон (17 августа 2020 г.). «IBM представляет Power10; рекламирует новую схему памяти, безопасность и вывод». HPCwire .
  8. ^ Прикетт Морган, Тимоти (31 августа 2020 г.). «Возможные проекты IBM для систем Power10». IT Jungle .
  9. ^ ab Джулиано Ансельми, Марк Грегорутти, Стивен Лутц, Майкл Маликдем, Гвидо Сомерс, Цветомир Спасов (11 июля 2022 г.). «Технический обзор и введение IBM Power E1050» (PDF) .{{cite web}}: CS1 maint: multiple names: authors list (link)
  10. ^ ab Джулиано Ансельми, Янг Хун Чо, Эндрю Лэйдлоу, Армин Рёлль, Цветомир Спасов (19 июля 2022 г.). «Технический обзор и введение IBM Power S1014, S1022s, S1022 и S1024» (PDF) .{{cite web}}: CS1 maint: multiple names: authors list (link)
  11. ^ Источник GitHub/OpenPower/Rainier
  12. ^ Вот как выглядит самый мощный сервер в мире
  13. ^ Джулиано Ансельми, Маниш Арора, Ивайло Божинов, Динил Дас, Тургут Генч, Бартоломей Грабовски, Мэдисон Ли, Армин Рёлль (9 декабря 2021 г.). «Технический обзор и введение IBM Power E1080» (PDF) .{{cite web}}: CS1 maint: multiple names: authors list (link)
  14. ^ Ларабель, Майкл (9 августа 2020 г.). «Linux 5.9 обеспечивает большую поддержку IBM POWER10, новый/более быстрый ABI системных вызовов SCV». Phoronix .
  15. ^ ab Prickett Morgan, Timothy (6 августа 2019 г.). «Обсуждение высокой пропускной способности с архитектором IBM POWER10». Следующая платформа .
  16. ^ Патрицио, Энди (18 августа 2020 г.). «IBM представляет процессор нового поколения POWER10». Network World .
  17. ^ "Псевдонимы типов данных". IBM . 26 августа 2020 г.
  18. ^ «Проблема POWER10 не только в OMI». 8 сентября 2021 г.
  19. ^ Больше не будем выкрикивать слово «Power» (ну, кроме как в нашем названии)