stringtranslate.com

Санвей SW26010

SW26010 — это 260-ядерный многоядерный процессор, разработанный Шанхайским центром развития технологий и промышленности интегральных схем (ICC для краткости) ( китайский : 上海集成电路技术与产业促进中心 (简称ICC)). Он реализует архитектуру Sunway , 64-битную архитектуру сокращенного набора команд (RISC), разработанную в Китае . [1] SW26010 имеет четыре кластера из 64 вычислительно-обрабатывающих элементов (CPE), которые расположены в массиве восемь на восемь. CPE поддерживают инструкции SIMD и способны выполнять восемь операций с плавающей точкой двойной точности за цикл. Каждый кластер сопровождается более традиционным ядром общего назначения , называемым элементом обработки управления (MPE), которое обеспечивает функции надзора. [1] Каждый кластер имеет свой собственный выделенный контроллер DDR3 SDRAM и банк памяти с собственным адресным пространством . [2] [3] Процессор работает на тактовой частоте 1,45 ГГц. [4]

Ядра CPE имеют 64  КБ оперативной памяти для данных и 16 КБ для инструкций и взаимодействуют через сеть на чипе вместо традиционной иерархии кэша . [5] MPE имеют более традиционную настройку с 32 КБ кэшей инструкций и данных L1 и 256 КБ кэша L2 . [1] Наконец, сеть на чипе подключается к единому интерфейсу системного взаимодействия, который соединяет чип с внешним миром.

SW26010 используется в суперкомпьютере Sunway TaihuLight , который с марта по июнь 2018 года был самым быстрым суперкомпьютером в мире по рейтингу проекта TOP500 . [6] Система использует 40 960 SW26010 для достижения 93,01  PFLOPS на тесте LINPACK .

Преемник: SW26010P

SW26010P включает в себя 6 основных групп (CG), каждая из которых включает один управляющий процессорный элемент (MPE) и один кластер вычислительных процессорных элементов (CPE) 8×8. Каждый CG имеет свой контроллер памяти (MC), подключенный к 16 ГБ памяти DDR4 с пропускной способностью 51,2 ГБ/с. Обмен данными между каждыми двумя CPE в одном кластере CPE достигается через интерфейс удаленного доступа к памяти (RMA) (замена функции связи регистров в предыдущем поколении). Каждый CPE имеет быструю локальную память данных (LDM) объемом 256 КБ. Каждый процессор SW26010P состоит из 390 процессорных элементов. [7]

Смотрите также

Ссылки

  1. ^ abc Dongarra, Jack (20 июня 2016 г.). "Отчет о системе Sunway TaihuLight" (PDF) . www.netlib.org . Получено 20 июня 2016 г. .
  2. ^ Фу, Хаохуань; Ляо, Цзюньфэн; Ян, Цзиньчжэ; и др. (2016). «Суперкомпьютер Sunway TaihuLight: система и приложения». наук. Китай Инф. Наука . 59 (7). дои : 10.1007/s11432-016-5588-7 .
  3. Trader, Tiffany (19 июня 2016 г.). «Китай дебютирует с 93-петафлопсным „Sunway“ с отечественными процессорами». HPC Wire . Получено 21 июня 2016 г. Каждое ядро ​​CPE имеет один конвейер с плавающей точкой , который может выполнять 8 флопсов за цикл на ядро ​​(64-битная арифметика с плавающей точкой), а MPE имеет двойной конвейер, каждый из которых может выполнять 8 флопсов за цикл на конвейер (64-битная арифметика с плавающей точкой).
  4. ^ Хемсот, Николь (2016-06-20). «Взгляд внутрь китайского суперкомпьютера, возглавившего чарты». Следующая платформа . Получено 2016-06-20 .
  5. ^ Лендино, Джейми (20 июня 2016 г.). «Встречайте новый самый быстрый суперкомпьютер в мире: китайский TaihuLight». Extremetech . Получено 21 июня 2016 г. В отчете TOP500 говорится, что чип также лишен традиционного кэша L1-L2-L3, а вместо этого имеет 12 КБ кэша инструкций и 64 КБ «локальной блокнотной памяти», которая работает как кэш L1.
  6. ^ "Top 500 The List: November 2016". TOP 500 . 14 ноября 2016 . Получено 26 ноября 2016 .
  7. ^ Лю, Юн (Александр); Лю, Синь (Люси); Ли, Фанг (Нэнси); Фу, Хаохуань; Ян, Юлин; Сун, Цзявэй; Чжао, Пэнпэн; Ван, Чжэнь; Пэн, Дацзя; Чен, Хуаронг; Го, Чу; Хуан, Хелян; У, Вэньчжао; Чен, Дексун (2021). «Закрытие разрыва в «квантовом превосходстве»». Материалы Международной конференции по высокопроизводительным вычислениям, сетям, хранению и анализу . стр. 1–12. дои : 10.1145/3458817.3487399. ISBN 9781450384421. S2CID  239036985.