Hewlett Packard Enterprise Frontier , или OLCF-5 , является первым в мире суперкомпьютером exascale . Он размещен в Oak Ridge Leadership Computing Facility (OLCF) в Теннесси , США, и введен в эксплуатацию в 2022 году. По состоянию на декабрь 2023 года Frontier является самым быстрым суперкомпьютером в мире . Он основан на Cray EX и является преемником Summit (OLCF-4). Frontier достиг Rmax в 1,102 exaFLOPS , что составляет 1,102 квинтиллиона операций с плавающей запятой в секунду, с использованием центральных процессоров и графических процессоров AMD . [2] [3] [4] [5] [6][обновлять]
Меньшая по размеру система Frontier TDS (система тестирования и разработки) с производительностью 62,86 гигафлопс/ватт возглавляла список Green500 как самый эффективный суперкомпьютер [6] , пока в ноябре 2022 года ее не сверг с пьедестала по эффективности суперкомпьютер Henri из Института Флэтайрона . [7]
Frontier использует 9472 64-ядерных процессора AMD Epyc 7713 "Trento" 2 ГГц (606208 ядер) и 37888 графических процессоров Instinct MI250X (8335360 ядер). Они могут выполнять операции двойной точности с той же скоростью, что и одинарной точности. [8]
«Trento» — оптимизированный процессор EPYC третьего поколения [9] («Milan»), основанный на микроархитектуре Zen 3 .
Он занимает 74 19-дюймовых (48 см) стоечных шкафа. [10] В каждом шкафу размещается 64 лезвия , каждое из которых состоит из 2 узлов.
Blades соединены между собой коммутаторами HPE Slingshot на 64 порта, которые обеспечивают пропускную способность 12,8 терабит/сек. Группы blades связаны в топологии стрекозы с максимум тремя переходами между любыми двумя узлами. Кабели либо оптические, либо медные, настроенные для минимизации длины кабеля. Общая длина кабелей составляет 145 км (90 миль). Frontier охлаждается жидкостью с помощью 4 насосов мощностью 350 лошадиных сил, которые каждую минуту пропускают через систему около 6000 галлонов (22 712,47 литров) неохлажденной воды, что позволяет увеличить плотность в 5 раз по сравнению с архитектурами с воздушным охлаждением. [8] [11]
Каждый узел состоит из одного CPU, 4 GPU и 4 терабайт флэш-памяти. Каждый GPU имеет 128 ГБ RAM, припаянных к нему, и каждый CPU имеет 512 ГБ локальной памяти DDR4. [8] [12]
Frontier имеет согласованные соединения между центральными и графическими процессорами, что позволяет коду, работающему на процессорах Epyc, осуществлять согласованный доступ к памяти графического процессора. [13]
Frontier использует внутреннюю флэш-систему хранения данных со скоростью чтения 75 ТБ/с, записи 35 ТБ/с и 15 млрд IOPS, а также файловую систему Lustre Orion объемом 700 ПБ . [14]
Frontier потребляет около 21 мегаватт (МВт) (что эквивалентно мощности, необходимой для 15 000 односемейных домов), по сравнению с 13 МВт его предшественника Summit . [11]
Одной из самых больших проблем в ходе разработки было энергопотребление. Существующая информация указывала на то, что для достижения 1 exaFLOP необходимы сотни тысяч графических процессоров с общим энергопотреблением 150-500 МВт. Таким образом, высокая эффективность была основной целью проекта. [8]
Oak Ridge объединилась с HPE Cray и AMD для создания системы стоимостью 600 миллионов долларов США. Она начала развертываться в 2021 году [15] и достигла полной мощности в 2022 году. [16] Он достиг 1,1 эксафлопс Rmax в мае 2022 года, что сделало его самым быстрым суперкомпьютером в мире, согласно измерениям в выпуске списка TOP500 за июнь 2022 года , заменив Fugaku . [1] [17]
После выпуска суперкомпьютер возглавил список Green500 как самый эффективный суперкомпьютер, измеренный на уровне 62,68 гигафлопс/ватт. [6] Директор ORNL Томас Захария сказал: «Frontier открывает новую эру эксафлопсных вычислений для решения крупнейших мировых научных задач». Он добавил: «Эта веха предлагает лишь предварительный просмотр непревзойденных возможностей Frontier как инструмента для научных открытий. Это результат более чем десятилетнего сотрудничества между национальными лабораториями, академическими кругами и частной промышленностью, включая проект Exascale Computing Project Министерства энергетики США, который развертывает приложения, программные технологии, аппаратное обеспечение и интеграцию, необходимые для обеспечения воздействия на эксафлопс». [14]