Тест HPC Challenge

HPC Challenge Benchmark объединяет несколько тестов для проверки ряда независимых атрибутов производительности высокопроизводительных компьютерных систем (HPC). Проект был совместно спонсирован программой DARPA High Productivity Computing Systems , Министерством энергетики США и Национальным научным фондом . ^[2]

Контекст

Производительность сложных приложений на системах HPC может зависеть от множества независимых атрибутов производительности оборудования. Тест HPC Challenge Benchmark — это попытка улучшить видимость этого многомерного пространства путем объединения измерения нескольких из этих атрибутов в одной программе.

Хотя интересующие нас характеристики производительности не являются специфичными для какой-либо конкретной компьютерной архитектуры, эталонная реализация HPC Challenge Benchmark на C и MPI предполагает, что тестируемая система представляет собой кластер многопроцессорных систем с общей памятью, соединенных сетью . Из-за этого предположения об иерархической структуре системы большинство тестов запускаются в нескольких различных режимах работы. Согласно обозначениям, используемым в отчетах о тестировании, результаты, помеченные как «одиночные», означают, что тест выполнялся на одном случайно выбранном процессоре в системе, результаты, помеченные как «звездочки», означают, что независимая копия теста выполнялась одновременно на каждом процессоре в системе, а результаты, помеченные как «глобальные», означают, что все процессоры работали согласованно для решения одной задачи (с данными, распределенными по узлам системы).

Компоненты

В настоящее время тест состоит из 7 тестов (для каждого из которых указаны режимы работы):

HPL ^[3] (High Performance LINPACK ) – измеряет производительность решателя для плотной системы линейных уравнений (глобально).
DGEMM – измеряет производительность умножения матриц (одиночных, звездных).
STREAM ^[4] – измеряет постоянную пропускную способность памяти в/из памяти (одинарная, звездообразная).
PTRANS – измеряет скорость, с которой система может транспонировать большой массив (глобальный).
RandomAccess – измеряет скорость 64-битных обновлений случайно выбранных элементов большой таблицы (отдельной, звездообразной, глобальной).
БПФ – выполняет быстрое преобразование Фурье большого одномерного вектора с использованием обобщенного алгоритма Кули–Тьюки (одиночного, звездообразного, глобального).
Пропускная способность и задержка связи – измерения производительности, ориентированные на MPI, на основе эталонного теста пропускной способности/задержки b_eff ^{[5] .}

Атрибуты производительности

На высоком уровне тесты предназначены для обеспечения покрытия четырех важных атрибутов производительности: арифметика с плавающей точкой двойной точности (DGEMM и HPL), пропускная способность локальной памяти (STREAM), пропускная способность сети для «больших» сообщений (PTRANS, RandomAccess, FFT, b_eff) и пропускная способность сети для «маленьких» сообщений (RandomAccess, b_eff). Некоторые коды сложнее других и могут иметь дополнительную чувствительность к производительности. Например, в некоторых системах производительность HPL может быть ограничена пропускной способностью сети и/или задержкой сети.

Соревнование

Ежегодный конкурс HPC Challenge Award на Суперкомпьютерной конференции фокусируется на четырех самых сложных тестах в пакете:

Глобальный HPL
Глобальный RandomAccess (или BSS Random Access Benchmark )
EP STREAM (Триада) на систему
Глобальный БПФ

Существует два класса наград:

Класс 1 : Лучшая производительность в базовом или оптимизированном прогоне, представленном на веб-сайте HPC Challenge. ^[6]
Класс 2 : Наиболее «элегантная» реализация четырех или пяти вычислительных ядер, включая три или более тестов HPC Challenge. ^[7]

Смотрите также

Место ссылки

Ссылки

^ «Релизы · icl-utk-edu/hpcc» . github.com . Проверено 12 апреля 2021 г.
^ "Cray X1 Supercomputer Has Highest Reported Scores on Government-Sponsored HPC Challenge Benchmark Tests". 2004-06-14. Архивировано из оригинала 2009-03-30 . Получено 2010-01-22 .
^ "HPL – Портативная реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью". Лаборатория инновационных вычислений, Университет Теннесси в Ноксвилле . Получено 10 июня 2015 г.
^ "STREAM: Устойчивая пропускная способность памяти в высокопроизводительных компьютерах" . Получено 10 июня 2015 г.
^ "Эффективная пропускная способность (b_eff) Benchmark". Центр высокопроизводительных вычислений в Штутгарте . Получено 10 июня 2015 г.
^ Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом "базовым" запуском. Дополнительные (но все еще ограниченные) модификации разрешены в категории "оптимизированных" запусков.
^ "Конкурс HPC Challenge Award". Программа DARPA HPCS . Получено 2010-01-23 .

Внешние ссылки

Официальный сайт бенчмарка HPC Challenge
Официальный сайт конкурса HPC Challenge Award
Оценка производительности BSS Random Access Benchmark и оптимизация доступа к произвольной памяти на многоядерных процессорах с высокой производительностью (награда за лучшую работу) на ACM/IEEE HiPC 2010