stringtranslate.com

Тест HPC Challenge

HPC Challenge Benchmark объединяет несколько тестов для проверки ряда независимых атрибутов производительности высокопроизводительных компьютерных систем (HPC). Проект был совместно спонсирован программой DARPA High Productivity Computing Systems , Министерством энергетики США и Национальным научным фондом . [2]

Контекст

Производительность сложных приложений на системах HPC может зависеть от множества независимых атрибутов производительности оборудования. Тест HPC Challenge Benchmark — это попытка улучшить видимость этого многомерного пространства путем объединения измерения нескольких из этих атрибутов в одной программе.

Хотя интересующие нас характеристики производительности не являются специфичными для какой-либо конкретной компьютерной архитектуры, эталонная реализация HPC Challenge Benchmark на C и MPI предполагает, что тестируемая система представляет собой кластер многопроцессорных систем с общей памятью, соединенных сетью . Из-за этого предположения об иерархической структуре системы большинство тестов запускаются в нескольких различных режимах работы. Согласно обозначениям, используемым в отчетах о тестировании, результаты, помеченные как «одиночные», означают, что тест выполнялся на одном случайно выбранном процессоре в системе, результаты, помеченные как «звездочки», означают, что независимая копия теста выполнялась одновременно на каждом процессоре в системе, а результаты, помеченные как «глобальные», означают, что все процессоры работали согласованно для решения одной задачи (с данными, распределенными по узлам системы).

Компоненты

В настоящее время тест состоит из 7 тестов (для каждого из которых указаны режимы работы):

  1. HPL [3] (High Performance LINPACK ) – измеряет производительность решателя для плотной системы линейных уравнений (глобально).
  2. DGEMM – измеряет производительность умножения матриц (одиночных, звездных).
  3. STREAM [4] – измеряет постоянную пропускную способность памяти в/из памяти (одинарная, звездообразная).
  4. PTRANS – измеряет скорость, с которой система может транспонировать большой массив (глобальный).
  5. RandomAccess – измеряет скорость 64-битных обновлений случайно выбранных элементов большой таблицы (отдельной, звездообразной, глобальной).
  6. БПФ – выполняет быстрое преобразование Фурье большого одномерного вектора с использованием обобщенного алгоритма Кули–Тьюки (одиночного, звездообразного, глобального).
  7. Пропускная способность и задержка связи – измерения производительности, ориентированные на MPI, на основе эталонного теста пропускной способности/задержки b_eff [5] .

Атрибуты производительности

На высоком уровне тесты предназначены для обеспечения покрытия четырех важных атрибутов производительности: арифметика с плавающей точкой двойной точности (DGEMM и HPL), пропускная способность локальной памяти (STREAM), пропускная способность сети для «больших» сообщений (PTRANS, RandomAccess, FFT, b_eff) и пропускная способность сети для «маленьких» сообщений (RandomAccess, b_eff). Некоторые коды сложнее других и могут иметь дополнительную чувствительность к производительности. Например, в некоторых системах производительность HPL может быть ограничена пропускной способностью сети и/или задержкой сети.

Соревнование

Ежегодный конкурс HPC Challenge Award на Суперкомпьютерной конференции фокусируется на четырех самых сложных тестах в пакете:

Существует два класса наград:

Смотрите также

Ссылки

  1. ^ «Релизы · icl-utk-edu/hpcc» . github.com . Проверено 12 апреля 2021 г.
  2. ^ "Cray X1 Supercomputer Has Highest Reported Scores on Government-Sponsored HPC Challenge Benchmark Tests". 2004-06-14. Архивировано из оригинала 2009-03-30 . Получено 2010-01-22 .
  3. ^ "HPL – Портативная реализация высокопроизводительного теста Linpack для компьютеров с распределенной памятью". Лаборатория инновационных вычислений, Университет Теннесси в Ноксвилле . Получено 10 июня 2015 г.
  4. ^ "STREAM: Устойчивая пропускная способность памяти в высокопроизводительных компьютерах" . Получено 10 июня 2015 г.
  5. ^ "Эффективная пропускная способность (b_eff) Benchmark". Центр высокопроизводительных вычислений в Штутгарте . Получено 10 июня 2015 г.
  6. ^ Тест предназначен для замены ограниченного набора функций более оптимизированными версиями, оставаясь при этом "базовым" запуском. Дополнительные (но все еще ограниченные) модификации разрешены в категории "оптимизированных" запусков.
  7. ^ "Конкурс HPC Challenge Award". Программа DARPA HPCS . Получено 2010-01-23 .

Внешние ссылки