Первоначально бренд был известен как AMD Radeon Instinct , но AMD исключила бренд Radeon из названия перед выпуском AMD Instinct MI100 в ноябре 2020 года.
В июне 2022 года суперкомпьютеры на базе процессоров AMD Epyc и графических процессоров Instinct возглавили список Green500 самых энергоэффективных суперкомпьютеров с отрывом более чем в 50% над любыми другими и заняли первые 4 места. [3] Один из них, Frontier на базе AMD, с июня 2022 года и по состоянию на 2023 год является самым быстрым суперкомпьютером в мире в списке TOP500 . [4] [5]
Продукция
Три первых продукта Radeon Instinct были анонсированы 12 декабря 2016 года и выпущены 20 июня 2017 года, при этом каждый из них был основан на отдельной архитектуре. [12] [13]
МИ6
MI6 — это пассивно охлаждаемая карта на базе Polaris 10 с 16 ГБ памяти GDDR5 и TDP <150 Вт . [1] [2] При производительности 5,7 TFLOPS ( FP16 и FP32 ) MI6, как ожидается, будет использоваться в первую очередь для вывода, а не для обучения нейронных сетей. Пиковая производительность вычислений с двойной точностью (FP64) у MI6 составляет 358 GFLOPS. [14]
МИ8
MI8 — это карта на базе Fiji , аналогичная R9 Nano, с TDP <175 Вт. [1] MI8 имеет 4 ГБ памяти с высокой пропускной способностью . При 8,2 TFLOPS (FP16 и FP32) MI8 нацелена на вывод. MI8 имеет пиковую (FP64) производительность вычислений двойной точности 512 GFLOPS. [15]
МИ25
MI25 — это карта на базе Vega , использующая память HBM2. Ожидается, что производительность MI25 составит 12,3 TFLOPS при использовании чисел FP32. В отличие от MI6 и MI8, MI25 способна увеличить производительность при использовании чисел с меньшей точностью и, соответственно, как ожидается, достигнет 24,6 TFLOPS при использовании чисел FP16. MI25 рассчитана на <300 Вт TDP с пассивным охлаждением. MI25 также обеспечивает пиковую производительность 768 GFLOPS с двойной точностью (FP64) при скорости 1/16. [16]
Серия МИ300
MI300A и MI300X — это ускорители центров обработки данных, использующие архитектуру CDNA 3 , оптимизированную для высокопроизводительных вычислений (HPC) и рабочих нагрузок генеративного искусственного интеллекта (AI). Архитектура CDNA 3 отличается масштабируемой конструкцией чиплетов, которая использует передовые технологии упаковки TSMC, такие как CoWoS (chip-on-wafer-on-substrate) и InFO (integrated fan-out), для объединения нескольких чиплетов на одном интерпозере. Чиплеты соединены между собой с помощью AMD Infinity Fabric, которая обеспечивает высокоскоростную и малозадерживаемую передачу данных между чиплетами и хост-системой.
MI300A — это ускоренный процессорный блок (APU), который объединяет 24 ядра ЦП Zen 4 с четырьмя ядрами ГП CDNA 3, что дает в общей сложности 228 CU в секции ГП и 128 ГБ памяти HBM3. Ядра ЦП Zen 4 основаны на 5-нм техпроцессе и поддерживают набор инструкций x86-64, а также расширения AVX-512 и BFloat16. Ядра ЦП Zen 4 могут запускать приложения общего назначения и обеспечивать вычисления на стороне хоста для ядер ГП. MI300A имеет пиковую производительность 61,3 TFLOPS FP64 (матрица FP64 122,6 TFLOPS) и 980,6 TFLOPS FP16 (1961,2 TFLOPS с разреженностью), а также пропускную способность памяти 5,3 ТБ/с. MI300A поддерживает интерфейсы PCIe 5.0 и CXL 2.0, которые позволяют ему взаимодействовать с другими устройствами и ускорителями в гетерогенной системе.
MI300X — это специализированный генеративный ускоритель ИИ, который заменяет ядра ЦП дополнительными ядрами ГП и памятью HBM, что в итоге дает 304 CU (64 ядра на CU) и 192 ГБ памяти HBM3. MI300X предназначен для ускорения генеративных приложений ИИ, таких как обработка естественного языка, компьютерное зрение и глубокое обучение. MI300X имеет пиковую производительность 653,7 TFLOPS TP32 (1307,4 TFLOPS с разреженностью) и 1307,4 TFLOPS FP16 (2614,9 TFLOPS с разреженностью), а также пропускную способность памяти 5,3 ТБ/с. MI300X также поддерживает интерфейсы PCIe 5.0 и CXL 2.0, а также программный стек AMD ROCm, который предоставляет унифицированную модель программирования и инструменты для разработки и развертывания приложений генеративного ИИ на оборудовании AMD. [17] [18] [19]
Программное обеспечение
ROCм
Следующее программное обеспечение с 2022 года перегруппировано в метапроект Radeon Open Compute.
MxGPU
Продукты MI6, MI8 и MI25 поддерживают технологию виртуализации AMD MxGPU , позволяющую совместно использовать ресурсы графического процессора для нескольких пользователей. [1] [20]
MIOpen
MIOpen — это библиотека глубокого обучения AMD, позволяющая использовать ускорение глубокого обучения на GPU. [1] Большая часть этого расширяет программное обеспечение Boltzmann Initiative от GPUOpen . [20] Это предназначено для конкуренции с частями глубокого обучения библиотеки CUDA от Nvidia . Она поддерживает фреймворки глубокого обучения: Theano , Caffe , TensorFlow , MXNet , Microsoft Cognitive Toolkit , Torch и Chainer . Программирование поддерживается в OpenCL и Python , в дополнение к поддержке компиляции CUDA через гетерогенный вычислительный интерфейс AMD для переносимости и гетерогенный вычислительный компилятор.
Таблица чипсетов
в
т
е
^ abc Значения надбавки (если таковые имеются) указаны под базовым значением курсивом .
^ Скорость заполнения текстур рассчитывается как количество блоков наложения текстур, умноженное на базовую (или повышенную) тактовую частоту ядра.
^ Скорость заполнения пикселей рассчитывается как количество выходных единиц рендеринга, умноженное на базовую (или повышенную) тактовую частоту ядра.
^ Производительность точности рассчитывается на основе базовой (или повышенной) тактовой частоты ядра на основе операции FMA .
^ GCD относится к графическому вычислительному кристаллу. Каждый GCD — это отдельный кусочек кремния.
^ Карты на базе CDNA 2.0 используют конструкцию, в которой два кристалла размещены в одном корпусе. Они соединены двунаправленным соединением Infinity Fabric со скоростью 400 ГБ/с. Хост-система обращается к кристаллам как к отдельным графическим процессорам.
Смотрите также
ROCm — открытый вычислительный программный стек AMD
^ abcde Смит, Райан (12 декабря 2016 г.). "AMD анонсирует Radeon Instinct: GPU-ускорители для глубокого обучения, которые появятся в 2017 г.". Anandtech . Получено 12 декабря 2016 г. .
^ ab Shrout, Ryan (12 декабря 2016 г.). "Radeon Instinct Machine Learning GPUs include Vega, Preview Performance". PC Per . Получено 12 декабря 2016 г.
^ "Green500 Release June 2022". TOP500 . Получено 9 мая 2024 .
^ "Top500 Release June 2022". TOP500 . Получено 9 мая 2024 .
^ "Top500 Release November 2023". TOP500 . Получено 9 мая 2024 .
^ Смит, Райан. «AMD анонсирует Radeon Instinct: GPU-ускорители для глубокого обучения, выйдут в 2017 году». www.anandtech.com . Получено 3 июня 2024 г.
^ Смит, Райан. «AMD анонсирует ускорители Radeon Instinct MI60 и MI50: на базе 7-нм Vega». www.anandtech.com . Получено 3 июня 2024 г.
^ Смит, Райан. «AMD выпускает ускоритель Instinct MI210: CDNA 2 на карте PCIe». www.anandtech.com . Получено 3 июня 2024 г.
^ Смит, Райан. «AMD анонсирует семейство ускорителей Instinct MI200: вывод серверов на уровень Exascale и выше». www.anandtech.com . Получено 3 июня 2024 г.
^ Боншор, Райан Смит, Гэвин. «Живой блог AMD Advancing AI & Instinct MI300 Launch (начало в 10:00 по тихоокеанскому времени/18:00 по всемирному координированному времени)». www.anandtech.com . Получено 3 июня 2024 г.{{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Смит, Райан. «AMD планирует выпуск массивной памяти Instinct MI325X на четвертый квартал 24 года, излагает дорожную карту ускорителей до 2026 года». www.anandtech.com . Получено 3 июня 2024 г.
^ WhyCry (12 декабря 2016 г.). "AMD анонсирует первый ускоритель VEGA: RADEON INSTINCT MI25 для глубокого обучения". VideoCardz . Получено 6 июня 2022 г. .
^ Mujtaba, Hassan (21 июня 2017 г.). «Подробные характеристики ускорителя AMD Radeon Instinct MI25 с 16 ГБ HBM2 — запуск сегодня вместе с Instinct MI8 и Instinct MI6». Wccftech . Получено 6 июня 2022 г. .
^ "Radeon Instinct MI6". Radeon Instinct . AMD . Получено 22 июня 2017 г. .[ постоянная мертвая ссылка ]
^ "Radeon Instinct MI8". Radeon Instinct . AMD . Получено 22 июня 2017 г. .[ постоянная мертвая ссылка ]
^ "Radeon Instinct MI25". Radeon Instinct . AMD . Получено 22 июня 2017 г. .[ постоянная мертвая ссылка ]
^ "Архитектура AMD CDNA 3" (PDF) . Архитектура AMD CDNA . AMD . Получено 7 декабря 2023 г. .
^ "AMD INSTINCT MI300A APU" (PDF) . Ускорители AMD Instinct . AMD . Получено 7 декабря 2023 г. .
^ "AMD INSTINCT MI300X APU" (PDF) . Ускорители AMD Instinct . AMD . Получено 7 декабря 2023 г. .
^ ab Kampman, Jeff (12 декабря 2016 г.). "AMD открывает возможности машинного обучения с помощью Radeon Instinct". TechReport . Получено 12 декабря 2016 г. .
^ abc Smith, Ryan (12 декабря 2016 г.). "AMD анонсирует Radeon Instinct: GPU-ускорители для глубокого обучения, которые появятся в 2017 г.". AnandTech . Получено 12 декабря 2016 г. .
^ abc Shrout, Ryan (12 декабря 2016 г.). "Radeon Instinct Machine Learning GPUs включают Vega, Preview Performance". PCPerspective . Получено 12 декабря 2016 г. .
^ abc Kampman, Jeff (12 декабря 2016 г.). "AMD открывает возможности машинного обучения с помощью Radeon Instinct". Tech Report . Получено 12 декабря 2016 г. .
^ "Radeon Instinct MI6". AMD . Архивировано из оригинала 1 августа 2017 г. Получено 27 мая 2022 г.
^ "AMD Radeon Instinct MI6 Datasheet" (PDF) . usermanual.wiki . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI6 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ "Radeon Instinct MI8". AMD . Архивировано из оригинала 1 августа 2017 г. Получено 27 мая 2022 г.
^ "AMD Radeon Instinct MI8 Datasheet" (PDF) . usermanual.wiki . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI8 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ Смит, Райан (5 января 2017 г.). «Архитектурный тизер AMD Vega: более высокий IPC, тайлинг и многое другое в первой половине 2017 г.». AnandTech . Получено 10 января 2017 г. .
^ "Radeon Instinct MI25". AMD . Архивировано из оригинала 1 августа 2017 г. Получено 27 мая 2022 г.
^ "AMD Radeon Instinct MI25 Datasheet" (PDF) . AMD . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI25 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ Уолтон, Джарред (10 января 2019 г.). «Изучаем AMD Radeon VII». PC Gamer .