AMD Инстинкт

AMD Instinct — это бренд графических процессоров AMD для центров обработки данных . ^[1]^[2] Он заменил бренд FirePro S от AMD в 2016 году. По сравнению с брендом Radeon , предназначенным для массовых потребительских/игровых продуктов, линейка продуктов Instinct предназначена для ускорения глубокого обучения, искусственных нейронных сетей и высокопроизводительных вычислений / приложений GPGPU .

Линейка продуктов AMD Instinct напрямую конкурирует с линейками графических процессоров для машинного обучения и GPGPU Tesla от Nvidia и Xeon Phi от Intel , а также с линейками графических процессоров Data Center.

Первоначально бренд был известен как AMD Radeon Instinct , но AMD исключила бренд Radeon из названия перед выпуском AMD Instinct MI100 в ноябре 2020 года.

В июне 2022 года суперкомпьютеры на базе процессоров AMD Epyc и графических процессоров Instinct возглавили список Green500 самых энергоэффективных суперкомпьютеров с отрывом более чем в 50% над любыми другими и заняли первые 4 места. ^[3] Один из них, Frontier на базе AMD, с июня 2022 года и по состоянию на 2023 год является самым быстрым суперкомпьютером в мире в списке TOP500 . ^[4]^[5]

Продукция

Три первых продукта Radeon Instinct были анонсированы 12 декабря 2016 года и выпущены 20 июня 2017 года, при этом каждый из них был основан на отдельной архитектуре. ^[12]^[13]

МИ6

MI6 — это пассивно охлаждаемая карта на базе Polaris 10 с 16 ГБ памяти GDDR5 и TDP <150 Вт . ^[1]^[2] При производительности 5,7 TFLOPS ( FP16 и FP32 ) MI6, как ожидается, будет использоваться в первую очередь для вывода, а не для обучения нейронных сетей. Пиковая производительность вычислений с двойной точностью (FP64) у MI6 составляет 358 GFLOPS. ^[14]

МИ8

MI8 — это карта на базе Fiji , аналогичная R9 Nano, с TDP <175 Вт. ^[1] MI8 имеет 4 ГБ памяти с высокой пропускной способностью . При 8,2 TFLOPS (FP16 и FP32) MI8 нацелена на вывод. MI8 имеет пиковую (FP64) производительность вычислений двойной точности 512 GFLOPS. ^[15]

МИ25

MI25 — это карта на базе Vega , использующая память HBM2. Ожидается, что производительность MI25 составит 12,3 TFLOPS при использовании чисел FP32. В отличие от MI6 и MI8, MI25 способна увеличить производительность при использовании чисел с меньшей точностью и, соответственно, как ожидается, достигнет 24,6 TFLOPS при использовании чисел FP16. MI25 рассчитана на <300 Вт TDP с пассивным охлаждением. MI25 также обеспечивает пиковую производительность 768 GFLOPS с двойной точностью (FP64) при скорости 1/16. ^[16]

Серия МИ300

MI300A и MI300X — это ускорители центров обработки данных, использующие архитектуру CDNA 3 , оптимизированную для высокопроизводительных вычислений (HPC) и рабочих нагрузок генеративного искусственного интеллекта (AI). Архитектура CDNA 3 отличается масштабируемой конструкцией чиплетов, которая использует передовые технологии упаковки TSMC, такие как CoWoS (chip-on-wafer-on-substrate) и InFO (integrated fan-out), для объединения нескольких чиплетов на одном интерпозере. Чиплеты соединены между собой с помощью AMD Infinity Fabric, которая обеспечивает высокоскоростную и малозадерживаемую передачу данных между чиплетами и хост-системой.

MI300A — это ускоренный процессорный блок (APU), который объединяет 24 ядра ЦП Zen 4 с четырьмя ядрами ГП CDNA 3, что дает в общей сложности 228 CU в секции ГП и 128 ГБ памяти HBM3. Ядра ЦП Zen 4 основаны на 5-нм техпроцессе и поддерживают набор инструкций x86-64, а также расширения AVX-512 и BFloat16. Ядра ЦП Zen 4 могут запускать приложения общего назначения и обеспечивать вычисления на стороне хоста для ядер ГП. MI300A имеет пиковую производительность 61,3 TFLOPS FP64 (матрица FP64 122,6 TFLOPS) и 980,6 TFLOPS FP16 (1961,2 TFLOPS с разреженностью), а также пропускную способность памяти 5,3 ТБ/с. MI300A поддерживает интерфейсы PCIe 5.0 и CXL 2.0, которые позволяют ему взаимодействовать с другими устройствами и ускорителями в гетерогенной системе.

MI300X — это специализированный генеративный ускоритель ИИ, который заменяет ядра ЦП дополнительными ядрами ГП и памятью HBM, что в итоге дает 304 CU (64 ядра на CU) и 192 ГБ памяти HBM3. MI300X предназначен для ускорения генеративных приложений ИИ, таких как обработка естественного языка, компьютерное зрение и глубокое обучение. MI300X имеет пиковую производительность 653,7 TFLOPS TP32 (1307,4 TFLOPS с разреженностью) и 1307,4 TFLOPS FP16 (2614,9 TFLOPS с разреженностью), а также пропускную способность памяти 5,3 ТБ/с. MI300X также поддерживает интерфейсы PCIe 5.0 и CXL 2.0, а также программный стек AMD ROCm, который предоставляет унифицированную модель программирования и инструменты для разработки и развертывания приложений генеративного ИИ на оборудовании AMD. ^[17]^[18]^[19]

Программное обеспечение

ROCм

Следующее программное обеспечение с 2022 года перегруппировано в метапроект Radeon Open Compute.

MxGPU

Продукты MI6, MI8 и MI25 поддерживают технологию виртуализации AMD MxGPU , позволяющую совместно использовать ресурсы графического процессора для нескольких пользователей. ^[1]^[20]

MIOpen

MIOpen — это библиотека глубокого обучения AMD, позволяющая использовать ускорение глубокого обучения на GPU. ^[1] Большая часть этого расширяет программное обеспечение Boltzmann Initiative от GPUOpen . ^[20] Это предназначено для конкуренции с частями глубокого обучения библиотеки CUDA от Nvidia . Она поддерживает фреймворки глубокого обучения: Theano , Caffe , TensorFlow , MXNet , Microsoft Cognitive Toolkit , Torch и Chainer . Программирование поддерживается в OpenCL и Python , в дополнение к поддержке компиляции CUDA через гетерогенный вычислительный интерфейс AMD для переносимости и гетерогенный вычислительный компилятор.

Таблица чипсетов

^ abc Значения надбавки (если таковые имеются) указаны под базовым значением курсивом .
^ Скорость заполнения текстур рассчитывается как количество блоков наложения текстур, умноженное на базовую (или повышенную) тактовую частоту ядра.
^ Скорость заполнения пикселей рассчитывается как количество выходных единиц рендеринга, умноженное на базовую (или повышенную) тактовую частоту ядра.
^ Производительность точности рассчитывается на основе базовой (или повышенной) тактовой частоты ядра на основе операции FMA .
^ Унифицированные шейдеры : блоки наложения текстур : блоки вывода рендеринга и вычислительные блоки (CU)
^ GCD относится к графическому вычислительному кристаллу. Каждый GCD — это отдельный кусочек кремния.
^ Карты на базе CDNA 2.0 используют конструкцию, в которой два кристалла размещены в одном корпусе. Они соединены двунаправленным соединением Infinity Fabric со скоростью 400 ГБ/с. Хост-система обращается к кристаллам как к отдельным графическим процессорам.

Смотрите также

ROCm — открытый вычислительный программный стек AMD
AMD FirePro — предшественник AMD Instinct от AMD
AMD Radeon Pro — графическое решение AMD для рабочих станций и GPGPU
Nvidia Tesla — конкурирующее решение GPGPU от Nvidia
Список графических процессоров AMD

Ссылки

^ abcde Смит, Райан (12 декабря 2016 г.). "AMD анонсирует Radeon Instinct: GPU-ускорители для глубокого обучения, которые появятся в 2017 г.". Anandtech . Получено 12 декабря 2016 г. .
^ ab Shrout, Ryan (12 декабря 2016 г.). "Radeon Instinct Machine Learning GPUs include Vega, Preview Performance". PC Per . Получено 12 декабря 2016 г.
^ "Green500 Release June 2022". TOP500 . Получено 9 мая 2024 .
^ "Top500 Release June 2022". TOP500 . Получено 9 мая 2024 .
^ "Top500 Release November 2023". TOP500 . Получено 9 мая 2024 .
^ Смит, Райан. «AMD анонсирует Radeon Instinct: GPU-ускорители для глубокого обучения, выйдут в 2017 году». www.anandtech.com . Получено 3 июня 2024 г.
^ Смит, Райан. «AMD анонсирует ускорители Radeon Instinct MI60 и MI50: на базе 7-нм Vega». www.anandtech.com . Получено 3 июня 2024 г.
^ Смит, Райан. «AMD выпускает ускоритель Instinct MI210: CDNA 2 на карте PCIe». www.anandtech.com . Получено 3 июня 2024 г.
^ Смит, Райан. «AMD анонсирует семейство ускорителей Instinct MI200: вывод серверов на уровень Exascale и выше». www.anandtech.com . Получено 3 июня 2024 г.
^ Боншор, Райан Смит, Гэвин. «Живой блог AMD Advancing AI & Instinct MI300 Launch (начало в 10:00 по тихоокеанскому времени/18:00 по всемирному координированному времени)». www.anandtech.com . Получено 3 июня 2024 г.{{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Смит, Райан. «AMD планирует выпуск массивной памяти Instinct MI325X на четвертый квартал 24 года, излагает дорожную карту ускорителей до 2026 года». www.anandtech.com . Получено 3 июня 2024 г.
^ WhyCry (12 декабря 2016 г.). "AMD анонсирует первый ускоритель VEGA: RADEON INSTINCT MI25 для глубокого обучения". VideoCardz . Получено 6 июня 2022 г. .
^ Mujtaba, Hassan (21 июня 2017 г.). «Подробные характеристики ускорителя AMD Radeon Instinct MI25 с 16 ГБ HBM2 — запуск сегодня вместе с Instinct MI8 и Instinct MI6». Wccftech . Получено 6 июня 2022 г. .
^ "Radeon Instinct MI6". Radeon Instinct . AMD . Получено 22 июня 2017 г. .^{[ постоянная мертвая ссылка ‍ ]}
^ "Radeon Instinct MI8". Radeon Instinct . AMD . Получено 22 июня 2017 г. .^{[ постоянная мертвая ссылка ‍ ]}
^ "Radeon Instinct MI25". Radeon Instinct . AMD . Получено 22 июня 2017 г. .^{[ постоянная мертвая ссылка ‍ ]}
^ "Архитектура AMD CDNA 3" (PDF) . Архитектура AMD CDNA . AMD . Получено 7 декабря 2023 г. .
^ "AMD INSTINCT MI300A APU" (PDF) . Ускорители AMD Instinct . AMD . Получено 7 декабря 2023 г. .
^ "AMD INSTINCT MI300X APU" (PDF) . Ускорители AMD Instinct . AMD . Получено 7 декабря 2023 г. .
^ ab Kampman, Jeff (12 декабря 2016 г.). "AMD открывает возможности машинного обучения с помощью Radeon Instinct". TechReport . Получено 12 декабря 2016 г. .
^ abc Smith, Ryan (12 декабря 2016 г.). "AMD анонсирует Radeon Instinct: GPU-ускорители для глубокого обучения, которые появятся в 2017 г.". AnandTech . Получено 12 декабря 2016 г. .
^ abc Shrout, Ryan (12 декабря 2016 г.). "Radeon Instinct Machine Learning GPUs включают Vega, Preview Performance". PCPerspective . Получено 12 декабря 2016 г. .
^ abc Kampman, Jeff (12 декабря 2016 г.). "AMD открывает возможности машинного обучения с помощью Radeon Instinct". Tech Report . Получено 12 декабря 2016 г. .
^ "Radeon Instinct MI6". AMD . Архивировано из оригинала 1 августа 2017 г. Получено 27 мая 2022 г.
^ "AMD Radeon Instinct MI6 Datasheet" (PDF) . usermanual.wiki . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI6 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ "Radeon Instinct MI8". AMD . Архивировано из оригинала 1 августа 2017 г. Получено 27 мая 2022 г.
^ "AMD Radeon Instinct MI8 Datasheet" (PDF) . usermanual.wiki . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI8 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ Смит, Райан (5 января 2017 г.). «Архитектурный тизер AMD Vega: более высокий IPC, тайлинг и многое другое в первой половине 2017 г.». AnandTech . Получено 10 января 2017 г. .
^ "Radeon Instinct MI25". AMD . Архивировано из оригинала 1 августа 2017 г. Получено 27 мая 2022 г.
^ "AMD Radeon Instinct MI25 Datasheet" (PDF) . AMD . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI25 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ Уолтон, Джарред (10 января 2019 г.). «Изучаем AMD Radeon VII». PC Gamer .
^ ab "Next Horizon – Презентация Дэвида Вана" (PDF) . AMD .
^ "AMD Radeon Instinct MI50 Accelerator (16GB)". AMD . Получено 24 декабря 2022 г. .
^ "AMD Radeon Instinct MI50 Accelerator (32GB)". AMD . Получено 24 декабря 2022 г. .
^ "AMD Radeon Instinct MI50 Datasheet" (PDF) . AMD . Получено 24 декабря 2022 г. .
^ "AMD Radeon Instinct MI50 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ "Radeon Instinct MI60". AMD . Архивировано из оригинала 22 ноября 2018 г. Получено 27 мая 2022 г.
^ "AMD Radeon Instinct MI60 Datasheet" (PDF) . AMD . Получено 24 декабря 2022 г. .
^ "AMD Radeon Instinct MI60 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ "AMD Instinct MI100 Accelerator". AMD . Получено 27 мая 2022 г. .
^ "AMD Instinct MI100 Accelerator Brochure" (PDF) . AMD . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI100 Specs". TechPowerUp . Получено 26 мая 2022 г. .
^ "AMD Instinct MI210 Accelerator". AMD . Получено 27 мая 2022 г. .
^ "AMD Instinct MI210 Accelerator Brochure" (PDF) . AMD . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI210 Specs". TechPowerUp . Получено 27 мая 2022 г. .
^ "AMD Instinct MI250 Accelerator". AMD . Получено 27 мая 2022 г. .
^ ab "Техническое описание ускорителя серии AMD Instinct MI200" (PDF) . AMD . Получено 24 декабря 2022 г. .
^ "AMD Radeon Instinct MI250 Specs". TechPowerUp . Получено 26 мая 2022 г. .
^ "AMD Instinct MI250X Accelerator". AMD . Получено 27 мая 2022 г. .
^ "AMD Radeon Instinct MI250X Specs". TechPowerUp . Получено 26 мая 2022 г. .
^ "AMD Instinct MI300A APU". AMD . Получено 12 декабря 2023 г. .
^ "AMD Instinct MI300A Series Accelerator Datasheet" (PDF) . AMD . Получено 12 декабря 2023 г. .
^ "AMD Radeon Instinct MI300 Specs". TechPowerUp . Получено 12 декабря 2023 г. .
^ "AMD-CDNA3-white-paper" (PDF) . AMD . Получено 12 декабря 2023 г. .
^ "AMD Instinct MI300X GPU". AMD . Получено 12 декабря 2023 г. .
^ "AMD Instinct MI300X Series Accelerator Datasheet" (PDF) . AMD . Получено 12 декабря 2023 г. .
^ "AMD Radeon Instinct MI300 Specs". TechPowerUp . Получено 12 декабря 2023 г. .
^ "AMD-CDNA3-white-paper" (PDF) . AMD . Получено 12 декабря 2023 г. .

Внешние ссылки

Веб-страница ускорителей AMD Instinct