AMD FireStream — торговая марка AMD для линейки продуктов на базе Radeon , ориентированной на потоковую обработку и/или GPGPU в суперкомпьютерах . Первоначально разработанная ATI Technologies вокруг Radeon X1900 XTX в 2006 году, линейка продуктов ранее называлась как ATI FireSTREAM и AMD Stream Processor . [1] AMD FireStream также может использоваться в качестве сопроцессора с плавающей точкой для разгрузки вычислений CPU, что является частью инициативы Torrenza . Линейка FireStream была прекращена с 2012 года, когда рабочие нагрузки GPGPU были полностью свернуты в линейку AMD FirePro .
Линейка FireStream представляет собой серию дополнительных карт расширения , выпущенных с 2006 по 2010 год, основанных на стандартных графических процессорах Radeon, но разработанных для работы в качестве сопроцессора общего назначения , а не для рендеринга и вывода 3D-графики. Как и линейка FireGL/FirePro , они получили больше памяти и пропускной способности памяти, но карты FireStream не обязательно имеют порты видеовыхода. Все поддерживают 32-битную одинарную точность с плавающей точкой , и все, кроме первого выпуска, поддерживают 64-битную двойную точность . Линейка была объединена с новыми API для обеспечения более высокой производительности, чем могли обеспечить существующие API шейдеров OpenGL и Direct3D , начиная с Close to Metal , за которым последовали OpenCL и Stream Computing SDK, и в конечном итоге интегрирована в APP SDK .
Для высокопараллельных математических рабочих нагрузок с плавающей точкой карты могут ускорить большие вычисления более чем в 10 раз; Folding@Home, самый ранний и один из самых заметных пользователей GPGPU, получил в 20-40 раз большую производительность ЦП. [2] Каждый пиксельный и вершинный шейдер или унифицированный шейдер в более поздних моделях может выполнять произвольные вычисления с плавающей точкой.
После выпуска ядер графических процессоров Radeon R520 и GeForce G70 с программируемыми шейдерами большая пропускная способность с плавающей точкой привлекла внимание академических и коммерческих групп, экспериментировавших с их использованием для неграфической работы. Интерес привел к тому, что ATI (и Nvidia ) создали продукты GPGPU — способные вычислять математические формулы общего назначения в массовом параллельном режиме — для обработки тяжелых вычислений, традиционно выполняемых на центральных процессорах и специализированных математических сопроцессорах с плавающей точкой . Предполагалось, что GPGPU будут иметь немедленный прирост производительности в 10 раз или более по сравнению с современными многосокетными вычислениями только на центральном процессоре.
С почти завершенной разработкой высокопроизводительного X1900 XFX, ATI основала на нем свой первый дизайн потокового процессора, объявив его как предстоящий ATI FireSTREAM вместе с новым API Close to Metal на SIGGRAPH 2006. [3] Само ядро в основном не изменилось, за исключением удвоения встроенной памяти и пропускной способности, аналогично FireGL V7350 ; новый драйвер и поддержка программного обеспечения составили большую часть разницы. Folding@home начала использовать X1900 для общих вычислений, используя предварительную версию драйвера ATI Catalyst версии 6.5, и сообщила об улучшении производительности GPU по сравнению с CPU в 20-40 раз. [2] Первый продукт был выпущен в конце 2006 года и был переименован в AMD Stream Processor после слияния с AMD. [4]
Бренд стал AMD FireStream со вторым поколением потоковых процессоров в 2007 году, основанным на чипе RV650 с новыми унифицированными шейдерами и поддержкой двойной точности. [5] Асинхронный DMA также повысил производительность, позволяя использовать больший пул памяти без помощи ЦП. Была выпущена одна модель, 9170, по начальной цене 1999 долларов. Планы включали разработку потокового процессора на модуле MXM к 2008 году для ноутбуков, [6] но он так и не был выпущен.
Третье поколение быстро последовало в 2008 году с существенным улучшением производительности ядра RV770; 9250 имел почти вдвое большую производительность, чем 9170, и стал первым однокристальным процессором терафлоп , несмотря на снижение цены до менее 1000 долларов. [7] Вскоре после этого был выпущен более быстрый собрат, 9270, по цене 1999 долларов.
В 2010 году вышло последнее поколение FireStreams, карты 9350 и 9370, основанные на чипе Cypress, представленном в HD 5800. Это поколение снова удвоило производительность по сравнению с предыдущим, до 2 терафлопс в 9350 и 2,6 терафлопс в 9370, [8] и было первым поколением, созданным с нуля для OpenCL . Это поколение также было единственным, которое имело полностью пассивное охлаждение, а активное охлаждение было недоступно.
Поколения Northern и Southern Islands были пропущены, и в 2012 году AMD объявила, что новые серии FirePro W (рабочая станция) и S (сервер), основанные на новой архитектуре Graphics Core Next, заменят карты FireStream. [9]
AMD FireStream был запущен с широким спектром поддержки программных платформ. Одной из поддерживающих фирм была PeakStream (приобретенная Google в июне 2007 года), которая первой предоставила открытую бета- версию программного обеспечения для поддержки CTM и AMD FireStream, а также процессоров x86 и Cell (Cell Broadband Engine). Было заявлено, что FireStream в типичных приложениях работает в 20 раз быстрее, чем обычные процессоры после запуска программного обеспечения PeakStream [ необходима цитата ] . RapidMind также предоставила программное обеспечение для потоковой обработки, которое работало с ATI и NVIDIA, а также с процессорами Cell. [19]
После отказа от недолговечного API Close to Metal , AMD сосредоточилась на OpenCL . AMD впервые выпустила свой Stream Computing SDK (v1.0) в декабре 2007 года в рамках AMD EULA для работы на Windows XP . [19] SDK включает в себя «Brook+», аппаратно оптимизированную версию языка Brook , разработанную Стэнфордским университетом, который сам по себе является вариантом ANSI C ( язык C ), с открытым исходным кодом и оптимизированную для потоковых вычислений. Также будут включены AMD Core Math Library (ACML) и AMD Performance Library (APL) с оптимизацией для AMD FireStream и видеобиблиотеки COBRA (далее переименованной в «Accelerated Video Transcoding» или AVT) для ускорения транскодирования видео . Другая важная часть SDK, Compute Abstraction Layer (CAL), представляет собой уровень разработки программного обеспечения, предназначенный для низкоуровневого доступа через аппаратный интерфейс CTM к архитектуре графического процессора для программного обеспечения настройки производительности, написанного на различных языках программирования высокого уровня .
В августе 2011 года AMD выпустила версию 2.5 ATI APP Software Development Kit, [19] которая включает поддержку OpenCL 1.1 , параллельного языка вычислений , разработанного Khronos Group . Концепция вычислительных шейдеров , официально называемая DirectCompute, в API следующего поколения Microsoft , называемом DirectX 11, уже включена в графические драйверы с поддержкой DirectX 11.
Согласно продемонстрированной AMD системе [20] с двумя двухъядерными процессорами AMD Opteron и двумя ядрами графического процессора Radeon R600, работающими на Microsoft Windows XP Professional , 1 терафлоп (TFLOPS) может быть достигнут с помощью универсального умножения-сложения (MADD). Для сравнения, процессор Intel Core 2 Quad Q9650 3.0 GHz в то время мог достичь 48 GFLOPS. [21]
В ходе демонстрации антивирусного сканирования Kaspersky SafeStream, оптимизированного для потоковых процессоров AMD, в 2007 году удалось выполнить сканирование в 21 раз быстрее с ускорением на базе R670, чем при поиске, полностью запущенном на Opteron. [22]
{{cite news}}
: CS1 maint: неподходящий URL ( ссылка ){{cite news}}
: CS1 maint: неподходящий URL ( ссылка )