stringtranslate.com

Графическое ядро ​​Next

Graphics Core Next ( GCN ) [1]кодовое название серии микроархитектур и архитектуры набора инструкций , разработанных AMD для своих графических процессоров в качестве преемника микроархитектуры TeraScale . Первый продукт с GCN был выпущен 9 января 2012 года. [2]

GCN — это микроархитектура SIMD с сокращенным набором команд , в отличие от архитектуры SIMD с очень длинными командными словами TeraScale. [3] GCN требует значительно больше транзисторов , чем TeraScale, но предлагает преимущества для вычислений на графических процессорах общего назначения (GPGPU) благодаря более простому компилятору .

Графические чипы GCN были изготовлены с использованием CMOS на 28 нм и с использованием FinFET на 14 нм ( Samsung Electronics и GlobalFoundries ) и 7 нм ( TSMC ), доступны в некоторых моделях видеокарт AMD серий Radeon HD 7000 , HD 8000 , 200 , 300 , 400 , 500 и Vega , включая отдельно выпущенную Radeon VII. GCN также использовался в графической части ускоренных процессоров (APU), в том числе в PlayStation 4 и Xbox One .

Набор инструкций

Набор инструкций GCN принадлежит AMD и был разработан специально для графических процессоров. В нем нет микрооперации для деления .

Документация доступна для:

Для набора инструкций GCN доступен бэкэнд компилятора LLVM . [5] Он используется Mesa 3D .

GNU Compiler Collection 9 поддерживает GCN 3 и GCN 5 с 2019 года [6] для однопоточных автономных программ, при этом GCC 10 также осуществляет разгрузку через OpenMP и OpenACC . [7]

MIAOW — это RTL- реализация микроархитектуры AMD Southern Islands GPGPU с открытым исходным кодом .

В ноябре 2015 года компания AMD объявила о своей инициативе Больцмана, которая направлена ​​на обеспечение возможности переноса приложений на базе CUDA на общую модель программирования C++ . [8]

На мероприятии Super Computing 15 компания AMD представила гетерогенный вычислительный компилятор (HCC), драйвер Linux без графического интерфейса и инфраструктуру среды выполнения HSA для высокопроизводительных вычислений кластерного класса, а также инструмент гетерогенного вычислительного интерфейса для переносимости (HIP) для переноса приложений CUDA на вышеупомянутую общую модель C++.

Микроархитектуры

По состоянию на июль 2017 года набор инструкций Graphics Core Next претерпел пять итераций. Различия между первыми четырьмя поколениями довольно минимальны, но архитектура GCN пятого поколения отличается сильно модифицированными потоковыми процессорами для повышения производительности и поддержки одновременной обработки двух чисел с меньшей точностью вместо одного числа с большей точностью. [9]

Обработка команд

Обработка команд GCN: каждый асинхронный вычислительный движок (ACE) может анализировать входящие команды и отправлять работу вычислительным блокам (CU). Каждый ACE может управлять до 8 независимыми очередями. ACE могут работать параллельно с графическим командным процессором и двумя движками DMA. Графический командный процессор обрабатывает графические очереди, ACE обрабатывает вычислительные очереди, а движки DMA обрабатывают очереди копирования. Каждая очередь может отправлять рабочие элементы, не дожидаясь завершения других задач, что позволяет чередовать независимые потоки команд в шейдере графического процессора.

Графический командный процессор

Графический командный процессор (GCP) — это функциональная единица микроархитектуры GCN. Среди прочих задач он отвечает за обработку асинхронных шейдеров . [10]

Асинхронный вычислительный движок

Асинхронный вычислительный модуль (ACE) — это отдельный функциональный блок, служащий для вычислительных целей, назначение которого аналогично назначению графического командного процессора. [ неоднозначно ]

Планировщики

Начиная с третьей итерации GCN, оборудование содержит два планировщика : один для планирования «волновых фронтов» во время выполнения шейдера (CU Scheduler или Compute Unit Scheduler), а другой для планирования выполнения очередей отрисовки и вычислений. Последний повышает производительность, выполняя вычислительные операции, когда вычислительные блоки (CU) недоиспользуются из-за графических команд, ограниченных фиксированной скоростью конвейера функций или пропускной способностью. Эта функциональность известна как Async Compute.

Для определенного шейдера драйверы графического процессора также могут планировать инструкции на центральном процессоре, чтобы минимизировать задержку.

Геометрический процессор

Геометрический процессор

Геометрический процессор содержит сборщик геометрии, тесселятор и сборщик вершин.

Tesselator способен выполнять тесселяцию на аппаратном уровне, как определено Direct3D 11 и OpenGL 4.5 (см. AMD 21 января 2017 г.) [11] , и пришел на смену ATI TruForm и аппаратной тесселяции в TeraScale как новейшему на тот момент ядру полупроводниковой интеллектуальной собственности AMD .

Вычислительные единицы

Один вычислительный блок (CU) объединяет 64 шейдерных процессора с 4 блоками отображения текстур (TMU). [12] [13] Вычислительные блоки отделены от блоков вывода рендеринга (ROP), но в них вводятся данные. [13] Каждый вычислительный блок состоит из следующих элементов:

Четыре вычислительных блока соединены для совместного использования кэша инструкций L1 объемом 16 КБ и кэша данных L1 объемом 32 КБ, оба из которых доступны только для чтения. SIMD-VU работает с 16 элементами одновременно (за цикл), в то время как SU может работать с одним элементом за раз (один/цикл). Кроме того, SU обрабатывает некоторые другие операции, такие как ветвление. [15]

Каждый SIMD-VU имеет некоторую личную память, где он хранит свои регистры. Существует два типа регистров: скалярные регистры (S0, S1 и т. д.), которые содержат 4-байтовые числа каждый, и векторные регистры (V0, V1 и т. д.), каждый из которых представляет собой набор из 64 4-байтовых чисел. В векторных регистрах каждая операция выполняется параллельно над 64 числами, которые соответствуют 64 входам. Например, он может работать с 64 различными пикселями одновременно (для каждого из них входы немного отличаются, и поэтому вы получаете немного другой цвет в конце).

Каждый SIMD-VU имеет место для 512 скалярных регистров и 256 векторных регистров.

AMD утверждает, что каждый вычислительный блок GCN (CU) имеет 64 КиБ локального общего доступа к данным (LDS). [16]

Планировщик CU

Планировщик CU — это аппаратный функциональный блок, выбирающий, какие волновые фронты выполняет SIMD-VU. Он выбирает один SIMD-VU на цикл для планирования. Его не следует путать с другими аппаратными или программными планировщиками.

Фронт волны

Шейдер — это небольшая программа, написанная на GLSL , которая выполняет обработку графики, а ядро ​​— это небольшая программа, написанная на OpenCL , которая выполняет обработку GPGPU. Этим процессам не нужно так много регистров, но им нужно загружать данные из системной или графической памяти. Эта операция сопровождается значительной задержкой. AMD и Nvidia выбрали схожие подходы, чтобы скрыть эту неизбежную задержку: группировку нескольких потоков . AMD называет такую ​​группу «волновым фронтом», тогда как Nvidia называет ее «варпом». Группа потоков — это самая базовая единица планирования графических процессоров, которые реализуют этот подход для сокрытия задержки. Это минимальный размер данных, обрабатываемых в стиле SIMD, наименьшая исполняемая единица кода и способ обработки одной инструкции по всем потокам в ней одновременно.

Во всех графических процессорах GCN «волновой фронт» состоит из 64 потоков, а во всех графических процессорах Nvidia «варп» состоит из 32 потоков.

Решение AMD заключается в том, чтобы приписать несколько волновых фронтов каждому SIMD-VU. Аппаратное обеспечение распределяет регистры по разным волновым фронтам, и когда один волновой фронт ожидает некоторого результата, который находится в памяти, планировщик CU назначает SIMD-VU другой волновой фронт. Волновые фронты приписываются к каждому SIMD-VU. SIMD-VU не обмениваются волновыми фронтами. Максимально 10 волновых фронтов могут быть приписаны к одному SIMD-VU (таким образом, 40 на CU).

AMD CodeXL показывает таблицы с соотношением количества SGPR и VGPR к количеству волновых фронтов, но по сути для SGPRS оно составляет от 104 до 512 на количество волновых фронтов, а для VGPRS — 256 на количество волновых фронтов.

Обратите внимание, что в сочетании с инструкциями SSE эта концепция самого базового уровня параллелизма часто называется «шириной вектора». Ширина вектора характеризуется общим числом бит в нем.

Векторный блок SIMD

Каждый векторный блок SIMD имеет:

Каждый SIMD-VU имеет 10 буферов инструкций волнового фронта, и для выполнения одного волнового фронта требуется 4 цикла.

Блоки ускорения аудио и видео

Многие реализации GCN обычно сопровождаются несколькими другими блоками ASIC от AMD . Включая, но не ограничиваясь, Unified Video Decoder , Video Coding Engine и AMD TrueAudio .

Механизм кодирования видео

Video Coding Engine — это специализированная интегральная схема кодирования видео , впервые представленная в серии Radeon HD 7000. [ 17]

Первоначальная версия VCE добавила поддержку кодирования I- и P-кадров H.264 в формате пикселей YUV420 , а также временное кодирование SVE и режим кодирования дисплея, тогда как во второй версии была добавлена ​​поддержка B-кадров для I-кадров YUV420 и YUV444.

VCE 3.0 стал частью третьего поколения GCN, добавив высококачественное масштабирование видео и кодек HEVC (H.265).

VCE 4.0 был частью архитектуры Vega и впоследствии был заменен на Video Core Next .

TrueAudio

Единая виртуальная память

В предварительном обзоре 2011 года AnandTech писал об унифицированной виртуальной памяти, поддерживаемой Graphics Core Next. [18]

Гетерогенная системная архитектура (HSA)

GCN включает в себя специальные функциональные блоки, которые будут использоваться HSA. Поддержка этих функциональных блоков доступна через amdkfd, начиная с ядра Linux 3.19. [20]

Некоторые из конкретных функций HSA , реализованных в оборудовании, требуют поддержки со стороны ядра операционной системы (ее подсистем) и/или со стороны определенных драйверов устройств. Например, в июле 2014 года AMD опубликовала набор из 83 исправлений для объединения в ядро ​​Linux mainline 3.17 для поддержки своих графических карт Radeon на базе Graphics Core Next . Так называемый драйвер ядра HSA находится в каталоге /drivers/gpu/hsa , в то время как драйверы графических устройств DRM находятся в /drivers/gpu/drm [21] и дополняют уже существующие драйверы DRM для карт Radeon. [22] Эта самая первая реализация фокусируется на одном APU «Kaveri» и работает вместе с существующим графическим драйвером ядра Radeon (kgd).

Сжатие цветов Delta без потерь

Аппаратные планировщики

Аппаратные планировщики используются для выполнения планирования [23] и разгрузки назначения вычислительных очередей в ACE с драйвера на оборудование, буферизируя эти очереди до тех пор, пока не будет хотя бы одной пустой очереди в хотя бы одной ACE. Это заставляет HWS немедленно назначать буферизованные очереди в ACE до тех пор, пока все очереди не будут заполнены или пока не останется очередей для безопасного назначения. [24]

Часть выполняемой работы по планированию включает в себя приоритетные очереди, которые позволяют критическим задачам выполняться с более высоким приоритетом, чем другие задачи, не требуя вытеснения задач с более низким приоритетом для выполнения задачи с высоким приоритетом, тем самым позволяя задачам выполняться одновременно с задачами с высоким приоритетом, запланированными для максимального использования графического процессора, в то же время позволяя другим задачам использовать ресурсы, которые не используются задачами с высоким приоритетом. [23] По сути, это асинхронные вычислительные машины, в которых отсутствуют диспетчерские контроллеры. [23] Они были впервые представлены в микроархитектуре GCN четвертого поколения, [23] но присутствовали в микроархитектуре GCN третьего поколения для целей внутреннего тестирования. [25] Обновление драйвера позволило использовать аппаратные планировщики в частях GCN третьего поколения для производственного использования. [23]

Примитивный ускоритель сброса

Этот блок отбрасывает вырожденные треугольники до того, как они попадут в вершинный шейдер, и треугольники, которые не покрывают никаких фрагментов, до того, как они попадут в фрагментный шейдер. [26] Этот блок был представлен в четвертом поколении микроархитектуры GCN. [26]

Поколения

Графическое ядро ​​Next 1

Микроархитектура GCN 1 использовалась в нескольких видеокартах серии Radeon HD 7000 .

Снимок кристалла графического процессора Tahiti, используемого в видеокартах Radeon HD 7950 GHz Edition

Существуют асинхронные вычислительные машины, управляющие вычислениями и диспетчеризацией. [15] [30]

ZeroCore Мощность

ZeroCore Power — это технология энергосбережения при длительном простое, которая отключает функциональные блоки графического процессора, когда они не используются. [31] Технология AMD ZeroCore Power дополняет AMD PowerTune .

Чипсы

Дискретные графические процессоры (семейство Southern Islands):

Графическое ядро ​​Next 2

AMD PowerTune "Бонейр"
Снимок кристалла графического процессора Hawaii, используемого в видеокартах Radeon R9 290

Второе поколение GCN было представлено с Radeon HD 7790 и также встречается в Radeon HD 8770 , R7 260/260X, R9 290/290X, R9 295X2 , R7 360 и R9 390/390X , а также в настольных APU "Kaveri" на базе Steamroller и мобильных APU "Kaveri" , а также в APU "Beema" и "Mullins" на базе Puma . Он имеет множество преимуществ по сравнению с оригинальным GCN, включая поддержку FreeSync , AMD TrueAudio и обновленную версию технологии AMD PowerTune .

GCN 2-го поколения представил сущность под названием "Shader Engine" (SE). Shader Engine включает в себя один геометрический процессор, до 44 CU (чип Hawaii), растеризаторы, ROP и кэш L1. Частью Shader Engine не являются графический командный процессор, 8 ACE, кэш L2 и контроллеры памяти, а также аудио- и видеоускорители, контроллеры дисплея, 2 контроллера DMA и интерфейс PCIe .

A10-7850K «Kaveri» содержит 8 вычислительных блоков (CU) и 8 асинхронных вычислительных модулей для независимого планирования и распределения рабочих элементов. [32]

На саммите разработчиков AMD (APU) в ноябре 2013 года Майкл Мантор представил Radeon R9 290X . [33]

Чипсы

Дискретные графические процессоры (семейство Sea Islands):

интегрированы в ВСУ:

Графическое ядро ​​Next 3

Снимок кристалла графического процессора Fiji, используемого в видеокартах Radeon R9 Nano

GCN 3-го поколения [34] был представлен в 2014 году с Radeon R9 285 и R9 M295X, которые имеют графический процессор "Tonga". Он отличается улучшенной производительностью тесселяции, компрессией цвета без потерь для снижения использования полосы пропускания памяти, обновленным и более эффективным набором инструкций, новым высококачественным масштабатором для видео, кодированием HEVC (VCE 3.0) и декодированием HEVC (UVD 6.0), а также новым мультимедийным движком (видеокодер/декодер). Сжатие цвета дельта поддерживается в Mesa. [35] Однако его производительность двойной точности хуже по сравнению с предыдущим поколением. [36]

Чипсы

Дискретные графические процессоры:

интегрированы в ВСУ:

Графическое ядро ​​Next 4

Снимок кристалла графического процессора Polaris 11, используемого в видеокартах Radeon RX 460
Снимок кристалла графического процессора Polaris 10, используемого в видеокартах Radeon RX 470

Графические процессоры семейства Arctic Islands были представлены во втором квартале 2016 года с серией AMD Radeon 400. 3D-движок (т. е. GCA (Graphics and Compute array) или GFX) идентичен тому, что используется в чипах Tonga. [38] Но Polaris оснащены более новым движком Display Controller, UVD версии 6.3 и т. д.

Все чипы на базе Polaris, кроме Polaris 30, производятся по 14-нм техпроцессу FinFET , разработанному Samsung Electronics и лицензированному GlobalFoundries . [39] Немного более новый обновленный Polaris 30 построен на 12-нм техпроцессе LP FinFET, разработанном Samsung и GlobalFoundries. Архитектура набора инструкций GCN четвертого поколения совместима с третьим поколением. Это оптимизация для 14-нм техпроцесса FinFET, обеспечивающая более высокие тактовые частоты GPU, чем в 3-м поколении GCN. [40] Архитектурные улучшения включают новые аппаратные планировщики, новый примитивный ускоритель сброса, новый контроллер дисплея и обновленный UVD, который может декодировать HEVC с разрешением 4K при 60 кадрах в секунду с 10 битами на цветовой канал.

Чипсы

Дискретные графические процессоры: [41]

Помимо специализированных графических процессоров, Polaris используется в APU PlayStation 4 Pro и Xbox One X, называемых «Neo» и «Scorpio» соответственно.

Точность исполнения

Производительность FP64 всех графических процессоров GCN 4-го поколения составляет 1/16 от производительности FP32.

Графическое ядро ​​Next 5

Снимок кристалла графического процессора Vega 10, используемого в видеокартах Radeon RX Vega 64

AMD начала публиковать подробности о следующем поколении архитектуры GCN, названной «Next-Generation Compute Unit», в январе 2017 года. [40] [45] [46] Ожидалось, что новый дизайн увеличит количество инструкций за такт , более высокие тактовые частоты , поддержку HBM2 , большее адресное пространство памяти . Дискретные графические чипсеты также включают «HBCC (High Bandwidth Cache Controller)», но не при интеграции в APU. [47] Кроме того, ожидалось, что новые чипы будут включать улучшения в выходных блоках растеризации и рендеринга . Потоковые процессоры сильно модифицированы по сравнению с предыдущими поколениями для поддержки упакованной математической технологии Rapid Pack Math для 8-битных, 16-битных и 32-битных чисел. Благодаря этому достигается значительное преимущество в производительности, когда приемлема более низкая точность (например: обработка двух чисел половинной точности с той же скоростью, что и одного числа одинарной точности ).

Nvidia представила растеризацию на основе плиток и биннинг с Maxwell , [48] и это стало большой причиной повышения эффективности Maxwell. В январе AnandTech предположил, что Vega наконец догонит Nvidia в отношении оптимизации энергоэффективности благодаря новому "DSBR (Draw Stream Binning Rasterizer)", который будет представлен с Vega. [49]

Также добавлена ​​поддержка нового этапа шейдера – Primitive Shaders. [50] [51] Primitive Shaders обеспечивают более гибкую обработку геометрии и заменяют вершинные и геометрические шейдеры в конвейере рендеринга. По состоянию на декабрь 2018 года Primitive Shaders не могут использоваться, поскольку требуемые изменения API еще не сделаны. [52]

Vega 10 и Vega 12 используют 14 нм процесс FinFET , разработанный Samsung Electronics и лицензированный GlobalFoundries . Vega 20 использует 7 нм процесс FinFET, разработанный TSMC .

Чипсы

Дискретные графические процессоры:

интегрированы в ВСУ:

Точность исполнения

Производительность всех графических процессоров GCN 5-го поколения с плавающей точкой двойной точности (FP64) , за исключением Vega 20, составляет одну шестнадцатую производительности FP32. Для Vega 20 с Radeon Instinct это половина производительности FP32. Для Vega 20 с Radeon VII это четверть производительности FP32. [59] Все графические процессоры GCN 5-го поколения поддерживают вычисления с плавающей точкой половинной точности (FP16), что вдвое превышает производительность FP32.

Сравнение графических процессоров GCN

1 Старые кодовые названия, такие как Treasure (Lexa) или Hawaii Refresh (Ellesmere), не указаны.
2 Первоначальная дата запуска. Даты запуска вариантов чипов, таких как Polaris 20 (апрель 2017 г.), не указаны.

Смотрите также

Внешние ссылки

Ссылки

  1. ^ AMD Developer Central (31 января 2014 г.). «GS-4106 Архитектура AMD GCN – краткий курс, автор Лейла Мах». Slideshare.net .
  2. ^ "AMD запускает самую быструю в мире одночиповую видеокарту – AMD Radeon HD 7970" (пресс-релиз). AMD. 22 декабря 2011 г. Архивировано из оригинала 20 января 2015 г. Получено 20 января 2015 г.
  3. ^ Gulati, Abheek (11 ноября 2019 г.). «Глубокое архитектурное погружение в архитектуры AMD TeraScale, GCN и RDNA GPU». Medium . Получено 12 декабря 2021 г. .
  4. ^ "Форумы сообщества AMD". Community.amd.com . 15 июля 2016 г.
  5. ^ "LLVM back-end amdgpu". Llvm.org .
  6. ^ "GCC 9 Release Series Changes, New Features, and Fixes" . Получено 13 ноября 2019 г. .
  7. ^ "AMD GCN Offloading Support" . Получено 13 ноября 2019 г. .
  8. ^ "AMD Boltzmann Initiative – Heterogeneous-compute Interface for Portability (HIP)". 16 ноября 2015 г. Архивировано из оригинала 26 января 2016 г. Получено 8 декабря 2019 г.
  9. ^ Смит, Райан (5 января 2017 г.). «Предварительный обзор архитектуры AMD Vega GPU». Anandtech.com . Получено 11 июля 2017 г. .
  10. ^ Смит, Райан. «AMD глубоко погружается в асинхронное затенение». Anandtech.com .
  11. ^ "Conformant Products". Khronos.org . 26 октября 2017 г.
  12. ^ Вычислительные ядра Белая книга (PDF) . AMD. 2014. стр. 5.
  13. ^ ab Smith, Ryan (21 декабря 2011 г.). "AMD's Graphics Core Next Preview". Anandtech.com . Получено 18 апреля 2017 г. .
  14. ^ "Архитектура AMD Graphics Core Next (GCN)" (PDF) . TechPowerUp . Получено 26 февраля 2024 г. .
  15. ^ ab Mantor, Michael; Houston, Mike (15 июня 2011 г.). "AMD Graphics Core Next" (PDF) . AMD . стр. 40 . Получено 15 июля 2014 г. . Asynchronous Compute Engine (ACE)
  16. ^ «Оптимизация загрузки и использования ресурсов графического процессора с большими группами потоков». AMD GPUOpen . Получено 1 января 2024 г.
  17. ^ "White Paper AMD UnifiedVideoDecoder (UVD)" (PDF) . 15 июня 2012 г. . Получено 20 мая 2017 г. .
  18. ^ ab "Не просто новая архитектура, но и новые возможности". AnandTech . 21 декабря 2011 г. Получено 11 июля 2014 г.
  19. ^ "Микроархитектура Kaveri". SemiAccurate . 15 января 2014 г.
  20. Airlie, Dave (26 ноября 2014 г.). «Объединить AMDKFD». freedesktop.org . Получено 21 января 2015 г. .
  21. ^ "/drivers/gpu/drm". Kernel.org .
  22. ^ "[PATCH 00/83] Драйвер ядра AMD HSA". LKML . 10 июля 2014 г. . Получено 11 июля 2014 г. .
  23. ^ abcde Анджелини, Крис (29 июня 2016 г.). "Обзор AMD Radeon RX 480 8 ГБ". Tom's Hardware . стр. 1 . Получено 11 августа 2016 г. .
  24. ^ "Dissecting the Polaris Architecture" (PDF) . 2016. Архивировано из оригинала (PDF) 20 сентября 2016 г. Получено 12 августа 2016 г.
  25. Shrout, Ryan (29 июня 2016 г.). «Обзор AMD Radeon RX 480 – обещание Polaris». PC Perspective . стр. 2. Архивировано из оригинала 10 октября 2016 г. Получено 12 августа 2016 г.
  26. ^ ab Smith, Ryan (29 июня 2016 г.). «AMD Radeon RX 480 Preview: Polaris Makes Its Mainstream Mark». AnandTech . стр. 3 . Получено 11 августа 2016 г. .
  27. ^ "AMD Radeon HD 7000 Series to be PCI-Express 3.0 Compliant". TechPowerUp . Получено 21 июля 2011 г. .
  28. ^ "AMD Details Next Gen. GPU Architecture" . Получено 3 августа 2011 г. .
  29. Тони Чен; Джейсон Гривз, «Архитектура AMD Graphics Core Next (GCN)» (PDF) , AMD , заархивировано из оригинала (PDF) 18 января 2023 г. , извлечено 13 августа 2016 г.
  30. ^ "AMD's Graphics Core Next Preview: AMD's New GPU, Architected For Compute". AnandTech . 21 декабря 2011 г. Получено 15 июля 2014 г. Новые асинхронные вычислительные движки AMD служат командными процессорами для вычислительных операций в GCN. Основной целью ACE будет принятие работы и отправка ее в CU для обработки.
  31. ^ «Управление питанием в режиме ожидания: знакомство с ZeroCore Power». AnandTech.com . 22 декабря 2011 г. Получено 29 апреля 2015 г.
  32. ^ "AMD Kaveri A10-7850K протестирован". AnandTech . 14 января 2014 г. Получено 7 июля 2014 г.
  33. ^ "AMD Radeon R9-290X". 21 ноября 2013 г.
  34. ^ "Carrizo Overview" (PNG) . Images.anandtech.com . Получено 20 июля 2018 г. .
  35. ^ "Добавить поддержку DCC". Freedesktop.org . 11 октября 2015 г.
  36. ^ Смит, Райан (10 сентября 2014 г.). "Обзор AMD Radeon R9 285". Anandtech.com . Получено 13 марта 2017 г. .
  37. ^ ab Cutress, Ian (1 июня 2016 г.). "AMD Announces 7th Generation APU". Anandtech.com . Получено 1 июня 2016 г. .
  38. ^ "RadeonFeature". www.x.org .
  39. ^ "Radeon Technologies Group – Январь 2016 г. – Архитектура AMD Polaris". Guru3d.com .
  40. ^ ab Smith, Ryan (5 января 2017 г.). «Архитектурный тизер AMD Vega: более высокий IPC, тайлинг и многое другое в первой половине 2017 г.». Anandtech.com . Получено 10 января 2017 г. .
  41. WhyCry (24 марта 2016 г.). «AMD подтверждает, что Polaris 10 — это Элсмир, а Polaris 11 — Баффин». VideoCardz . Получено 8 апреля 2016 г.
  42. ^ "Быстрая информация об аппаратном обеспечении AMD Radeon RX 500 серии" . www.3dcenter.org .
  43. ^ "AMD Polaris 23". TechPowerUp . Получено 12 мая 2022 г. .
  44. О, Нейт (15 ноября 2018 г.). «Обзор AMD Radeon RX 590 с участием XFX и PowerColor: Polaris возвращается (снова)». anandtech.com . Получено 24 ноября 2018 г.
  45. ^ Кампман, Джефф (5 января 2017 г.). «Архитектура Vega от AMD раскрывается». TechReport.com . Получено 10 января 2017 г.
  46. Shrout, Ryan (5 января 2017 г.). «AMD Vega GPU Architecture Preview: Redesigned Memory Architecture». PC Perspective . Получено 10 января 2017 г.
  47. ^ Кампман, Джефф (26 октября 2017 г.). «AMD Ryzen 7 2700U и Ryzen 5 2500U APUs reveal». Techreport.com . Получено 26 октября 2017 г. .
  48. ^ Raevenlord (1 марта 2017 г.). «О рендеринге на основе тайлов от NVIDIA». techPowerUp .
  49. ^ "Vega Teaser: растеризатор Draw Stream Binning". Anandtech.com .
  50. ^ "Radeon RX Vega раскрыта: AMD обещает производительность в играх в разрешении 4K за 499 долларов – Trusted Reviews". Trustedreviews.com . 31 июля 2017 г. Архивировано из оригинала 14 июля 2017 г. Получено 20 марта 2017 г.
  51. ^ "Архитектура AMD Vega раскрывается". Techreport.com . Архивировано из оригинала 1 сентября 2017 г. . Получено 20 марта 2017 г. .
  52. ^ Кампман, Джефф (23 января 2018 г.). «Примитивным шейдерам Radeon RX Vega потребуется поддержка API». Techreport.com . Получено 29 декабря 2018 г. .
  53. ^ "ROCm-OpenCL-Runtime/libUtils.cpp в главном · RadeonOpenCompute/ROCm-OpenCL-Runtime". github.com . 3 мая 2017 г. . Получено 10 ноября 2018 г. .
  54. ^ "Обзор AMD Radeon RX Vega 64 и RX Vega 56: Vega Burning Bright". Anandtech.com . 14 августа 2017 г. . Получено 16 ноября 2017 г. .
  55. ^ "AMD Vega Mobile Lives: Vega Pro 20 и 16 в обновленных MacBook Pro в ноябре". Anandtech.com . 30 октября 2018 г. . Получено 10 ноября 2018 г. .
  56. ^ "AMD анонсирует ускорители Radeon Instinct MI60 и MI50: на базе 7-нм Vega". Anandtech.com . 6 ноября 2018 г. . Получено 10 ноября 2018 г. .
  57. ^ "AMD представляет первый в мире игровой графический процессор 7 нм — обеспечивающий исключительную производительность и невероятные впечатления для геймеров, создателей и энтузиастов" (пресс-релиз). Лас-Вегас, Невада: AMD. 9 января 2019 г. Получено 12 января 2019 г.
  58. ^ Феррейра, Бруно (16 мая 2017 г.). «Мобильные APU Ryzen появятся на ноутбуках рядом с вами». Tech Report . Получено 16 мая 2017 г.
  59. ^ "AMD представляет первые в мире 7-нм графические процессоры для центров обработки данных — основа новой эры искусственного интеллекта, облачных вычислений и высокопроизводительных вычислений (HPC) | AMD". AMD.com (пресс-релиз). 6 ноября 2018 г. Получено 10 ноября 2018 г.
  60. ^ "RadeonFeature". x.Org . Получено 21 ноября 2022 г. .
  61. ^ "AMD Tahiti GPU Specs". TechPowerUp . Получено 20 ноября 2022 г. .
  62. ^ "AMD Pitcairn GPU Specs". TechPowerUp . Получено 20 ноября 2022 г. .
  63. ^ "AMD Cape Verde GPU Specs". TechPowerUp . Получено 20 ноября 2022 г. .
  64. ^ "AMD Oland GPU Specs". TechPowerUp . Получено 20 ноября 2022 г. .
  65. ^ "AMD Hainan GPU Specs". TechPowerUp . Получено 20 ноября 2022 г. .
  66. ^ "AMD Bonaire GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  67. ^ "AMD Hawaii GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  68. ^ "AMD Topaz GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  69. ^ "AMD Tonga GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  70. ^ "AMD Fiji GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  71. ^ "AMD Ellesmere GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  72. ^ "AMD Baffin GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  73. ^ "AMD Lexa GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  74. ^ "AMD Vega 10 GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  75. ^ "AMD Vega 12 GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .
  76. ^ "AMD Vega 20 GPU Specs". TechPowerUp . Получено 21 ноября 2022 г. .