Микроархитектура графического процессора от Nvidia
Ampere — кодовое название микроархитектуры графического процессора (GPU), разработанной Nvidia в качестве преемника архитектур Volta и Turing . Она была официально анонсирована 14 мая 2020 года и названа в честь французского математика и физика Андре-Мари Ампера . [1] [2]
Nvidia анонсировала потребительские графические процессоры GeForce 30-й серии с архитектурой Ampere на специальном мероприятии GeForce 1 сентября 2020 года. [3] [4] Nvidia анонсировала графический процессор A100 80 ГБ на SC20 16 ноября 2020 года. [5] Мобильные видеокарты RTX и RTX 3060 на базе архитектуры Ampere были представлены 12 января 2021 года. [6]
Nvidia анонсировала преемника Ampere, Hopper , на GTC 2022 и «Ampere Next Next» ( Blackwell ), выпуск которого запланирован на 2024 год, на конференции GPU Technology Conference 2021.
Подробности
Архитектурные усовершенствования архитектуры Ampere включают в себя следующее:
- CUDA Compute Capability 8.0 для A100 и 8.6 для серии GeForce 30 [7]
- 7 нм процесс FinFET от TSMC для A100
- Специальная версия 8-нм техпроцесса Samsung (8N) для серии GeForce 30 [8]
- Третье поколение тензорных ядер с поддержкой FP16, bfloat16 , TensorFloat-32 (TF32) и FP64 и ускорением разреженности. [9] Отдельные тензорные ядра имеют 256 операций FP16 FMA за такт, что в 4 раза больше вычислительной мощности (только GA100, в 2 раза больше на GA10x) по сравнению с предыдущими поколениями тензорных ядер; количество тензорных ядер уменьшено до одного на SM.
- Ядра трассировки лучей второго поколения; одновременная трассировка лучей, затенение и вычисления для серии GeForce 30
- Память с высокой пропускной способностью 2 (HBM2) на A100 40 ГБ и A100 80 ГБ
- Память GDDR6X для GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti
- Двойные ядра FP32 на SM на графических процессорах GA10x
- NVLink 3.0 с пропускной способностью 50 Гбит/с на пару [9]
- PCI Express 4.0 с поддержкой SR-IOV (SR-IOV зарезервирован только для A100)
- Функция виртуализации нескольких экземпляров GPU (MIG) и разбиения GPU на разделы в A100 с поддержкой до семи экземпляров
- Набор функций PureVideo K для аппаратного декодирования видео с аппаратным декодированием AV1 [10] для серии GeForce 30 и набор функций J для A100
- 5 NVDEC для A100
- Добавляет новый аппаратный 5-ядерный JPEG декодер ( NVJPG ) с YUV420, YUV422, YUV444, YUV400, RGBA. Не следует путать с Nvidia NVJPEG ( библиотека с ускорением на GPU для кодирования/декодирования JPEG)
Чипсы
- ГА100 [11]
- ГА102
- ГА103
- ГА104
- GA106
- ГА107
- ГА10Б
Сравнение вычислительных возможностей: GP100 против GV100 против GA100 [12]
Сравнение матрицы поддержки точности [13] [14]
Легенда:
- FPnn: число с плавающей точкой с nn битами
- INTn: целое число с n битами
- INT1: двоичный
- TF32: TensorFloat32
- BF16: bfloat16
Сравнение производительности декодирования
Ампер умирает
Ускоритель A100 и DGX A100
Ускоритель A100 на базе Ampere был анонсирован и выпущен 14 мая 2020 года. [9] A100 имеет производительность FP32 19,5 терафлопс, 6912 ядер CUDA FP32/INT32, 3456 ядер CUDA FP64, 40 ГБ графической памяти и пропускную способность графической памяти 1,6 ТБ/с. [22] Первоначально ускоритель A100 был доступен только в третьем поколении серверов DGX , включая 8 A100. [9] В DGX A100 также включены 15 ТБ хранилища PCIe gen 4 NVMe , [22] два 64-ядерных процессора AMD Rome 7742, 1 ТБ оперативной памяти и межсоединение HDR InfiniBand на базе Mellanox . Первоначальная цена DGX A100 составляла 199 000 долларов. [9]
Сравнение ускорителей, используемых в DGX: [23] [24] [25]
Продукция с использованием Ampere
- Серия GeForce MX
- GeForce MX570 (мобильный) (GA107)
- GeForce 20 серии
- GeForce RTX 2050 (мобильная) (GA107)
- GeForce 30 серии
- Видеокарта GeForce RTX 3050 для ноутбука (GA107)
- GeForce RTX 3050 (GA106 или GA107) [26]
- Видеокарта GeForce RTX 3050 Ti для ноутбука (GA107)
- Видеокарта GeForce RTX 3060 для ноутбука (GA106)
- GeForce RTX 3060 (GA106 или GA104) [27]
- GeForce RTX 3060 Ti (GA104 или GA103) [28]
- Видеокарта GeForce RTX 3070 для ноутбука (GA104)
- GeForce RTX 3070 (GA104)
- Видеокарта GeForce RTX 3070 Ti для ноутбука (GA104)
- GeForce RTX 3070 Ti (GA104 или GA102) [29]
- Видеокарта GeForce RTX 3080 для ноутбука (GA104)
- GeForce RTX 3080 (GA102)
- GeForce RTX 3080 12 ГБ (GA102)
- Видеокарта GeForce RTX 3080 Ti для ноутбука (GA103)
- GeForce RTX 3080 Ti (GA102)
- GeForce RTX 3090 (GA102)
- GeForce RTX 3090 Ti (GA102)
- Графические процессоры Nvidia Workstation (ранее Quadro )
- RTX A1000 (мобильный) (GA107)
- RTX A2000 (мобильный) (GA106)
- RTX A2000 (GA106)
- RTX A3000 (мобильный) (GA104)
- RTX A4000 (мобильный) (GA104)
- RTX A4000 (GA104)
- RTX A5000 (мобильный) (GA104)
- RTX A5500 (мобильный) (GA103)
- RTX A4500 (GA102)
- RTX A5000 (GA102)
- RTX A5500 (GA102)
- RTX A6000 (GA102)
- А800 Активный
- Tegra SoC
- AGX Орин (GA10B)
- Орин NX (GA10B)
- Орин Нано (GA10B)
Смотрите также
Ссылки
- ^ Новости, NVIDIA. «Новый графический процессор NVIDIA Ampere для центров обработки данных запущен в серийное производство». Новости NVIDIA Новости .
- ^ "Подробнее об архитектуре NVIDIA Ampere". Блог разработчиков NVIDIA . 14 мая 2020 г.
- ^ "NVIDIA обеспечивает величайший скачок в истории поколения с графическими процессорами GeForce RTX 30-й серии". Nvidia Newsroom . 1 сентября 2020 г. Получено 9 апреля 2023 г.
- ^ "Обратный отсчет NVIDIA GeForce Ultimate". Nvidia .
- ^ "NVIDIA удваивает ставку: анонсирует графический процессор A100 80 ГБ, ускоряющий самый мощный в мире графический процессор для супервычислений с использованием искусственного интеллекта". Nvidia Newsroom . 16 ноября 2020 г. Получено 9 апреля 2023 г.
- ^ "NVIDIA GeForce Beyond на выставке CES 2023". NVIDIA .
- ^ "I.7. Compute Capability 8.x". Nvidia . Получено 23 сентября 2020 г. .
- ^ Bosnjak, Dominik (1 сентября 2020 г.). «Старая 8-нм технология Samsung в основе чудовищных карт NVIDIA Ampere». SamMobile . Получено 19 сентября 2020 г.
- ^ abcde Смит, Райан (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель». AnandTech.
- ^ Дельгадо, Херардо (1 сентября 2020 г.). «GeForce RTX 30 Series GPUs: Ushering In A New Era of Video Content With AV1 Decode». Nvidia . Получено 9 апреля 2023 г. .
- ^ Морган, Тимоти Прикетт (29 мая 2020 г.). «Глубокое погружение в архитектуру графического процессора Nvidia Ampere». Следующая платформа . Получено 24 марта 2022 г.
- ^ "Архитектура графического процессора NVIDIA A100 Tensor Core: беспрецедентное ускорение в любом масштабе" (PDF) . Nvidia . Получено 18 сентября 2020 г. .
- ^ "NVIDIA Tensor Cores: Универсальность для HPC и ИИ". NVIDIA .
- ^ "Аннотация". docs.nvidia.com .
- ^ "Архитектура графического процессора NVIDIA A100 Tensor Core" (PDF) . NVIDIA Corporation . Получено 29 апреля 2024 г. .
- ^ "NVIDIA GA102 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
- ^ "NVIDIA GA103 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
- ^ "NVIDIA GA104 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
- ^ "Спецификации графического процессора NVIDIA GA106". TechPowerUp . Получено 29 апреля 2024 г. .
- ^ "NVIDIA GA107 GPU Specs". TechPowerUp . Получено 29 апреля 2024 г. .
- ^ «Технический обзор NVIDIA AGX серии Orin, версия 1.2» (PDF) . Корпорация NVIDIA . Проверено 29 апреля 2024 г.
- ^ Том Уоррен; Джеймс Винсент (14 мая 2020 г.). «Первый графический процессор Ampere от Nvidia предназначен для центров обработки данных и искусственного интеллекта, а не для вашего ПК». The Verge.
- ^ Смит, Райан (22 марта 2022 г.). «Анонсирована архитектура графического процессора NVIDIA Hopper и ускоритель H100: работа умнее и сложнее». AnandTech.
- ^ Смит, Райан (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель». AnandTech.
- ^ "Протестирована NVIDIA Tesla V100: почти невероятная мощность графического процессора". TweakTown . 17 сентября 2017 г.
- ^ Игорь, Валлоссек (13 февраля 2022 г.). «Два лица GeForce RTX 3050 8 ГБ». Igor's Lab . Получено 23 февраля 2022 г.
- ^ Шилов, Антон (25 сентября 2021 г.). "Gainward и Galax перечисляют карты GeForce RTX 3060 с графическим процессором GA104". Tom's Hardware . Получено 23 сентября 2022 г. .
- ^ Тайсон, Марк (23 февраля 2022 г.). «Zotac представляет первые настольные видеокарты RTX 3060 Ti с графическим процессором GA103». Tom's Hardware . Получено 23 сентября 2022 г.
- ↑ WhyCry (26 октября 2022 г.). «ZOTAC выпускает GeForce RTX 3070 Ti с графическим процессором GA102-150» . ВидеоКардз . Проверено 21 мая 2023 г.
Внешние ссылки
- Технический документ по архитектуре графического процессора Nvidia A100 Tensor Core
- Архитектура графического процессора Nvidia Ampere GA102: техническая документация
- Архитектура Nvidia Ampere
- Графический процессор Nvidia A100 Tensor Core
- Подробное описание архитектуры Nvidia Ampere