stringtranslate.com

Паскаль (микроархитектура)

Картина Блеза Паскаля, эпонима архитектуры

Pascal — кодовое название микроархитектуры графического процессора , разработанной Nvidia в качестве преемника архитектуры Maxwell . Архитектура была впервые представлена ​​в апреле 2016 года с выпуском Tesla P100 (GP100) 5 апреля 2016 года и в основном используется в серии GeForce 10 , начиная с GeForce GTX 1080 и GTX 1070 (обе используют графический процессор GP104), которые были выпущены 27 мая 2016 года и 10 июня 2016 года соответственно. Pascal был изготовлен с использованием 16-нм процесса FinFET компании TSMC [1], а затем 14 -нм процесса FinFET компании Samsung [2] .  

Архитектура названа в честь французского математика и физика XVII века Блеза Паскаля .

В апреле 2019 года компания Nvidia включила программную реализацию DirectX Raytracing на картах на базе Pascal, начиная с GTX 1060 6 ГБ, а также на картах серии 16. До этого момента эта функция была доступна только на картах серии RTX на базе Turing. [3] [4]

Подробности

Снимок кристалла графического процессора GP100, используемого в картах Nvidia Tesla P100
Снимок кристалла графического процессора GP102, обнаруженного внутри видеокарт GeForce GTX 1080 Ti
Снимок кристалла графического процессора GP106, обнаруженного внутри карт GTX 1060

В марте 2014 года Nvidia объявила, что преемником Maxwell станет микроархитектура Pascal; анонсирована 6 мая 2016 года и выпущена 27 мая того же года. Tesla P100 (чип GP100) имеет другую версию архитектуры Pascal по сравнению с GTX GPU (чип GP104). Шейдерные блоки в GP104 имеют дизайн, подобный Maxwell . [5]

Архитектурные усовершенствования архитектуры GP100 включают следующее: [6] [7] [8]

Архитектурные усовершенствования архитектуры GP104 включают следующее: [5]

Обзор

Графический процессор кластера

Чип разделен на графические процессорные кластеры (GPC). Для чипов GP104 GPC охватывает 5 SM.

Потоковый мультипроцессор "Паскаль"

«Потоковый мультипроцессор» аналогичен вычислительному блоку AMD . SM включает в себя 128 ALU одинарной точности («ядра CUDA») на чипах GP104 и 64 ALU одинарной точности на чипах GP100. В то время как все версии CU состоят из 64 шейдерных процессоров (т. е. 4 векторных блока SIMD, каждый шириной 16 полос), Nvidia экспериментировала с очень разным количеством ядер CUDA:

Полиморф-движок 4.0

Polymorph Engine версии 4.0 — это блок, отвечающий за тесселяцию . Он функционально соответствует геометрическому процессору AMD . Он был перемещен из шейдерного модуля в TPC, чтобы позволить одному Polymorph engine питать несколько SM в пределах TPC. [19]

Чипсы

Печатная плата и кристалл GTX 1080 Ti

Производительность

Теоретическая вычислительная мощность графического процессора Pascal с одинарной точностью в GFLOPS вычисляется как 2 × операций на инструкцию FMA на ядро ​​CUDA за цикл × количество ядер CUDA × тактовая частота ядра (в ГГц).

Теоретическая вычислительная мощность графического процессора Pascal при обработке чисел двойной точности составляет 1/2 от производительности при обработке чисел одинарной точности на Nvidia GP100 и 1/32 от Nvidia GP102, GP104, GP106, GP107 и GP108.

Теоретическая мощность обработки половинной точности графического процессора Pascal составляет 2× от производительности одинарной точности на GP100 [12] и 1/64 на GP104, GP106, GP107 и GP108. [18]

Преемник

В 2017 году архитектура Pascal была заменена архитектурой Volta на рынках высокопроизводительных вычислений , облачных вычислений и беспилотных автомобилей , а в 2018 году на потребительском и деловом рынках — Turing . [33]

Ускоритель P100 и DGX-1

Сравнение ускорителей, используемых в DGX: [34] [35] [36]

Смотрите также

Ссылки

  1. ^ "NVIDIA 7nm Next-Gen-GPUs To Be Built By TSMC". Wccftech . 24 июня 2018 г. Получено 6 июля 2019 г.
  2. ^ "Samsung оптически сжимает NVIDIA "Pascal" до 14 нм" . Получено 13 августа 2016 г.
  3. ^ «Ускорение экосистемы трассировки лучей в реальном времени: DXR для GeForce RTX и GeForce GTX». NVIDIA .
  4. ^ «Трассировка лучей появилась на графических процессорах Nvidia GTX: как ее включить». 11 апреля 2019 г.
  5. ^ ab "NVIDIA GeForce GTX 1080" (PDF) . International.download.nvidia.com . Получено 15 сентября 2016 г. .
  6. ^ Гупта, Сумит (21 марта 2014 г.). «NVIDIA обновляет дорожную карту GPU; анонсирует Pascal». Blogs.nvidia.com . Получено 25 марта 2014 г. .
  7. ^ "Parallel Forall". NVIDIA Developer Zone . Devblogs.nvidia.com. Архивировано из оригинала 26 марта 2014 г. Получено 25 марта 2014 г.
  8. ^ "NVIDIA Tesla P100" (PDF) . International.download.nvidia.com . Получено 15 сентября 2016 г. .
  9. ^ «Внутри Pascal: новейшая вычислительная платформа NVIDIA». 5 апреля 2016 г.
  10. Денис Фоли (25 марта 2014 г.). «NVLink, Pascal и стековая память: удовлетворение аппетита к большим данным». nvidia.com . Получено 7 июля 2014 г.
  11. ^ "Архитектура графических процессоров NVIDIA следующего поколения Pascal обеспечивает 10-кратное ускорение для приложений глубокого обучения". Официальный блог NVIDIA . Получено 23 марта 2015 г.
  12. ^ ab Smith, Ryan (5 апреля 2015 г.). "NVIDIA анонсирует Tesla P100 Accelerator - Pascal GP100 Power for HPC". AnandTech . Получено 27 мая 2016 г. Каждый из этих SM также содержит 32 ядра FP64 CUDA, что дает нам 1/2 скорости для FP64, а новым для архитектуры Pascal является возможность упаковать 2 операции FP16 внутри одного ядра FP32 CUDA при правильных обстоятельствах.
  13. ^ abc Smith, Ryan (20 июля 2016 г.). «Обзор NVIDIA GeForce GTX 1080 и GTX 1070 Founders Editions: начало поколения FinFET». AnandTech . стр. 9 . Получено 21 июля 2016 г. .
  14. ^ abcde Смит, Райан (20 июля 2016 г.). «Обзор NVIDIA GeForce GTX 1080 и GTX 1070 Founders Editions: начало поколения FinFET». AnandTech . стр. 10 . Получено 21 июля 2016 г. .
  15. ^ "GTX 1080 Graphics Card". GeForce . Получено 15 сентября 2016 г. .
  16. ^ Карботт, Кевин (17 мая 2016 г.). "Nvidia GeForce GTX 1080 Simultaneous Multi-Projection & Async Compute". Tomshardware.com . Получено 15 сентября 2016 г. .
  17. ^ "Nvidia Pascal HDCP 2.2". Страница оборудования Nvidia . Получено 8 мая 2016 г.
  18. ^ ab Smith, Ryan (20 июля 2016 г.). «Обзор NVIDIA GeForce GTX 1080 и GTX 1070 Founders Editions: начало поколения FinFET». AnandTech . стр. 5 . Получено 21 июля 2016 г. .
  19. ^ Смит, Райан (20 июля 2016 г.). «Обзор NVIDIA GeForce GTX 1080 и GTX 1070 Founders Editions: начало поколения FinFET». AnandTech . стр. 4 . Получено 21 июля 2016 г. .
  20. ^ Харрис, Марк (5 апреля 2016 г.). «Внутри Pascal: новейшая вычислительная платформа NVIDIA». Parallel Forall . Nvidia . Получено 3 июня 2016 г. .
  21. ^ "Видеокарта NVIDIA TITAN Xp с архитектурой Pascal". NVIDIA .
  22. ^ "Видеокарта NVIDIA TITAN X с Pascal". GeForce . Получено 15 сентября 2016 г. .
  23. ^ "Новая графика Quadro на архитектуре Pascal". NVIDIA . Получено 15 сентября 2016 г. .
  24. ^ "Ускорение рабочих нагрузок центра обработки данных с помощью графических процессоров". NVIDIA . Получено 15 сентября 2016 г.
  25. ^ Zhiye Liu (22 октября 2018 г.). "Nvidia GeForce GTX 1060 получает GDDR5X в пятом обновлении". Tom's Hardware . Получено 2 февраля 2024 г.
  26. ^ "Видеокарты NVIDIA GeForce 10 серии". NVIDIA .
  27. ^ "NVIDIA GeForce GTX 1060 выйдет 7 июля". VideoCardz.com . 29 июня 2016 г. Получено 15 сентября 2016 г.
  28. ^ "GTX 1060 Graphics Cards". GeForce . Получено 15 сентября 2016 г. .
  29. ^ Смит, Райан (12 ноября 2012 г.). «NVIDIA запускает Tesla K20 и K20X: GK110 наконец-то появился». AnandTech . стр. 3 . Получено 24 июля 2016 г. .
  30. ^ abcdef Nvidia (1 сентября 2015 г.). "Руководство по программированию CUDA C" . Получено 24 июля 2016 г.
  31. ↑ abcdefghijklmno Триоле, Дэмиен (24 мая 2016 г.). «Nvidia GeForce GTX 1080, лучший 16-нм графический процессор в тесте!». Hardware.fr (на французском языке). п. 2 . Проверено 24 июля 2016 г.
  32. ^ ab Smith, Ryan (26 января 2015 г.). "GeForce GTX 970: исправление спецификаций и исследование распределения памяти". AnandTech . стр. 1 . Получено 24 июля 2016 г. .
  33. ^ "Дата выпуска NVIDIA Turing". Techradar . 2 февраля 2021 г.
  34. ^ Смит, Райан (22 марта 2022 г.). «Анонсирована архитектура графического процессора NVIDIA Hopper и ускоритель H100: работа умнее и сложнее». AnandTech.
  35. ^ Смит, Райан (14 мая 2020 г.). «NVIDIA Ampere Unleashed: NVIDIA анонсирует новую архитектуру графического процессора, графический процессор A100 и ускоритель». AnandTech.
  36. ^ "Протестирована NVIDIA Tesla V100: почти невероятная мощность графического процессора". TweakTown . 17 сентября 2017 г.