Серия GeForce 400 — это серия графических процессоров , разработанных Nvidia , которые стали первыми в истории микроархитектуры Fermi . Первоначально её выпуск был запланирован на ноябрь 2009 года, [2] однако после задержек она была выпущена 26 марта 2010 года, а доступность появилась в апреле 2010 года.
Nvidia описала микроархитектуру Fermi как следующий важный шаг в своей линейке графических процессоров после микроархитектуры Tesla, используемой со времен G80 . GF100, первый продукт архитектуры Fermi, большой: 512 потоковых процессоров , в шестнадцати группах по 32, и 3,0 миллиарда транзисторов, произведенных TSMC по 40-нм техпроцессу. Это первый чип Nvidia, поддерживающий OpenGL 4.0 и Direct3D 11. Ни один продукт с полностью включенным графическим процессором GF100 никогда не продавался. У GTX 480 был отключен один потоковый мультипроцессор. У GTX 470 было отключено два потоковых мультипроцессора и один контроллер памяти. У GTX 465 было отключено пять потоковых мультипроцессоров и два контроллера памяти. Потребительские карты GeForce поставлялись с 256 МБ, подключенными к каждому из включенных контроллеров памяти GDDR5, в общей сложности 1,5, 1,25 или 1,0 ГБ; Tesla C2050 имела 512 МБ на каждом из шести контроллеров, а Tesla C2070 имела 1024 МБ на контроллер. Обе карты Tesla имели четырнадцать активных групп потоковых процессоров.
Чипы, найденные в высокопроизводительном брендинге Tesla , оснащены памятью с опциональным ECC и способностью выполнять одну операцию с плавающей точкой двойной точности за цикл на ядро; потребительские карты GeForce искусственно ограничены драйвером одной операцией DP за четыре цикла. Благодаря этим функциям, в сочетании с поддержкой Visual Studio и C++ , Nvidia нацелилась на профессиональный и коммерческий рынки, а также на использование в высокопроизводительных вычислениях .
Ферми назван в честь итальянского физика Энрико Ферми .
Текущие ограничения и компромиссы
Количество встроенной SRAM на ALU фактически уменьшилось пропорционально по сравнению с предыдущим поколением G200, несмотря на увеличение кэша L2 с 256 КБ на 240 ALU до 768 КБ на 512 ALU, поскольку у Fermi всего 32768 регистров на 32 ALU (против 16384 на 8 ALU), всего 48 КБ общей памяти на 32 ALU (против 16 КБ на 8 ALU) и всего 16 КБ кэша на 32 ALU (против 8 КБ постоянного кэша на 8 ALU + 24 КБ текстурного кэша на 24 ALU). Такие параметры, как количество регистров, можно найти в Таблице сравнения вычислительных возможностей CUDA в справочном руководстве. [3]
История
30 сентября 2009 года Nvidia выпустила официальный документ, описывающий архитектуру: [4] чип оснащен 16 «потоковыми мультипроцессорами», каждый из которых имеет 32 «ядра CUDA», способные выполнять одну операцию с одинарной точностью за цикл или одну операцию с двойной точностью за каждый второй цикл, 40-битным виртуальным адресным пространством, которое позволяет отображать память хоста в адресное пространство чипа, что означает, что существует только один вид указателя и значительно упрощает поддержку C++, и 384-битным интерфейсом памяти GDDR5 . Как и в G80 и GT200 , потоки планируются в «варпах», наборах по 32 потока, каждый из которых работает на одном ядре шейдера. В то время как GT200 имел 16 КБ «общей памяти», связанной с каждым кластером шейдеров, и требовал считывания данных через блоки текстурирования, если требовался кэш, GF100 имеет 64 КБ памяти, связанной с каждым кластером, которая может использоваться либо как 48 КБ кэша плюс 16 КБ общей памяти, либо как 16 КБ кэша плюс 48 КБ общей памяти, а также 768 КБ кэша L2, общего для всех 16 кластеров.
В техническом документе чип описывается скорее как процессор общего назначения для рабочих нагрузок, охватывающих десятки тысяч потоков (напоминающий архитектуру Tera MTA , хотя и без поддержки этой машины для очень эффективного произвольного доступа к памяти), чем как графический процессор.
Многие пользователи сообщали о высоких температурах и энергопотреблении, получая при этом соответственно низкие улучшения производительности в графических процессорах Fermi серии GeForce 400 по сравнению с конкурирующей серией AMD Radeon HD 5000 , что привело к тому, что AMD создала и выпустила рекламный видеоролик «Недоразумение» [5] , чтобы высмеять эту проблему. В видеоролике видно, как полицейский отряд начинает рейд в дом с большим тепловым профилем, что указывает на операцию по выращиванию . Однако при входе в дом становится ясно, что источником высокой температуры является графический процессор Fermi. [6] [7] Стало распространенной шуткой, что на графическом процессоре Fermi при полной нагрузке можно поджарить яичницу . [8]
2 Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF100 содержит 32 SP и 4 SFU. Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF104/106/108 содержит 48 SP и 8 SFU. Каждый SP может выполнять 2 операции слияния умножения-сложения одинарной точности ( FMA ) за цикл. Каждый SFU может выполнять четыре операции SF за цикл. Одна операция FMA соответствует двум операциям с плавающей точкой. Таким образом, теоретическую пиковую производительность одинарной точности с количеством шейдеров [ n ] и частотой шейдеров [ f , ГГц] можно оценить следующим образом: FLOPS sp ≈ f × n × 2 (FMA). Общая вычислительная мощность: для GF100 FLOPS sp ≈ f × m ×(32 SP × 2(FMA) + 4 × 4 SFU) и для GF104/106/108 FLOPS sp ≈ f × m × (48 SP × 2(FMA) + 4 × 8 SFU) или для GF100 FLOPS sp ≈ f × n × 2,5 и для GF104/106/108 FLOPS sp ≈ f × n × 8 / 3. [9]
SP — шейдерный процессор (унифицированный шейдер, ядро CUDA ), SFU — специальный функциональный блок, SM — потоковый мультипроцессор.
3 Каждый SM в GF100 содержит 4 блока текстурной фильтрации для каждого блока текстурного адреса. Полный кристалл GF100 содержит 64 блока текстурного адреса и 256 блоков текстурной фильтрации [10] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков текстурной фильтрации для каждого блока текстурного адреса. Полный кристалл GF104 содержит 64 блока текстурного адреса и 512 блоков текстурной фильтрации, полный кристалл GF106 содержит 32 блока текстурного адреса и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурного адреса и 128 блоков текстурной фильтрации. [11]
Все продукты производятся по 40 нм техпроцессу. Все продукты поддерживают Direct3D 12.0 на уровне функций 11_0, OpenGL 4.6 и OpenCL 1.1. Единственным исключением является GeForce 405, карта только для OEM, которая основана на ядре GT218 ( Tesla ) с поддержкой только DirectX 11.1 с уровнем функций 10_1, OpenGL 3.3 и без поддержки OpenCL, и является единственной картой в линейке GeForce 400, не основанной на микроархитектуре Fermi. По параметрам GeForce 405 идентична GeForce 310 , также карте только для OEM, которая сама основана на GeForce 210. Все продукты имеют один разъем DB15 VGA на полной высоте и полной длине карты, если не указано иное.
8 ноября 2010 года Nvidia выпустила чип GF110 вместе с GTX 580 (замена 480). Это переработанный чип GF100, который потребляет значительно меньше энергии. Это позволило Nvidia включить все 16 SM (все 16 ядер), что ранее было невозможно на GF100 "Nvidia GeForce GTX 580".Различные функции архитектуры GF100 были доступны только на более дорогих картах серий Quadro и Tesla. [12] Для потребительских продуктов GeForce производительность двойной точности составляет четверть от производительности «полной» архитектуры Fermi. Проверка и исправление ошибок памяти (ECC) также не работает на потребительских картах. [13] Карты GF100 обеспечивают Compute Capability 2.0, тогда как карты GF104/106/108 обеспечивают Compute Capability 2.1.
Прекращена поддержка
Nvidia объявила, что после выпуска драйверов версии 390 она больше не будет выпускать 32-битные драйверы для 32-битных операционных систем. [14]
В апреле 2018 года компания Nvidia объявила, что Fermi перейдет на статус поддержки устаревших драйверов и будет поддерживаться до января 2019 года. [15]
^ ab Каждый SM в GF100 содержит 4 блока текстурной фильтрации для каждого блока текстурного адреса. Полный кристалл GF100 содержит 64 блока текстурного адреса и 256 блоков текстурной фильтрации. [10] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков текстурной фильтрации для каждого блока текстурного адреса, но имеет удвоенные блоки адресации и фильтрации. Полный кристалл GF104 также содержит 64 блока текстурного адреса и 512 блоков текстурной фильтрации, несмотря на уменьшенное вдвое количество SM, полный кристалл GF106 содержит 32 блока текстурного адреса и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурного адреса и 128 блоков текстурной фильтрации. [16]
^ abcde Обратите внимание, что хотя TDP GTX 460 сопоставим с серией AMD HD5000, карты на базе GF100 (GTX 480/470/465) имеют гораздо более низкий рейтинг, но потребляют значительно больше энергии, например, GTX 480 с TDP 250 Вт потребляет больше энергии, чем HD 5970 с TDP 297 Вт. [17]
^ ab Серия 400 — единственное не-OEM семейство из серий GeForce 9 и 700, не включающее официальную двухчиповую систему. Однако 18 марта 2011 года EVGA выпустила первую одноплатную карту с двумя 460 на борту. Карта имела 2048 МБ памяти на частоте 3600 МГц и 672 шейдерных процессора на частоте 1400 МГц и предлагалась по рекомендованной розничной цене 429 долларов США.
^ Видеокарта GeForce 405 — это переименованная GeForce 310, которая, в свою очередь, является переименованной GeForce 210.
Дэвид Кантер (30 сентября 2009 г.). "Внутри Fermi: HPC Push от Nvidia". realworldtech.com . Получено 16 декабря 2010 г. .
Ссылки
^ Киллиан, Зак (3 июля 2017 г.). «Nvidia наконец-то позволяет владельцам графических процессоров Fermi наслаждаться DirectX 12». Технический отчет . Получено 4 июля 2017 г.
^ "ОФИЦИАЛЬНО: NVIDIA заявляет, что GT300 выйдет по графику в четвертом квартале 2009 года, урожайность хорошая - Bright Side Of News*". Brightsideofnews.com. 25 сентября 2009 г. Получено 20 сентября 2010 г.
^ Таблица сравнения вычислительных возможностей в «Страницах 147–148, Приложение G.1, Официальное справочное руководство CUDA 3.1» (PDF) .На странице 97 в Приложении A перечислены старые графические процессоры NVIDIA и показано, что все серии G200 имеют вычислительную мощность 1.3, в то время как карты на базе Fermi имеют вычислительную мощность 2.x (страница 14, раздел 2.5).
^ Техническая документация по вычислительной архитектуре NVIDIA Fermi nvidia.com
↑ Архивировано в Ghostarchive и Wayback Machine: «Недоразумение — представлено AMD». YouTube .
^ "AMD высмеивает тепловыделение графического процессора NVIDIA Fermi в видеоролике "The Misunderstanding"". 9 августа 2010 г.
^ «Графические процессоры NVIDIA Fermi GF100 — слишком мало, слишком поздно, слишком жарко и слишком дорого». ZDNet .
^ "GeForce GTX 480: достаточно ли она горяча, чтобы поджарить яйцо?". Архивировано из оригинала 20 сентября 2019 г. Получено 20 сентября 2019 г.
^ siliconmadness.com (2010). "Nvidia анонсирует Tesla 20 Series". Архивировано из оригинала 21 мая 2010 года.
^ ab "Обзор GF100 - GeForce GTX 480 и GTX 470 от Nvidia: опоздание на 6 месяцев. Стоило ли оно ожидания?". Anandtech.com . Архивировано из оригинала 5 августа 2011 г. Получено 11 декабря 2015 г.
^ Смит, Райан. «NVIDIA GeForce GTX 460: король за 200 долларов». www.anandtech.com . Получено 16 мая 2024 г.
^ "Официальные форумы NVIDIA". NVIDIA . Получено 16 мая 2024 г. .
^ "Веб-страница NVIDIA Tesla C2xxx".Обратите внимание, из описания можно сделать вывод, что в автомобилях Tesla ECC можно включать и выключать, используя 1/8 существующей встроенной памяти, в отличие от стандартных модулей памяти ECC, для которых требуется 1/8 дополнительных чипов памяти (то есть на печатную плату необходимо установить один дополнительный чип на каждые 8).
^ «План поддержки 32-битных и 64-битных операционных систем | NVIDIA».
^ «План поддержки графических процессоров GeForce серии Fermi | NVIDIA».
^ "GF104: Nvidia Goes Superscalar - GeForce GTX 460 от Nvidia: The $200 King". Anandtech.com . Архивировано из оригинала 22 декабря 2015 г. Получено 11 декабря 2015 г.
^ "GeForce GTX 480 и 470: от Fermi и GF100 до реальных карт!". Tomshardware.com . 27 марта 2010 г. Получено 11 декабря 2015 г.
^ "Группа Хронос". 31 мая 2022 г.
^ "Nvidia Fermi Compute Architecture Whitepaper" (PDF) . Архивировано (PDF) из оригинала 22 ноября 2009 г. . Получено 17 апреля 2010 г. .( 855КБ) , страница 11 из 22
Внешние ссылки
На Викискладе есть медиафайлы по теме GeForce 400 series .