серия GeForce 400

Серия GeForce 400 — это серия графических процессоров , разработанная Nvidia и представляющая собой внедрение микроархитектуры Fermi . Его выпуск первоначально был запланирован на ноябрь 2009 года, ^[2] однако после задержек он был выпущен 26 марта 2010 года, а доступность появится в апреле 2010 года.

Его прямым конкурентом была серия ATI Radeon HD 5000 .

Архитектура

Nvidia описала микроархитектуру Fermi как следующий важный шаг в линейке графических процессоров после микроархитектуры Tesla, используемой со времен G80 . GF100, первый продукт с архитектурой Fermi, имеет большие размеры: 512 потоковых процессоров , сгруппированных в шестнадцать групп по 32, и 3,0 миллиарда транзисторов, изготовленных TSMC по 40-нм техпроцессу. Это первый чип Nvidia, поддерживающий OpenGL 4.0 и Direct3D 11 . Ни одна продукция с полностью включенным графическим процессором GF100 никогда не продавалась. У GTX 480 был отключен один потоковый мультипроцессор. У GTX 470 были отключены два потоковых мультипроцессора и один контроллер памяти. У GTX 465 было отключено пять потоковых мультипроцессоров и два контроллера памяти. Потребительские карты GeForce поставлялись с 256 МБ памяти, подключенными к каждому из включенных контроллеров памяти GDDR5, что в общей сложности составляло 1,5, 1,25 или 1,0 ГБ; у Tesla C2050 было 512 МБ на каждом из шести контроллеров, а у Tesla C2070 — 1024 МБ на каждый контроллер. Обе карты Tesla имели четырнадцать активных групп потоковых процессоров.

Чипы находятся в высокопроизводительной фирменной памяти Tesla с дополнительным ECC и способностью выполнять одну операцию с плавающей запятой двойной точности за цикл на ядро; потребительские карты GeForce искусственно ограничены драйверами одной операцией DP за четыре цикла. Благодаря этим функциям в сочетании с поддержкой Visual Studio и C++ Nvidia ориентировалась на профессиональные и коммерческие рынки, а также на использование в высокопроизводительных вычислениях .

Ферми назван в честь итальянского физика Энрико Ферми .

Текущие ограничения и компромиссы

Количество встроенной SRAM на одно ALU фактически уменьшилось пропорционально по сравнению с предыдущим поколением G200, несмотря на увеличение кэша L2 с 256 КБ на 240 ALU до 768 КБ на 512 ALU, поскольку у Fermi всего 32768 регистров на 32 ALU (против 16384). на 8 ALU), только 48 КБ общей памяти на 32 ALU (против 16 КБ на 8 ALU) и только 16 КБ кэша на 32 ALU (против 8 КБ постоянного кэша на 8 ALU + 24 КБ текстурного кэша на 24 ALU). Такие параметры, как количество регистров, можно найти в таблице сравнения вычислительных возможностей CUDA в справочном руководстве. ^[3]

История

30 сентября 2009 года Nvidia выпустила официальный документ с описанием архитектуры: ^[4] чип оснащен 16 «потоковыми мультипроцессорами», каждый с 32 «ядрами CUDA», способными выполнять одну операцию одинарной точности за цикл или одну операцию двойной точности каждый другой. цикл, 40-битное виртуальное адресное пространство, которое позволяет отображать память хоста в адресное пространство чипа, что означает, что существует только один тип указателя и значительно упрощает поддержку C ++, а также 384-битный интерфейс памяти GDDR5 . Как и в G80 и GT200 , потоки планируются в «варпах» — наборах по 32 потока, каждый из которых выполняется на одном шейдерном ядре. В то время как GT200 имел 16 КБ «общей памяти», связанной с каждым шейдерным кластером, и требовал, чтобы данные считывались через блоки текстурирования, если был необходим кэш, GF100 имеет 64 КБ памяти, связанной с каждым кластером, которую можно использовать либо в качестве Кэш 48 КБ плюс 16 КБ общей памяти или кэш 16 КБ плюс 48 КБ общей памяти вместе с кэшем L2 объемом 768 КБ, общим для всех 16 кластеров.

В официальном документе чип описывается скорее как процессор общего назначения для рабочих нагрузок, охватывающих десятки тысяч потоков (напоминающий архитектуру Tera MTA , хотя и без поддержки этой машиной очень эффективного произвольного доступа к памяти), чем как графический процессор.

Многие пользователи сообщали о высоких температурах и энергопотреблении, получая при этом соответственно низкий прирост производительности в графических процессорах Fermi серии GeForce 400 по сравнению с конкурирующей серией AMD Radeon HD 5000 , что побудило AMD создать и выпустить рекламный видеоролик «Недоразумение» ^[5], чтобы задеть его. весело в этом вопросе. На видео видно, как полицейское подразделение начинает рейд на дом с большим тепловым профилем, что указывает на операцию по выращиванию . Однако при входе в дом становится ясно, что источником высокой температуры является графический процессор Fermi. ^[6]^[7] Стало распространенной шуткой, что на графическом процессоре Fermi при полной нагрузке можно поджарить яйцо . ^[8]

Продукты

¹ SP – Шейдерные процессоры – Унифицированные шейдеры : Единицы отображения текстур : Единицы вывода рендеринга
² Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF100 содержит 32 SP и 4 SFU. Каждый потоковый мультипроцессор (SM) в графическом процессоре архитектуры GF104/106/108 содержит 48 SP и 8 SFU. Каждый SP может выполнять две операции умножения-сложения одинарной точности ( FMA ) за цикл. Каждый SFU может выполнять четыре операции SF за цикл. Одна операция FMA засчитывается за две операции с плавающей запятой. Таким образом, теоретическая пиковая производительность одинарной точности с числом шейдеров [ n ] и частотой шейдеров [ f , ГГц] может быть оценена по следующей формуле: FLOPS _sp ≈ f × n × 2 (FMA). Общая вычислительная мощность: для GF100 FLOPS _sp ≈ f × m × (32 SP × 2(FMA) + 4 × 4 SFU) и для GF104/106/108 FLOPS _sp ≈ f × m × (48 SP × 2(FMA) + 4 × 8 SFU) или для GF100 FLOPS _sp ≈ f × n × 2,5 и для GF104/106/108 FLOPS _sp ≈ f × n × 8/3. ^[9]

SP — шейдерный процессор (унифицированный шейдер, ядро CUDA ), SFU — блок специальных функций, SM — потоковый мультипроцессор.

³ Каждый SM в GF100 содержит 4 блока фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF100 содержит 64 блока текстурной фильтрации и 256 блоков текстурной фильтрации ^[10]. Каждый SM в архитектуре GF104/106/108 содержит 8 блоков текстурной фильтрации для каждого блока текстурного адреса. Полный кристалл GF104 содержит 64 блока адресации текстур и 512 блоков фильтрации текстур, полный кристалл GF106 содержит 32 блока адресации текстур и 256 блоков фильтрации текстур, а полный кристалл GF108 содержит 16 блоков адресации текстур и 128 блоков фильтрации текстур. ^[11]

Вся продукция производится по технологическому процессу 40 нм. Все продукты поддерживают Direct3D 12.0 на уровне функций 11_0, OpenGL 4.6 и OpenCL 1.1. Единственным исключением является GeForce 405, карта OEM-производства, основанная на ядре GT218 ( Tesla ), поддерживающая только DirectX 10.1, OpenGL 3.3 и не поддерживающая OpenCL, и единственная карта в линейке GeForce 400, не основанная на Микроархитектура Ферми. По параметрам GeForce 405 идентична GeForce 310 , также OEM-карте, которая сама основана на GeForce 210 . Все продукты имеют один разъем VGA DB15 на плате полной высоты и полной длины, если не указано иное.

8 ноября 2010 года Nvidia выпустила чип GF110 вместе с GTX 580 (замена 480). Это переработанный чип GF100, который потребляет значительно меньше энергии. Это позволило Nvidia включить все 16 SM (все 16 ядер), что ранее было невозможно на GF100 «Nvidia GeForce GTX 580».Различные функции архитектуры GF100 были доступны только на более дорогих сериях карт Quadro и Tesla. ^[12] Для потребительских продуктов GeForce производительность двойной точности составляет четверть производительности «полной» архитектуры Fermi. Проверка и исправление ошибок памяти (ECC) также не работает на потребительских картах. ^[13] Карты GF100 обеспечивают вычислительные возможности 2.0, а карты GF104/106/108 — вычислительные возможности 2.1.

Прекращена поддержка

Nvidia объявила, что после выпуска драйверов Release 390 она больше не будет выпускать 32-битные драйверы для 32-битных операционных систем. ^[14]

^{В апреле 2018 года Nvidia объявила ,} что Fermi перейдет на статус поддержки устаревших драйверов и будет поддерживаться до января 2019 года.

Таблица чипсета

^ ab Унифицированные шейдеры : блоки отображения текстур : блоки вывода рендеринга
^ ab Каждый SM в GF100 содержит 4 блока фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF100 содержит 64 блока адресации текстур и 256 блоков фильтрации текстур. ^[10] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков фильтрации текстур для каждого блока адреса текстуры, но имеет удвоенное количество блоков адресации и фильтрации. Полный кристалл GF104 также содержит 64 блока текстурных адресов и 512 блоков текстурной фильтрации, несмотря на уменьшенное вдвое количество SM, полный кристалл GF106 содержит 32 блока текстурных адресов и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурных адресов и 128 блоков текстурных фильтров. . ^[16]
^ ab Чтобы рассчитать вычислительную мощность, см. Fermi (микроархитектура)#Performance .
^ abcde Обратите внимание, что хотя TDP GTX 460 сравним с TDP серии AMD HD5000, карты на базе GF100 (GTX 480/470/465) имеют гораздо более низкий рейтинг, но потребляют значительно больше энергии, например GTX 480 с TDP 250 Вт потребляет больше энергии, чем HD 5970 с TDP 297 Вт. ^[17]
^ ab Серия 400 — единственное семейство не OEM, от серий GeForce 9 до 700, которое не включает официальную систему с двумя графическими процессорами. Однако 18 марта 2011 года EVGA выпустила первую карту с одной печатной платой и двумя процессорами 460 на борту. Карта имела 2048 МБ памяти на частоте 3600 МГц и 672 шейдерных процессора на частоте 1400 МГц и предлагалась по рекомендуемой розничной цене 429 долларов.
^ Карта GeForce 405 представляет собой обновленную версию GeForce 310, которая сама по себе является переименованной GeForce 210.

Смотрите также

Примечания

Дэвид Кантер (30 сентября 2009 г.). «Внутри Fermi: HPC Push от Nvidia». Realworldtech.com . Проверено 16 декабря 2010 г.

Внешние ссылки

Викискладе есть медиафайлы, связанные с серией GeForce 400 .

Следующее поколение NVIDIA GeForce
Ферми архитектура
Обзор GTX 400
GeForce GTX 480
GeForce GTX 470
GeForce GTX 465
GeForce GTX 460
GeForce ГТС 450
GeForce GT 440
GeForce GT 430
GeForce GTX 485M
GeForce GTX 480M
GeForce GTX 470M
GeForce GTX 460M
GeForce GT 445M
GeForce GT 435M
GeForce GT 425M
GeForce GT 420M
GeForce GT 415M
GeForce 410М
видеокарта 405
Нвидиа Нсайт
techPowerUp! База данных графического процессора