stringtranslate.com

серия GeForce 400

Серия GeForce 400 — это серия графических процессоров , разработанная Nvidia и представляющая собой внедрение микроархитектуры Fermi . Его выпуск первоначально был запланирован на ноябрь 2009 года, [2] однако после задержек он был выпущен 26 марта 2010 года, а доступность появится в апреле 2010 года.

Его прямым конкурентом была серия ATI Radeon HD 5000 .

Архитектура

Nvidia описала микроархитектуру Fermi как следующий важный шаг в линейке графических процессоров после микроархитектуры Tesla, используемой со времен G80 . GF100, первый продукт с архитектурой Fermi, имеет большие размеры: 512 потоковых процессоров , сгруппированных в шестнадцать групп по 32, и 3,0 миллиарда транзисторов, изготовленных TSMC по 40-нм техпроцессу. Это первый чип Nvidia, поддерживающий OpenGL 4.0 и Direct3D 11 . Ни одна продукция с полностью включенным графическим процессором GF100 никогда не продавалась. У GTX 480 был отключен один потоковый мультипроцессор. У GTX 470 были отключены два потоковых мультипроцессора и один контроллер памяти. У GTX 465 было отключено пять потоковых мультипроцессоров и два контроллера памяти. Потребительские карты GeForce поставлялись с 256 МБ памяти, подключенными к каждому из включенных контроллеров памяти GDDR5, что в общей сложности составляло 1,5, 1,25 или 1,0 ГБ; у Tesla C2050 было 512 МБ на каждом из шести контроллеров, а у Tesla C2070 — 1024 МБ на каждый контроллер. Обе карты Tesla имели четырнадцать активных групп потоковых процессоров.

Чипы находятся в высокопроизводительной фирменной памяти Tesla с дополнительным ECC и способностью выполнять одну операцию с плавающей запятой двойной точности за цикл на ядро; потребительские карты GeForce искусственно ограничены драйверами одной операцией DP за четыре цикла. Благодаря этим функциям в сочетании с поддержкой Visual Studio и C++ Nvidia ориентировалась на профессиональные и коммерческие рынки, а также на использование в высокопроизводительных вычислениях .

Ферми назван в честь итальянского физика Энрико Ферми .

Текущие ограничения и компромиссы

Количество встроенной SRAM на одно ALU фактически уменьшилось пропорционально по сравнению с предыдущим поколением G200, несмотря на увеличение кэша L2 с 256 КБ на 240 ALU до 768 КБ на 512 ALU, поскольку у Fermi всего 32768 регистров на 32 ALU (против 16384). на 8 ALU), только 48 КБ общей памяти на 32 ALU (против 16 КБ на 8 ALU) и только 16 КБ кэша на 32 ALU (против 8 КБ постоянного кэша на 8 ALU + 24 КБ текстурного кэша на 24 ALU). Такие параметры, как количество регистров, можно найти в таблице сравнения вычислительных возможностей CUDA в справочном руководстве. [3]

История

30 сентября 2009 года Nvidia выпустила официальный документ с описанием архитектуры: [4] чип оснащен 16 «потоковыми мультипроцессорами», каждый с 32 «ядрами CUDA», способными выполнять одну операцию одинарной точности за цикл или одну операцию двойной точности каждый другой. цикл, 40-битное виртуальное адресное пространство, которое позволяет отображать память хоста в адресное пространство чипа, что означает, что существует только один тип указателя и значительно упрощает поддержку C ++, а также 384-битный интерфейс памяти GDDR5 . Как и в G80 и GT200 , потоки планируются в «варпах» — наборах по 32 потока, каждый из которых выполняется на одном шейдерном ядре. В то время как GT200 имел 16 КБ «общей памяти», связанной с каждым шейдерным кластером, и требовал, чтобы данные считывались через блоки текстурирования, если был необходим кэш, GF100 имеет 64 КБ памяти, связанной с каждым кластером, которую можно использовать либо в качестве Кэш 48 КБ плюс 16 КБ общей памяти или кэш 16 КБ плюс 48 КБ общей памяти вместе с кэшем L2 объемом 768 КБ, общим для всех 16 кластеров.

Печатная плата и кристалл GTX 480

В официальном документе чип описывается скорее как процессор общего назначения для рабочих нагрузок, охватывающих десятки тысяч потоков (напоминающий архитектуру Tera MTA , хотя и без поддержки этой машиной очень эффективного произвольного доступа к памяти), чем как графический процессор.

Многие пользователи сообщали о высоких температурах и энергопотреблении, получая при этом соответственно низкий прирост производительности в графических процессорах Fermi серии GeForce 400 по сравнению с конкурирующей серией AMD Radeon HD 5000 , что побудило AMD создать и выпустить рекламный видеоролик «Недоразумение» [5], чтобы задеть его. весело в этом вопросе. На видео видно, как полицейское подразделение начинает рейд на дом с большим тепловым профилем, что указывает на операцию по выращиванию . Однако при входе в дом становится ясно, что источником высокой температуры является графический процессор Fermi. [6] [7] Стало распространенной шуткой, что на графическом процессоре Fermi при полной нагрузке можно поджарить яйцо . [8]

Продукты

GTX480 в ПК

SP — шейдерный процессор (унифицированный шейдер, ядро ​​CUDA ), SFU — блок специальных функций, SM — потоковый мультипроцессор.

Вся продукция производится по технологическому процессу 40 нм. Все продукты поддерживают Direct3D 12.0 на уровне функций 11_0, OpenGL 4.6 и OpenCL 1.1. Единственным исключением является GeForce 405, карта OEM-производства, основанная на ядре GT218 ( Tesla ), поддерживающая только DirectX 10.1, OpenGL 3.3 и не поддерживающая OpenCL, и единственная карта в линейке GeForce 400, не основанная на Микроархитектура Ферми. По параметрам GeForce 405 идентична GeForce 310 , также OEM-карте, которая сама основана на GeForce 210 . Все продукты имеют один разъем VGA DB15 на плате полной высоты и полной длины, если не указано иное.

8 ноября 2010 года Nvidia выпустила чип GF110 вместе с GTX 580 (замена 480). Это переработанный чип GF100, который потребляет значительно меньше энергии. Это позволило Nvidia включить все 16 SM (все 16 ядер), что ранее было невозможно на GF100 «Nvidia GeForce GTX 580».Различные функции архитектуры GF100 были доступны только на более дорогих сериях карт Quadro и Tesla. [12] Для потребительских продуктов GeForce производительность двойной точности составляет четверть производительности «полной» архитектуры Fermi. Проверка и исправление ошибок памяти (ECC) также не работает на потребительских картах. [13] Карты GF100 обеспечивают вычислительные возможности 2.0, а карты GF104/106/108 — вычислительные возможности 2.1.

Прекращена поддержка

Nvidia объявила, что после выпуска драйверов Release 390 она больше не будет выпускать 32-битные драйверы для 32-битных операционных систем. [14]

В апреле 2018 года Nvidia объявила , что Fermi перейдет на статус поддержки устаревших драйверов и будет поддерживаться до января 2019 года.

Таблица чипсета

  1. ^ ab Унифицированные шейдеры : блоки отображения текстур : блоки вывода рендеринга
  2. ^ ab Каждый SM в GF100 содержит 4 блока фильтрации текстур для каждого блока адреса текстуры. Полный кристалл GF100 содержит 64 блока адресации текстур и 256 блоков фильтрации текстур. [10] Каждый SM в архитектуре GF104/106/108 содержит 8 блоков фильтрации текстур для каждого блока адреса текстуры, но имеет удвоенное количество блоков адресации и фильтрации. Полный кристалл GF104 также содержит 64 блока текстурных адресов и 512 блоков текстурной фильтрации, несмотря на уменьшенное вдвое количество SM, полный кристалл GF106 содержит 32 блока текстурных адресов и 256 блоков текстурной фильтрации, а полный кристалл GF108 содержит 16 блоков текстурных адресов и 128 блоков текстурных фильтров. . [16]
  3. ^ ab Чтобы рассчитать вычислительную мощность, см. Fermi (микроархитектура)#Performance .
  4. ^ abcde Обратите внимание, что хотя TDP GTX 460 сравним с TDP серии AMD HD5000, карты на базе GF100 (GTX 480/470/465) имеют гораздо более низкий рейтинг, но потребляют значительно больше энергии, например GTX 480 с TDP 250 Вт потребляет больше энергии, чем HD 5970 с TDP 297 Вт. [17]
  5. ^ ab Серия 400 — единственное семейство не OEM, от серий GeForce 9 до 700, которое не включает официальную систему с двумя графическими процессорами. Однако 18 марта 2011 года EVGA выпустила первую карту с одной печатной платой и двумя процессорами 460 на борту. Карта имела 2048 МБ памяти на частоте 3600 МГц и 672 шейдерных процессора на частоте 1400 МГц и предлагалась по рекомендуемой розничной цене 429 долларов.
  6. ^ Карта GeForce 405 представляет собой обновленную версию GeForce 310, которая сама по себе является переименованной GeForce 210.

Смотрите также

Примечания

Рекомендации

  1. Киллиан, Зак (3 июля 2017 г.). «Nvidia наконец-то позволила владельцам графических процессоров Fermi насладиться DirectX 12». Технический отчет . Проверено 4 июля 2017 г.
  2. ^ «ОФИЦИАЛЬНО: NVIDIA сообщает, что выпуск GT300 запланирован на четвертый квартал 2009 года, доходность хорошая - Яркая сторона новостей *». Brightsideofnews.com. 25 сентября 2009 года . Проверено 20 сентября 2010 г.
  3. ^ Таблица сравнения вычислительных возможностей на «Страницах 147–148, Приложение G.1, официальное справочное руководство CUDA 3.1» (PDF) .На странице 97 в Приложении A перечислены старые графические процессоры NVIDIA и показано, что все серии G200 имеют вычислительную мощность 1.3, тогда как карты на базе Fermi имеют вычислительную мощность 2.x (стр. 14, раздел 2.5).
  4. ^ http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIA_Fermi_Compute_Architecture_Whitepaper.pdf [ пустой URL-адрес PDF ]
  5. ^ Архивировано в Ghostarchive и Wayback Machine: «Недоразумение, представленное AMD». YouTube .
  6. ^ «AMD высмеивает тепловую мощность графического процессора NVIDIA Fermi в видео «Недоразумение»» . 9 августа 2010 г.
  7. ^ «Графические процессоры NVIDIA Fermi GF100 — слишком мало, слишком поздно, слишком жарко и слишком дорого» . ЗДНет .
  8. ^ «GeForce GTX 480: достаточно ли жарко, чтобы пожарить яйцо?». Архивировано из оригинала 20 сентября 2019 года . Проверено 20 сентября 2019 г.
  9. ^ Siliconmadness.com (2010). «Nvidia анонсирует Tesla 20 Series». Архивировано из оригинала 21 мая 2010 года.
  10. ^ ab «Резюме GF100 — GeForce GTX 480 и GTX 470 от Nvidia: опоздание на 6 месяцев, стоило ли ждать?». Anandtech.com . Архивировано из оригинала 5 августа 2011 года . Проверено 11 декабря 2015 г.
  11. ^ NVIDIA GeForce GTX 460: король за 200 долларов
  12. ^ «Заявление NVIDIA на их общем дискуссионном форуме по вычислениям на графических процессорах CUDA» .
  13. ^ "Веб-страница NVIDIA Tesla C2xxx" ., обратите внимание, из описания можно сделать вывод, что на Teslas ECC можно включать и выключать, используя 1/8 имеющейся встроенной памяти, в отличие от стандартных модулей памяти ECC, которым требуется 1/8 дополнительных микросхем памяти (то есть одна дополнительная микросхема устанавливается на печатную плату каждые 8).
  14. ^ «План поддержки 32-битных и 64-битных операционных систем | NVIDIA» .
  15. ^ «План поддержки графических процессоров GeForce серии Fermi | NVIDIA» .
  16. ^ «GF104: Nvidia становится суперскалярной — GeForce GTX 460 от Nvidia: король за 200 долларов» . Anandtech.com . Архивировано из оригинала 22 декабря 2015 года . Проверено 11 декабря 2015 г.
  17. ^ «GeForce GTX 480 и 470: от Fermi и GF100 к настоящим картам!». Tomshardware.com . 27 марта 2010 года . Проверено 11 декабря 2015 г.
  18. ^ "Группа Хронос". 31 мая 2022 г.
  19. ^ "Информационный документ по вычислительной архитектуре Nvidia Fermi" (PDF) . Архивировано (PDF) из оригинала 22 ноября 2009 г. Проверено 17 апреля 2010 г. ( 855КБ) , страница 11 из 22

Внешние ссылки