stringtranslate.com

Бульдозер (микроархитектура)

AMD Bulldozer Family 15h — это микроархитектура микропроцессоров для линеек процессоров FX и Opteron , разработанная AMD для рынков настольных компьютеров и серверов. [1] [2] Bulldozer — кодовое название этого семейства микроархитектур. Оно было выпущено 12 октября 2011 года как преемник микроархитектуры K10 .

Bulldozer разработан с нуля, а не является развитием более ранних процессоров. [3] Ядро специально предназначено для вычислительных продуктов с TDP от 10 до 125  Вт . AMD заявляет о значительном повышении эффективности производительности на ватт в приложениях высокопроизводительных вычислений (HPC) с ядрами Bulldozer.

Ядра Bulldozer поддерживают большинство наборов инструкций, реализованных процессорами Intel ( Sandy Bridge ), доступных на момент их появления (включая SSSE3 , SSE4.1 , SSE4.2 , AES , CLMUL и AVX ), а также новые наборы инструкций, предложенные AMD: ABM , XOP , FMA4 и F16C . [4] [5] Только Bulldozer GEN4 ( Excavator ) поддерживает наборы инструкций AVX2 .

Обзор

По данным AMD, процессоры на базе Bulldozer основаны на 32-нм техпроцессе «Кремний на изоляторе» (SOI) компании GlobalFoundries и повторно используют подход DEC к производительности многозадачных компьютеров, аргументируя это тем, что, согласно заметкам для прессы, он «балансирует выделенные и общие ресурсы компьютера, чтобы обеспечить очень компактную конструкцию с большим количеством блоков, которая легко воспроизводится на кристалле для масштабирования производительности». [6] Другими словами, устранив некоторые «избыточные» элементы, которые естественным образом проникают в многоядерные конструкции, AMD надеется лучше использовать возможности своего оборудования, потребляя при этом меньше энергии.

Реализации на основе Bulldozer, построенные на 32 нм SOI с HKMG, появились в октябре 2011 года как для серверов, так и для настольных компьютеров. Серверный сегмент включал двухчиповый (16-ядерный) процессор Opteron под кодовым названием Interlagos (для Socket G34 ) и одночиповый (4, 6 или 8 ядер) Valencia (для Socket C32 ), в то время как Zambezi (4, 6 и 8 ядер) были нацелены на настольные компьютеры на Socket AM3+ . [7] [8]

Bulldozer — это первая крупная переделка архитектуры процессоров AMD с 2003 года, когда компания выпустила свои процессоры K8, а также два 128-битных FMA -совместимых FPU , которые можно объединить в один 256-битный FPU. Эта конструкция сопровождается двумя целочисленными кластерами, каждый с 4 конвейерами (стадия выборки/декодирования является общей). Bulldozer также представила общий кэш L2 в новой архитектуре. AMD называет эту конструкцию «Модулем». Конструкция 16-ядерного процессора будет включать восемь таких «модулей», [9] но операционная система будет распознавать каждый «модуль» как два логических ядра.

Модульная архитектура состоит из многопоточного общего кэша L2 и FlexFPU, который использует одновременную многопоточность . Каждое физическое целочисленное ядро, два на модуль, является однопоточным, в отличие от Hyperthreading от Intel , где два виртуальных одновременных потока совместно используют ресурсы одного физического ядра. [10] [11]

В ретроспективном обзоре Джереми Лэрд из журнала APC прокомментировал проблемы Bulldozer, отметив, что он был медленнее, чем уходящий дизайн Phenom II K10, и что экосистема программного обеспечения ПК еще не «приняла» многопоточную модель. По его наблюдениям, проблемы привели к большим потерям для AMD, компания потеряла более 1 миллиарда долларов США в 2012 году, и что некоторые отраслевые обозреватели предсказывали банкротство к середине 2015 года. Позже компании удалось вернуться к прибыли. Упомянутыми причинами восстановления прибыльности были более ранняя продажа собственного производства в GlobalFoundries , а затем аутсорсинг производства в TSMC и создание нового дизайна процессора Ryzen . [12]

Архитектура

Ядро бульдозера

Блок-схема полного модуля Bulldozer, показывающая 2 целочисленных кластера
Блок-схема 4-модульной конструкции с 8 целочисленными кластерами
Топология памяти сервера Bulldozer
Снимок штампа бульдозера с выделенными деталями

Bulldozer использовал «кластерную многопоточность» (Clustered Multithreading, CMT), технику, при которой некоторые части процессора совместно используются двумя потоками, а некоторые части уникальны для каждого потока. Предшествующие примеры такого подхода к нетрадиционной многопоточности можно проследить еще до процессора UltraSPARC T1 компании Sun Microsystems 2005 года . С точки зрения аппаратной сложности и функциональности модуль Bulldozer CMT равен двухъядерному процессору по его возможностям целочисленных вычислений, а с точки зрения вычислительной мощности с плавающей точкой — либо одноядерному процессору, либо двухъядерному процессору с ограниченными возможностями, в зависимости от того, насыщен ли код инструкциями с плавающей точкой в ​​обоих потоках, работающих на одном модуле CMT, и выполняет ли FPU 128-битные или 256-битные операции с плавающей точкой. Причина этого в том, что для каждых двух целочисленных ядер, то есть в пределах одного модуля, существует один блок с плавающей точкой, состоящий из пары 128-битных исполнительных блоков FMAC .

CMT в некотором роде является более простой, но похожей на SMT философией проектирования ; обе конструкции пытаются эффективно использовать блоки исполнения; в любом методе, когда два потока конкурируют за некоторые конвейеры исполнения, происходит потеря производительности в одном или нескольких потоках. Благодаря выделенным целочисленным ядрам модули семейства Bulldozer работали примерно как двухъядерный двухпоточный процессор во время участков кода, которые были либо полностью целочисленными, либо смесью целочисленных и плавающих вычислений; тем не менее, из-за использования SMT общих конвейеров плавающей точки модуль будет работать аналогично одноядерному двухпоточному процессору SMT (SMT2) для пары потоков, насыщенных инструкциями с плавающей точкой. (Оба этих последних двух сравнения предполагают, что процессор обладает одинаково широким и производительным ядром исполнения, как целочисленным, так и плавающим, соответственно.)

И CMT, и SMT достигают пиковой эффективности при запуске целочисленного и плавающего кода на паре потоков. CMT сохраняет пиковую эффективность при работе на паре потоков, состоящих из целочисленного кода, в то время как при SMT один или оба потока будут работать хуже из-за конкуренции за целочисленные исполнительные блоки. Недостатком CMT является большее количество простаивающих целочисленных исполнительных блоков в однопоточном случае. В однопоточном случае CMT ограничен использованием не более половины целочисленных исполнительных блоков в своем модуле, в то время как SMT не накладывает такого ограничения. Большое ядро ​​SMT с целочисленной схемой такой же ширины и скорости, как два ядра CMT, теоретически может на мгновение иметь вдвое большую целочисленную производительность в однопоточном случае. (Более реалистично для общего кода в целом, правило Поллака оценивает коэффициент ускорения в , или приблизительно 40% увеличения производительности.)

Процессоры CMT и типичный процессор SMT схожи в эффективном совместном использовании кэша L2 между парой потоков.

Более длинный конвейер позволил процессорам семейства Bulldozer достичь гораздо более высокой тактовой частоты по сравнению с предшественниками K10. Хотя это увеличило частоты и пропускную способность, более длинный конвейер также увеличил задержки и увеличил штрафы за неправильное предсказание ветвлений .

Ширина выпуска (и пиковое выполнение инструкций за цикл) ядер Jaguar, K10 и Bulldozer составляет 2, 3 и 4 соответственно. Это сделало Bulldozer более суперскалярной конструкцией по сравнению с Jaguar/Bobcat. Однако из-за несколько более широкого ядра K10 (в дополнение к отсутствию улучшений и оптимизаций в конструкции первого поколения) архитектура Bulldozer обычно работала с несколько более низким IPC по сравнению с ее предшественниками K10. Только после улучшений, внесенных в Piledriver и Steamroller, IPC семейства Bulldozer начал отчетливо превышать таковой у процессоров K10, таких как Phenom II.

Предсказатель ветвления

Расширения набора инструкций

Технологический процесс и тактовая частота

Интерфейс кэша и памяти

Интерфейс ввода-вывода и сокета

Функции

Процессоры

Чипсет и вводы/выводы для 1-го поколения CMT
Процессор AMD FX 8350
Процессор AMD Opteron 6282

Первые коммерческие поставки процессоров Opteron на базе Bulldozer были объявлены 7 сентября 2011 года. [32] FX-4100, FX-6100, FX-8120 и FX-8150 были выпущены в октябре 2011 года; остальные процессоры AMD серии FX были выпущены в конце первого квартала 2012 года.

Рабочий стол

Основные источники: CPU-World [33] и Xbit-Labs [34]

Сервер

Существует две серии процессоров на базе Bulldozer для серверов : серия Opteron 4200 ( Socket C32 , кодовое название Valencia, до четырех модулей) и серия Opteron 6200 ( Socket G34 , кодовое название Interlagos, до 8 модулей). [35] [36]

Иск о ложной рекламе

В ноябре 2015 года AMD подали в суд в соответствии с Законом о правовой защите прав потребителей Калифорнии и Законом о недобросовестной конкуренции за якобы искажение спецификаций чипов Bulldozer. В коллективном иске, поданном 26 октября в Окружной суд США по Северному округу Калифорнии, утверждается, что каждый модуль Bulldozer на самом деле является одним ядром ЦП с несколькими чертами двухъядерного процессора, а не настоящей двухъядерной конструкцией. [37] В августе 2019 года AMD согласилась урегулировать иск за 12,1 млн долларов. [38] [39]

Производительность

Производительность в Linux

24 октября 2011 года тесты первого поколения, проведенные Phoronix, подтвердили, что производительность процессора Bulldozer оказалась несколько ниже ожидаемой. [40] В нескольких тестах процессор показал результаты, аналогичные показателям предыдущего поколения Phenom 1060T.

Позже производительность существенно возросла, поскольку были выпущены различные оптимизации компилятора и исправления драйвера ЦП. [41] [42]

Производительность в Windows

Первые процессоры Bulldozer были встречены неоднозначно. Было обнаружено, что FX-8150 плохо показал себя в тестах, которые не были высокопоточными, отставая от процессоров серии Intel Core i* второго поколения и сравнявшись или даже уступив собственному Phenom II X6 от AMD на более низких тактовых частотах. В высокопоточных тестах FX-8150 показал себя на одном уровне с Phenom II X6 и Intel Core i7 2600K , в зависимости от теста. Учитывая общую более стабильную производительность Intel Core i5 2500K по более низкой цене, эти результаты разочаровали многих обозревателей. Процессор оказался чрезвычайно прожорливым под нагрузкой, особенно при разгоне, по сравнению с Sandy Bridge от Intel . [43] [44]

13 октября 2011 года AMD заявила в своем блоге, что «в нашем сообществе есть некоторые, кто считает, что производительность продукта не соответствует их ожиданиям», но продемонстрировала тесты на реальных приложениях, где он превзошел Sandy Bridge i7 2600k и AMD X6 1100T. [45]

В январе 2012 года Microsoft выпустила два исправления для Windows 7 и Server 2008 R2, которые незначительно улучшают производительность процессоров Bulldozer, решая проблемы планирования потоков, возникшие после выпуска Bulldozer. [46] [47] [48]

6 марта 2012 года AMD опубликовала статью в базе знаний, в которой говорилось, что существует проблема совместимости с процессорами FX и некоторыми играми на широко используемой платформе цифровой дистрибуции игр Steam . AMD заявила, что предоставила обновление BIOS нескольким производителям материнских плат (а именно: Asus , Gigabyte Technology , MSI и ASRock ), которое должно исправить эту проблему. [49]

В сентябре 2014 года генеральный директор AMD Рори Рид признал, что дизайн Bulldozer не стал «элементом, который изменил правила игры», и что AMD пришлось жить с этим дизайном в течение четырех лет. [50]

Разгон

31 августа 2011 года AMD и группа известных оверклокеров, включая Брайана Маклахлана, Сами Мякинена, Аарона Шрадина и Саймона Солотко, сумели установить новый мировой рекорд частоты ЦП, используя невыпущенный и разогнанный процессор FX-8150 Bulldozer. До этого дня рекорд составлял 8,309 ГГц, но Bulldozer в сочетании с охлаждением жидким гелием достиг нового максимума в 8,429 ГГц. С тех пор рекорд был побит Андре Янгом с использованием жидкого азота — 8,58 ГГц . [51] [52] 22 августа 2014 года, используя FX-8370 (Piledriver), The Stilt из Team Finland достиг максимальной частоты ЦП в 8,722 ГГц. [53]

Рекорды тактовой частоты ЦП, установленные разогнанными процессорами Bulldozer, были побиты лишь почти десятилетие спустя разгоном процессоров Intel Core Raptor Lake 13-го поколения в октябре 2022 года. [54]

Пересмотры

Piledriver — кодовое название AMD для своей улучшенной микроархитектуры второго поколения на основе Bulldozer . Ядра AMD Piledriver используются вAPU и CPU на базе Socket FM2 Trinity и Richland , а также в CPU серии FX на базе Socket AM3+ Vishera . Piledriver был последним поколением в семействе Bulldozer, доступным для Socket AM3+ и имеющим кэш L3. Процессоры Piledriver, доступные для сокетов FM2 (и его мобильного варианта), не имели кэша L3, поскольку кэш L2 является кэшем последнего уровня для всех процессоров FM2/FM2+.

Steamroller — кодовое название микроархитектуры AMD третьего поколения, основанной на улучшенной версии Piledriver . Ядра Steamroller используются всерии APU и CPU на базе Socket FM2+ Kaveri .

Excavator — кодовое название ядра Bulldozer четвертого поколения. [55] Excavator был реализован в виде APU серии «Carrizo», APU серии «Bristol Ridge» и процессоров Athlon x4. [56]

Смотрите также

Ссылки

  1. ^ "Процессоры FX". AMD . 24 февраля 2016 г. . Получено 24 февраля 2016 г. .
  2. ^ "AMD поставляет 16-ядерный Opteron 6200 с питанием от бульдозера". Engadget . 14 ноября 2011 г. Получено 24 февраля 2016 г.
  3. Bulldozer на 50% быстрее, чем Core i7 и Phenom II, techPowerUp, 13 января 2011 г. , получено 23 января 2012 г.
  4. ^ AMD64 Architecture Programmer's Manual Volume 6: 128-Bit and 256-Bit XOP, and FMA4 Instructions (PDF) , AMD , 1 мая 2009 г. , получено 8 мая 2009 г.
  5. Нахождение баланса, Дэйв Кристи, блоги разработчиков AMD, 7 мая 2009 г., архивировано из оригинала 2 апреля 2012 г. , извлечено 8 мая 2009 г.
  6. ^ AMD устанавливает новый уровень инноваций x86, впервые подробно раскрывая два новых дизайна ядер, AMD , 24 августа 2011 г., стр. 1 , получено 18 сентября 2011 г.
  7. Analyst Day Summary 2009, AMD , 11 ноября 2009 г. , получено 14 ноября 2009 г.
  8. ^ AMD bestätigt: "Zambezi" ist inkompatibel zum Sockel AM3, Planet3dnow.de , получено 23 января 2012 г.
  9. Презентации Analyst Day 2009, AMD , 11 ноября 2009 г. , получено 14 ноября 2009 г.
  10. ^ "Архивная копия". Архивировано из оригинала 17 октября 2013 г. Получено 22 июля 2013 г.{{cite web}}: CS1 maint: архивная копия как заголовок ( ссылка )
  11. ^ "AMD представляет Flex FP - bit-tech.net". bit-tech.net .
  12. ^ Лэрд, Джереми (август 2022 г.). «Снова Ryzen: воскрешение AMD». APC . № 509. Future Publishing. стр. 56–57. ISSN  0725-4415.
  13. ^ Блок микроархитектуры Bulldozer, AnandTech , 24 августа 2010 г.
  14. ^ Функциональная схема модуля Bulldozer, AMD , 24 августа 2010 г., заархивировано из оригинала 1 октября 2012 г. , извлечено 25 августа 2010 г.
  15. Подробнее о Bulldozer, Tomshardware.com, 24 августа 2010 г. , получено 23 января 2012 г.
  16. ^ AMD раскрывает подробности о микропроцессорах Bulldozer, AMD раскрывает подробности о микропроцессорах Bulldozer, Xbitlabs.com, архивировано из оригинала 3 сентября 2011 г. , извлечено 23 января 2012 г.
  17. Real World Technologies (26 августа 2010 г.), AMD Bulldozer Microarchitecture, Realworldtech.com , получено 23 января 2012 г.
  18. ^ Дэвид Кантер (26 августа 2010 г.). "Продолжение разработки подсистемы памяти AMD Bulldozer Microarchitecture". Real World Technologies .
  19. ^ Энергоэффективность конструкции бульдозера, AMD , 24 августа 2010 г.
  20. ^ abc AP (PDF) , заархивировано из оригинала (PDF) 20 января 2012 г. , извлечено 23 января 2012 г.
  21. ^ Йохан Де Гелас, «Последствия бульдозера: копаем еще глубже»
  22. ^ Ананд Лал Шимпи, Архитектура AMD Jaguar: процессор, на котором работают Xbox One, PlayStation 4, Kabini и Temash
  23. ^ Barragy, Ted (23 января 2012 г.). "Bulldozer Overview" (PDF) . Получено 19 сентября 2024 г. .
  24. ^ Набор инструкций XOP и FMA4 в SSE5, Techreport.com, 6 мая 2009 г. , получено 23 января 2012 г.
  25. AMD Financial Analyst Day 2010, Server Platforms Presentation, Ir.amd.com, 9 ноября 2010 г., архивировано из оригинала 12 ноября 2013 г. , извлечено 23 января 2012 г.
  26. ^ AMD Roadmap , получено 23 января 2012 г.
  27. ^ AMD (14 мая 2012 г.), Краткое справочное руководство по процессорам серии AMD Opteron 4200 (PDF) , www.amd.com , получено 15 августа 2012 г.
  28. ^ AMD (14 мая 2012 г.), Краткое справочное руководство по процессорам серии AMD Opteron 6200 (PDF) , www.amd.com , получено 15 августа 2012 г.
  29. ^ ASUS подтверждает совместимость AM3+ с платами AM3, Event.asus.com, заархивировано из оригинала 6 июня 2013 г. , извлечено 23 января 2012 г.
  30. ^ MSI подтверждает совместимость AM3+ с платами AM3, Event.msi.com, апрель 2011 г. , получено 23 января 2012 г.
  31. ^ "Процессоры AM3 будут работать в сокете AM3+, но чипы Bulldozer не будут работать в материнских платах, отличных от AM3+". Архивировано из оригинала 10 декабря 2010 г.
  32. ^ AMD поставляет первые процессоры «Bulldozer»
  33. ^ Семейства процессоров AMD FX-Series, Cpu-world.com, 2 октября 2012 г. , получено 21 октября 2012 г.
  34. Шилов, Антон (21 сентября 2012 г.). "AMD устанавливает дату запуска FX "Vishera"". X-bit laboratory . X-bit labs. Архивировано из оригинала 24 сентября 2012 г. Получено 23 сентября 2012 г.
  35. Что такое бульдозер?, 2 августа 2010 г., архивировано из оригинала 6 августа 2010 г.
  36. ^ Семейство микропроцессоров AMD Opteron 6200, cpu-world.com
  37. ^ "AMD подала в суд из-за якобы вводящего в заблуждение подсчета ядер Bulldozer". Ars Technica . Получено 8 ноября 2015 г.
  38. ^ "AMD Bulldozer 'Core' иск: AMD урегулировала вопрос за $12,1 млн, выплатила часть". AnandTech . Получено 19 января 2021 г. .
  39. ^ "Тони Дики и Пол Пармер и др. против Advanced Micro Devices". Архивировано из оригинала 19 октября 2019 г. Получено 19 января 2021 г.
  40. ^ AMD FX-8150 Bulldozer на Ubuntu Linux, phoronix.com, 24 октября 2011 г. , получено 13 декабря 2012 г.
  41. ^ Исправление проблемы псевдонимов кэша AMD Bulldozer, phoronix.com
  42. ^ AMD FX-8150 Bulldozer выигрывает от новых компиляторов, настройки, phoronix.com
  43. Bulldozer Has Arrived: AMD FX-8150 Processor Review, X-bit labs, 11 октября 2011 г., стр. 13, архивировано из оригинала 13 января 2012 г. , извлечено 23 января 2012 г.
  44. Bulldozer Has Arrived: AMD FX-8150 Processor Review, X-bit labs, 11 октября 2011 г., стр. 14, архивировано из оригинала 16 января 2012 г. , извлечено 23 января 2012 г.
  45. Наш взгляд на AMD FX, 'akozak' от имени AMD Blogs, 13 октября 2011 г., заархивировано из оригинала 15 октября 2011 г. , извлечено 23 января 2012 г.
  46. ^ Доступно обновление для компьютеров с установленным процессором серии AMD FX, AMD Opteron 4200, AMD Opteron 6200 или AMD Bulldozer, работающих под управлением Windows 7 или Windows Server 2008 R2, support.microsoft.com, январь 2012 г. , получено 11 февраля 2014 г.
  47. ^ Доступно обновление, которое выборочно отключает функцию парковки ядер в Windows 7 или Windows Server 2008 R2, support.microsoft.com, январь 2012 г. , получено 11 февраля 2014 г.
  48. ^ "AMD FX-8150 после двух исправлений Windows 7 и обновлений UEFI". tomshardware.com . 24 января 2012 г.
  49. ^ STEAM Games на платформах AMD FX, support.amd.com, 12 июня 2012 г. , получено 11 октября 2012 г.
  50. ^ "AMD: микроархитектура следующего поколения компенсирует приглушенный прием Bulldozer". pcgamer.com .
  51. ^ Процессор AMD Bulldozer снова побил мировой рекорд, достигнув 8,461 ГГц, geek.com, 1 ноября 2011 г., заархивировано из оригинала 28 апреля 2012 г. , извлечено 16 октября 2012 г.
  52. ^ "Рекорд скорости AMD Bulldozer снова побит на частоте 8,58 ГГц". tomshardware.com . 5 ноября 2011 г.
  53. ^ Сэмюэл Д. "CPU-Z Validator 4.0" . Получено 23 сентября 2014 г.
  54. ^ "Intel Core i9 13900K @ 8812.85 MHz - CPU-Z VALIDATOR". valid.x86.fr . Получено 23 октября 2022 г. .
  55. Обзор Bulldozer: AMD FX-8150 протестирован, AnandTech, 12 октября 2011 г. , получено 23 января 2012 г.
  56. ^ Кютресс, Ян (2 февраля 2016 г.). "AMD запускает экскаватор на настольном ПК: 65-ваттный Athlon X4 845 за 70 долларов". anandtech . Получено 28 марта 2017 г.

Внешние ссылки