Микроархитектура NetBurst [1] [2] называемая P68 внутри Intel , была преемницей микроархитектуры P6 в семействе x86 центральных процессоров (ЦП), производимых Intel. Первым ЦП, использовавшим эту архитектуру, был Willamette -core Pentium 4 , выпущенный 20 ноября 2000 года и первый из ЦП Pentium 4 ; все последующие варианты Pentium 4 и Pentium D также были основаны на NetBurst. В середине 2001 года Intel выпустила ядро Foster , которое также было основано на NetBurst, тем самым переведя ЦП Xeon на новую архитектуру. ЦП Celeron на базе Pentium 4 также используют архитектуру NetBurst.
NetBurst был заменен микроархитектурой Core на базе P6, выпущенной в июле 2006 года.
Микроархитектура NetBurst включает в себя такие функции, как Hyper-threading , Hyper Pipelined Technology, Rapid Execution Engine, Execution Trace Cache и систему воспроизведения , которые были впервые представлены именно в этой микроархитектуре, а некоторые из них никогда больше не появлялись.
Hyper-threading — это фирменная реализация Intel одновременной многопоточности (SMT), используемая для улучшения распараллеливания вычислений (выполнения нескольких задач одновременно), выполняемых на процессорах x86. Intel представила ее с процессорами NetBurst в 2002 году. Позднее Intel повторно представила ее в микроархитектуре Nehalem после ее отсутствия в Core 2.
Ядра Northwood и Willamette имеют внешнюю шину Front Side Bus (FSB), которая работает на частоте 100 МГц и передает четыре бита за такт, таким образом, имея эффективную скорость 400 МГц. Более поздние версии ядра Northwood, а также ядра Prescott ( и производные ) имеют эффективную шину Front Side Bus на частоте 800 МГц (200 МГц с четырехкратной накачкой). [1]
Ядра Willamette и Northwood содержат 20-ступенчатый конвейер инструкций . Это значительное увеличение количества этапов по сравнению с Pentium III, в конвейере которого было всего 10 этапов. Ядро Prescott увеличило длину конвейера до 31 этапа. Недостатком более длинных конвейеров является увеличение количества этапов, которые необходимо проследить в случае неправильного предсказания ветвления, что увеличивает штраф за указанное неправильное предсказание. Чтобы решить эту проблему, Intel разработала Rapid Execution Engine и вложила большие средства в свою технологию предсказания ветвлений, которая, по утверждениям Intel, снижает неправильное предсказание ветвлений на 33% по сравнению с Pentium III . [3] В действительности более длинный конвейер привел к снижению эффективности из-за меньшего количества выполняемых инструкций за такт (IPC), поскольку не удалось достичь достаточно высоких тактовых частот, чтобы компенсировать потерю производительности из-за большего, чем ожидалось, увеличения энергопотребления и нагрева.
С этой технологией два арифметико-логических устройства (АЛУ) в ядре ЦП имеют двойную накачку, что означает, что они фактически работают на частоте, вдвое превышающей тактовую частоту ядра. Например, в процессоре с частотой 3,8 ГГц АЛУ будут эффективно работать на частоте 7,6 ГГц. Причина этого в том, чтобы в целом компенсировать низкое количество IPC; кроме того, это значительно повышает целочисленную производительность ЦП. Intel также заменила высокоскоростной сдвигатель сдвига на исполнительный блок сдвига/вращения, который работает на той же частоте, что и ядро ЦП. Недостатком является то, что некоторые инструкции теперь намного медленнее (относительно и абсолютно), чем раньше, что затрудняет оптимизацию для нескольких целевых ЦП. Примером являются операции сдвига и поворота, которые страдают от отсутствия сдвигающего устройства сдвига, которое присутствовало на каждом ЦП x86, начиная с i386, включая основной процессор-конкурент Athlon .
В кэш L1 ЦП Intel включила свой Execution Trace Cache. Он хранит декодированные микрооперации , так что при выполнении новой инструкции, вместо того, чтобы снова извлекать и декодировать инструкцию, ЦП напрямую обращается к декодированным микрооперациям из кэша трассировки, тем самым значительно экономя время. Более того, микрооперации кэшируются в их прогнозируемом пути выполнения, что означает, что когда инструкции извлекаются ЦП из кэша, они уже присутствуют в правильном порядке выполнения. [4] Позже Intel представила похожую, но более простую концепцию с Sandy Bridge, называемую кэшем микроопераций (кешем UOP).
Система воспроизведения — это подсистема в процессоре Intel Pentium 4, которая перехватывает операции, ошибочно отправленные на выполнение планировщиком процессора. Операции, перехваченные системой воспроизведения, затем повторно выполняются в цикле до тех пор, пока не будут выполнены условия, необходимые для их правильного выполнения.
Архитектура Intel NetBurst позволяет вставлять подсказки по предсказанию ветвлений в код, чтобы сообщать, следует ли использовать статическое предсказание или нет, в то время как эта функция была заброшена в более поздних процессорах Intel. По данным Intel, алгоритм предсказания ветвлений NetBurst на 33% лучше, чем в P6. [5] [6]
Несмотря на эти усовершенствования, архитектура NetBurst создала препятствия для инженеров, пытающихся масштабировать ее производительность. С этой микроархитектурой Intel планировала достичь тактовой частоты 10 ГГц, [7] но из-за роста тактовой частоты Intel столкнулась с растущими проблемами с сохранением рассеивания мощности в приемлемых пределах. Intel достигла скоростного барьера в 3,8 ГГц в ноябре 2004 года, но столкнулась с проблемами, пытаясь достичь даже этого. Intel отказалась от NetBurst в 2006 году после того, как проблемы с тепловыделением стали неприемлемыми, а затем разработала микроархитектуру Core , вдохновленную ядром P6 процессора Pentium Pro для Tualatin Pentium III -S и, в первую очередь, Pentium M.
В январе 2002 года компания Intel заменила оригинальное ядро Willamette на переработанную версию микроархитектуры NetBurst под названием Northwood. Конструкция Northwood сочетала в себе увеличенный размер кэша, меньший 130-нм техпроцесс и технологию Hyper-Threading (хотя изначально во всех моделях, кроме модели 3,06 ГГц, эта функция была отключена), что позволило создать более современную и высокопроизводительную версию микроархитектуры NetBurst.
В феврале 2004 года Intel представила Prescott , более радикальную переработку микроархитектуры. Ядро Prescott производилось по 90-нм техпроцессу и включало несколько крупных изменений в конструкции, включая добавление еще большего кэша (с 512 КБ в Northwood до 1 МБ и 2 МБ в Prescott 2M), гораздо более глубокий конвейер инструкций (31 этап по сравнению с 20 в Northwood ), значительно улучшенный предсказатель ветвлений , введение инструкций SSE3 и позднее реализацию технологии Intel Extended Memory 64 (EM64T), бренда Intel для их совместимой реализации 64-битной версии x86-64 микроархитектуры x86 (как и в случае с гиперпоточностью, все чипы Prescott под маркой Pentium 4 HT имеют аппаратную поддержку этой функции, но изначально она была включена только в высокопроизводительных процессорах Xeon , прежде чем была официально представлена в процессорах с торговой маркой Pentium ). Потребление энергии и тепловыделение также стали основными проблемами Prescott , который быстро стал самым горячим и самым энергоемким из одноядерных процессоров Intel x86 и x86-64. Проблемы с питанием и тепловыделением не позволили Intel выпустить Prescott с тактовой частотой выше 3,8 ГГц, а также мобильную версию ядра с тактовой частотой выше 3,46 ГГц.
Intel также выпустила двухъядерный процессор на базе микроархитектуры NetBurst под торговой маркой Pentium D. Первое ядро Pentium D имело кодовое название Smithfield , которое на самом деле представляло собой два ядра Prescott на одном кристалле, а позднее — Presler , которое состояло из двух ядер Cedar Mill на двух отдельных кристаллах ( Cedar Mill — это 65-нм уменьшенная версия Prescott ).
Intel разрабатывала преемников на основе Netburst под названием Tejas и Jayhawk с числом стадий конвейера от 40 до 50, но в конечном итоге решила заменить NetBurst на микроархитектуру Core , [8] [9], выпущенную в июле 2006 года; эти преемники были более непосредственно получены из Pentium Pro ( микроархитектура P6 ). 8 августа 2008 года ознаменовал конец процессоров на основе Intel NetBurst. [10] Причиной отказа от NetBurst стали серьезные проблемы с нагревом, вызванные высокими тактовыми частотами. Хотя некоторые процессоры на основе Core и Nehalem имеют более высокие TDP , большинство процессоров являются многоядерными, поэтому каждое ядро выделяет часть максимального TDP, а одноядерные процессоры на основе Core с самой высокой тактовой частотой выделяют максимум 27 Вт тепла. Самые быстро тактируемые процессоры Pentium 4 для настольных ПК (одноядерные) имели TDP 115 Вт по сравнению с 88 Вт для самых быстро тактируемых мобильных версий. Хотя с введением новых степпингов TDP для некоторых моделей в конечном итоге были снижены.
Микроархитектура Nehalem, преемница микроархитектуры Core, должна была стать развитием NetBurst в соответствии с планами Intel, датируемыми 2000 годом. [ необходима ссылка ] Nehalem повторно реализует некоторые функции NetBurst, включая технологию Hyper-Threading, впервые представленную в ядре Northwood с частотой 3,06 ГГц , и кэш L3, впервые реализованную в потребительском процессоре в ядре Gallatin , используемом в Pentium 4 Extreme Edition.