Larrabee — кодовое название отмененного чипа GPGPU , который Intel разрабатывала отдельно от своей текущей линейки интегрированных графических ускорителей . Он назван в честь горы Ларраби или государственного парка Ларраби в штате Вашингтон. [1] [2] Чип должен был быть выпущен в 2010 году как ядро потребительской 3D-видеокарты , но эти планы были отменены из-за задержек и разочаровывающих ранних показателей производительности. [3] [4] Проект по производству розничного продукта GPU непосредственно из исследовательского проекта Larrabee был прекращен в мае 2010 года [5], и его технология была передана Xeon Phi . Многопроцессорная архитектура Intel MIC, анонсированная в 2010 году, унаследовала многие элементы дизайна из проекта Larrabee, но не функционирует как графический процессор; продукт предназначен как сопроцессор для высокопроизводительных вычислений .
Почти десятилетие спустя, 12 июня 2018 года, идея выделенного графического процессора Intel вновь возродилась в связи с желанием Intel создать дискретный графический процессор к 2020 году. [6] Этот проект в конечном итоге стал сериями Intel Xe и Intel Arc , выпущенными в сентябре 2020 года и марте 2022 года соответственно, но оба они не были связаны с работой над проектом Larrabee.
4 декабря 2009 года Intel официально объявила, что Larrabee первого поколения не будет выпущен как потребительский GPU-продукт. [7] Вместо этого он должен был быть выпущен как платформа разработки для графики и высокопроизводительных вычислений . Официальной причиной стратегической перезагрузки были названы задержки в разработке оборудования и программного обеспечения. [8] 25 мая 2010 года блог Technology@Intel объявил, что Larrabee не будет выпущен как GPU, а вместо этого будет выпущен как продукт для высокопроизводительных вычислений, конкурирующий с Nvidia Tesla . [9]
Проект по производству розничного продукта GPU непосредственно из исследовательского проекта Larrabee был прекращен в мае 2010 года. [5] Архитектура многопроцессорной системы Intel MIC , анонсированная в 2010 году, унаследовала многие элементы дизайна из проекта Larrabee, но не функционирует как графический процессор; продукт предназначен как сопроцессор для высокопроизводительных вычислений. Прототип карты был назван Knights Ferry , производственная карта, построенная на 22-нм процессе под названием Knights Corner , планировалась к производству в 2012 году или позже. [ необходима цитата ]
Larrabee можно считать гибридом многоядерного CPU и GPU , и он имеет сходство с обоими. Его когерентная иерархия кэша и совместимость с архитектурой x86 подобны CPU, в то время как его широкие векторные блоки SIMD и аппаратное обеспечение для выборки текстур подобны GPU.
Как графический процессор, Larrabee поддерживал бы традиционную растровую 3D-графику ( Direct3D и OpenGL ) для игр. Однако его гибридизация функций CPU и GPU также должна была бы подходить для задач GPU общего назначения (GPGPU) или потоковой обработки . Например, он мог бы выполнять трассировку лучей или обработку физики [10] в реальном времени для игр или офлайн для научных исследований в качестве компонента суперкомпьютера [ 11] .
Ранняя презентация Larrabee вызвала некоторую критику со стороны конкурентов GPU. На NVISION 08 сотрудник Nvidia назвал статью Intel SIGGRAPH о Larrabee «маркетинговой болтовней» и процитировал отраслевого аналитика (Питера Гласковски), который предположил, что архитектура Larrabee была «как GPU из 2006 года». [12] К июню 2009 года Intel заявила, что прототипы Larrabee были на одном уровне с Nvidia GeForce GTX 285. [ 13] Джастин Раттнер , технический директор Intel , выступил с основным докладом на конференции Supercomputing 2009 17 ноября 2009 года. Во время своего выступления он продемонстрировал разогнанный процессор Larrabee, превосходящий один терафлопс по производительности. Он заявил, что это была первая публичная демонстрация однокристальной системы, превышающей один терафлопс. Он указал, что это был ранний кремний, тем самым оставив открытым вопрос о возможной производительности архитектуры. Поскольку это составляло всего лишь одну пятую от доступных конкурирующих графических плат, Larrabee был отменен «как отдельный дискретный графический продукт» 4 декабря 2009 года. [3]
Larrabee должен был отличаться от старых дискретных графических процессоров, таких как серии GeForce 200 и Radeon 4000, тремя основными способами:
Ожидалось, что это сделает Larrabee более гибким, чем текущие графические процессоры, что позволит больше различать внешний вид игр или других 3D-приложений. В статье Intel SIGGRAPH 2008 упоминается несколько функций рендеринга, которые было трудно достичь на текущих графических процессорах: чтение цели рендеринга, прозрачность, независимая от порядка , нерегулярное отображение теней и трассировка лучей в реальном времени . [14]
Более современные графические процессоры, такие как ATI Radeon HD 5xxx и Nvidia GeForce 400, обладают все более широкими возможностями универсальных вычислений благодаря DirectX11 DirectCompute и OpenCL, а также фирменной технологии Nvidia CUDA , что дает им многие из возможностей Larrabee.
Ядра процессора x86 в Larrabee отличались от ядер в современных процессорах Intel, таких как Core 2 Duo или Core i7 , по нескольким параметрам :
Теоретически ядра процессора Larrabee x86 могли бы запускать существующее программное обеспечение для ПК или даже операционные системы. Другая версия процессора могла бы находиться в сокетах ЦП материнской платы с использованием QuickPath [17] , но Intel никогда не объявляла о каких-либо планах на этот счет. Хотя собственный компилятор Larrabee C/C++ включал автоматическую векторизацию, и многие приложения могли выполняться правильно после перекомпиляции, ожидалось, что максимальная эффективность потребовала бы оптимизации кода с использованием векторных встроенных функций C++ или встроенного ассемблерного кода Larrabee [14] . Однако, как и во всех GPGPU, не все программное обеспечение выиграло бы от использования векторного процессора. Один сайт технической журналистики утверждает, что графические возможности Larrabee планировалось интегрировать в ЦП на основе микроархитектуры Haswell [18] .
Философия Larrabee по использованию множества небольших, простых ядер была похожа на идеи, лежащие в основе процессора Cell . Есть и некоторые другие общие черты, такие как использование кольцевой шины с высокой пропускной способностью для связи между ядрами. [14] Однако было много существенных различий в реализации, которые, как ожидалось, упростят программирование Larrabee.
Intel начала интегрировать линейку графических процессоров на материнские платы под брендом Intel GMA в 2004 году. Будучи интегрированными на материнские платы (более новые версии, такие как выпущенные с Sandy Bridge, встроены в тот же кристалл, что и ЦП), эти чипы не продавались отдельно. Хотя низкая стоимость и энергопотребление чипов Intel GMA сделали их подходящими для небольших ноутбуков и менее требовательных задач, им не хватает вычислительной мощности 3D-графики, чтобы конкурировать с современными графическими процессорами Nvidia и AMD/ATI за долю рынка игровых компьютеров высокого класса, рынка HPC или место в популярных игровых консолях . Напротив, Larrabee должен был продаваться как дискретный графический процессор, отдельно от материнских плат, и, как ожидалось, должен был работать достаточно хорошо для рассмотрения в следующем поколении игровых консолей. [19] [20]
Команда, работающая над Larrabee, была отделена от команды Intel GMA. Аппаратное обеспечение было разработано недавно сформированной командой на площадке Intel в Хиллсборо, штат Орегон, отдельно от тех, кто проектировал Nehalem . Программное обеспечение и драйверы были написаны недавно сформированной командой. 3D-стек был специально написан разработчиками из RAD Game Tools (включая Майкла Абраша ). [21]
Институт визуальных вычислений Intel исследовал базовые и прикладные технологии, которые можно было бы применить к продуктам на базе Larrabee. [22]
В документе Intel SIGGRAPH 2008 описывается моделирование с точностью до цикла (включая ограничения памяти, кэшей и текстурных блоков) прогнозируемой производительности Larrabee. [14] Графики показывают, сколько ядер Larrabee с частотой 1 ГГц требуется для поддержания 60 кадров/с при разрешении 1600×1200 в нескольких популярных играх. Примерно 25 ядер требуется для Gears of War без сглаживания, 25 ядер для FEAR с 4-кратным сглаживанием и 10 ядер для Half-Life 2: Episode Two с 4-кратным сглаживанием. Intel заявила, что Larrabee, скорее всего, будет работать быстрее 1 ГГц, поэтому эти числа не представляют собой фактические ядра, а скорее виртуальные временные интервалы таковых. Другой график показывает, что производительность в этих играх масштабируется почти линейно с количеством ядер до 32 ядер. При 48 ядрах производительность падает до 90% от ожидаемой, если бы линейная зависимость сохранялась. [23]
В статье PC Watch за июнь 2007 года говорилось, что первые чипы Larrabee будут иметь 32 ядра процессора x86 и выйдут в конце 2009 года, изготовленные по 45-нанометровому процессу . Чипы с несколькими дефектными ядрами из-за проблем с выходом продукции будут продаваться как 24-ядерная версия. Позже в 2010 году Larrabee будет уменьшен для 32-нанометрового процесса изготовления , чтобы сделать возможной 48-ядерную версию. [24]
Последнее утверждение о производительности можно рассчитать (теоретически это максимально возможная производительность) следующим образом: 32 ядра × 16 операций SIMD одинарной точности с плавающей точкой на ядро × 2 FLOP (объединенное умножение-сложение) × 2 ГГц = 2 TFLOPS теоретически.
Публичная демонстрация возможностей трассировки лучей Larrabee состоялась на форуме разработчиков Intel в Сан-Франциско 22 сентября 2009 года. Экспериментальная версия Enemy Territory: Quake Wars под названием Quake Wars: Ray Traced была показана в реальном времени. Сцена содержала водную поверхность с трассировкой лучей, которая точно отражала окружающие объекты, такие как корабль и несколько летательных аппаратов. [25] [26] [27]
Вторая демонстрация была представлена на конференции SC09 в Портленде 17 ноября 2009 года во время выступления технического директора Intel Джастина Раттнера . Карта Larrabee смогла достичь 1006 GFLops в расчетах SGEMM 4Kx4K.
Инженерный образец карты Larrabee был приобретен и рассмотрен Линусом Себастьяном в видео, опубликованном 14 мая 2018 года. Однако ему не удалось заставить карту выдавать видеовыход, поскольку материнская плата отображала POST-код D6. [28] В 2022 году YouTuber Роман «der8auer» Хартунг продемонстрировал другую карту, которая, как было показано, работала и выдавала сигнал дисплея, но не могла обеспечить 3D-ускорение из-за отсутствующих драйверов. [29]
{{cite web}}
: CS1 maint: неподходящий URL ( ссылка ){{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ){{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка )