PowerVR — это подразделение Imagination Technologies (ранее VideoLogic), которое разрабатывает аппаратное и программное обеспечение для 2D- и 3D-рендеринга , а также для кодирования , декодирования видео , сопутствующей обработки изображений и ускорения DirectX , OpenGL ES , OpenVG и OpenCL . PowerVR также разрабатывает ускорители ИИ, называемые Neural Network Accelerator (NNA).
Линейка продуктов PowerVR изначально была представлена для конкуренции на рынке настольных ПК за 3D-аппаратные ускорители с продуктом с лучшим соотношением цены и производительности , чем существующие продукты, такие как продукты от 3dfx Interactive . Быстрые изменения на этом рынке, особенно с появлением OpenGL и Direct3D , привели к быстрой консолидации. PowerVR представила новые версии с маломощной электроникой , которые были нацелены на рынок ноутбуков . Со временем это превратилось в серию проектов, которые можно было включить в архитектуры систем на кристалле, подходящие для использования на карманных устройствах .
Ускорители PowerVR не производятся компанией PowerVR, но вместо этого их IP-блоки конструкций интегральных схем и патенты лицензируются другими компаниями, такими как Texas Instruments , Intel , NEC , BlackBerry , Renesas , Samsung , Sony , STMicroelectronics , Freescale , Apple , [1] NXP Semiconductors (ранее Philips Semiconductors) и многими другими.
Чипсет PowerVR использует метод 3D-рендеринга, известный как отложенный рендеринг на основе плиток (часто сокращенно TBDR), который представляет собой рендеринг на основе плиток в сочетании с фирменным методом PowerVR по удалению скрытых поверхностей (HSR) и технологией иерархического планирования (HST). Поскольку программа генерации полигонов подает треугольники в PowerVR (драйвер), она сохраняет их в памяти в полосе треугольников или индексированном формате. В отличие от других архитектур, рендеринг полигонов (обычно) не выполняется до тех пор, пока вся информация о полигонах не будет собрана для текущего кадра . Кроме того, дорогостоящие операции текстурирования и затенения пикселей (или фрагментов) задерживаются, когда это возможно, пока не будет определена видимая поверхность в пикселе — следовательно, рендеринг откладывается.
Для визуализации дисплей делится на прямоугольные секции в виде сетки. Каждая секция называется плиткой. С каждой плиткой связан список треугольников, которые визуально перекрывают эту плитку. Каждая плитка визуализируется по очереди для получения конечного изображения.
Плитки визуализируются с использованием процесса, похожего на ray-casting . Лучи численно моделируются, как если бы они были направлены на треугольники, связанные с плиткой, и пиксель визуализируется из треугольника, ближайшего к камере. Аппаратное обеспечение PowerVR обычно вычисляет глубины, связанные с каждым полигоном для одной строки плитки за 1 цикл. [ dubious – discussion ]
Этот метод имеет то преимущество, что в отличие от более традиционных ранних иерархических систем, основанных на отклонении Z, не нужно выполнять никаких вычислений, чтобы определить, как выглядит полигон в области, где он скрыт другой геометрией. Он также позволяет корректно визуализировать частично прозрачные полигоны, независимо от порядка, в котором они обрабатываются приложением, создающим полигоны. (Эта возможность была реализована только в Series 2, включая Dreamcast и один вариант MBX. Обычно она не включается из-за отсутствия поддержки API и соображений стоимости.) Что еще более важно, поскольку визуализация ограничена одной плиткой за раз, вся плитка может находиться в быстрой встроенной памяти, которая сбрасывается в видеопамять перед обработкой следующей плитки. В обычных обстоятельствах каждая плитка посещается только один раз за кадр.
PowerVR — пионер отложенного рендеринга на основе плиток. Microsoft также концептуализировала эту идею в своем заброшенном проекте Talisman . Gigapixel, компания, которая разработала IP для 3D-графики на основе плиток, была куплена 3dfx , которая, в свою очередь, впоследствии была куплена Nvidia . Теперь было показано, что Nvidia использует рендеринг плиток в микроархитектурах Maxwell и Pascal для ограниченного количества геометрии. [2]
После приобретения Falanx компания ARM начала разработку еще одной крупной плиточной архитектуры, известной как Mali .
Intel использует похожую концепцию в своих интегрированных графических продуктах. Однако ее метод, называемый зонным рендерингом, не выполняет полное удаление скрытых поверхностей (HSR) и отложенное текстурирование, поэтому тратит скорость заполнения и полосу пропускания текстуры на пиксели, которые не видны в конечном изображении.
Недавние достижения в области иерархической Z-буферизации эффективно воплотили в себе идеи, ранее использовавшиеся только при отложенном рендеринге, включая идею возможности разбиения сцены на плитки и потенциальной возможности принимать или отклонять фрагменты полигонов размером с плитку.
Сегодня программный и аппаратный пакет PowerVR имеет ASIC для кодирования видео , декодирования и связанной обработки изображений . Он также имеет виртуализацию и ускорение DirectX , OpenGL ES , OpenVG и OpenCL . [3] Новейшие графические процессоры PowerVR Wizard имеют аппаратное обеспечение Ray Tracing Unit (RTU) с фиксированной функцией и поддерживают гибридный рендеринг. [4]
Первая серия карт PowerVR была в основном разработана как платы ускорителей только для 3D, которые использовали память основной 2D-видеокарты в качестве кадрового буфера через PCI. Первым продуктом PowerVR PC от Videologic на рынке был 3-чиповый Midas3, который имел очень ограниченную доступность в некоторых OEM- ПК Compaq . [5] [6] Эта карта имела очень плохую совместимость со всеми играми, кроме первых Direct3D, и даже большинство игр SGL не запускались. Однако ее внутренняя 24-битная цветовая точность рендеринга была примечательна для того времени.
Одночиповый PCX1 был выпущен в розницу как VideoLogic Apocalypse 3D [7] и имел улучшенную архитектуру с большим объемом текстурной памяти, что обеспечивало лучшую совместимость с играми. За ним последовала еще более усовершенствованная PCX2, которая работала на 6 МГц выше, разгружала часть работы драйвера, включив больше функциональности чипа [8] и добавила билинейную фильтрацию, и была выпущена в розницу на картах Matrox M3D [9] и Videologic Apocalypse 3Dx. Также была Videologic Apocalypse 5D Sonic, которая объединяла ускоритель PCX2 с ядром Tseng ET6100 2D и звуком ESS Agogo на одной плате PCI.
Карты PowerVR PCX были представлены на рынке как бюджетные продукты и хорошо себя зарекомендовали в играх своего времени, но не были столь полнофункциональны, как ускорители 3DFX Voodoo (например, из-за отсутствия некоторых режимов смешивания). Однако подход PowerVR к рендерингу в память 2D-карты означал, что в теории возможны гораздо более высокие разрешения 3D-рендеринга, особенно в играх PowerSGL, которые в полной мере использовали аппаратные возможности.
Второе поколение PowerVR2 («PowerVR Series2», кодовое название чипа «CLX2») было представлено на рынке в консоли Dreamcast между 1998 и 2001 годами. В рамках внутреннего конкурса в Sega на разработку преемника Saturn , PowerVR2 был лицензирован NEC и был выбран вместо конкурирующего дизайна, основанного на 3dfx Voodoo2 . Во время разработки он назывался «Проектом Highlander». [10] PowerVR2 был сопряжен с Hitachi SH-4 в Dreamcast, причем SH-4 использовался в качестве геометрического движка T&L , а PowerVR2 — в качестве движка рендеринга. [11] PowerVR2 также использовался в Sega Naomi , модернизированной аркадной системной плате, аналогичной Dreamcast.
Однако успех Dreamcast привел к тому, что вариант для ПК, продаваемый как Neon 250, появился на рынке на год позже, [12] в конце 1999 года. Тем не менее, Neon 250 был конкурентоспособен с RIVA TNT2 и Voodoo3 . [13] Neon 250 имеет худшие аппаратные характеристики по сравнению с частью PowerVR2, используемой в Dreamcast, например, уменьшенный вдвое размер плитки и т. д.
В 2000 году было выпущено третье поколение PowerVR3 STG4000 KYRO , произведенное новым партнером STMicroelectronics . Архитектура была переработана для лучшей совместимости с играми и расширена до двухконвейерной конструкции для большей производительности. Обновленная STM PowerVR3 KYRO II, выпущенная позднее в 2001 году, вероятно, имела удлиненный конвейер для достижения более высоких тактовых частот [14] и могла конкурировать с более дорогими ATI Radeon DDR и NVIDIA GeForce 2 GTS в некоторых бенчмарках того времени, несмотря на свои скромные спецификации на бумаге и отсутствие аппаратного преобразования и освещения (T&L), факт, который Nvidia особенно пыталась извлечь из конфиденциальной статьи, которую они разослали рецензентам. [15] Поскольку игры все больше стали включать больше геометрии с учетом этой функции, KYRO II потеряла свою конкурентоспособность.
Серия KYRO имела приличный набор функций для бюджетного графического процессора своего времени, включая несколько функций, совместимых с Direct3D 8.1, таких как 8-слойное мультитекстурирование (не 8-проходное) и Environment Mapped Bump Mapping (EMBM); также присутствовали полноэкранное сглаживание (FSAA) и трилинейная/анизотропная фильтрация. [16] [17] [18] KYRO II также мог выполнять Dot Product (Dot3) Bump Mapping с той же скоростью, что и GeForce 2 GTS в тестах. [19] К упущениям относились аппаратный T&L (опциональная функция в Direct3D 7), Cube Environment Mapping и устаревшая поддержка 8-битной палитровой текстуры. Хотя чип поддерживал сжатие текстур S3TC /DXTC, поддерживался только (наиболее часто используемый) формат DXT1. [20] Поддержка проприетарного API PowerSGL также была прекращена в этой серии.
Качество 16-битного вывода было превосходным по сравнению с большинством конкурентов благодаря рендерингу во внутренний 32-битный кэш плиток и понижению дискретизации до 16 бит вместо прямого использования 16-битного буфера кадров. [21] Это могло сыграть свою роль в повышении производительности без значительной потери качества изображения, поскольку пропускная способность памяти была невелика. Однако из-за своей уникальной концепции на рынке архитектура иногда могла демонстрировать недостатки, такие как отсутствие геометрии в играх, и поэтому драйвер имел заметное количество настроек совместимости, таких как отключение внутреннего Z-буфера. Эти настройки могли оказать негативное влияние на производительность.
Второе обновление KYRO было запланировано на 2002 год, STG4800 KYRO II SE. Образцы этой карты были отправлены рецензентам, но, похоже, она не была выпущена на рынок. Помимо повышения тактовой частоты, это обновление было анонсировано с программной эмуляцией HW T&L "EnT&L", которая в конечном итоге попала в драйверы для предыдущих карт KYRO, начиная с версии 2.0. STG5500 KYRO III, основанная на PowerVR4 следующего поколения , была завершена и должна была включать аппаратный T&L, но была отложена из-за закрытия STMicro своего графического подразделения.
PowerVR добился большого успеха на рынке мобильной графики с его маломощным PowerVR MBX . MBX и его преемники SGX получили лицензии от ряда ведущих производителей мобильных полупроводников в своих мобильных чипсетах SoC , включая Intel , Texas Instruments , Samsung , NEC , NXP Semiconductors , Freescale , Renesas , SiRF , Marvell и Sunplus. [23]
Эти мобильные чипсеты с MBX IP в свою очередь использовались в нескольких высококлассных сотовых телефонах и смартфонах, включая оригинальный iPhone и iPod Touch (с Samsung S5L8900), Nokia N95 и Motorola RIZR Z8 (с TI OMAP 2420), а также Sony Ericsson P1 и M600 ( NXP Nexperia PNX4008 ). Он также использовался в некоторых КПК , таких как Dell Axim X50V и X51V с сопроцессором Intel 2700G , а также в телевизионных приставках с процессором Intel CE 2110 на базе MBX Lite.
Существовало два варианта: MBX и MBX Lite. Оба имели одинаковый набор функций, где MBX был оптимизирован для скорости, а MBX Lite был оптимизирован для низкого энергопотребления. MBX также мог быть объединен с опциями, включающими полный или облегченный FPU , и/или полный или облегченный VGP (процессор векторной графики).
Серия Series5 SGX от PowerVR оснащена аппаратными средствами пиксельных , вершинных и геометрических шейдеров , поддерживающими OpenGL ES 2.0 и DirectX 10.1 с Shader Model 4.1.
Ядро графического процессора SGX включено в несколько популярных систем на кристалле (SoC), используемых во многих портативных устройствах. Apple использует A4 (производства Samsung) в своих iPhone 4 , iPad , iPod Touch и Apple TV , а также в Apple Watch как часть Apple S1 . SoC серий OMAP 3 и 4 от Texas Instruments используются в Kindle Fire HD 8.9" от Amazon , Nook HD(+) от Barnes and Noble , BlackBerry PlayBook , Nokia N9 , Nokia N900 , Sony Ericsson Vivaz , Motorola Droid/Milestone , Motorola Defy , Motorola RAZR D1/D3, Droid Bionic, Archos 70 , Palm Pre , Samsung Galaxy SL , Galaxy Nexus , Open Pandora и других. Samsung производит SoC Hummingbird и использует его в своих устройствах Samsung Galaxy S , Galaxy Tab , Samsung Wave S8500 , Samsung Wave II S8530 и Samsung Wave III S860. Hummingbird также используется в смартфоне Meizu M9 .
Intel использовала ряд продуктов SGX в своих платформах Menlow , Moorestown , Medfield и Clover Trail+ на базе Atom MID . Использование графических чипсетов SGX помогло Intel успешно достичь сверхнизких бюджетов мощности, необходимых для пассивно охлаждаемых устройств, таких как смартфоны, планшеты и нетбуки. [24] Однако существенная разница в графической архитектуре привела к плохой поддержке драйверов. [25]
Чипы PowerVR Series5XT SGX представляют собой многоядерные варианты серии SGX с некоторыми обновлениями. Он включен в портативное игровое устройство PlayStation Vita с моделью MP4+ PowerVR SGX543, единственное предполагаемое отличие, помимо +, указывающего на функции, настроенные для Sony, — это ядра, где MP4 обозначает 4 ядра (четырехъядерный), тогда как MP8 обозначает 8 ядер (восьмиядерный). Allwinner A31 (четырехъядерный мобильный процессор приложений) оснащен двухъядерным SGX544 MP2. Apple iPad 2 и iPhone 4S с A5 SoC также оснащены двухъядерным SGX543MP2. iPad (3-го поколения) A5X SoC оснащен четырехъядерным SGX543MP4. [26] iPhone 5 A6 SoC оснащен трехъядерным SGX543MP3. В iPad (4-го поколения) A6X SoC используется четырехъядерный SGX554MP4. Вариант Exynos в Samsung Galaxy S4 оснащен трехъядерным SGX544MP3 с тактовой частотой 533 МГц.
Эти графические процессоры могут использоваться как в одноядерной, так и в многоядерной конфигурации. [27]
Представленный в 2014 году графический процессор PowerVR GX5300 [28] основан на архитектуре SGX и является самым маленьким в мире графическим ядром с поддержкой Android, предлагая маломощные продукты для смартфонов начального уровня, носимых устройств, Интернета вещей и других небольших встраиваемых приложений, включая корпоративные устройства, такие как принтеры.
Графические процессоры PowerVR Series6 [29] основаны на эволюции архитектуры SGX под кодовым названием Rogue . ST-Ericsson (ныне несуществующая) объявила, что ее процессоры приложений Nova будут включать архитектуру PowerVR Series6 следующего поколения от Imagination. [30] MediaTek анонсировала четырехъядерную систему на кристалле MT8135 (два ядра ARM Cortex-A15 и два ядра ARM Cortex-A7 ) для планшетов. [31] Renesas объявила, что ее система на кристалле R-Car H2 включает G6400. [32] Система на кристалле Allwinner Technology A80 (4 ядра Cortex-A15 и 4 ядра Cortex-A7), доступная в планшете Onda V989, оснащена графическим процессором PowerVR G6230. [33] Система на кристалле Apple A7 интегрирует графический процессор (GPU), который, по мнению AnandTech, является PowerVR G6430 в четырехкластерной конфигурации. [34]
Intel также продолжила использовать графику PowerVR исключительно в своих сверхмаломощных смартфонных платформах Merrifield и Moorefield Atom. [35]
Графические процессоры PowerVR Series 6 имеют 2 TMU на кластер. [36]
Графические процессоры PowerVR Series6XE [37] основаны на Series6 и разработаны как чипы начального уровня, нацеленные на обеспечение примерно такой же скорости заполнения по сравнению с серией Series5XT. Однако они имеют обновленную поддержку API, такую как Vulkan, OpenGL ES 3.1, OpenCL 1.2 и DirectX 9.3 (9.3 L3). [38] Rockchip и Realtek использовали графические процессоры Series6XE в своих SoC.
Графические процессоры PowerVR Series 6XE были анонсированы 6 января 2014 года. [38]
Графические процессоры PowerVR Series6XT [39] нацелены на дальнейшее снижение энергопотребления за счет оптимизации площади кристалла и производительности, обеспечивая прирост до 50% по сравнению с графическими процессорами Series6. Эти чипы поддерживают оптимизацию на уровне системы с тройным сжатием PVR3C и глубокий цвет Ultra HD. [40] Apple iPhone 6 , iPhone 6 Plus и iPod Touch (6-го поколения) с A8 SoC оснащены четырехъядерным GX6450. [41] [42] Неанонсированный 8-кластерный вариант использовался в Apple A8X SoC для их модели iPad Air 2 (выпущенной в 2014 году). MediaTek MT8173 и Renesas R-Car H3 SoC используют графические процессоры Series6XT.
Графические процессоры PowerVR Series 6XT были представлены 6 января 2014 года. [43]
Графические процессоры PowerVR Series 7XE были анонсированы 10 ноября 2014 года. На момент анонса серия 7XE содержала самый маленький графический процессор, совместимый с Android Extension Pack .
Графические процессоры PowerVR Series7XT [44] доступны в конфигурациях от двух до 16 кластеров, предлагая значительно масштабируемую производительность от 100 GFLOPS до 1,5 TFLOPS. GT7600 используется в моделях Apple iPhone 6s и iPhone 6s Plus (выпущенных в 2015 году), а также в модели Apple iPhone SE (выпущенной в 2016 году) и модели Apple iPad (выпущенной в 2017 году) соответственно. Неанонсированный вариант с 12 кластерами использовался в Apple A9X SoC для моделей iPad Pro (выпущенных в 2015 году).
Графические процессоры PowerVR Series 7XT были представлены 10 ноября 2014 года.
Графические процессоры PowerVR Series7XT Plus являются развитием семейства Series7XT и добавляют специальные функции, предназначенные для ускорения компьютерного зрения на мобильных и встраиваемых устройствах, включая новые пути данных INT16 и INT8, которые повышают производительность до 4 раз для ядер OpenVX. Дальнейшие улучшения в общей виртуальной памяти также обеспечивают поддержку OpenCL 2.0. GT7600 Plus используется в моделях Apple iPhone 7 и iPhone 7 Plus (выпущенных в 2016 году), а также в модели Apple iPad (выпущенной в 2018 году).
Графические процессоры PowerVR Series 7XT Plus были анонсированы на международной выставке CES в Лас-Вегасе 6 января 2016 года.
Series7XT Plus обеспечивает до 4-кратного увеличения производительности для приложений машинного зрения.
Графические процессоры разработаны для обеспечения повышенной внутрисистемной эффективности, улучшенной энергоэффективности и сокращенной полосы пропускания для машинного зрения и вычислительной фотографии в потребительских устройствах, смартфонах среднего и массового класса, планшетах и автомобильных системах, таких как усовершенствованные системы помощи водителю (ADAS), информационно-развлекательные системы, компьютерное зрение и усовершенствованная обработка для приборных панелей.
Новые графические процессоры включают в себя усовершенствованный набор функций с упором на вычисления следующего поколения:
До 4 раз более высокая производительность для алгоритмов OpenVX/vision по сравнению с предыдущим поколением за счет улучшенной целочисленной (INT) производительности (2x INT16; 4x INT8) Улучшения пропускной способности и задержки за счет общей виртуальной памяти (SVM) в OpenCL 2.0 Динамический параллелизм для более эффективного выполнения и управления за счет поддержки очереди устройств в OpenCL 2.0
Графические процессоры PowerVR Series8XE поддерживают OpenGL ES 3.2 и Vulkan 1.x и доступны в конфигурациях 1, 2, 4 и 8 пикселей/такт, [45] что позволяет запускать новейшие игры и приложения и дополнительно снижает стоимость высококачественных пользовательских интерфейсов на устройствах с ограниченным бюджетом.
PowerVR Series 8XE были анонсированы 22 февраля 2016 года на Mobile World Congress 2016. Они являются итерацией микроархитектуры Rogue и нацелены на рынок SoC GPU начального уровня. Новые GPU улучшают производительность/мм² для наименьшего размера кремния и профиля мощности, а также включают аппаратную виртуализацию и многодоменную безопасность. [46] Более новые модели были выпущены позже в январе 2017 года с новой частью low-end и high-end. [47]
PowerVR Series8XEP были анонсированы в январе 2017 года. Это итерация микроархитектуры Rogue, нацеленная на рынок SoC GPU среднего уровня с разрешением 1080p. Series8XEP по-прежнему ориентирована на размер кристалла и производительность на единицу
Анонсированная 8 марта 2017 года, Furian является первой новой архитектурой PowerVR с момента появления Rogue пятью годами ранее. [48]
PowerVR Series 8XT были анонсированы 8 марта 2017 года. Это первая серия GPU на базе новой архитектуры Furian. По данным Imagination, GFLOPS/мм² улучшен на 35%, а Fill Rate/мм² улучшен на 80% по сравнению с серией 7XT Plus на том же узле. [ необходима цитата ] Конкретные конструкции не были анонсированы по состоянию на март 2017 года. Series8XT имеет 32-широкие конвейерные кластеры.
Анонсированное в сентябре 2017 года семейство графических процессоров Series9XE обеспечивает экономию полосы пропускания до 25% по сравнению с графическими процессорами предыдущего поколения. Семейство Series9XE предназначено для телевизионных приставок (STB), цифровых телевизоров (DTV) и бюджетных смартфонов SoC. Примечание: данные в таблице приведены для кластера. [50]
Семейство графических процессоров Series9XM достигает на 50% лучшей плотности производительности, чем предыдущее поколение 8XEP. Семейство Series9XM нацелено на SoC для смартфонов среднего уровня.
Семейство графических процессоров Series9XEP было анонсировано 4 декабря 2018 года. [51] Семейство Series9XEP поддерживает сжатие изображений PVRIC4. [52] Семейство Series9XEP предназначено для телевизионных приставок (STB), цифровых телевизоров (DTV) и бюджетных смартфонов SoC.
Семейство графических процессоров Series9XMP было анонсировано 4 декабря 2018 года. [51] Семейство Series9XMP поддерживает сжатие изображений PVRIC4. [52] Семейство Series9XMP нацелено на SoC для смартфонов среднего класса.
Семейство графических процессоров Series9XTP было анонсировано 4 декабря 2018 года. [51] Семейство Series9XTP поддерживает сжатие изображений PVRIC4. [52] Семейство Series9XTP нацелено на высокопроизводительные SoC для смартфонов. Series9XTP имеет кластеры конвейеров шириной 40.
Графические процессоры серии A обеспечивают на 250% лучшую производительность, чем предыдущая серия 9. Эти графические процессоры больше не называются PowerVR, они называются IMG. [53]
Графические процессоры серии B занимают на 25% меньше места на кристалле и потребляют на 30% меньше энергии, чем предыдущая серия A.
4 ноября 2021 года компания Imagination Technologies анонсировала новую архитектуру графических процессоров серии C. [59]
Примечания
Семейство ускорителей нейронных сетей (NNA) Series2NX было анонсировано 21 сентября 2017 года.
Основные параметры Series2NX:
Семейство ускорителей нейронных сетей (NNA) Series3NX было анонсировано 4 декабря 2018 года. [62]
Основные параметры Series3NX:
Многоядерные опции Series3NX
Семейство ускорителей нейронных сетей (NNA) Series3NX-F было анонсировано вместе с семейством Series3NX. Семейство Series3NX-F объединяет Series 3NX с GPGPU на основе Rogue (NNPU) и локальной оперативной памятью. Это обеспечивает поддержку программируемости и операций с плавающей точкой. [62]
Варианты графических процессоров PowerVR можно найти в следующей таблице систем на чипах ( SoC ). Реализации ускорителей PowerVR в продуктах перечислены здесь .
Начиная с 2019 г. Apple больше не будет использовать разработки компании.
{{cite news}}
: CS1 maint: несколько имен: список авторов ( ссылка )