stringtranslate.com

Intel Tera-Scale

Intel Tera-Scale — это исследовательская программа Intel , которая фокусируется на разработке процессоров и платформ Intel, использующих присущий им параллелизм новых приложений визуальных вычислений. Таким приложениям требуются терафлопсы производительности параллельных вычислений для быстрой обработки терабайт данных. [1] Параллелизм — это концепция одновременного выполнения нескольких задач. Использование параллелизма не только увеличит эффективность вычислительных блоков (ЦП), но и увеличит количество байтов данных, анализируемых каждую секунду. Для надлежащего применения параллелизма ЦП должен иметь возможность обрабатывать несколько потоков , и для этого ЦП должен состоять из нескольких ядер. Обычное количество ядер в компьютерах потребительского класса составляет 2–8 ядер, в то время как компьютеры уровня рабочей станции могут иметь даже большее количество. Однако даже текущего количества ядер недостаточно для работы с производительностью терафлопсов, что приводит к необходимости добавления еще большего количества ядер. В результате программы были изготовлены два прототипа, которые использовались для проверки возможности использования гораздо большего количества ядер, чем обычно, и оказались успешными.

Прототипы

Teraflops Research Chip (Polaris) — это 80-ядерный прототип процессора, разработанный Intel в 2007 году. Он представляет собой первую публичную попытку Intel создать процессор Tera-Scale. Процессор Polaris требует работы на частоте 3,13 ГГц и 1 В, чтобы сохранить свое название teraFLOP. При пиковой производительности процессор способен выдавать 1,28 teraFLOP. [2]

Однокристальный облачный компьютер — еще один исследовательский процессор, разработанный Intel в 2009 году. Этот процессор состоит из 48 ядер P54C, соединенных в двумерную сетку 6x4. [3]

Идеология

Параллелизм — это концепция одновременного выполнения нескольких задач, эффективно сокращающая время, необходимое для выполнения заданной задачи. Исследовательская программа Tera-Scale сосредоточена на концепции использования гораздо большего количества ядер, чем обычно, для повышения производительности с помощью параллелизма. Основываясь на их предыдущем опыте с увеличенным количеством ядер в ЦП, удвоение количества ядер смогло почти удвоить производительность без увеличения мощности. С большим количеством ядер есть возможности повышения энергоэффективности, улучшения производительности, увеличения срока службы и новых возможностей. Процессоры Tera-Scale повысят энергоэффективность, имея возможность «усыплять» ядра, которые в данный момент не нужны, и в то же время смогут повысить производительность за счет разумного перераспределения рабочих нагрузок для обеспечения равномерного распределения рабочей нагрузки по всему чипу. Увеличенный срок службы также возможен для процессоров Tera-Scale из-за возможности иметь резервные ядра, которые могут быть включены в работу при отказе ядра в процессоре. Наконец, процессоры получат новые возможности и функциональность, поскольку могут быть интегрированы специализированные аппаратные движки, такие как графические движки. [4]

Аппаратное обеспечение

Intel Tera-Scale сосредоточена на создании многоядерных процессоров, которые могут использовать параллельную обработку для достижения терафлопс производительности вычислений. Текущие процессоры состоят из очень сложных ядер; однако, текущие ядра построены таким образом, что затрудняют наличие большего количества ядер в ЦП, чем текущее. В результате Intel в настоящее время сосредоточена на создании процессоров Tera-Scale с большим количеством ядер, а не высокопроизводительных ядер. Чтобы упростить ядра ЦП, Intel перешла от ЦП, использующих архитектуру x86 , к гораздо более простой архитектуре VLIW . VLIW является необычной архитектурой для настольных компьютеров, но подходит для компьютеров, работающих со специализированными приложениями. Эта архитектура упрощает проектирование оборудования за счет увеличения рабочей нагрузки на стороне компилятора, что означает, что больше работы должно быть вложено в программирование. Этот недостаток компенсируется тем фактом, что количество приложений, которые будут запущены на процессоре Tera-Scale, достаточно мало, чтобы не быть слишком большой нагрузкой для программного обеспечения. [2]

Программное обеспечение

С выпуском процессора Polaris 80 core в 2007 году люди усомнились в необходимости десятков или сотен ядер. Intel ответила категорией программного обеспечения под названием Recognition, Mining, and Synthesis (RMS), которое требует вычислительной мощности десятков или сотен ядер. Приложения распознавания создают модели на основе того, что они идентифицируют, например, лицо человека. Приложения майнинга извлекают один или несколько экземпляров из большого объема данных. Наконец, приложения синтеза позволяют прогнозировать и проектировать новые среды. Примером того, где необходимы процессоры RMS и тера-масштаба, является создание спортивных сводок. Обычно для спортивных сводок требуются часы, чтобы компьютер просмотрел сотни тысяч видеокадров, чтобы найти короткие клипы действий для показа в спортивных сводках. С программным обеспечением RMS и процессором тера-масштаба спортивные сводки можно создавать в режиме реального времени во время спортивных мероприятий. [1] Процессоры Tera-Scale также демонстрируют потенциал в анализе в реальном времени в таких областях, как финансы, где требуется процессор, способный анализировать огромные объемы данных. Из прошлой эволюции Intel от одноядерных к многоядерным процессорам Intel узнала, что параллелизация является ключом к большей вычислительной мощности в будущем. Исследовательская программа Intel Tera-Scale сосредоточена не только на создании многоядерных процессоров, но и на распараллеливании приложений сегодня и в будущем. Чтобы продемонстрировать свою преданность всем аспектам параллельных вычислений, Intel выделила 20 миллионов долларов на создание центров, которые будут исследовать и разрабатывать новые методы использования параллельных вычислений во многих других приложениях. [5]

Вызовы

В начале 2005 года Intel изначально столкнулась с проблемой пропускной способности памяти. По мере добавления большего количества ядер пропускная способность памяти остается прежней из-за ограничений по размеру, что фактически делает ЦП узким местом. Они смогли преодолеть эту проблему с помощью процесса, называемого укладкой кристаллов. Это процесс, в котором кристалл ЦП , флэш-память и DRAM укладываются друг на друга, значительно увеличивая возможную ширину шины памяти. [2] Еще одной проблемой, с которой столкнулась Intel, были физические ограничения электрических шин. Пропускная способность шины — это соединение ЦП с внешним миром, и с текущей пропускной способностью шины она не сможет поддерживать производительность терафлопс, получаемую от тера-масштабных процессоров. Исследования Intel в области кремниевой фотоники создали функциональную оптическую шину, которая может обеспечить превосходную скорость передачи сигналов и энергоэффективность по сравнению с текущими шинами. Эти оптические шины являются идеальным решением для ограничения пропускной способности шины для тера-масштабных процессоров. [2]

Ссылки

  1. ^ ab Held, Jim; Bautista, Jerry; Koehl, Sean (2006). "From a Few Cores to Many: A Tera-scale Computing Research Overview" (PDF) . White Paper Research at Intel . Intel Corporation . Получено 28 октября 2014 г. .
  2. ^ abcd Шимпи, Ананд Лал. "Эра Tera: Intel раскрывает больше о 80-ядерных ЦП". AnandTech . Получено 29 октября 2014 г. .
  3. ^ Мэттсон, Тим. «Использование однокристального облачного компьютера Intel (SCC)» (PDF) . Архивировано из оригинала (PDF) 20 декабря 2014 г. . Получено 11 ноября 2014 г. .
  4. ^ "Обзор архитектуры вычислений Tera-scale". Intel. Архивировано из оригинала 29-11-2014 . Получено 02-01-2017 .
  5. ^ Фергюсон, Скотт. «Microsoft, Intel выделяют $20 млн на параллельные вычисления». eWeek . Получено 6 ноября 2014 г.