Roadrunner — суперкомпьютер , созданный IBM для Лос-Аламосской национальной лаборатории в Нью-Мексико, США. Roadrunner стоимостью 100 миллионов долларов США был разработан для пиковой производительности 1,7 петафлопс . Он достиг 1,026 петафлопс 25 мая 2008 года, став первой в мире системой TOP500 LINPACK, устойчиво работающей на уровне 1,0 петафлопс. [2] [3]
В ноябре 2008 года он достиг максимальной производительности в 1,456 петафлопс , сохранив свое первое место в списке TOP500 . [4] Он также был четвертым по энергоэффективности суперкомпьютером в мире в списке Supermicro Green500 с рабочей скоростью 444,94 мегафлопс на ватт потребляемой мощности. Гибридная конструкция Roadrunner затем была повторно использована для нескольких других энергоэффективных суперкомпьютеров. [5] Roadrunner был выведен из эксплуатации Лос-Аламосом 31 марта 2013 года. [6] Вместо него Лос-Аламос ввел в эксплуатацию суперкомпьютер под названием Cielo , который был установлен в 2010 году.
IBM построила компьютер для Национальной администрации по ядерной безопасности (NNSA ) Министерства энергетики США (DOE ). [7] [8] Это была гибридная конструкция с 12 960 процессорами IBM PowerXCell 8i [9] и 6 480 двухъядерными процессорами AMD Opteron [10] в специально разработанных блейд-серверах, соединенных InfiniBand . Roadrunner использовал Red Hat Enterprise Linux вместе с Fedora [11] в качестве своих операционных систем и управлялся с помощью программного обеспечения распределенных вычислений xCAT . Он также использовал реализацию интерфейса передачи сообщений Open MPI . [12]
Roadrunner занимал около 296 серверных стоек [13], которые занимали 560 квадратных метров (6000 квадратных футов) [14] и был введен в эксплуатацию в 2008 году. Он был выведен из эксплуатации 31 марта 2013 года. [13] Министерство энергетики использовало компьютер для моделирования того, как стареют ядерные материалы, чтобы предсказать, является ли стареющий арсенал ядерного оружия США безопасным и надежным. Другие области применения Roadrunner включали науку, финансы, автомобилестроение и аэрокосмическую промышленность.
Roadrunner отличался от других современных суперкомпьютеров, поскольку он продолжал гибридный подход [13] к проектированию суперкомпьютеров, представленный Сеймуром Крейем в 1964 году с Control Data Corporation CDC 6600 и продолжил его с на порядок более быстрым CDC 7600 в 1969 году. Однако в этой архитектуре периферийные процессоры использовались только для функций операционной системы, а все приложения запускались в одном центральном процессоре. Большинство предыдущих суперкомпьютеров использовали только одну архитектуру процессора, поскольку считалось, что ее проще проектировать и программировать. Чтобы реализовать весь потенциал Roadrunner, все программное обеспечение должно было быть написано специально для этой гибридной архитектуры. Гибридная конструкция состояла из двухъядерных серверных процессоров Opteron, произведенных AMD с использованием стандартной архитектуры AMD64 . К каждому ядру Opteron присоединен процессор PowerXCell 8i , разработанный и изготовленный IBM . Как суперкомпьютер, Roadrunner рассматривался как кластер Opteron с ускорителями Cell, поскольку каждый узел состоял из Cell, подключенного к ядру Opteron, и Opteron друг к другу. [15]
Roadrunner находился в разработке с 2002 года и был запущен в эксплуатацию в 2006 году. Из-за своей новой конструкции и сложности он был построен в три этапа и стал полностью работоспособным в 2008 году. Его предшественником была машина, также разработанная в Лос-Аламосе под названием Dark Horse. [16] Эта машина была одной из самых ранних систем с гибридной архитектурой, изначально основанной на ARM, а затем перешедшей на процессор Cell. Это был полностью 3D-дизайн, его конструкция интегрировала 3D-память, сетевые технологии, процессоры и ряд других технологий.
Первая фаза Roadrunner заключалась в создании стандартного кластера на базе Opteron, а также оценке возможности дальнейшего создания и программирования будущей гибридной версии. Эта фаза 1 Roadrunner достигла 71 терафлопс и была полностью запущена в эксплуатацию в Лос-Аламосской национальной лаборатории в 2006 году.
Фаза 2, известная как AAIS (Advanced Architecture Initial System), включала в себя создание небольшой гибридной версии готовой системы с использованием старой версии процессора Cell. Эта фаза использовалась для создания прототипов приложений для гибридной архитектуры. Она была запущена в январе 2007 года.
Целью Фазы 3 было достижение устойчивой производительности свыше 1 петафлопс. В конструкцию были добавлены дополнительные узлы Opteron и новые процессоры PowerXCell. Эти процессоры PowerXCell в пять раз мощнее процессоров Cell, используемых в Фазе 2. Он был построен в полном масштабе на предприятии IBM в Покипси, штат Нью-Йорк , [1] , где он преодолел барьер в 1 петафлопс во время своей четвертой попытки 25 мая 2008 года. Полная система была перемещена на постоянное место в Нью-Мексико летом 2008 года. [1]
Roadrunner использовал две разные модели процессоров. Первая — AMD Opteron 2210 , работающая на частоте 1,8 ГГц. Opteron используются как в вычислительных узлах, снабжающих ячейки полезными данными, так и в системных операциях и узлах связи, передающих данные между вычислительными узлами и помогающих операторам, управляющим системой. Roadrunner имеет в общей сложности 6912 процессоров Opteron, из которых 6480 используются для вычислений и 432 для работы. Opteron соединены между собой с помощью каналов HyperTransport . Каждый Opteron имеет два ядра, что в общей сложности составляет 13 824 ядра.
Второй процессор — IBM PowerXCell 8i , работающий на частоте 3,2 ГГц. Эти процессоры имеют одно ядро общего назначения (PPE) и восемь ядер специальной производительности (SPE) для операций с плавающей точкой . Roadrunner имеет в общей сложности 12 960 процессоров PowerXCell с 12 960 ядрами PPE и 103 680 ядрами SPE, что в общей сложности составляет 116 640 ядер.
Логически TriBlade состоит из двух двухъядерных Opteron с 16 ГБ ОЗУ и четырех процессоров PowerXCell 8i с 16 ГБ оперативной памяти Cell. [10]
Физически TriBlade состоит из одного лезвия LS21 Opteron , лезвия расширения и двух лезвий QS22 Cell . LS21 имеет два двухъядерных Opteron 1,8 ГГц с 16 ГБ памяти для всего лезвия, обеспечивая 8 ГБ для каждого ЦП. Каждый QS22 имеет два ЦП PowerXCell 8i, работающих на частоте 3,2 ГГц и 8 ГБ памяти, что составляет 4 ГБ для каждого ЦП. Лезвие расширения подключает два QS22 через четыре канала PCIe x8 к LS21, по два канала для каждого QS22. Он также обеспечивает внешнее подключение через адаптер InfiniBand 4x DDR. Это составляет общую ширину четырех слотов для одного TriBlade. Три TriBlades помещаются в одно шасси BladeCenter H. Лезвие расширения подключается к лезвию Opteron через HyperTransport.
Подключенный блок — это 60 BladeCenter H, заполненных TriBlades, то есть 180 TriBlades. Все TriBlades подключены к 288-портовому коммутатору Voltaire ISR2012 Infiniband. Каждый CU также имеет доступ к файловой системе Panasas через двенадцать серверов System x3755 . [10]
Информация о системе CU: [10]
Окончательный кластер состоит из 18 подключенных блоков, которые подключены через восемь дополнительных (второй ступени) коммутаторов Infiniband ISR2012. Каждый CU подключен через двенадцать восходящих линий для каждого коммутатора второй ступени, что в общей сложности составляет 96 восходящих соединений. [10]
Общая информация о системе: [10]
IBM Roadrunner был закрыт 31 марта 2013 года. [13] Хотя суперкомпьютер был одним из самых быстрых в мире, его энергоэффективность была относительно низкой. Roadrunner выдавал 444 мегафлопса на ватт против 886 мегафлопсов на ватт сопоставимого суперкомпьютера. [17] Перед тем, как суперкомпьютер будет демонтирован, исследователи проведут один месяц, выполняя эксперименты с памятью и маршрутизацией данных, которые помогут в проектировании будущих суперкомпьютеров. [13]
После того, как IBM Roadrunner будет демонтирован, электроника будет уничтожена. [18] Лос-Аламос выполнит большую часть уничтожения суперкомпьютера, ссылаясь на секретный характер его вычислений. Некоторые его части будут сохранены для исторических целей. [18]