Подразделение NASA Advanced Supercomputing (NAS) находится в исследовательском центре NASA Ames , Moffett Field в самом сердце Кремниевой долины в Маунтин-Вью, Калифорния . На протяжении почти сорока лет оно является основным ресурсом суперкомпьютеров, моделирования и имитации для миссий NASA в области аэродинамики, исследования космоса, изучения погодных условий и океанских течений, а также проектирования и разработки космических челноков и самолетов.
В настоящее время на объекте размещаются петафлопсные суперкомпьютеры Pleiades , Aitken и Electra , а также терафлопсный суперкомпьютер Endeavour . Системы основаны на архитектуре SGI и HPE с процессорами Intel . В главном здании также размещаются дисковые и архивные ленточные системы хранения данных емкостью более эксабайта данных, система визуализации гиперстены и одна из крупнейших в мире сетевых структур InfiniBand . [4] Подразделение NAS является частью Директората исследовательских технологий NASA и управляет проектом NASA's High-End Computing Capability (HECC). [5]
В середине 1970-х годов группа инженеров аэрокосмической отрасли в Исследовательском центре Эймса начала изучать возможность перевода аэрокосмических исследований и разработок из дорогостоящих и трудоемких испытаний в аэродинамической трубе в проектирование и инжиниринг на основе моделирования с использованием моделей вычислительной гидродинамики (CFD) на суперкомпьютерах, более мощных, чем те, которые были доступны в то время. Это начинание позже было названо Проектом численного аэродинамического симулятора (NAS), и первый компьютер был установлен в Центральном вычислительном центре Исследовательского центра Эймса в 1984 году.
Закладка фундамента суперсовременного суперкомпьютерного комплекса состоялась 14 марта 1985 года с целью строительства здания, где эксперты по вычислительной гидродинамике, специалисты по информатике, специалисты по визуализации, а также инженеры по сетям и системам хранения данных могли бы находиться под одной крышей в совместной среде. В 1986 году NAS перешла в полноценное подразделение NASA, а в 1987 году персонал и оборудование NAS, включая второй суперкомпьютер Cray-2 под названием Navier, были перемещены в новый комплекс, который был открыт 9 марта 1987 года. [6]
В 1995 году NAS изменила свое название на Numerical Aerospace Simulation Division, а в 2001 году — на название, которое она носит сегодня.
NAS был одним из ведущих новаторов в мире суперкомпьютеров, разработав множество инструментов и процессов, которые стали широко использоваться в коммерческих суперкомпьютерах. Некоторые из этих первых включают: [7]
NAS разрабатывает и адаптирует программное обеспечение для того, чтобы «дополнять и улучшать работу, выполняемую на его суперкомпьютерах, включая программное обеспечение для поддержки систем, систем мониторинга, безопасности и научной визуализации», и часто предоставляет это программное обеспечение своим пользователям через Соглашение NASA об открытом исходном коде (NOSA). [9]
Вот несколько важных разработок программного обеспечения от NAS:
С момента своего создания в 1987 году, NASA Advanced Supercomputing Facility разместил и эксплуатировал некоторые из самых мощных суперкомпьютеров в мире. Многие из этих компьютеров включают испытательные стенды, созданные для тестирования новой архитектуры, оборудования или сетевых установок, которые могут быть использованы в более крупных масштабах. [6] [8] Пиковая производительность показана в операциях с плавающей точкой в секунду (FLOPS) .
В 1987 году NAS объединилась с Агентством перспективных исследовательских проектов Министерства обороны США (DARPA) и Калифорнийским университетом в Беркли в проекте Redundant Array of Inexpensive Disks (RAID), целью которого было создание технологии хранения, объединяющей несколько компонентов дискового накопителя в одну логическую единицу. Завершенный в 1992 году, проект RAID привел к технологии распределенного хранения данных, используемой сегодня. [6]
В настоящее время на объекте NAS размещается дисковое хранилище на параллельном кластере SGI DMF с программным обеспечением высокой доступности, состоящим из четырех 32-процессорных систем front-end, которые подключены к суперкомпьютерам и архивной ленточной системе хранения. Система имеет 192 ГБ памяти на front-end [34] и 7,6 петабайт (ПБ) дискового кэша. [4] Данные, хранящиеся на диске, регулярно переносятся в ленточные архивные системы хранения на объекте, чтобы освободить место для других пользовательских проектов, выполняемых на суперкомпьютерах.
В 1987 году NAS разработала первую иерархическую систему массового хранения на базе UNIX, названную NAStore. Она содержала два робота картриджной ленты StorageTek 4400, каждый с емкостью хранения приблизительно 1,1 терабайта, что сократило время извлечения ленты с 4 минут до 15 секунд. [6]
С установкой суперкомпьютера Pleiades в 2008 году системы StorageTek, которые NAS использовала в течение 20 лет, оказались неспособны удовлетворить потребности большего числа пользователей и увеличения размеров файлов наборов данных каждого проекта . [35] В 2009 году NAS внедрила роботизированные ленточные системы Spectra Logic T950, которые увеличили максимальную емкость на объекте до 16 петабайт пространства, доступного пользователям для архивирования своих данных с суперкомпьютеров. [36] По состоянию на март 2019 года объект NAS увеличил общую емкость архивного хранения ленточных библиотек Spectra Logic до 1048 петабайт (или 1 эксабайт) со сжатием 35%. [34] SGI Data Migration Facility (DMF) и OpenVault управляют миграцией данных с диска на ленту и обратным переносом с ленты на диск для объекта NAS.
По состоянию на март 2019 года в архивной системе хранения данных NAS хранится более 110 петабайт уникальных данных. [34]
В 1984 году NAS приобрела 25 графических терминалов SGI IRIS 1000, что стало началом их длительного партнерства с компанией из Кремниевой долины, которое оказало значительное влияние на постобработку и визуализацию результатов вычислительной гидродинамики, запущенных на суперкомпьютерах на объекте. [6] Визуализация стала ключевым процессом в анализе данных моделирования, запущенных на суперкомпьютерах, позволяя инженерам и ученым просматривать свои результаты в пространственном виде и способами, которые позволяли лучше понимать силы вычислительной гидродинамики, работающие в их проектах.
В 2002 году эксперты визуализации NAS разработали систему визуализации под названием «гиперстена», которая включала 49 связанных ЖК- панелей, которые позволяли ученым просматривать сложные наборы данных на большом динамическом массиве экранов размером семь на семь. Каждый экран имел собственную вычислительную мощность, что позволяло каждому из них отображать, обрабатывать и обмениваться наборами данных, так что одно изображение могло отображаться на всех экранах или настраиваться так, чтобы данные могли отображаться в «ячейках», как в гигантской визуальной таблице. [37]
Второе поколение «hyperwall-2» было разработано в 2008 году NAS в партнерстве с Colfax International и состоит из 128 ЖК-экранов, расположенных в сетке 8x16 шириной 23 фута и высотой 10 футов. Он способен отображать четверть миллиарда пикселей , что делает его самой высокой системой научной визуализации в мире. [38] Он содержит 128 узлов, каждый из которых оснащен двумя четырехъядерными процессорами AMD Opteron ( Barcelona ) и графическим процессором (GPU) Nvidia GeForce 480 GTX для выделенной пиковой вычислительной мощности 128 терафлопс по всей системе — в 100 раз мощнее, чем оригинальный hyperwall. [39] hyperwall-2 напрямую подключен к файловой системе суперкомпьютера Pleiades через сеть InfiniBand, что позволяет системе считывать данные напрямую из файловой системы без необходимости копирования файлов в память hyperwall-2.
В 2014 году гиперстена была модернизирована новым оборудованием: 256 процессорами Intel Xeon "Ivy Bridge" и 128 графическими процессорами NVIDIA Geforce 780 Ti. Модернизация увеличила пиковую вычислительную мощность системы с 9 терафлопс до 57 терафлопс, и теперь она имеет почти 400 гигабайт графической памяти. [40]
В 2020 году гиперстена была дополнительно модернизирована новым оборудованием: 256 процессоров Intel Xeon Platinum 8268 (Cascade Lake) и 128 графических процессоров NVIDIA Quadro RTX 6000 с общим объемом графической памяти 3,1 терабайта. Модернизация увеличила пиковую вычислительную мощность системы с 57 терафлопс до 512 терафлопс. [41]
Важной особенностью технологии гиперстены, разработанной в NAS, является то, что она позволяет осуществлять «одновременную визуализацию» данных, что позволяет ученым и инженерам анализировать и интерпретировать данные, пока вычисления выполняются на суперкомпьютерах. Это не только показывает текущее состояние вычислений для мониторинга времени выполнения, управления и завершения, но и «позволяет визуализировать с более высоким временным разрешением по сравнению с постобработкой, поскольку требования к вводу-выводу и пространству хранения в значительной степени устраняются... [и] может показывать особенности в моделировании, которые в противном случае не были бы видны». [42]
Команда визуализации NAS разработала настраиваемый параллельный конвейер для использования с массивно-параллельной моделью прогнозирования, запущенной на суперкомпьютере Columbia в 2005 году, чтобы помочь предсказать сезон ураганов в Атлантике для Национального центра ураганов . Из-за крайних сроков подачи каждого из прогнозов было важно, чтобы процесс визуализации не препятствовал моделированию в значительной степени и не приводил к его сбою.