Петафлопсные вычисления относятся к вычислительным системам, способным выполнять не менее 1 квадриллиона (10^15) операций с плавающей точкой в секунду (FLOPS) . Эти системы часто называют петафлопсными системами , и они представляют собой значительный скачок по сравнению с традиционными суперкомпьютерами с точки зрения чистой производительности, что позволяет им обрабатывать огромные наборы данных и сложные вычисления.
Операции с плавающей точкой в секунду (FLOPS) являются одним из показателей производительности компьютера . FLOPS может быть записан в различных единицах измерения точности, однако стандартная единица измерения (используемая списком суперкомпьютеров TOP500 ) использует 64-битные ( формат с плавающей точкой двойной точности ) операции в секунду с использованием бенчмарка High Performance LINPACK (HPLinpack) . [1] [2]
Метрика обычно относится к отдельным вычислительным системам, хотя может использоваться для измерения распределенных вычислительных систем для сравнения. Можно отметить, что существуют альтернативные меры точности, использующие тесты LINPACK, которые не являются частью стандартной метрики/определения. [2] Было признано, что HPLinpack может не быть хорошим общим измерением полезности суперкомпьютера в реальном мире, однако это общий стандарт для измерения производительности. [3] [4]
Барьер петафлопс был впервые преодолен 16 сентября 2007 года проектом распределенных вычислений Folding@home . [5] Первая отдельная система петафлопсного масштаба, Roadrunner , была введена в эксплуатацию в 2008 году. [6] Roadrunner , созданный IBM , имел устойчивую производительность 1,026 петафлопс. Jaguar стал вторым компьютером , преодолевшим рубеж петафлопс, позднее в 2008 году, и достиг производительности 1,759 петафлопс после обновления 2009 года. [7]
К 2018 году Summit стал самым мощным суперкомпьютером в мире с производительностью 200 петафлопс, а в июне 2020 года Fugaku достиг показателя в 415 петафлопс.
К 2024 году Frontier и Aurora станут самыми мощными суперкомпьютерами в мире с производительностью 1206 и 1012 петафлопс, что сделает их единственными в мире суперкомпьютерами эксафлопсного класса. [8]
Современные системы искусственного интеллекта (ИИ) требуют больших вычислительных мощностей для обучения параметров модели. OpenAI использовала 25 000 графических процессоров Nvidia A100 для обучения GPT-4 , используя 133 триллиона операций с плавающей точкой. [9]