Арифметика с плавающей точкой необходима для очень больших или очень маленьких действительных чисел или вычислений, требующих большого динамического диапазона. Представление с плавающей точкой похоже на научную запись, за исключением того, что все выполняется в системе счисления с основанием два, а не десять. Схема кодирования сохраняет знак, показатель степени (в системе с основанием два для Cray и VAX , в системе с основанием два или десять для форматов с плавающей точкой IEEE и в системе с основанием 16 для архитектуры с плавающей точкой IBM ) и мантисса (число после запятой ). Хотя используется несколько похожих форматов, наиболее распространенным является ANSI/IEEE Std. 754-1985 . Этот стандарт определяет формат для 32-битных чисел, называемых одинарной точностью , а также 64-битных чисел, называемых двойной точностью , и более длинных чисел, называемых расширенной точностью (используется для промежуточных результатов). Представления с плавающей точкой могут поддерживать гораздо более широкий диапазон значений, чем с фиксированной точкой, с возможностью представления очень маленьких чисел и очень больших чисел. [2]
Динамический диапазон и точность
Возведение в степень, присущее вычислениям с плавающей точкой, обеспечивает гораздо больший динамический диапазон — наибольшие и наименьшие числа, которые могут быть представлены, — что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно большой диапазон числовых значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей точкой идеально подходят для вычислительно интенсивных приложений. [3]
Вычислительная производительность
FLOPS и MIPS — единицы измерения численной вычислительной производительности компьютера. Операции с плавающей точкой обычно используются в таких областях, как научные вычислительные исследования, а также в машинном обучении . Однако до конца 1980-х годов оборудование с плавающей точкой (возможно реализовать арифметику FP в программном обеспечении на любом целочисленном оборудовании) обычно было необязательной функцией, и компьютеры, которые имели ее, назывались «научными компьютерами» или имели возможность « научных вычислений ». Таким образом, единица MIPS была полезна для измерения целочисленной производительности любого компьютера, включая те, у которых не было такой возможности, и для учета различий в архитектуре, аналогичная единица MOPS (миллион операций в секунду) также использовалась еще в 1970 году [4] . Обратите внимание, что помимо целочисленной (или фиксированной) арифметики, примеры целочисленных операций включают перемещение данных (от A до B) или проверку значений (если A = B, то C). Вот почему MIPS как эталон производительности является адекватным показателем, когда компьютер используется для запросов к базам данных, обработки текстов, электронных таблиц или для запуска нескольких виртуальных операционных систем. [5] [6] В 1974 году Дэвид Кук ввел термины «флопс» и «мегафлопс» для описания производительности суперкомпьютеров того времени по количеству вычислений с плавающей точкой, которые они выполняли в секунду. [7] Это было намного лучше, чем использование распространенного MIPS для сравнения компьютеров, поскольку эта статистика обычно мало влияла на арифметические возможности машины при выполнении научных задач.
FLOPS в HPC-системе можно рассчитать с помощью следующего уравнения: [8]
Это можно упростить до самого распространенного случая: компьютер, имеющий ровно 1 ЦП:
FLOPS может быть записан в различных единицах измерения точности, например, список суперкомпьютеров TOP500 ранжирует компьютеры по 64-битным ( формат с плавающей точкой двойной точности ) операциям в секунду, сокращенно FP64 . [9] Аналогичные единицы измерения доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.
Операции с плавающей точкой за такт для различных процессоров
Рекорды производительности
Отдельные записи компьютера
В июне 1997 года ASCI Red от Intel стал первым в мире компьютером, достигшим одного терафлопса и более. Директор Sandia Билл Кэмп сказал, что ASCI Red имел лучшую надежность среди всех когда-либо созданных суперкомпьютеров и «был высшей точкой суперкомпьютеров по долговечности, цене и производительности». [39]
В июне 2006 года японский исследовательский институт RIKEN анонсировал новый компьютер MDGRAPE -3 . Производительность компьютера достигает одного петафлопса, что почти в два раза быстрее, чем у Blue Gene/L, но MDGRAPE-3 не является компьютером общего назначения, поэтому он не появляется в списке Top500.org . Он имеет специализированные конвейеры для моделирования молекулярной динамики.
К 2007 году корпорация Intel представила экспериментальный многоядерный чип POLARIS , который достигает 1 терафлопс на частоте 3,13 ГГц. 80-ядерный чип может поднять этот результат до 2 терафлопс на частоте 6,26 ГГц, хотя тепловыделение на этой частоте превышает 190 Вт. [40]
В июне 2007 года сайт Top500.org сообщил, что самым быстрым компьютером в мире является суперкомпьютер IBM Blue Gene/L , пиковая производительность которого составляет 596 терафлопс. [41] Cray XT4 занял второе место с показателем 101,7 терафлопс.
26 июня 2007 года IBM анонсировала второе поколение своего топового суперкомпьютера, названного Blue Gene/P и разработанного для непрерывной работы на скоростях, превышающих один петафлопс, быстрее, чем Blue Gene/L. При соответствующей настройке он может достигать скоростей, превышающих три петафлопса. [42]
25 октября 2007 года корпорация NEC из Японии выпустила пресс-релиз, анонсирующий модель серии SX SX-9 , [43] утверждая, что это самый быстрый в мире векторный суперкомпьютер. SX-9 оснащен первым процессором, способным обеспечить пиковую векторную производительность 102,4 гигаФЛОПС на одно ядро.
4 февраля 2008 года Национальный научный фонд и Техасский университет в Остине начали полномасштабные исследования на суперкомпьютере AMD , Sun под названием Ranger [44] ,
самой мощной в мире суперкомпьютерной системе для открытых научных исследований, которая работает с постоянной скоростью 0,5 петафлопс.
25 мая 2008 года американский суперкомпьютер, созданный IBM , названный « Roadrunner », достиг вычислительного рубежа в один петафлопс. Он возглавил список TOP500 самых мощных суперкомпьютеров за июнь и ноябрь 2008 года (исключая грид-компьютеры ). [45] [46] Компьютер находится в Лос-Аламосской национальной лаборатории в Нью-Мексико. Название компьютера отсылает к птице штата Нью-Мексико , большой дорожной бегунке ( Geococcyx californianus ). [47]
В июне 2008 года AMD выпустила серию ATI Radeon HD 4800, которая, как сообщается, стала первым графическим процессором, достигшим одного терафлопса. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870X2 с двумя графическими процессорами Radeon R770, суммарно достигающими 2,4 терафлопса.
В ноябре 2008 года модернизация суперкомпьютера Cray Jaguar в Национальной лаборатории Оук-Ридж (ORNL) Министерства энергетики (DOE) увеличила вычислительную мощность системы до пиковых 1,64 петафлопс, что сделало Jaguar первой в мире системой петафлопс, предназначенной для открытых исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракен . Кракен был объявлен самым быстрым в мире суперкомпьютером, управляемым университетом, и шестым по скорости в общем списке TOP500 2009 года. В 2010 году Кракен был модернизирован и теперь может работать быстрее и мощнее.
В 2009 году Cray Jaguar показал производительность 1,75 петафлопс, обойдя IBM Roadrunner и заняв первое место в списке TOP500 . [48]
В октябре 2010 года Китай представил Tianhe-1 , суперкомпьютер, работающий с пиковой скоростью вычислений 2,5 петафлопс. [49] [50]
По состоянию на 2010 год [обновлять]самый быстрый процессор ПК достиг 109 гигаФЛОПС ( Intel Core i7 980 XE ) [51] в вычислениях с двойной точностью. Графические процессоры значительно мощнее. Например, вычислительные процессоры Nvidia Tesla C2050 GPU выполняют около 515 гигаФЛОПС [52] в вычислениях с двойной точностью, а AMD FireStream 9270 достигает пика в 240 гигаФЛОПС. [53]
В ноябре 2011 года было объявлено , что Япония достигла 10,51 петафлопс с ее компьютером K. [54] Он имеет 88 128 процессоров SPARC64 VIIIfx в 864 стойках с теоретической производительностью 11,28 петафлопс. Он назван в честь японского слова «kei», которое означает 10 квадриллионов , [55] что соответствует целевой скорости 10 петафлопс.
15 ноября 2011 года Intel продемонстрировала один процессор на базе x86 под кодовым названием «Knights Corner», поддерживающий более терафлопса на широком спектре операций DGEMM . Intel подчеркнула во время демонстрации, что это был поддерживаемый терафлопс (а не «сырой терафлопс», используемый другими для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, когда-либо преодолевший терафлопс. [56] [57]
18 июня 2012 года суперкомпьютерная система Sequoia компании IBM , базирующаяся в Ливерморской национальной лаборатории имени Лоуренса (LLNL), США, достигла производительности в 16 петафлопс, установив мировой рекорд и заняв первое место в последнем списке TOP500. [58]
12 ноября 2012 года список TOP500 сертифицировал Titan как самый быстрый в мире суперкомпьютер по результатам теста LINPACK с производительностью 17,59 петафлопс. [59] [60] Он был разработан компанией Cray Inc. в Национальной лаборатории Оук-Ридж и сочетает в себе процессоры AMD Opteron с технологиями графического процессора (GPU) NVIDIA Tesla «Kepler». [61] [62]
10 июня 2013 года китайский Tianhe-2 был признан самым быстрым в мире с производительностью 33,86 петафлопс. [63]
20 июня 2016 года китайская Sunway TaihuLight была признана самой быстрой в мире с 93 петафлопсами на бенчмарке LINPACK (из 125 пиковых петафлопс). Система была установлена в Национальном суперкомпьютерном центре в Уси и показала большую производительность, чем следующие пять самых мощных систем в списке TOP500 в то время вместе взятые. [64]
В июне 2019 года Summit , суперкомпьютер, созданный IBM, который сейчас работает в Национальной лаборатории Оук-Ридж (ORNL) Министерства энергетики (DOE), занял первое место с производительностью 148,6 петафлопс на High Performance Linpack (HPL), бенчмарке, используемом для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими процессорами NVIDIA Tesla V100. [65]
В июне 2022 года американский Frontier стал самым мощным суперкомпьютером в рейтинге TOP500, достигнув 1102 петафлопс (1,102 эксафлопс) в тестах LINPACK. [66]
Распределенные вычислительные записи
Распределенные вычисления используют Интернет для связи персональных компьютеров с целью достижения большего количества FLOPS:
По состоянию на апрель 2020 года [обновлять]сеть Folding@home имеет более 2,3 exaFLOPS общей вычислительной мощности. [67] [68] [69] [70] Это самая мощная распределенная компьютерная сеть, которая первой в истории преодолела 1 exaFLOPS общей вычислительной мощности. Такой уровень производительности в первую очередь обеспечивается совокупными усилиями огромного массива мощных графических процессоров и центральных процессоров . [71]
По состоянию на декабрь 2020 года [обновлять]вся сеть BOINC в среднем производит около 31 петафлопса. [72]
По состоянию на июнь 2018 года [обновлять]средняя производительность SETI@home , использующего программную платформу BOINC , составляет 896 терафлопс. [73]
По состоянию на июнь 2018 года [обновлять]проект Einstein @Home , использующий сеть BOINC , достигал производительности 3 петафлопс. [74]
По состоянию на июнь 2018 года [обновлять]MilkyWay @home , использующий инфраструктуру BOINC , выполняет вычисления со скоростью 847 терафлопс. [75]
По состоянию на июнь 2020 года [обновлять]GIMPS , выполняющий поиск простых чисел Мерсенна , поддерживает производительность 1354 терафлопс. [76]
^ "Понять показатели производительности суперкомпьютера и емкости системы хранения". kb.iu.edu . Получено 23 марта 2024 г. .
↑ Плавающая точка. Получено 25 декабря 2009 г.
↑ Резюме: Фиксированная точка (целые числа) против плавающей точки. Архивировано 31 декабря 2009 г. на Wayback Machine. Получено 25 декабря 2009 г.
^ Техническая записка НАСА. Национальное управление по аэронавтике и исследованию космического пространства. 1970.
^ Фиксированная и плавающая точка. Получено 25 декабря 2009 г.
^ Обработка данных и математические вычисления. Получено 25 декабря 2009 г.
^ Кук, DJ (1974). Основы производительности компьютерных систем. Министерство торговли США, Национальное бюро стандартов.
^ ""Nodes, Sockets, Cores and FLOPS, Oh, My" д-ра Марка Р. Фернандеса, доктора философии." Архивировано из оригинала 13 февраля 2019 г. . Получено 12 февраля 2019 г. .
^ "ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ". top500.org . Получено 23 июня 2020 г. .
^ «Операций с плавающей точкой в секунду (FLOPS)».
^ ab "home.iae.nl".
^ ab "Вычислительная мощность на протяжении истории". alternativewars.com . Получено 13 февраля 2021 г. .
^ abcde Дольбо, Ромен (2017). «Теоретический пик FLOPS на набор инструкций: учебник». Журнал суперкомпьютеров . 74 (3): 1341–1377. doi :10.1007/s11227-017-2177-5. S2CID 3540951.
^ "Поддержка новых инструкций для Bulldozer (FMA3) и Piledriver (FMA3+4 и CVT, BMI, TBM)" (PDF) .
^ «Блог Агнера о процессорах — результаты испытаний AMD Ryzen» .
^ https://arstechnica.com/gadgets/2017/03/amds-moment-of-zen-finally-an-architecture-that-can-compete/2/ "каждое ядро теперь имеет пару собственных 128-битных блоков FMA"
^ Майк Кларк (23 августа 2016 г.). Новая архитектура ядра x86 для следующего поколения вычислений (PDF) . HotChips 28. AMD. Архивировано из оригинала (PDF) 31 июля 2020 г. Получено 8 октября 2017 г.страница 7
^ «Микроархитектура процессоров Intel и AMD» (PDF) .
^ "Выступление генерального директора AMD Лизы Су на COMPUTEX 2019". youtube.com . 27 мая 2019 г. Архивировано из оригинала 11 декабря 2021 г.
^ "Entertainment Systems and High-Performance Processor SH-4" (PDF) . Обзор Hitachi . 48 (2). Hitachi : 58–63. 1999 . Получено 21 июня 2019 .
^ "SH-4 Next-Generation DSP Architecture for VoIP" (PDF) . Hitachi . 2000 . Получено 21 июня 2019 .
^ «Внутри Volta: самый передовой в мире графический процессор для центров обработки данных». 10 мая 2017 г.
^ «Подробный обзор архитектуры NVIDIA Ampere». 14 мая 2020 г.
^ "Графические процессоры NVIDIA A100 обеспечивают работу современных центров обработки данных". NVIDIA .
↑ Шиллинг, Андреас (10 июня 2019 г.). «Die RDNA-Architektur - Страница 2». Аппаратное обеспечениеluxx .
^ "250 TFLOPs/s для двух чипов со смешанной точностью FP16". youtube.com . 26 октября 2018 г.
↑ Архивировано в Ghostarchive и Wayback Machine: «Оценка по энергопотреблению, что FP32 составляет 1/4 от FP16, а тактовая частота ниже 1,5 ГГц». youtube.com . 25 октября 2017 г.
↑ Архивировано в Ghostarchive и Wayback Machine: «Представляем системы Mk2 IPU от Graphcore». youtube.com . 15 июля 2020 г.
^ "Bow-2000 IPU-Machine". docs.graphcore.ai/ .
^ ENIAC]] @ 100 кГц с 385 флопсами «Компьютеры прошлого». clear.rice.edu . Получено 26 февраля 2021 г. .
^ "Архитектура IMS T800". transputer.net . Получено 28 декабря 2023 г. .
^ Epiphany-III 16-ядерный 65-нм микропроцессор (E16G301) // admin (19 августа 2012 г.)
^ ab Feldman, Michael (22 августа 2012 г.). "Adapteva представляет 64-ядерный чип". HPCWire . Получено 3 сентября 2014 г. .
^ Epiphany-IV 64-ядерный 28-нм микропроцессор (E64G401) // admin (19 августа 2012 г.)
^ "Sandia's ASCI Red, первый в мире суперкомпьютер терафлоп, выведен из эксплуатации" (PDF) . Архивировано из оригинала (PDF) 5 ноября 2010 г. . Получено 17 ноября 2011 г. .
↑ Ричард Суинберн (30 апреля 2007 г.). «Приход TeraFLOP Computing». bit-tech.net . Получено 9 февраля 2012 г. .
^ "29-й список TOP500 самых быстрых суперкомпьютеров мира опубликован". Top500.org . 23 июня 2007 г. Архивировано из оригинала 9 мая 2008 г. Получено 8 июля 2008 г.
^ "Июнь 2008". TOP500 . Получено 8 июля 2008 .
^ "NEC запускает самый быстрый в мире векторный суперкомпьютер SX-9". NEC. 25 октября 2007 г. Получено 8 июля 2008 г.
^ "Техасский университет в Остине, Техасский передовой вычислительный центр". Архивировано из оригинала 1 августа 2009 г. Получено 13 сентября 2010 г. Любой исследователь в американском учреждении может подать предложение о выделении циклов в системе.
↑ Шарон Годен (9 июня 2008 г.). «IBM Roadrunner преодолевает милю суперкомпьютеров за 4 минуты». Computerworld. Архивировано из оригинала 24 декабря 2008 г. Получено 10 июня 2008 г.
^ "Austin ISC08". Top500.org. 14 ноября 2008 г. Архивировано из оригинала 22 февраля 2012 г. Получено 9 февраля 2012 г.
^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп петафлоп». BBC News . Получено 8 июля 2008 г.
↑ Гринберг, Энди (16 ноября 2009 г.). «Cray свергает IBM в области суперкомпьютеров». Forbes .
^ "Китай претендует на суперкомпьютерную корону". BBC News. 28 октября 2010 г.
^ Диллоу, Клэй (28 октября 2010 г.). «Китай представил 2507-петафлопсный суперкомпьютер — самый быстрый в мире». Popsci.com . Получено 9 февраля 2012 г.
^ "Intel Core i7-980X Extreme Edition – готовы к крутым результатам?: Математика: Sandra Arithmetic, Crypto, Microsoft Excel". Techgage . 10 марта 2010 г. Получено 9 февраля 2012 г.
^ "NVIDIA Tesla Personal Supercomputer". Nvidia.com . Получено 9 февраля 2012 г.
^ "AMD FireStream 9270 GPU Compute Accelerator". Amd.com . Получено 9 февраля 2012 г. .
^ "'K computer' достиг цели в 10 петафлопс". Fujitsu.com . Получено 9 февраля 2012 г. .
^ "Intel's Knights Corner: 50+ Core 22nm Co-processor". 16 ноября 2011 г. Получено 16 ноября 2011 г.
^ "Intel представляет 1 TFLOP/s Knight's Corner" . Получено 16 ноября 2011 г. .
↑ Кларк, Дон (18 июня 2012 г.). «IBM Computer устанавливает рекорд скорости». The Wall Street Journal . Получено 18 июня 2012 г.
^ "US Titan supercomputer clocked as a world's fastest". BBC. 12 ноября 2012 г. Получено 28 февраля 2013 г.
^ "Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan | TOP500 Supercomputer Sites". Top500.org. 12 ноября 2012 г. Получено 28 февраля 2013 г.
^ Монтальбано, Элизабет (11 октября 2011 г.). «Oak Ridge Labs строит самый быстрый суперкомпьютер». Informationweek . Получено 9 февраля 2012 г.
^ Тибкен, Шара (29 октября 2012 г.). «Суперкомпьютер Titan дебютирует для открытых научных исследований | Cutting Edge». News.CNet.com . Получено 28 февраля 2013 г.
^ "Китайский суперкомпьютер теперь самый быстрый в мире – намного быстрее". Журнал Forbes . 17 июня 2013 г. Получено 17 июня 2013 г.
^ Фельдман, Майкл. «Китай вырывается вперед в списке суперкомпьютеров TOP500, положив конец превосходству США». Top500.org . Получено 31 декабря 2016 г.
^ "Июнь 2018". Top500.org . Получено 17 июля 2018 .
^ "Folding@Home Active CPUs & GPUs by OS". foldingathome.org . Получено 8 апреля 2020 г. .
^ Folding@home (25 марта 2020 г.). «Благодаря нашему УДИВИТЕЛЬНОМУ сообществу мы преодолели барьер exaFLOP! Это более 1 000 000 000 000 000 000 операций в секунду, что делает нас примерно в 10 раз быстрее, чем IBM Summit! pic.twitter.com/mPMnb4xdH3». @foldingathome . Получено 4 апреля 2020 г.
^ "Folding@Home преодолевает барьер экзафлопсности, теперь быстрее десятков суперкомпьютеров - ExtremeTech". extremetech.com . Получено 4 апреля 2020 г. .
^ «Folding@Home превышает 1,5 Эксафлопса в битве против Covid-19». TechSpot . 26 марта 2020 г. Получено 4 апреля 2020 г.
^ "Sony Computer Entertainment's Support for Folding@home Project on PlayStation™3 Receives This Year's "Good Design Gold Award"" (пресс-релиз). Sony Computer Entertainment Inc. 6 ноября 2008 г. Архивировано из оригинала 31 января 2009 г. Получено 11 декабря 2008 г.
^ "BOINC Computing Power". BOINC . Получено 28 декабря 2020 г. .
^ "Обзор SETI@Home Credit". BOINC . Получено 15 июня 2018 г.
^ "Обзор кредита Einstein@Home". BOINC . Получено 15 июня 2018 г.
^ "Обзор кредита MilkyWay@Home". BOINC . Получено 15 июня 2018 г.
^ "Интернет PrimeNet Server Distributed Computing Technology for the Great Internet Mersenne Prime Search". GIMPS . Получено 15 июня 2018 г.
^ 1634–1699: McCusker, JJ (1997). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов: Дополнения и исправления (PDF) . Американское антикварное общество .1700–1799: Маккаскер, Дж. Дж. (1992). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора стоимости денег в экономике Соединенных Штатов (PDF) . Американское антикварное общество .1800–настоящее время: Федеральный резервный банк Миннеаполиса. "Индекс потребительских цен (оценка) 1800–" . Получено 29 февраля 2024 г.
^ "IBM 7030 (STRETCH)". Норман Харди . Получено 24 февраля 2017 г.
^ "Loki and Hyglac". Loki-www.lanl.gov. 13 июля 1997 г. Архивировано из оригинала 21 июля 2011 г. Получено 9 февраля 2012 г.
^ "Kentucky Linux Athlon Testbed 2 (KLAT2)". The Aggregate . Получено 9 февраля 2012 г.
^ "KASY0". The Aggregate . 22 августа 2003 г. Получено 9 февраля 2012 г.
^ "Microulf: Персональный, Портативный Кластер Beowulf". Архивировано из оригинала 12 сентября 2007 г. Получено 9 февраля 2012 г.
^ Адам Стивенсон, Янн Ле Ду и Марием Эль Африт. «Высокопроизводительные вычисления на игровых ПК». Ars Technica . 31 марта 2011 г.
↑ Том Логан (9 января 2012 г.). "Обзор HD7970 Quadfire Eyefinity". OC3D.net .
^ «Sony разжигает ценовую войну, предлагая PS4 по цене $399». CNBC . 11 июня 2013 г.
^ "FreezePage". Архивировано из оригинала 16 ноября 2013 г. Получено 9 мая 2020 г.
^ "FreezePage". Архивировано из оригинала 19 декабря 2013 г. Получено 9 мая 2020 г.
^ "FreezePage". Архивировано из оригинала 10 января 2015 г. Получено 9 мая 2020 г.
^ "Обзор Radeon R9 295X2 8 ГБ: Project Hydra получает жидкостное охлаждение". 8 апреля 2014 г.
^ Перес, Кэрол Э. (13 июля 2017 г.). «Создание 50-терафлопсного AMD Vega Deep Learning Box менее чем за 3 тыс. долларов». Intuition Machine . Получено 26 июля 2017 г.