Арифметика с плавающей запятой необходима для очень больших или очень маленьких действительных чисел или вычислений, требующих большого динамического диапазона. Представление с плавающей запятой похоже на экспоненциальную запись, за исключением того, что все выполняется по второй, а не по десятичной системе счисления. Схема кодирования хранит знак, показатель степени (по основанию два для Cray и VAX , по основанию два или десять для форматов с плавающей запятой IEEE и по основанию 16 для архитектуры с плавающей запятой IBM ) и мантиссу (число после запятой ). Хотя используется несколько подобных форматов, наиболее распространенным является ANSI/IEEE Std. 754-1985 . Этот стандарт определяет формат для 32-битных чисел, называемых одинарной точностью , а также 64-битных чисел, называемых двойной точностью , и более длинных чисел, называемых расширенной точностью (используемых для промежуточных результатов). Представления с плавающей запятой могут поддерживать гораздо более широкий диапазон значений, чем с фиксированной запятой, с возможностью представления как очень маленьких, так и очень больших чисел. [1]
Динамический диапазон и точность
Возведение в степень, свойственное вычислениям с плавающей запятой, обеспечивает гораздо больший динамический диапазон – самые большие и наименьшие числа, которые могут быть представлены – что особенно важно при обработке наборов данных, где некоторые данные могут иметь чрезвычайно широкий диапазон числовых значений или где диапазон может быть непредсказуемым. Таким образом, процессоры с плавающей запятой идеально подходят для приложений с интенсивными вычислениями. [2]
Вычислительная производительность
FLOPS и MIPS — это единицы измерения вычислительной производительности компьютера. Операции с плавающей запятой обычно используются в таких областях, как научные вычислительные исследования, а также в машинном обучении . Однако до конца 1980-х годов аппаратное обеспечение для операций с плавающей запятой (возможно реализовать арифметику FP в программном обеспечении на любом целочисленном оборудовании) обычно было необязательной функцией, а компьютеры, на которых она была, назывались «научными компьютерами» или осуществляющими «научные вычисления ». "возможность. Таким образом, единица MIPS была полезна для измерения целочисленной производительности любого компьютера, в том числе без такой возможности, а также для учета различий в архитектуре. Аналогичный MOPS (миллион операций в секунду) использовался еще в 1970 году [3] . Обратите внимание, что помимо целочисленной арифметики (или арифметики с фиксированной точкой), примеры целочисленных операций включают перемещение данных (от A к B) или проверку значений (если A = B, то C). Вот почему MIPS в качестве показателя производительности подходит, когда компьютер используется для запросов к базе данных, обработки текстов, электронных таблиц или для запуска нескольких виртуальных операционных систем. [4] [5] В 1974 году Дэвид Кук ввёл термины флоп и мегафлопс для описания производительности суперкомпьютеров того времени по количеству вычислений с плавающей запятой, которые они выполняли в секунду. [6] Это было намного лучше, чем использование распространенного MIPS для сравнения компьютеров, поскольку эта статистика обычно мало влияла на арифметические возможности машины при выполнении научных задач.
FLOPS в системе HPC можно рассчитать с помощью этого уравнения: [7]
Это можно упростить до наиболее распространенного случая: компьютер, имеющий ровно 1 процессор:
FLOPS могут быть записаны с различными показателями точности, например, список суперкомпьютеров TOP500 ранжирует компьютеры по 64-битным ( формат с плавающей запятой двойной точности ) операциям в секунду, сокращенно FP64 . [8] Аналогичные меры доступны для 32-битных ( FP32 ) и 16-битных ( FP16 ) операций.
Операции с плавающей запятой за такт для различных процессоров
Рекорды производительности
Записи одного компьютера
В июне 1997 года Intel ASCI Red стал первым в мире компьютером, достигшим производительности в один терафлопс и выше. Директор Sandia Билл Кэмп заявил, что ASCI Red обладает лучшей надежностью из всех когда-либо созданных суперкомпьютеров и «является высшим достижением суперкомпьютеров по долговечности, цене и производительности». [38]
В июне 2006 года японский исследовательский институт RIKEN анонсировал новый компьютер — MDGRAPE-3 . Максимальная производительность компьютера составляет один петафлопс, что почти в два раза выше, чем у Blue Gene/L, но MDGRAPE-3 не является компьютером общего назначения, поэтому он не фигурирует в списке Top500.org . Он имеет специальные конвейеры для моделирования молекулярной динамики.
К 2007 году корпорация Intel представила экспериментальный многоядерный чип POLARIS , производительность которого достигает 1 терафлопс на частоте 3,13 ГГц. 80-ядерный чип способен поднять этот результат до 2 терафлопс на частоте 6,26 ГГц, хотя тепловыделение на этой частоте превышает 190 Вт. [39]
В июне 2007 года сайт Top500.org сообщил, что самым быстрым компьютером в мире является суперкомпьютер IBM Blue Gene/L с пиковой производительностью 596 терафлопс. [40] Cray XT4 занял второе место с производительностью 101,7 терафлопс.
26 июня 2007 года IBM анонсировала второе поколение своего лучшего суперкомпьютера, получившего название Blue Gene/P и предназначенного для непрерывной работы на скоростях, превышающих один петафлопс, что быстрее, чем Blue Gene/L. При такой настройке он может достигать скорости, превышающей три петафлопс. [41]
25 октября 2007 года японская корпорация NEC выпустила пресс-релиз, анонсирующий модель SX-9 серии SX , [42] утверждающую, что это самый быстрый векторный суперкомпьютер в мире. SX -9 оснащен первым процессором, способным обеспечить пиковую векторную производительность 102,4 гигафлопс на одно ядро.
25 мая 2008 года американский суперкомпьютер Roadrunner , построенный IBM , достиг вычислительной вехи в один петафлопс. Он возглавил список TOP500 самых мощных суперкомпьютеров за июнь 2008 г. и ноябрь 2008 г. (исключая грид-компьютеры ). [44] [45] Компьютер расположен в Национальной лаборатории Лос-Аламоса в Нью-Мексико. Название компьютера отсылает к птице штата Нью-Мексико , большому дорожному бегуну ( Geococcyx Californianus ). [46]
В июне 2008 года AMD выпустила серию ATI Radeon HD 4800, которые, как сообщается, стали первыми графическими процессорами, достигающими производительности в один терафлопс. 12 августа 2008 года AMD выпустила видеокарту ATI Radeon HD 4870X2 с двумя графическими процессорами Radeon R770 общей производительностью 2,4 терафлопс.
В ноябре 2008 года модернизация суперкомпьютера Cray Jaguar в Окриджской национальной лаборатории (ORNL) Министерства энергетики (DOE) увеличила вычислительную мощность системы до пиковых 1,64 петафлопс, что сделало Jaguar первой в мире петафлопс-системой, предназначенной для открытых исследований . В начале 2009 года суперкомпьютер был назван в честь мифического существа Кракена . Kraken был объявлен самым быстрым в мире суперкомпьютером, управляемым университетом, и шестым по скорости в списке TOP500 2009 года. В 2010 году Kraken был модернизирован и теперь может работать быстрее и мощнее.
В 2009 году Cray Jaguar показал производительность 1,75 петафлопс, опередив IBM Roadrunner и заняв первое место в списке TOP500 . [47]
В октябре 2010 года Китай представил Tianhe-1 , суперкомпьютер, который работает с пиковой вычислительной скоростью 2,5 петафлопс. [48] [49]
По состоянию на 2010 год производительность [update]самого быстрого процессора ПК достигла 109 гигафлопс ( Intel Core i7 980 XE ) [50] в вычислениях двойной точности. Графические процессоры значительно мощнее. Например, вычислительные процессоры Nvidia Tesla C2050 GPU выполняют около 515 гигафлопс [51] в вычислениях двойной точности, а пиковая производительность AMD FireStream 9270 составляет 240 гигафлопс. [52]
В ноябре 2011 года было объявлено, что Япония достигла производительности своего компьютера K 10,51 петафлопс . [53] Он имеет 88 128 процессоров SPARC64 VIIIfx в 864 стойках с теоретической производительностью 11,28 петафлопс. Он назван в честь японского слова «кей», что означает 10 квадриллионов [54] , что соответствует целевой скорости 10 петафлопс.
15 ноября 2011 года Intel продемонстрировала один процессор на базе x86 под кодовым названием Knights Corner, обеспечивающий производительность более терафлопс в широком диапазоне операций DGEMM . Во время демонстрации Intel подчеркнула, что это устойчивая производительность в терафлопс (а не «необработанные терафлопс», используемые другими для получения более высоких, но менее значимых чисел), и что это был первый процессор общего назначения, когда-либо преодолевший терафлопс. [55] [56]
18 июня 2012 года суперкомпьютерная система IBM Sequoia , базирующаяся в Ливерморской национальной лаборатории имени Лоуренса США (LLNL), достигла производительности 16 петафлопс, установив мировой рекорд и заняв первое место в последнем списке TOP500. [57]
12 ноября 2012 года список TOP500 признал Titan самым быстрым суперкомпьютером в мире по результатам теста LINPACK с производительностью 17,59 петафлопс. [58] [59] Он был разработан компанией Cray Inc. в Национальной лаборатории Ок-Ридж и сочетает в себе процессоры AMD Opteron с технологиями графических процессоров (GPU) NVIDIA Tesla «Kepler». [60] [61]
10 июня 2013 года китайский Tianhe-2 был признан самым быстрым в мире с производительностью 33,86 петафлопс. [62]
20 июня 2016 года китайский Sunway TaihuLight был признан самым быстрым в мире с 93 петафлопсами по тесту LINPACK (из 125 пиковых петафлопс). Система, почти полностью основанная на технологии, разработанной в Китае, установлена в Национальном суперкомпьютерном центре в Уси и обеспечивает большую производительность, чем следующие пять самых мощных систем в списке TOP500 вместе взятые. [63]
В июне 2019 года суперкомпьютер Summit , построенный IBM, который сейчас работает в Окриджской национальной лаборатории (ORNL) Министерства энергетики (DOE), занял первое место с производительностью 148,6 петафлопс в тесте High Performance Linpack (HPL), эталонном тесте. используется для ранжирования списка TOP500. Summit имеет 4356 узлов, каждый из которых оснащен двумя 22-ядерными процессорами Power9 и шестью графическими процессорами NVIDIA Tesla V100. [64]
Записи распределенных вычислений
Распределенные вычисления используют Интернет для связи персональных компьютеров для достижения большего количества FLOPS:
По состоянию на апрель 2020 года общая вычислительная мощность [update]сети Folding@home превышает 2,3 экзафлопс. [65] [66] [67] [68] Это самая мощная распределенная компьютерная сеть, первая в истории, достигшая 1 экзафлопс общей вычислительной мощности. Такой уровень производительности в первую очередь обеспечивается совокупной работой огромного количества мощных блоков графического процессора и процессора . [69]
По состоянию на декабрь 2020 года [update]вся сеть BOINC в среднем составляет около 31 петафлопс. [70]
[update]По состоянию на июнь 2018 года производительность SETI@home , использующей программную платформу BOINC , составляет в среднем 896 терафлопс. [71]
По состоянию на июнь 2018 года Einstein@Home[update] , проект, использующий сеть BOINC , работает на скорости 3 петафлопс. [72]
По состоянию на июнь 2018 года MilkyWay@home[update] , используя инфраструктуру BOINC , вычисляет производительность 847 терафлопс. [73]
По состоянию на июнь 2020 года [update]производительность GIMPS при поиске простых чисел Мерсенна составляет 1354 терафлопс. [74]
^ «Макс. графический процессор Intel для центров обработки данных» . 9 ноября 2022 г.
^ «250 терафлопс/с для двух чипов со смешанной точностью FP16» . youtube.com .
^ Архивировано в Ghostarchive и Wayback Machine: «Оценка по энергопотреблению: FP32 составляет 1/4 от FP16, а тактовая частота ниже 1,5 ГГц». youtube.com .
^ Архивировано в Ghostarchive и Wayback Machine: «Представляем системы IPU Graphcore Mk2». youtube.com .
^ "ИПУ-машина Лук-2000" . docs.graphcore.ai/ .
^ ENIAC]] @ 100 кГц с 385 флопами «Компьютеры прошлого». Clear.rice.edu . Проверено 26 февраля 2021 г.
^ «Архитектура IMS T800» . Transputer.net . Проверено 28 декабря 2023 г.
^ 16-ядерный 65-нм микропроцессор Epiphany-III (E16G301) // администратор (19 августа 2012 г.)
↑ Аб Фельдман, Майкл (22 августа 2012 г.). «Adapteva представляет 64-ядерный чип». HPCWire . Проверено 3 сентября 2014 г.
^ 64-ядерный 28-нм микропроцессор Epiphany-IV (E64G401) // администратор (19 августа 2012 г.)
^ «ASCI Red компании Sandia, первый в мире суперкомпьютер с терафлопной производительностью, выведен из эксплуатации» (PDF) . Архивировано из оригинала (PDF) 5 ноября 2010 г. Проверено 17 ноября 2011 г.
↑ Ричард Суинберн (30 апреля 2007 г.). «Прибытие вычислений TeraFLOP». bit-tech.net . Проверено 9 февраля 2012 г.
^ «Выпущен 29-й список TOP500 самых быстрых суперкомпьютеров в мире» . Top500.org . 23 июня 2007. Архивировано из оригинала 9 мая 2008 года . Проверено 8 июля 2008 г.
^ «Июнь 2008 г.». ТОП500 . Проверено 8 июля 2008 г.
^ «NEC запускает самый быстрый в мире векторный суперкомпьютер SX-9» . НЭК. 25 октября 2007 года . Проверено 8 июля 2008 г.
^ «Техасский университет в Остине, Техасский центр передовых вычислений» . Архивировано из оригинала 1 августа 2009 года . Проверено 13 сентября 2010 г. Любой исследователь в институте США может подать заявку на распределение циклов в системе.
↑ Шэрон Годен (9 июня 2008 г.). «Roadrunner от IBM преодолевает 4-минутную милю суперкомпьютеров» . Компьютерный мир. Архивировано из оригинала 24 декабря 2008 года . Проверено 10 июня 2008 г.
^ "Остин ISC08". Топ500.org. 14 ноября 2008 года. Архивировано из оригинала 22 февраля 2012 года . Проверено 9 февраля 2012 г.
↑ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп в петафлопе». Новости BBC . Проверено 8 июля 2008 г.
↑ Гринберг, Энди (16 ноября 2009 г.). «Крей свергает IBM с трона в области суперкомпьютеров». Форбс .
^ «Китай претендует на корону суперкомпьютера» . Новости BBC. 28 октября 2010 г.
↑ Диллоу, Клэй (28 октября 2010 г.). «Китай представляет суперкомпьютер мощностью 2507 петафлопс, самый быстрый в мире». Popsci.com . Проверено 9 февраля 2012 г.
^ «Intel Core i7-980X Extreme Edition — готовы к плохим результатам?: Математика: Сандра Арифметика, Криптовалюта, Microsoft Excel» . Техгейдж . 10 марта 2010 года . Проверено 9 февраля 2012 г.
^ "Персональный суперкомпьютер NVIDIA Tesla" . Nvidia.com . Проверено 9 февраля 2012 г.
^ «Вычислительный ускоритель графического процессора AMD FireStream 9270» . Amd.com . Проверено 9 февраля 2012 г.
^ «Компьютер K достиг цели в 10 петафлопс» . Fujitsu.com . Проверено 9 февраля 2012 г.
^ «Уголок рыцарей Intel: 22-нм сопроцессор с более чем 50 ядрами» . 16 ноября 2011 года . Проверено 16 ноября 2011 г.
^ «Intel представляет Knight's Corner с производительностью 1 терафлопс/с» . Проверено 16 ноября 2011 г.
↑ Кларк, Дон (18 июня 2012 г.). «Компьютер IBM устанавливает рекорд скорости». Журнал "Уолл Стрит . Проверено 18 июня 2012 г.
^ «Американский суперкомпьютер Titan признан самым быстрым в мире» . Би-би-си. 12 ноября 2012 года . Проверено 28 февраля 2013 г.
^ «Ок-Ридж претендует на первое место в последнем списке TOP500 с Titan | TOP500 суперкомпьютерных сайтов» . Топ500.org. 12 ноября 2012 года . Проверено 28 февраля 2013 г.
↑ Монтальбано, Элизабет (11 октября 2011 г.). «Лаборатория Ок-Ридж создает самый быстрый суперкомпьютер». Информационная неделя . Проверено 9 февраля 2012 г.
↑ Тибкен, Шара (29 октября 2012 г.). «Суперкомпьютер Titan дебютирует для открытых научных исследований | Cutting Edge» . Новости.CNet.com . Проверено 28 февраля 2013 г.
^ «Китайский суперкомпьютер теперь самый быстрый в мире - во многом» . Журнал Форбс . 17 июня 2013 года . Проверено 17 июня 2013 г.
^ Фельдман, Майкл. «Китай вырывается вперед в списке суперкомпьютеров TOP500, положив конец превосходству США». Top500.org . Проверено 31 декабря 2016 г.
^ «Июнь 2018». Top500.org . Проверено 17 июля 2018 г.
^ «Активные процессоры и графические процессоры Folding@Home по ОС» . Foldingathome.org . Проверено 8 апреля 2020 г.
↑ Folding@home (25 марта 2020 г.). «Благодаря нашему УДИВИТЕЛЬНОМУ сообществу мы преодолели барьер exaFLOP! Это более 1 000 000 000 000 000 000 операций в секунду, что делает нас примерно в 10 раз быстрее, чем IBM Summit! pic.twitter.com/mPMnb4xdH3». @foldingathome . Проверено 4 апреля 2020 г.
^ «Folding@Home преодолевает экзафлопсный барьер, теперь быстрее, чем десятки суперкомпьютеров - ExtremeTech» . ExtremeTech.com . Проверено 4 апреля 2020 г.
^ «Folding@Home превышает 1,5 экзафлопс в борьбе с Covid-19» . ТехСпот . 26 марта 2020 г. Проверено 4 апреля 2020 г.
^ «Поддержка Sony Computer Entertainment проекта Folding@home на PlayStation™3 получила в этом году золотую награду за хороший дизайн» (пресс-релиз). Sony Computer Entertainment Inc., 6 ноября 2008 г. Архивировано из оригинала 31 января 2009 г. Проверено 11 декабря 2008 г.
^ «Вычислительная мощность BOINC» . БОИНК . Проверено 28 декабря 2020 г.
^ "Обзор SETI@Home Credit" . БОИНК . Проверено 15 июня 2018 г.
^ "Обзор Einstein@Home Credit" . БОИНК . Проверено 15 июня 2018 г.
^ "Обзор MilkyWay@Home Credit" . БОИНК . Проверено 15 июня 2018 г.
^ «Технология распределенных вычислений Internet PrimeNet Server для великого поиска простых чисел Мерсенна в Интернете» . ГИМПЫ . Проверено 15 июня 2018 г.
^ 1634–1699: Маккаскер, Джей-Джей (1997). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов: Addenda et Corrigenda (PDF) . Американское антикварное общество .1700–1799: Маккаскер, Джей-Джей (1992). Сколько это в реальных деньгах? Исторический индекс цен для использования в качестве дефлятора денежных ценностей в экономике Соединенных Штатов (PDF) . Американское антикварное общество .1800 – настоящее время: Федеральный резервный банк Миннеаполиса. «Индекс потребительских цен (оценка) 1800–» . Проверено 28 мая 2023 г.
^ «IBM 7030 (СТРЕТЧ)» . Норман Харди . Проверено 24 февраля 2017 г.
^ «Локи и Хиглак». Локи-www.lanl.gov. 13 июля 1997 года. Архивировано из оригинала 21 июля 2011 года . Проверено 9 февраля 2012 г.
^ «Тестовый стенд Linux Athlon 2 в Кентукки (KLAT2)» . Агрегат . Проверено 9 февраля 2012 г.
^ "КАСЫ0". Агрегат . 22 августа 2003 года . Проверено 9 февраля 2012 г.
^ «Микровульф: Персональный портативный кластер Беовульфа» . Архивировано из оригинала 12 сентября 2007 года . Проверено 9 февраля 2012 г.
^ Адам Стивенсон, Янн Ле Дю и Марием Эль Африт. «Высокопроизводительные вычисления на игровых ПК». Арс Техника . 31 марта 2011 г.
↑ Том Логан (9 января 2012 г.). «Обзор HD7970 Quadfire Eyefinity». OC3D.net .
^ «Sony разжигает ценовую войну с PS4 по цене 399 долларов». CNBC . 11 июня 2013 г.
^ "Заморозить страницу". Архивировано из оригинала 16 ноября 2013 года . Проверено 9 мая 2020 г.
^ "Заморозить страницу". Архивировано из оригинала 19 декабря 2013 года . Проверено 9 мая 2020 г.
^ "Заморозить страницу". Архивировано из оригинала 10 января 2015 года . Проверено 9 мая 2020 г.
^ «Обзор Radeon R9 295X2 8 ГБ: проект Hydra получает жидкостное охлаждение» . 8 апреля 2014 г.
↑ Перес, Кэрол Э. (13 июля 2017 г.). «Создание блока глубокого обучения AMD Vega мощностью 50 терафлопс менее чем за 3 тысячи долларов». Машина интуиции . Проверено 26 июля 2017 г.