ИЭЭЭ 754-1985

IEEE 754-1985 ^[1] — исторический отраслевой стандарт представления чисел с плавающей запятой в компьютерах , официально принятый в 1985 году и замененный в 2008 году стандартом IEEE 754-2008 , а затем снова в 2019 году незначительной редакцией IEEE 754-2019 . ^[2] На протяжении 23 лет существования это был наиболее широко используемый формат для вычислений с плавающей запятой. Он был реализован программно, в виде библиотек с плавающей запятой , и аппаратно, в инструкциях многих CPU и FPU . Первой интегральной схемой , реализовавшей проект того, что впоследствии стало стандартом IEEE 754-1985, была Intel 8087 .

IEEE 754-1985 представляет числа в двоичном формате , обеспечивая определения четырех уровней точности, из которых наиболее часто используются два:

Стандарт также определяет представления для положительной и отрицательной бесконечности , « отрицательный ноль », пять исключений для обработки недопустимых результатов, таких как деление на ноль , специальные значения, называемые NaN, для представления этих исключений, денормализованные числа для представления чисел, меньших, чем показано выше, и четыре округления. режимы.

Представление чисел

Числа с плавающей запятой в формате IEEE 754 состоят из трех полей: знакового бита , смещенной экспоненты и дроби. Следующий пример иллюстрирует значение каждого из них.

Десятичное число 0,15625 ₁₀ , представленное в двоичном виде, равно 0,00101 ₂ (то есть 1/8 + 1/32). (Нижние индексы указывают базу счисления .) Аналогично экспоненциальному обозначению , где числа записываются так, чтобы слева от десятичной точки была одна ненулевая цифра, мы переписываем это число так, чтобы оно имело один бит 1 слева от " двоичная точка». Мы просто умножаем на соответствующую степень 2, чтобы компенсировать сдвиг битов влево на три позиции:

0.00101_{2}=1.01_{2}\times 2^{-3}

Теперь мы можем считать дробь и показатель степени: дробь равна 0,01 ₂ , а показатель степени равен −3.

Как показано на рисунках, в представлении этого числа в стандарте IEEE 754 есть три поля:

знак = 0, поскольку число положительное. (1 означает отрицательный результат.)

смещенный показатель степени = −3 + «смещение». В одинарной точности смещение равно 127 , поэтому в этом примере показатель смещения равен 124; в двойной точности смещение равно 1023 , поэтому показатель смещения в этом примере равен 1020.

дробь = .01000… ₂ .

IEEE 754 добавляет смещение к показателю степени, так что числа во многих случаях можно удобно сравнивать с помощью того же оборудования, которое сравнивает целые числа со знаком, дополняемые до двух . Используя смещенную экспоненту, меньшее из двух положительных чисел с плавающей запятой получится «меньше», чем большее, в том же порядке, что и для целых чисел со знаком и величиной . Если два числа с плавающей запятой имеют разные знаки, сравнение знаков и величин также работает со смещенными показателями. Однако если оба числа с плавающей запятой со смещенной экспонентой отрицательны, то порядок должен быть обратным. Если бы показатель степени был представлен, скажем, как число с дополнением до 2, сравнение с целью определить, какое из двух чисел больше, было бы не так удобно.

Ведущий бит 1 опускается, поскольку все числа, кроме нуля, начинаются с ведущей 1; ведущая единица является неявной и на самом деле ее не нужно сохранять, что дает дополнительную точность для слова «бесплатно».

Нуль

Число ноль представлено особым образом:

знак = 0 для положительного нуля , 1 для отрицательного нуля .

смещенный показатель = 0.

дробь = 0.

Денормализованные числа

Представления чисел, описанные выше, называются нормализованными, что означает, что неявной ведущей двоичной цифрой является 1. Чтобы уменьшить потерю точности при возникновении потери значения , IEEE 754 включает возможность представлять дроби, меньшие, чем это возможно в нормализованном представлении, путем создания неявная старшая цифра a 0. Такие числа называются денормальными . Они не содержат столько значащих цифр, как нормализованное число, но допускают постепенную потерю точности, когда результат операции не совсем равен нулю, но слишком близок к нулю, чтобы его можно было представить нормализованным числом.

Денормальное число представлено смещенной экспонентой, состоящей из всех нулевых битов, что представляет собой показатель степени -126 в одинарной точности (не -127) или -1022 в двойной точности (не -1023). ^[3] Напротив, наименьший смещенный показатель степени, представляющий нормальное число, равен 1 (см. примеры ниже).

Представление нечисловых чисел

Поле смещенной экспоненты заполняется всеми единицами битов, что указывает либо на бесконечность, либо на недопустимый результат вычисления.

Положительная и отрицательная бесконечность

Положительная и отрицательная бесконечность изображаются следующим образом:

знак = 0 для положительной бесконечности, 1 для отрицательной бесконечности.

смещенная экспонента = все 1 бит.

дробь = все 0 бит.

НЭН

Некоторые операции арифметики с плавающей запятой недопустимы, например извлечение квадратного корня из отрицательного числа. Получение недопустимого результата называется исключением с плавающей запятой. Исключительный результат представлен специальным кодом, называемым NaN, что означает « не число ». Все NaN в IEEE 754-1985 имеют следующий формат:

знак = либо 0, либо 1.

смещенная экспонента = все 1 бит.

дробь = что угодно, кроме всех 0 бит (поскольку все 0 бит представляют бесконечность).

Дальность и точность

Точность определяется как минимальная разница между двумя последовательными представлениями мантиссы; таким образом, это функция только в мантиссе; в то время как разрыв определяется как разница между двумя последовательными числами. ^[4]

Одинарная точность

Числа одинарной точности занимают 32 бита. В одинарной точности:

Положительные и отрицательные числа, ближайшие к нулю (представленные денормализованным значением со всеми нулями в поле показателя и двоичным значением 1 в поле дроби), равны
± ^2–23 × ^2–126 ≈ ± ^1,40130× 10–45
Положительные и отрицательные нормализованные числа, ближайшие к нулю (представленные двоичным значением 1 в поле показателя и 0 в поле дроби):
±1 × ^2–126 ≈ ± ^1,17549× 10–38
Конечные положительные и конечные отрицательные числа, наиболее удаленные от нуля (представленные значением с 254 в поле показателя и всеми единицами в поле дроби), равны
±(2−2 ⁻²³ ) × 2 ¹²⁷^[5] ≈ ±3,40282 × 10³⁸

Некоторые примеры значений диапазона и разрыва для заданных показателей степени с одинарной точностью:

Например, число 16 777 217 не может быть закодировано как 32-битное число с плавающей запятой, поскольку оно будет округлено до 16 777 216. Однако все целые числа в представимом диапазоне, являющиеся степенью 2, могут храниться в 32-битном формате с плавающей запятой без округления.

Двойная точность

Числа двойной точности занимают 64 бита. В двойной точности:

Положительные и отрицательные числа, ближайшие к нулю (представленные денормализованным значением со всеми нулями в поле Exp и двоичным значением 1 в поле Fraction), равны
± ^2–52 × ^2–1022 ≈ ± ^4,94066× 10–324
Положительные и отрицательные нормализованные числа, ближайшие к нулю (представленные двоичным значением 1 в поле Exp и 0 в поле дроби), равны
±1 × ^2–1022 ≈ ± ^2,22507× 10–308
Конечные положительные и конечные отрицательные числа, наиболее удаленные от нуля (представленные значением с 2046 в поле Exp и всеми единицами в поле дроби), равны
±(2−2 ⁻⁵² ) × 2 ¹⁰²³^[5] ≈ ±1,79769 × 10³⁰⁸

Некоторые примеры значений диапазона и разрыва для заданных показателей степени в двойной точности:

Расширенные форматы

Стандарт также рекомендует использовать расширенные форматы для выполнения внутренних вычислений с более высокой точностью, чем та, которая требуется для конечного результата, чтобы минимизировать ошибки округления: стандарт определяет только минимальные требования к точности и показателю для таких форматов. 80-битный расширенный формат x87 — это наиболее часто реализуемый расширенный формат, отвечающий этим требованиям .

Примеры

Вот несколько примеров представлений IEEE 754 одинарной точности:

Сравнение чисел с плавающей запятой

Каждая возможная комбинация битов представляет собой либо NaN, либо число с уникальным значением в аффинно расширенной системе действительных чисел с соответствующим порядком, за исключением двух комбинаций битов для отрицательного нуля и положительного нуля, которые иногда требуют особого внимания (см. ниже). . Двоичное представление обладает особым свойством: за исключением NaN, любые два числа можно сравнивать как целые числа по знаку и величине ( применяются проблемы с порядком байтов ). При сравнении целых чисел с дополнением до 2 : Если биты знака различаются, отрицательное число предшествует положительному числу, поэтому дополнение до 2 дает правильный результат (за исключением того, что отрицательный ноль и положительный ноль следует считать равными). Если оба значения положительны, сравнение с дополнением до двух снова дает правильный результат. В противном случае (два отрицательных числа) правильный порядок FP противоположен порядку дополнения до 2.

Ошибки округления, присущие вычислениям с плавающей запятой, могут ограничить использование сравнений для проверки точного равенства результатов. Выбор приемлемого диапазона – сложная тема. Распространенным методом является использование значения эпсилон сравнения для выполнения приблизительных сравнений. ^[6] В зависимости от того, насколько снисходительны сравнения, общие значения включают 1e-6или 1e-5одинарную точность, и 1e-14двойную точность. ^[7]^[8] Другой распространенный метод — ULP, который проверяет разницу в последних цифрах, эффективно проверяя, на сколько шагов различаются два значения. ^[9]

Хотя отрицательный ноль и положительный ноль обычно считаются равными для целей сравнения, некоторые реляционные операторы языков программирования и подобные конструкции рассматривают их как разные. Согласно спецификации языка Java ^[10] операторы сравнения и равенства рассматривают их как равные, но и различают их (официально начиная с версии Java 1.1, но фактически с 1.1.1), как и методы сравнения , и даже классов и .Math.min()Math.max()equals()compareTo()compare()FloatDouble

Округление чисел с плавающей запятой

Стандарт IEEE имеет четыре различных режима округления; первый используется по умолчанию; остальные называются направленными округлениями .

Round to Nearest – округляет до ближайшего значения; если число попадает на полпути, оно округляется до ближайшего значения с четным (нулевым) младшим битом, что означает, что оно округляется в большую сторону в 50% случаев (в IEEE 754-2008 этот режим называется roundTiesToEven , чтобы отличить его от другого раунда). - режим ближайшего)
Округление в сторону 0 – направленное округление в сторону нуля.
Округление в сторону +∞ – направленное округление в сторону положительной бесконечности.
Округление в сторону −∞ – направленное округление в сторону отрицательной бесконечности.

Расширение действительных чисел

Стандарт IEEE использует (и расширяет) аффинно расширенную систему действительных чисел с отдельными положительными и отрицательными бесконечностями. Во время разработки стандарта было предложено включить проективно расширенную систему действительных чисел с одной беззнаковой бесконечностью, предоставив программистам возможность выбора режима. Однако в целях снижения сложности окончательного стандарта от проективного режима отказались. Сопроцессоры Intel 8087 и Intel 80287 с плавающей запятой поддерживают этот проекционный режим. ^[11]^[12]^[13]

Функции и предикаты

Стандартные операции

Должны быть предусмотрены следующие функции:

Складывать, вычитать, умножать, делить
Квадратный корень
Остаток с плавающей запятой. Это не похоже на обычную операцию по модулю : для двух положительных чисел она может быть отрицательной. Он возвращает точное значение $x-(round(x/y)\cdoty)$ .
Округлить до ближайшего целого числа . Для ненаправленного округления, когда находится посередине между двумя целыми числами, выбирается четное целое число.
Операции сравнения. Помимо более очевидных результатов, IEEE 754 определяет, что −∞ = −∞, +∞ = +∞ и x ≠ NaNдля любого x (включая NaN).

История

В 1976 году Intel начала разработку сопроцессора с плавающей запятой . ^[14]^[15] Intel надеялась, что сможет продать чип, содержащий хорошие реализации всех операций, найденных в самых разных библиотеках математического программного обеспечения. ^[14]^[16]

Джон Палмер, руководивший проектом, считал, что эти усилия должны быть подкреплены стандартным объединением операций с плавающей запятой на разных процессорах. Он связался с Уильямом Кэханом из Калифорнийского университета , который помог повысить точность калькуляторов Hewlett-Packard . Кахан предложил Intel использовать систему с плавающей запятой VAX компании Digital Equipment Corporation (DEC). Первый VAX, VAX-11/780, вышел только в конце 1977 года, и его плавающая точка получила высокую оценку. Однако, стремясь вывести свой чип на как можно более широкий рынок, Intel хотела получить как можно лучший результат с плавающей запятой, и Кахан приступил к составлению спецификаций. ^[14] Кахан изначально рекомендовал использовать десятичную систему счисления с плавающей запятой ^[17]^{[ ненадежный источник? ],} но аппаратная конструкция сопроцессора была слишком далеко проработана, чтобы внести такие изменения.

Работа внутри Intel обеспокоила других поставщиков, которые предприняли усилия по стандартизации, чтобы обеспечить «равные условия игры». Кахан присутствовал на втором заседании рабочей группы по стандартам IEEE 754, состоявшемся в ноябре 1977 года. Впоследствии он получил разрешение от Intel выдвинуть проект предложения, основанный на его работе над их сопроцессором; ему было разрешено объяснить детали формата и его обоснование, но не что-либо, связанное с архитектурой реализации Intel. Проект был написан в соавторстве с Джеромом Куненом и Гарольдом Стоуном и первоначально был известен как «предложение Кахана-Кунена-Стоуна» или «формат KCS». ^[14]^[15]^[16]^[18]

Поскольку 8-битный показатель степени был недостаточно широк для некоторых операций, необходимых для чисел двойной точности, например, для хранения произведения двух 32-битных чисел, ^[19] поэтому и в предложении Кахана, и в контрпредложении DEC использовалось 11 бит. как проверенный временем 60-битный формат с плавающей запятой CDC 6600 1965 года. ^[15]^[18]^[20] Предложение Кахана также предусматривало бесконечности, которые полезны при работе с условиями деления на ноль; нечисловые значения, которые полезны при работе с недопустимыми операциями; денормальные числа , которые помогают смягчить проблемы, вызванные недостаточным заполнением; ^[18]^[21]^[22] и более сбалансированное смещение экспоненты , которое может помочь избежать переполнения и потери значения при получении обратного числа. ^[23]^[24]

Еще до утверждения проект стандарта был внедрен рядом производителей. ^[25]^[26] Intel 8087, анонсированный в 1980 году, был первым чипом, реализовавшим проект стандарта.

В 1980 году уже был выпущен чип Intel 8087 , ^[27] но DEC по-прежнему выступала против ненормальных чисел, в частности, из-за проблем с производительностью и потому, что это давало DEC конкурентное преимущество для стандартизации формата DEC.

Споры по поводу постепенного сокращения расходов продолжались до 1981 года, когда эксперт, нанятый DEC для оценки ситуации, встал на сторону несогласных. DEC провела исследование, чтобы продемонстрировать, что постепенное сокращение расходов было плохой идеей, но исследование пришло к противоположному выводу, и DEC уступила. В 1985 году стандарт был ратифицирован, но годом ранее он уже стал стандартом де-факто. реализовано многими производителями. ^[15]^[18]^[5]

Смотрите также

ИЭЭЭ 754
Minifloat для простых примеров свойств чисел с плавающей запятой IEEE 754.
Арифметика с фиксированной запятой

Примечания

^ Точность: точность количества десятичных цифр рассчитывается через число_of_mantissa_bits * Log ₁₀ (2). Таким образом, ~7,2 и ~15,9 для одинарной и двойной точности соответственно.

дальнейшее чтение

Чарльз Северанс (март 1998 г.). «IEEE 754: Интервью с Уильямом Каханом» (PDF) . IEEE-компьютер . 31 (3): 114–115. дои : 10.1109/MC.1998.660194. S2CID 33291145. Архивировано из оригинала (PDF) 23 августа 2009 г. Проверено 28 апреля 2008 г.
Дэвид Голдберг (март 1991 г.). «Что должен знать каждый ученый-компьютерщик об арифметике с плавающей запятой» (PDF) . Обзоры вычислительной техники ACM . 23 (1): 5–48. дои : 10.1145/103162.103163. S2CID 222008826 . Проверено 28 апреля 2008 г.
Крис Хекер (февраль 1996 г.). «Давайте перейдем к (плавающей) точке» (PDF) . Журнал разработчиков игр : 19–24. ISSN 1073-922X. Архивировано из оригинала (PDF) 3 февраля 2007 г.
Дэвид Моннио (май 2008 г.). «Подводные камни проверки вычислений с плавающей запятой». Транзакции ACM в языках и системах программирования . 30 (3): 1–41. arXiv : cs/0701192 . дои : 10.1145/1353445.1353446. ISSN 0164-0925. S2CID 218578808.: Сборник неинтуитивных вариантов поведения чисел с плавающей запятой в популярных архитектурах, имеющих значение для проверки и тестирования программ.

Внешние ссылки

Сравнение поплавков
Coprocessor.info: изображения x87 FPU, информация о разработке и производителе.
IEEE 854-1987 — История и протоколы
Онлайн-конвертер IEEE754 (одинарной и двойной точности)