NaN

В вычислительной технике NaN ( / n æ n / ) , что означает Not a Number (не число ) , представляет собой конкретное значение числового типа данных (часто число с плавающей точкой ), которое не определено как число, например, результат 0/0 . Систематическое использование NaN было введено стандартом IEEE 754 с плавающей точкой в 1985 году, наряду с представлением других неконечных величин, таких как бесконечности .

В математике результат 0/0 обычно не определяется как число ^[a] и поэтому может быть представлен как NaN в вычислительных системах.

Квадратный корень отрицательного числа не является действительным числом , и поэтому также представлен как NaN в совместимых вычислительных системах. NaN также могут использоваться для представления отсутствующих значений в вычислениях. ^[1]^[2]

Предоставляются два отдельных типа NaN, называемые тихими NaN и сигнальными NaN . Тихие NaN используются для распространения ошибок, возникающих из-за недопустимых операций или значений. Сигнальные NaN могут поддерживать расширенные функции, такие как смешивание числовых и символьных вычислений или другие расширения базовой арифметики с плавающей точкой.

С плавающей точкой

В вычислениях с плавающей точкой NaN не то же самое, что бесконечность , хотя оба обычно обрабатываются как особые случаи в представлениях вещественных чисел с плавающей точкой, а также в операциях с плавающей точкой. Недопустимая операция также не то же самое, что арифметическое переполнение (которое вернуло бы бесконечность или наибольшее конечное число по величине) или арифметическое подзаряд (которое вернуло бы наименьшее нормальное число по величине, субнормальное число или ноль ).

Значения NaN в формате IEEE 754 кодируются с помощью поля экспоненты, заполненного единицами (как значения бесконечности), и некоторого ненулевого числа в поле мантиссы (чтобы отличать их от значений бесконечности); это позволяет определять несколько различных значений NaN в зависимости от того, какие биты установлены в поле мантиссы, а также от значения ведущего бита знака (но приложения не обязаны предоставлять различную семантику для этих различных значений NaN).

Например, NaN одинарной точности (32 бита) IEEE 754 будет закодирован как

s111 1111 1xxx xxxx xxxx xxxx xxxx xxxx

где s — знак (чаще всего игнорируется в приложениях), а последовательность x представляет собой ненулевое число (значение ноль кодирует бесконечности). На практике старший бит из x используется для определения типа NaN: «тихий NaN» или «сигнальный NaN» (подробнее см. в разделе Кодирование). Остальные биты кодируют полезную нагрузку (чаще всего игнорируется в приложениях).

Операции с плавающей точкой, отличные от упорядоченных сравнений, обычно распространяют тихий NaN ( qNaN ). Большинство операций с плавающей точкой на сигнальном NaN ( sNaN ) сигнализируют об исключении недопустимой операции ; действие исключения по умолчанию тогда такое же, как для операндов qNaN, и они производят qNaN, если производят результат с плавающей точкой.

Распространение тихих NaN через арифметические операции позволяет обнаруживать ошибки в конце последовательности операций без обширного тестирования на промежуточных этапах. Например, если начать с NaN и добавить 1 пять раз подряд, каждое добавление приведет к NaN, но нет необходимости проверять каждое вычисление, поскольку можно просто отметить, что конечный результат — NaN. Однако, в зависимости от языка и функции, NaN могут быть тихо удалены из цепочки вычислений, где одно вычисление в цепочке даст постоянный результат для всех других значений с плавающей точкой. Например, вычисление x ⁰ может дать результат 1, даже если x — NaN, поэтому проверка только конечного результата скроет тот факт, что вычисление до x ⁰ привело к NaN. В общем случае, затем, для обнаружения всех случаев, когда вводятся NaN, необходим более поздний тест на установленный недопустимый флаг ^[3] (см. Определение функции ниже для получения дополнительных сведений).

В разделе 6.2 старого стандарта IEEE 754-2008 есть две аномальные функции ( функции maxNumи minNum, которые возвращают максимум и минимум соответственно двух операндов, которые, как ожидается, будут числами), которые отдают предпочтение числам — если хотя бы один из операндов является NaN, то возвращается значение другого операнда. Пересмотр IEEE 754-2019 заменил эти функции, поскольку они не являются ассоциативными (когда в операнде появляется сигнальный NaN). ^[4]^[5]

Сравнение с NaN

Сравнения определены стандартом IEEE 754 для учета возможных операндов NaN. ^[6] При сравнении двух действительных чисел или расширенных действительных чисел (как в форматах с плавающей точкой IEEE 754) первое число может быть либо меньше, либо равно, либо больше второго числа. Это дает три возможных отношения. Но когда хотя бы один операнд сравнения — NaN, эта трихотомия не применяется, и необходимо четвертое отношение: неупорядоченное . В частности, два значения NaN сравниваются как неупорядоченные, а не как равные.

Как указано, предикаты, связанные с математическими символами <, ≤, =, ≥, > (или эквивалентными обозначениями в языках программирования), возвращают false для неупорядоченного отношения. Так, например, NOT ( x < y ) логически не эквивалентно x ≥ y : для неупорядоченного, т. е. когда x или y равно NaN, первый возвращает true, а последний возвращает false. Однако ≠ определяется как отрицание =, поэтому он возвращает true для неупорядоченного.

Согласно этим правилам, сравнение x с самим собой, x ≠ x или x = x , можно использовать для проверки того, является ли x NaN или не NaN.

Предикаты сравнения являются либо сигнальными, либо несигнальными для тихих операндов NaN; сигнальные версии сигнализируют об исключении недопустимой операции для таких сравнений (т. е. по умолчанию это просто устанавливает соответствующий флаг статуса в дополнение к поведению несигнальных версий). Предикаты равенства и неравенства являются несигнальными. Все другие стандартные предикаты сравнения, связанные с указанными выше математическими символами, являются сигнальными, если они получают операнд NaN. Стандарт также предоставляет несигнальные версии этих других предикатов. Предикат определяет, является ли значение NaN, и никогда не сигнализирует об исключении, даже если x является сигнальным NaN.isNaN(x)

Стандарт IEEE для чисел с плавающей точкой требует, чтобы соблюдалось условие NaN ≠ NaN . Напротив, частный стандарт арифметики posit 2022 года имеет схожую концепцию, NaR (Not a Real), где соблюдается условие NaR = NaR . ^[7]

Операции, генерирующие NaN

Существует три вида операций, которые могут возвращать NaN: ^[8]

Большинство операций с как минимум одним операндом NaN.
Неопределенные формы :
- Деления $(\pm0) / (\pm0)$ и $(\pm\infty) / (\pm\infty)$ .
- Умножения $(\pm0) \times (\pm\infty)$ и $(\pm\infty) \times (\pm0)$ .
- Остаток $x % y$ , когда $x$ равен бесконечности или $y$ равен нулю.
- Сложения $(+\infty) + (-\infty)$ , $(-\infty) + (+\infty)$ и эквивалентные вычитания $(+\infty) - (+\infty)$ и $(-\infty) - (-\infty)$ .
- Стандарт предусматривает альтернативные функции для полномочий:
  - Стандартная powфункция и целочисленная экспоненциальная pownфункция определяют $0 0$ , $1 \infty$ и $\infty 0$ как $1$ .
  - Функция powrопределяет все три неопределенные формы как недопустимые операции и поэтому возвращает NaN.
Реальные операции со сложными результатами, например:
- Квадратный корень из отрицательного числа.
- Логарифм отрицательного числа.
- Арксинус или арккосинус числа, которое меньше −1 или больше 1.

NaN также могут быть явно назначены переменным, как правило, как представление отсутствующих значений. До стандарта IEEE программисты часто использовали специальное значение (например, −99999999) для представления неопределенных или отсутствующих значений, но не было никакой гарантии, что они будут обработаны последовательно или правильно. ^[1]

NaN не обязательно генерируются во всех вышеперечисленных случаях. Если операция может создать условие исключения, а ловушки не замаскированы, то операция вместо этого вызовет ловушку. ^[9] Если операнд является тихим NaN, и также нет сигнализирующего операнда NaN, то условия исключения нет, и результатом является тихий NaN. Явные назначения не вызовут исключения даже для сигнализирующих NaN.

Тихий NaN

В общем, тихие NaN или qNaN не вызывают никаких дополнительных исключений, поскольку они распространяются через большинство операций. Но исключение недопустимой операции сигнализируется некоторыми операциями, которые не возвращают значение с плавающей точкой, такими как преобразования формата или определенные операции сравнения.

Сигнализация NaN

Сигнальные NaN, или sNaN, являются особыми формами NaN, которые при использовании большинством операций должны вызывать исключение недопустимой операции, а затем, если это уместно, "успокаиваться" в qNaN, который затем может распространяться. Они были введены в IEEE 754. Было несколько идей относительно того, как их можно использовать:

Заполнение неинициализированной памяти сигнальными NaN-значениями приведет к исключению недопустимой операции, если данные будут использованы до их инициализации.
Использование sNaN в качестве заполнителя для более сложного объекта , например:
- Представление числа, которое вышло за пределы
- Представление числа, которое переполнилось
- Число в формате более высокой точности
- Комплексное число

При обнаружении обработчик ловушек может декодировать sNaN и вернуть индекс к вычисленному результату. На практике этот подход сталкивается со многими осложнениями. Обработка знакового бита NaN для некоторых простых операций (таких как абсолютное значение ) отличается от обработки для арифметических операций. Ловушки не требуются стандартом. ^{[ необходима цитата ]}

Операции с полезной нагрузкой

IEEE 754-2019 рекомендует реализовать операции getPayload , setPayload и setPayloadSignaling , ^[10] стандартизируя доступ к полезным нагрузкам для упрощения использования приложений. ^[11] Согласно справочному документу IEEE 754-2019, эту рекомендацию следует интерпретировать как «требуемую для новых реализаций с оговоркой для обратной совместимости». ^[12]

Кодирование

В форматах обмена IEEE 754 NaN идентифицируются определенными, предопределенными битовыми шаблонами, уникальными для NaN. Знаковый бит не имеет значения. Двоичный формат NaN представлен экспоненциальным полем, заполненным единицами (как значения бесконечности), и некоторым ненулевым числом в поле значащей части (чтобы отличать их от значений бесконечности). Исходный стандарт IEEE 754 от 1985 года ( IEEE 754-1985 ) описывал только двоичные форматы с плавающей точкой и не указывал, как следует помечать состояние сигнализации/спокойствия. На практике старший значащий бит поля значащей части определял, является ли NaN сигнальным или тихим. В результате были получены две различные реализации с обратными значениями:

большинство процессоров (включая процессоры семейства x86 Intel и AMD , семейства Motorola 68000 , семейства AIM PowerPC , семейства ARM , семейства Sun SPARC и опционально новых процессоров MIPS ) устанавливают бит сигнализации/тишины в ненулевое значение, если NaN тихий, и в ноль, если NaN сигнализирует. Таким образом, на этих процессорах бит представляет флаг ; is_quiet
В NaN, сгенерированных процессорами PA-RISC и старыми MIPS, бит сигнализации/тишины равен нулю, если NaN тихий, и ненулевой, если NaN сигнализирует. Таким образом, на этих процессорах бит представляет флаг is_signaling.

Первый вариант был предпочтительнее, поскольку он позволяет реализации заглушить сигнальный NaN, просто установив бит сигнализации/заглушения в 1. Обратное невозможно при последнем варианте, поскольку установка бита сигнализации/заглушения в 0 может привести к бесконечности. ^[13]

В редакциях стандарта IEEE 754 2008 и 2019 годов содержатся формальные требования и рекомендации по кодированию состояния сигнализации/спокойствия.

Для форматов двоичного обмена старший бит поля значимости используется исключительно для различения тихих и сигнальных NaN. ^[14] (Это требование было добавлено в редакции 2019 года.) Более того, он должен быть флагом is_quiet. ^[15] То есть этот бит не равен нулю, если NaN тихий, и нулю, если NaN сигнальный.
Для десятичных форматов обмена, как в двоичной, так и в десятичной кодировке, NaN идентифицируется по тому, что верхние пять бит поля комбинации после бита знака установлены в единицы. Шестой бит поля — это флаг is_signaling. То есть этот бит равен нулю, если NaN не активен, и не равен нулю, если NaN сигнализирует. ^[16]

Для соответствия IEEE 754-2008 значение бита сигнализации/тишины в последних процессорах MIPS теперь можно настроить через поле NAN2008 регистра FCSR. Эта поддержка является необязательной в MIPS Release 3 и обязательной в Release 5. ^[17]

Состояние/значение остальных битов поля значимости не определены стандартом. Это значение называется «полезной нагрузкой» NaN. Если операция имеет один вход NaN и распространяет его на выход, полезная нагрузка результирующего NaN должна быть такой же, как у входного NaN (это не всегда возможно для двоичных форматов, когда сигнальное/тихое состояние кодируется флагом is_signaling, как объяснено выше). Если есть несколько входов NaN, полезная нагрузка результирующего NaN должна быть из одного из входных NaN; стандарт не указывает, какой именно.

Канонический NaN

В ряде систем есть концепция «канонического NaN», где одно конкретное значение NaN выбирается как единственное возможное значение qNaN, сгенерированное операциями с плавающей точкой, не имеющими входного значения NaN. Значение обычно выбирается как тихое NaN с нулевой полезной нагрузкой и произвольно определенным битом знака.

В RISC-V операции с плавающей точкой всегда генерируют только каноническое NaN, даже если NaN задано как операнд (полезная нагрузка не распространяется). ^[18]^[b] ARM может включить режим «NaN по умолчанию» для этого поведения. ^[20] WebAssembly имеет такое же поведение, хотя он допускает два канонических значения. ^[21]
Ряд языков не различают различные значения NaN, не требуя от своих реализаций принудительного использования определенного значения NaN. ECMAScript (JavaScript) обрабатывает все NaN так, как будто они являются одним и тем же значением. ^[21] Java обрабатывает то же самое «по большей части». ^[22]

Использование ограниченного количества представлений NaN позволяет системе использовать другие возможные значения NaN для неарифметических целей, наиболее важным из которых является «NaN-boxing», т. е. использование полезной нагрузки для произвольных данных. ^[23] (Эта концепция «канонического NaN» не совпадает с концепцией «канонического кодирования» в IEEE 754.)

Определение функции

Существуют разные мнения о правильном определении результата числовой функции , которая получает тихий NaN в качестве входных данных. Одна точка зрения заключается в том, что NaN должен распространяться на выход функции во всех случаях, чтобы распространить указание на ошибку. Другая точка зрения, принятая стандартами ISO C99 и IEEE 754-2008 в целом, заключается в том, что если функция имеет несколько аргументов и выход однозначно определяется всеми не-NaN входными данными (включая бесконечность), то это значение должно быть результатом. Так, например, значение, возвращаемое hypot(±∞, qNaN)и, hypot(qNaN, ±∞)равно +∞.

Проблема особенно остра для функции возведения в степень = x ^y . Выражения 0 ⁰ , ∞ ⁰ и 1 ^∞ считаются неопределенными формами , когда они встречаются как пределы (как и ∞ × 0), и вопрос о том, следует ли определять ноль в нулевой степени как 1, имеет разделившиеся мнения.pow(x, y)

Если вывод считается неопределенным, когда параметр не определен, то pow(1, qNaN)должен выдавать qNaN. Однако математические библиотеки обычно возвращают 1 для любого действительного числа y , и даже когда y является бесконечностью . Аналогично они выдают 1 для даже когда x равен 0 или бесконечности. Обоснованием возврата значения 1 для неопределенных форм было то, что значение функций в особых точках может быть принято как определенное значение, если это значение находится в пределе значение ^[^{необходимо пояснение}^] для всех, кроме исчезающе малой части шара вокруг предельного значения параметров. ^[^{необходима цитата}^] Версия стандарта IEEE 754 2008 года гласит, что и должны возвращать 1, поскольку они возвращают 1, что бы ни использовалось, вместо тихого NaN. Более того, ISO C99, а позднее IEEE 754-2008, решили указать = 1 вместо qNaN; Причина такого выбора указана в обосновании C: ^[24] «Как правило, C99 избегает результата NaN там, где полезно числовое значение. ... Результат равен +∞, поскольку все большие положительные значения с плавающей точкой являются четными целыми числами».pow(1, y) pow(x, 0)pow(1, qNaN)pow(qNaN, 0)pow(−1, ±∞)pow(−2, ∞)

Чтобы удовлетворить тех, кто желает более строгой интерпретации того, как должна действовать степенная функция, стандарт 2008 года определяет две дополнительные степенные функции: , где показатель степени должен быть целым числом, и , которая возвращает NaN всякий раз, когда параметр является NaN или возведение в степень даст неопределенную форму .pown(x, n)powr(x, y)

Целое число NaN

Большинство форматов целых чисел фиксированного размера не могут явно указывать на недопустимые данные. В таком случае при преобразовании NaN в целочисленный тип стандарт IEEE 754 требует, чтобы исключение недопустимой операции было сигнализировано. Например, в Java такие операции выдают экземпляры java.lang.ArithmeticException. ^[25] В C они приводят к неопределенному поведению , но если поддерживается приложение F, операция выдает «недопустимое» исключение с плавающей точкой (как того требует стандарт IEEE) и неуказанное значение.

Пакет Perl используетMath::BigInt «NaN» для результата строк, которые не представляют допустимые целые числа. ^[26]

> perl -mMath::BigInt -e "print Math::BigInt->new('foo')" NaN

Отображать

Разные операционные системы и языки программирования могут иметь разные строковые представления NaN.

нан (C, C++, Python)NaN (ECMAScript, Rust, C#, Julia). Julia может отображать альтернативные значения NaN, в зависимости от точности, NaN32 и NaN16; NaN — для типа Float64.NaN%НАН (C, C++, Rust)NaNQ (IBM XL и AIX: Fortran, C++ предложение n2290)NaNS (то же самое)qNaNsNaN1.#SNAN (Excel)1.#QNAN (Excel)-1.#ИНД (Excel)+nan.0 (Схема)

Поскольку на практике закодированные NaN имеют знак, тихий/сигнальный бит и необязательную «диагностическую информацию» (иногда называемую полезной нагрузкой ), они иногда будут встречаться и в строковых представлениях NaN. Вот несколько примеров:

Для языков C и C++ бит знака всегда отображается функциями стандартной библиотеки (например, -nan), если он присутствует. Стандартного отображения полезной нагрузки или статуса сигнализации не существует, но тихое значение NaN определенной полезной нагрузки может быть создано либо путем предоставления строки функции разбора чисел (например, ), либо путем предоставления строки последовательности символов (или для sNaN), оба интерпретируются способом, определяемым реализацией.nan(char-sequence)strtodnan()nans()
- GCC и LLVM предоставляют встроенные реализации nan()и nans(). Они анализируют последовательность символов как целое число strtoull(или эквивалент другого размера) с его обнаружением целочисленных оснований.
- Анализатор float библиотеки GNU C использует строку последовательности символов «каким-то неопределенным образом». ^[27] На практике этот анализ был эквивалентен анализу GCC/LLVM для полезной нагрузки размером до 64 бит.
- Newlib не реализует nan()синтаксический анализ, но strtod()принимает шестнадцатеричный формат без префикса.
- musl не реализует никакого анализа полезной нагрузки.

Не все языки допускают существование нескольких NaN. Например, ECMAScript использует только одно значение NaN.

Ссылки

Примечания

^ 0/0 не определено как число ни в системе действительных чисел , ни в расширенной системе действительных чисел , в то время как 1/±0, например, можно было бы последовательно присвоить значение ±∞ в последней системе, предполагая знаковый ноль .
^ IEEE 754-2008 рекомендует, но не требует, распространение полезной нагрузки NaN. Большинство процессоров предпочитают следовать этой рекомендации, но сами не генерируют ненулевую полезную нагрузку. ^[19] Таким образом, поведение RISC-V не рекомендуется, но соответствует.

Цитаты

^ ab Bowman, Kenneth (2006). Введение в программирование с IDL: интерактивный язык данных . Academic Press. стр. 26. ISBN 978-0-12-088559-6.
^ Пресс, Уильям Х.; Тьюколски, Сол А.; Веттерлинг, Уильям Т.; Флэннери, Брайан П. (2007). Численные рецепты: искусство научных вычислений . Cambridge University Press. стр. 34. ISBN 978-0-521-88068-8.
↑ Уильям Кахан (1 октября 1997 г.). «Конспект лекций о состоянии стандарта IEEE 754 для двоичной арифметики с плавающей точкой» (PDF) .
^ Дэвид Х. Чэнь (21 февраля 2017 г.). «Удаление/понижение операций MinNum и MaxNum из IEEE 754-2018» (PDF) . Получено 6 мая 2019 г.
^ "754R Minutes". 19 мая 2017 г. Получено 25 июня 2017 г.
^ IEEE 754 2019, §5.11
^ Стандарт для арифметики Posit (2022)
^ Дэвид Голдберг (1991). «Что каждый специалист по компьютерам должен знать о числах с плавающей точкой».
^ «Руководство разработчика программного обеспечения для архитектур Intel 64 и IA-32. Том 1: Базовая архитектура». Апрель 2008 г., стр. 118–125, 266–267, 334–335.
^ IEEE 754 2019, §9.7
^ «Обсуждение предыстории новых функций полезной нагрузки».
^ «Пересмотр стандарта IEEE для арифметики с плавающей точкой запланирован на 2019 год» (PDF) .
^ "Re: (длинные) sNaNs не такие, какими они могли бы быть..." IEEE . 15 октября 2010 г. Получено 5 ноября 2020 г.
^ IEEE 754 2019, §3.4
^ IEEE 754 2019, §6.2.1
^ IEEE 754 2019, §3.5.2
^ "Архитектура MIPS для программистов – Том IA: Введение в архитектуру MIPS64" (PDF) . MIPS Technologies, Inc. 20 ноября 2013 г. стр. 79 . Получено 27 сентября 2017 г. .
^ Embeddev, Five. "Стандартное расширение "F" для чисел с плавающей точкой одинарной точности, версия 2.2 / Руководство по набору инструкций RISC-V, том I: RISC-V ISA уровня пользователя". Five EmbedDev .
^
- Фог, Агнер (11 апреля 2018 г.). «Распространение полезной нагрузки NaN — нерешенные вопросы» (PDF) .
- Туман Агнер (27 апреля 2020 г.). «Отслеживание исключений с плавающей запятой и распространение NAN» (PDF) .
^ "Обработка NaN и значение NaN по умолчанию (Справочное руководство по архитектуре ARM, издания ARMv7-A и ARMv7-R)". Документация – Arm Developer .
^ ab "Какова мотивация канонизации 'NaN'? · Проблема № 1463 · WebAssembly/design". GitHub .– см. ответ Дэна Гохмана "sunfishcode"
^ "Глава 4. Типы, значения и переменные". docs.oracle.com . По большей части платформа Java SE обрабатывает значения NaN заданного типа так, как будто они свернуты в одно каноническое значение, и поэтому эта спецификация обычно относится к произвольному NaN как к каноническому значению.
^ Нистром, Роберт (28 июля 2021 г.). "§ 30.3 NaN Boxing". Crafting Interpreters. Дженевер Беннинг. ISBN 978-0-9905829-3-9.
^ "Обоснование международного стандарта — Языки программирования — C, редакция 5.10" (PDF) . Апрель 2003 г. стр. 180.
^ "ArithmeticException (Java Platform SE 8)". docs.oracle.com .
^ "Math::BigInt". perldoc.perl.org . Получено 12 июня 2015 г. .
^ "Parsing of Floats (The GNU C Library)". www.gnu.org . Получено 9 сентября 2021 г. Если указаны символы… , они используются каким-то неопределенным образом для выбора конкретного представления NaN (их может быть несколько).

Стандарты

IEEE Computer Society (29 августа 2008 г.). Стандарт IEEE для арифметики с плавающей точкой . IEEE. стр. 1–70. doi :10.1109/IEEESTD.2008.4610935. ISBN 978-0-7381-5753-5. Стандарт IEEE 754-2008.
IEEE Computer Society (22 июля 2019 г.). Стандарт IEEE для арифметики с плавающей точкой . IEEE. стр. 1–84. doi :10.1109/IEEESTD.2019.8766229. ISBN 978-1-5044-5924-2. Стандарт IEEE 754-2019.

Внешние ссылки

Не число, foldoc.org
Стандарт IEEE 754-2008 для арифметики с плавающей точкой (требуется подписка)
Стандарт IEEE 754-2019 для арифметики с плавающей точкой (требуется подписка)