Вероятность результата эксперимента никогда не бывает отрицательной, хотя квазивероятностное распределение допускает отрицательную вероятность или квазивероятность для некоторых событий. Эти распределения могут применяться к ненаблюдаемым событиям или условным вероятностям.
В 1942 году Поль Дирак написал статью «Физическая интерпретация квантовой механики» [1] , в которой он ввел понятия отрицательных энергий и отрицательных вероятностей :
Отрицательные энергии и вероятности не следует считать бессмыслицей. Это четко определенные математически концепции, как отрицание денег.
Идея отрицательных вероятностей позже получила повышенное внимание в физике и особенно в квантовой механике . Ричард Фейнман утверждал [2] , что никто не возражает против использования отрицательных чисел в расчетах: хотя «минус три яблока» не является допустимой концепцией в реальной жизни, отрицательные деньги допустимы. Аналогичным образом он утверждал, что отрицательные вероятности, а также вероятности выше единицы, возможно, могут быть полезны в расчетах вероятностей .
Отрицательные вероятности позже были предложены для решения нескольких проблем и парадоксов . [3] Половины монет представляют собой простые примеры отрицательных вероятностей. Эти странные монеты были введены в 2005 году Габором Й. Секей . [4] Половины монет имеют бесконечно много сторон, пронумерованных 0, 1, 2,..., а положительные четные числа берутся с отрицательными вероятностями. Две половинки монеты составляют полную монету в том смысле, что если мы подбросим две половинки монеты, то сумма результатов будет 0 или 1 с вероятностью 1/2, как если бы мы просто подбросили честную монету.
В работах «Конволюционные коэффициенты неотрицательно определенных функций» [5] и «Алгебраическая теория вероятностей» [6] Имре З. Ружа и Габор Й. Секей доказали, что если случайная величина X имеет знаковое или квазираспределение, где некоторые вероятности отрицательны, то всегда можно найти две случайные величины, Y и Z, с обычными (не знаковыми / не квази) распределениями, такими, что X, Y независимы и X + Y = Z в распределении. Таким образом, X всегда можно интерпретировать как «разность» двух обычных случайных величин, Z и Y. Если Y интерпретируется как ошибка измерения X, а наблюдаемое значение равно Z, то отрицательные области распределения X маскируются / экранируются ошибкой Y.
Другой пример, известный как распределение Вигнера в фазовом пространстве , введенный Юджином Вигнером в 1932 году для изучения квантовых поправок, часто приводит к отрицательным вероятностям. [7] По этой причине позже он был более известен как распределение квазивероятности Вигнера . В 1945 году М. С. Бартлетт разработал математическую и логическую последовательность такой отрицательной значимости. [8] Функция распределения Вигнера в настоящее время обычно используется в физике и является краеугольным камнем квантования фазового пространства . Ее отрицательные характеристики являются преимуществом формализма и часто указывают на квантовую интерференцию. Отрицательные области распределения защищены от прямого наблюдения квантовым принципом неопределенности : как правило, моменты такого неположительно-полуопределенного квазивероятностного распределения сильно ограничены и препятствуют прямой измеримости отрицательных областей распределения. Тем не менее, эти области вносят отрицательный и решающий вклад в ожидаемые значения наблюдаемых величин, вычисляемых с помощью таких распределений.
Концепция отрицательных вероятностей также была предложена для надежных моделей расположения объектов, где объекты подвержены отрицательно коррелированным рискам сбоев, когда расположения объектов, распределение клиентов и планы резервного обслуживания определяются одновременно. [9] [10] Ли и др. [11] предложили структуру виртуальной станции, которая преобразует сеть объектов с положительно коррелированными сбоями в эквивалентную сеть с добавленными виртуальными поддерживающими станциями, и эти виртуальные станции подвергались независимым сбоям. Этот подход сводит проблему с одной с коррелированными сбоями к другой без них. Се и др. [12] позже показали, как отрицательно коррелированные сбои также могут быть решены той же структурой моделирования, за исключением того, что виртуальная поддерживающая станция теперь может быть нарушена с «склонностью к сбоям», которая
... наследует все математические характеристики и свойства вероятности отказа, за исключением того, что мы позволяем ей быть больше 1...
Это открытие открывает пути для использования компактных смешанно-целочисленных математических программ для оптимального проектирования надежного местоположения объектов обслуживания в условиях зависящих от местоположения и положительных/отрицательных/смешанных корреляций сбоев в работе объектов. [13]
Предложенная концепция «предрасположенности» в работе Сье и др. [12] оказывается тем, что Фейнман и другие называли «квазивероятностью». Обратите внимание, что когда квазивероятность больше 1, то 1 минус это значение дает отрицательную вероятность. В контексте надежного расположения объекта действительно физически проверяемым наблюдением являются состояния нарушения объекта (вероятности которых гарантированно находятся в пределах обычного диапазона [0,1]), но нет прямой информации о состояниях нарушения станции или их соответствующих вероятностях. Следовательно, «вероятности» нарушения станций, интерпретируемые как «вероятности воображаемых промежуточных состояний», могут превышать единицу и, таким образом, называются квазивероятностями.
Отрицательные вероятности в последнее время стали применяться в математических финансах . В количественных финансах большинство вероятностей являются не реальными вероятностями, а псевдовероятностями, часто известными как вероятности, нейтральные к риску . [14] Это не реальные вероятности, а теоретические «вероятности» при ряде предположений, которые помогают упростить вычисления, позволяя таким псевдовероятностям быть отрицательными в определенных случаях, как впервые указал Эспен Гаардер Хауг в 2004 году. [15]
Строгое математическое определение отрицательных вероятностей и их свойств было недавно получено Марком Бергином и Гюнтером Мейсснером (2011). Авторы также показывают, как отрицательные вероятности могут быть применены к ценообразованию финансовых опционов . [14]
Некоторые проблемы машинного обучения используют графовые или гиперграфовые формулировки, в которых ребрам назначены веса, чаще всего положительные. Положительный вес от одной вершины к другой можно интерпретировать в случайном блуждании как вероятность перехода от первой вершины к последней. В цепи Маркова это вероятность каждого события, зависящая только от состояния, достигнутого в предыдущем событии.
Некоторые проблемы в машинном обучении, например, корреляционная кластеризация , естественно, часто имеют дело со знаковым графом , где вес ребра указывает, являются ли два узла похожими (коррелированными с положительным весом ребра) или несхожими (антикоррелированными с отрицательным весом ребра). Обработка веса графа как вероятности того, что две вершины будут связаны, здесь заменяется корреляцией, которая, конечно, может быть отрицательной или положительной в равной степени законно. Положительные и отрицательные веса графа не вызывают споров, если их интерпретировать как корреляции, а не вероятности, но поднимают схожие вопросы, например, проблемы нормализации в графе Лапласа и объяснимости спектральной кластеризации для знакового разбиения графа ; например, [16]
Аналогично, в спектральной теории графов собственные значения матрицы Лапласа представляют частоты , а собственные векторы образуют то, что известно как граф Фурье-базис, заменяющий классическое преобразование Фурье в обработке сигналов на основе графов . В приложениях к визуализации граф Лапласиан формулируется аналогично оператору анизотропной диффузии , где сглаженное по Гауссу изображение интерпретируется как один временной срез решения уравнения теплопроводности, которое имеет исходное изображение в качестве своих начальных условий. Если бы вес графа был отрицательным, это соответствовало бы отрицательной проводимости в уравнении теплопроводности , стимулируя концентрацию тепла в вершинах графа, соединенных ребром графа, а не нормальное рассеивание тепла . Хотя отрицательная теплопроводность не является физической, этот эффект полезен для сглаживания изображений с улучшением краев , например, приводит к заострению углов одномерных сигналов при использовании в сглаживании с сохранением краев на основе графов . [17]