В теории принятия решений теорема о полезности фон Неймана–Моргенштерна ( VNM ) демонстрирует, что рациональный выбор в условиях неопределенности подразумевает принятие решений, которые принимают форму максимизации ожидаемого значения некоторой кардинальной функции полезности. Эта функция известна как функция полезности фон Неймана–Моргенштерна. Теорема составляет основу теории ожидаемой полезности .
В 1947 году Джон фон Нейман и Оскар Моргенштерн доказали, что любой индивид, чьи предпочтения удовлетворяют четырем аксиомам, имеет функцию полезности , где предпочтения такого индивида могут быть представлены на интервальной шкале , и индивид всегда будет предпочитать действия, которые максимизируют ожидаемую полезность. [1] То есть, они доказали, что агент является (VNM-)рациональным тогда и только тогда, когда существует действительнозначная функция u, определяемая возможными результатами, такая, что каждое предпочтение агента характеризуется максимизацией ожидаемого значения u , которое затем может быть определено как VNM-полезность агента (она уникальна с точностью до аффинных преобразований, т. е. добавления константы и умножения на положительный скаляр). Не утверждается, что у агента есть «сознательное желание» максимизировать u , а только то, что u существует.
VNM-полезность — это полезность решения , поскольку она используется для описания решений . Она связана, но не обязательно эквивалентна полезности утилитаризма Бентама . [2]
В теореме отдельный агент сталкивается с вариантами, называемыми лотереями . При наличии некоторых взаимоисключающих результатов лотерея — это сценарий, в котором каждый результат произойдет с заданной вероятностью , а все вероятности в сумме дают единицу. Например, для двух результатов A и B ,
обозначает сценарий, где P ( A ) = 25% - вероятность того, что произойдет A , а P ( B ) = 75% (и произойдет ровно один из них). В более общем смысле, для лотереи со многими возможными результатами A i мы пишем:
с суммой s, равной 1.
Результаты лотереи сами по себе могут быть лотереями между другими результатами, и расширенное выражение считается эквивалентной лотереей: 0,5(0,5 A + 0,5 B ) + 0,5 C = 0,25 A + 0,25 B + 0,50 C .
Если лотерея M предпочтительнее лотереи L , мы пишем , или эквивалентно, . Если агенту безразлично между L и M , мы пишем отношение безразличия [3] Если M либо предпочтительнее, либо рассматривается с безразличием относительно L , мы пишем
Четыре аксиомы VNM-рациональности — это полнота , транзитивность , непрерывность и независимость . Эти аксиомы, помимо непрерывности, часто обосновываются с помощью теорем голландской книги (тогда как непрерывность используется для того, чтобы отбросить лексикографические или бесконечно малые полезности).
Полнота предполагает, что у человека есть четко определенные предпочтения:
(индивид должен выразить некоторое предпочтение или безразличие [4] ). Обратите внимание, что это подразумевает рефлексивность .
Транзитивность предполагает, что предпочтения одинаковы для любых трех вариантов:
Непрерывность предполагает, что существует «переломный момент» между тем, чтобы быть лучше или хуже заданного среднего варианта:
где обозначение в левой части относится к ситуации, в которой L принимается с вероятностью p, а N принимается с вероятностью (1– p ).
Вместо непрерывности можно предположить альтернативную аксиому, которая не подразумевает точного равенства, называемую свойством Архимеда . [3] Она гласит, что любое разделение в предпочтениях может быть сохранено при достаточно малом отклонении вероятностей:
Необходимо предположить только одно из (3) или (3′), а другое будет подразумеваться теоремой.
Независимость предполагает, что предпочтение сохраняется независимо от вероятности другого результата.
Другими словами, вероятности, связанные с , взаимно уничтожаются и не влияют на наше решение, поскольку вероятность одинакова в обеих лотереях.
Обратите внимание, что направление "только если" необходимо для работы теоремы. Без этого у нас есть этот контрпример: есть только два результата , и агент безразличен к , и строго предпочитает их все . С направлением "только если" мы можем утверждать, что подразумевает , тем самым исключая этот контрпример.
Аксиома независимости подразумевает аксиому сокращения сложных лотерей: [5]
Чтобы увидеть, как Аксиома 4 подразумевает Аксиому 4, установите выражение в Аксиоме 4 и раскройте его.
Для любого VNM-рационального агента (т.е. удовлетворяющего аксиомам 1–4) существует функция u , которая присваивает каждому результату A действительное число u(A) такое, что для любых двух лотерей
где E(u(L)) или, короче, Eu ( L ) определяется как
Таким образом, u может быть однозначно определено (с точностью до добавления константы и умножения на положительный скаляр) предпочтениями между простыми лотереями , то есть лотереями вида pA + (1 − p ) B , имеющими только два результата. Наоборот, любой агент, действующий для максимизации ожидания функции u, будет подчиняться аксиомам 1–4. Такая функция называется полезностью агента по фон Нейману–Моргенштерну (VNM) .
Доказательство конструктивно: оно показывает, как можно построить желаемую функцию. Здесь мы обрисовываем процесс построения для случая, когда число достоверных результатов конечно. [6] : 132–134
Предположим, что существует n достоверных результатов, . Обратите внимание, что каждый достоверный результат можно рассматривать как лотерею: это вырожденная лотерея, в которой результат выбирается с вероятностью 1. Следовательно, по аксиомам полноты и транзитивности можно упорядочить результаты от худшего к лучшему:
Мы предполагаем, что по крайней мере одно из неравенств является строгим (в противном случае функция полезности тривиальна — константа). Итак . Мы используем эти два крайних результата — худший и лучший — как единицу масштабирования нашей функции полезности и определяем:
Для каждой вероятности определите лотерею, которая выбирает лучший результат с вероятностью и худший результат в противном случае:
Обратите внимание, что и .
По аксиоме непрерывности для каждого достоверного результата существует вероятность, такая что:
и
Для каждого функция полезности результата определяется как
Таким образом, полезность каждой лотереи определяется как ожидание u :
Чтобы понять, почему эта функция полезности имеет смысл, рассмотрим лотерею , которая выбирает исход с вероятностью . Но, по нашему предположению, принимающему решение безразлично между гарантированным исходом и лотереей . Таким образом, по аксиоме редукции, ему безразлично между лотереей и следующей лотереей:
Лотерея , по сути, является лотереей, в которой с вероятностью выигрывает лучший результат , а в противном случае — худший.
Следовательно, если , то рациональный человек, принимающий решения, предпочтет лотерею лотерее , потому что она дает ему больший шанс выиграть и получить лучший результат.
Следовательно:
Фон Нейман и Моргенштерн ожидали удивления от силы своего вывода. Но, по их словам, причина, по которой их функция полезности работает, заключается в том, что она построена именно так, чтобы заполнить роль чего-то, чье ожидание максимизируется:
«Многие экономисты посчитают, что мы предполагаем слишком много... Разве мы не показали слишком много?... Насколько мы можем видеть, наши постулаты [являются] правдоподобными... Мы практически определили численную полезность как то, для чего исчисление математических ожиданий является законным». – VNM 1953, § 3.1.1 стр. 16 и § 3.7.1 стр. 28 [1]
Таким образом, содержание теоремы заключается в том, что построение u возможно, и они мало что говорят о его природе.
Часто бывает так, что человек, столкнувшись с реальными ставками на деньги, не действует, чтобы максимизировать ожидаемую стоимость своих долларовых активов. Например, человек, у которого есть только 1000 долларов сбережений, может не захотеть рисковать всем ради 20% вероятности выиграть 10 000 долларов, даже если
Однако, если человек VNM-рационален, такие факты автоматически учитываются в его функции полезности u . В этом примере мы могли бы заключить, что
где суммы в долларах здесь на самом деле представляют результаты (ср. « стоимость »), три возможные ситуации, с которыми может столкнуться индивид. В частности, u может проявлять свойства, такие как u ($1)+ u ($1) ≠ u ($2), не противореча VNM-рациональности вообще. Это приводит к количественной теории неприятия денежного риска.
В 1738 году Даниил Бернулли опубликовал трактат [7] , в котором он постулирует, что рациональное поведение можно описать как максимизацию ожидания функции u , которая, в частности, не обязательно должна быть оценена в денежном выражении, что объясняет неприятие риска. Это гипотеза ожидаемой полезности . Как уже говорилось, гипотеза может показаться смелым утверждением. Целью теоремы об ожидаемой полезности является предоставление «скромных условий» (т. е. аксиом), описывающих, когда гипотеза ожидаемой полезности верна, которые можно оценить напрямую и интуитивно:
«Аксиом не должно быть слишком много, их система должна быть максимально простой и прозрачной, и каждая аксиома должна иметь непосредственное интуитивное значение, по которому можно напрямую судить о ее уместности. В такой ситуации, как наша, это последнее требование особенно важно, несмотря на ее неопределенность: мы хотим сделать интуитивную концепцию поддающейся математической обработке и как можно яснее увидеть, какие гипотезы для этого требуются». – VNM 1953 § 3.5.2, стр. 25 [1]
Таким образом, утверждения о том, что гипотеза ожидаемой полезности не характеризует рациональность, должны отвергнуть одну из аксиом VNM. Возникло множество обобщенных теорий ожидаемой полезности , большинство из которых отбрасывают или ослабляют аксиому независимости.
Поскольку теорема ничего не предполагает о природе возможных результатов азартных игр, они могут быть морально значимыми событиями, например, связанными с жизнью, смертью, болезнью или здоровьем других. Рациональный агент фон Неймана–Моргенштерна способен действовать с большой заботой о таких событиях, жертвуя большим количеством личного богатства или благополучия, и все эти действия будут учитываться при построении/определении функции полезности VNM агента. Другими словами, и то, что естественным образом воспринимается как «личная выгода», и то, что естественным образом воспринимается как «альтруизм», неявно сбалансированы в функции полезности VNM рационального человека. Следовательно, полный спектр агентно -ориентированного и агентно-нейтрального поведения возможен с различными функциями полезности VNM [ необходимо разъяснение ] .
Если полезность равна , то рациональный агент фон Неймана–Моргенштерна должен быть безразличен между и . Поэтому рациональный агент фон Неймана–Моргенштерна, ориентированный на агента, не может отдавать предпочтение более равному или «справедливому» распределению полезности между своими возможными будущими «я».
Некоторые утилитаристские моральные теории касаются величин, называемых «общей полезностью» и «средней полезностью» коллективов, и характеризуют мораль с точки зрения предпочтения полезности или счастья других с пренебрежением к своему собственному. Эти понятия могут быть связаны с VNM-полезностью, но отличны от нее:
Термин E-полезность для «полезности опыта» был придуман [2] для обозначения типов «гедонистической» полезности, подобной принципу наибольшего счастья Бентама . Поскольку мораль влияет на решения, мораль VNM-рационального агента будет влиять на определение его собственной функции полезности (см. выше). Таким образом, мораль VNM-рационального агента может быть охарактеризована через корреляцию VNM-полезности агента с VNM-полезностью, E-полезностью или «счастьем» других, среди прочего, но не через игнорирование собственной VNM-полезности агента, противоречие в терминах.
Поскольку если L и M являются лотереями, то pL + (1 − p ) M просто «расширяется» и считается лотереей сама по себе, формализм VNM игнорирует то, что может восприниматься как «вложенная азартная игра». Это связано с проблемой Эллсберга , когда люди предпочитают избегать восприятия рисков относительно рисков . Фон Нейман и Моргенштерн осознавали это ограничение:
«... такие концепции, как определенная полезность азартных игр, не могут быть сформулированы без противоречий на этом уровне. Это может показаться парадоксальным утверждением. Но любой, кто серьезно пытался аксиоматизировать эту неуловимую концепцию, вероятно, согласится с ней». – VNM 1953 § 3.7.1, стр. 28. [ 1]
Поскольку для любых двух VNM-агентов X и Y их функции VNM-полезности u X и u Y определены только с точностью до аддитивных констант и мультипликативных положительных скаляров, теорема не предоставляет канонического способа сравнить их. Следовательно, выражения типа u X ( L ) + u Y ( L ) и u X ( L ) − u Y ( L ) не определены канонически, а сравнения типа u X ( L ) < u Y ( L ) не являются канонически истинными или ложными. В частности, вышеупомянутые «общая VNM-полезность» и «средняя VNM-полезность» популяции не имеют канонического смысла без предположений нормализации.
Было показано, что гипотеза ожидаемой полезности имеет несовершенную прогностическую точность в ряде лабораторных эмпирических экспериментов, таких как парадокс Алле .