Теорема фон Неймана – Моргенштерна о полезности

В теории принятия решений теорема о полезности фон Неймана–Моргенштерна ( VNM ) демонстрирует, что рациональный выбор в условиях неопределенности подразумевает принятие решений, которые принимают форму максимизации ожидаемого значения некоторой кардинальной функции полезности. Эта функция известна как функция полезности фон Неймана–Моргенштерна. Теорема составляет основу теории ожидаемой полезности .

В 1947 году Джон фон Нейман и Оскар Моргенштерн доказали, что любой индивид, чьи предпочтения удовлетворяют четырем аксиомам, имеет функцию полезности , где предпочтения такого индивида могут быть представлены на интервальной шкале , и индивид всегда будет предпочитать действия, которые максимизируют ожидаемую полезность. ^[1] То есть, они доказали, что агент является (VNM-)рациональным тогда и только тогда, когда существует действительнозначная функция u, определяемая возможными результатами, такая, что каждое предпочтение агента характеризуется максимизацией ожидаемого значения u , которое затем может быть определено как VNM-полезность агента (она уникальна с точностью до аффинных преобразований, т. е. добавления константы и умножения на положительный скаляр). Не утверждается, что у агента есть «сознательное желание» максимизировать u , а только то, что u существует.

VNM-полезность — это полезность решения , поскольку она используется для описания решений . Она связана, но не обязательно эквивалентна полезности утилитаризма Бентама . ^[2]

Настраивать

В теореме отдельный агент сталкивается с вариантами, называемыми лотереями . При наличии некоторых взаимоисключающих результатов лотерея — это сценарий, в котором каждый результат произойдет с заданной вероятностью , а все вероятности в сумме дают единицу. Например, для двух результатов A и B ,

L=0.25A+0.75B

обозначает сценарий, где P ( A ) = 25% - вероятность того, что произойдет A , а P ( B ) = 75% (и произойдет ровно один из них). В более общем смысле, для лотереи со многими возможными результатами A _i мы пишем:

L=\sum p_{i}A_{i},

с суммой s, равной 1. $p_{i}$

Результаты лотереи сами по себе могут быть лотереями между другими результатами, и расширенное выражение считается эквивалентной лотереей: 0,5(0,5 A + 0,5 B ) + 0,5 C = 0,25 A + 0,25 B + 0,50 C .

Если лотерея M предпочтительнее лотереи L , мы пишем , или эквивалентно, . Если агенту безразлично между L и M , мы пишем отношение безразличия ^[3] Если M либо предпочтительнее, либо рассматривается с безразличием относительно L , мы пишем $M\succ L$ $L\prec M$ $L\sim M.$ $L\preceq M.$

Аксиомы

Четыре аксиомы VNM-рациональности — это полнота , транзитивность , непрерывность и независимость . Эти аксиомы, помимо непрерывности, часто обосновываются с помощью теорем голландской книги (тогда как непрерывность используется для того, чтобы отбросить лексикографические или бесконечно малые полезности).

Полнота предполагает, что у человека есть четко определенные предпочтения:

Аксиома 1 (Полнота) Для любых лотерей и , либо , либо .

L

M

\,L\succeq M

\,M\succeq L

(индивид должен выразить некоторое предпочтение или безразличие ^[4] ). Обратите внимание, что это подразумевает рефлексивность .

Транзитивность предполагает, что предпочтения одинаковы для любых трех вариантов:

Аксиома 2 (Транзитивность) Если и , то .

\,L\succeq M

\,M\succeq N

\,L\succeq N

Непрерывность предполагает, что существует «переломный момент» между тем, чтобы быть лучше или хуже заданного среднего варианта:

Аксиома 3 (Непрерывность): Если , то существует вероятность такая, что

\,L\preceq M\preceq N

\,p\in [0,1]

\,pL+(1-p)N\,\sim \,M

где обозначение в левой части относится к ситуации, в которой L принимается с вероятностью p, а N принимается с вероятностью (1– p ).

Вместо непрерывности можно предположить альтернативную аксиому, которая не подразумевает точного равенства, называемую свойством Архимеда . ^[3] Она гласит, что любое разделение в предпочтениях может быть сохранено при достаточно малом отклонении вероятностей:

Аксиома 3′ (Архимедово свойство): Если , то существует вероятность такая, что

\,L\prec M\prec N

\,\varepsilon \in (0,1)

\,(1-\varepsilon )L+\varepsilon N\,\prec \,M\,\prec \,\varepsilon L+(1-\varepsilon )N.

Необходимо предположить только одно из (3) или (3′), а другое будет подразумеваться теоремой.

Независимость предполагает, что предпочтение сохраняется независимо от вероятности другого результата.

Аксиома 4 (Независимость): Для любого и (с подчеркнутой «несущественной» частью лотереи):

N

p\in [0,1)

L\preceq N\quad {\text{if and only if}}\quad \,(1-p)\,L+{\underline {pM}}\preceq (1-p)\,N+{\underline {pM}}

Другими словами, вероятности, связанные с , взаимно уничтожаются и не влияют на наше решение, поскольку вероятность одинакова в обеих лотереях. $M$ $M$

Обратите внимание, что направление "только если" необходимо для работы теоремы. Без этого у нас есть этот контрпример: есть только два результата , и агент безразличен к , и строго предпочитает их все . С направлением "только если" мы можем утверждать, что подразумевает , тем самым исключая этот контрпример. $A,B$ $\{pA+(1-p)B:p\in [0,1)\}$ $A$ ${\frac {1}{2}}A+{\frac {1}{2}}B\succeq {\frac {1}{2}}B+{\frac {1}{2}}B$ $A\succeq B$

Аксиома независимости подразумевает аксиому сокращения сложных лотерей: ^[5]

Аксиома 4′ (Сокращение сложных лотерей): Для любых лотерей и любых ,

L,L',N,N'

p,q\in [0,1]

{\text{if}}\qquad L\sim qL'+(1-q)N',

{\text{then}}\quad pL+(1-p)N\sim pqL'+p(1-q)N'+(1-p)N.

Чтобы увидеть, как Аксиома 4 подразумевает Аксиому 4, установите выражение в Аксиоме 4 и раскройте его. $M=qL'+(1-q)N'$

Теорема

Для любого VNM-рационального агента (т.е. удовлетворяющего аксиомам 1–4) существует функция u , которая присваивает каждому результату A действительное число u(A) такое, что для любых двух лотерей

L\prec M\qquad \mathrm {if\,and\,only\,if} \qquad E(u(L))<E(u(M)),

где E(u(L)) или, короче, Eu ( L ) определяется как

Eu(p_{1}A_{1}+\cdots +p_{n}A_{n})=p_{1}u(A_{1})+\cdots +p_{n}u(A_{n}).

Таким образом, u может быть однозначно определено (с точностью до добавления константы и умножения на положительный скаляр) предпочтениями между простыми лотереями , то есть лотереями вида pA + (1 − p ) B , имеющими только два результата. Наоборот, любой агент, действующий для максимизации ожидания функции u, будет подчиняться аксиомам 1–4. Такая функция называется полезностью агента по фон Нейману–Моргенштерну (VNM) .

Эскиз доказательства

Доказательство конструктивно: оно показывает, как можно построить желаемую функцию. Здесь мы обрисовываем процесс построения для случая, когда число достоверных результатов конечно. ^[6]^{: 132–134} $u$

Предположим, что существует n достоверных результатов, . Обратите внимание, что каждый достоверный результат можно рассматривать как лотерею: это вырожденная лотерея, в которой результат выбирается с вероятностью 1. Следовательно, по аксиомам полноты и транзитивности можно упорядочить результаты от худшего к лучшему: $A_{1}\dots A_{n}$

A_{1}\preceq A_{2}\preceq \cdots \preceq A_{n}

Мы предполагаем, что по крайней мере одно из неравенств является строгим (в противном случае функция полезности тривиальна — константа). Итак . Мы используем эти два крайних результата — худший и лучший — как единицу масштабирования нашей функции полезности и определяем: $A_{1}\prec A_{n}$

u(A_{1})=0

u(A_{n})=1

Для каждой вероятности определите лотерею, которая выбирает лучший результат с вероятностью и худший результат в противном случае: $p\in [0,1]$ $p$

L(p)=p\cdot A_{n}+(1-p)\cdot A_{1}

Обратите внимание, что и . $L(0)\sim A_{1}$ $L(1)\sim A_{n}$

По аксиоме непрерывности для каждого достоверного результата существует вероятность, такая что: $A_{i}$ $q_{i}$

L(q_{i})\sim A_{i}

0=q_{1}\leq q_{2}\leq \cdots \leq q_{n}=1

Для каждого функция полезности результата определяется как $i$ $A_{i}$

u(A_{i})=q_{i}

Таким образом, полезность каждой лотереи определяется как ожидание u : $M=\sum _{i}p_{i}A_{i}$

u(M)=u\left(\sum _{i}p_{i}A_{i}\right)=\sum _{i}p_{i}u(A_{i})=\sum _{i}p_{i}q_{i}

Чтобы понять, почему эта функция полезности имеет смысл, рассмотрим лотерею , которая выбирает исход с вероятностью . Но, по нашему предположению, принимающему решение безразлично между гарантированным исходом и лотереей . Таким образом, по аксиоме редукции, ему безразлично между лотереей и следующей лотереей: $M=\sum _{i}p_{i}A_{i}$ $A_{i}$ $p_{i}$ $A_{i}$ $q_{i}\cdot A_{n}+(1-q_{i})\cdot A_{1}$ $M$

M'=\sum _{i}p_{i}[q_{i}\cdot A_{n}+(1-q_{i})\cdot A_{1}]

M'=\left(\sum _{i}p_{i}q_{i}\right)\cdot A_{n}+\left(\sum _{i}p_{i}(1-q_{i})\right)\cdot A_{1}

M'=u(M)\cdot A_{n}+(1-u(M))\cdot A_{1}

Лотерея , по сути, является лотереей, в которой с вероятностью выигрывает лучший результат , а в противном случае — худший. $M'$ $u(M)$

Следовательно, если , то рациональный человек, принимающий решения, предпочтет лотерею лотерее , потому что она дает ему больший шанс выиграть и получить лучший результат. $u(M)>u(L)$ $M$ $L$

Следовательно:

L\prec M\;

если и только если

E(u(L))<E(u(M)).

Реакция

Фон Нейман и Моргенштерн ожидали удивления от силы своего вывода. Но, по их словам, причина, по которой их функция полезности работает, заключается в том, что она построена именно так, чтобы заполнить роль чего-то, чье ожидание максимизируется:

«Многие экономисты посчитают, что мы предполагаем слишком много... Разве мы не показали слишком много?... Насколько мы можем видеть, наши постулаты [являются] правдоподобными... Мы практически определили численную полезность как то, для чего исчисление математических ожиданий является законным». – VNM 1953, § 3.1.1 стр. 16 и § 3.7.1 стр. 28 ^[1]

Таким образом, содержание теоремы заключается в том, что построение u возможно, и они мало что говорят о его природе.

Последствия

Автоматический учет неприятия риска

Часто бывает так, что человек, столкнувшись с реальными ставками на деньги, не действует, чтобы максимизировать ожидаемую стоимость своих долларовых активов. Например, человек, у которого есть только 1000 долларов сбережений, может не захотеть рисковать всем ради 20% вероятности выиграть 10 000 долларов, даже если

20\%(\$10\,000)+80\%(\$0)=\$2000>100\%(\$1000)

Однако, если человек VNM-рационален, такие факты автоматически учитываются в его функции полезности u . В этом примере мы могли бы заключить, что

20\%u(\$10\,000)+80\%u(\$0)<u(\$1000)

где суммы в долларах здесь на самом деле представляют результаты (ср. « стоимость »), три возможные ситуации, с которыми может столкнуться индивид. В частности, u может проявлять свойства, такие как u ($1)+ u ($1) ≠ u ($2), не противореча VNM-рациональности вообще. Это приводит к количественной теории неприятия денежного риска.

Последствия для гипотезы ожидаемой полезности

В 1738 году Даниил Бернулли опубликовал трактат ^[7] , в котором он постулирует, что рациональное поведение можно описать как максимизацию ожидания функции u , которая, в частности, не обязательно должна быть оценена в денежном выражении, что объясняет неприятие риска. Это гипотеза ожидаемой полезности . Как уже говорилось, гипотеза может показаться смелым утверждением. Целью теоремы об ожидаемой полезности является предоставление «скромных условий» (т. е. аксиом), описывающих, когда гипотеза ожидаемой полезности верна, которые можно оценить напрямую и интуитивно:

«Аксиом не должно быть слишком много, их система должна быть максимально простой и прозрачной, и каждая аксиома должна иметь непосредственное интуитивное значение, по которому можно напрямую судить о ее уместности. В такой ситуации, как наша, это последнее требование особенно важно, несмотря на ее неопределенность: мы хотим сделать интуитивную концепцию поддающейся математической обработке и как можно яснее увидеть, какие гипотезы для этого требуются». – VNM 1953 § 3.5.2, стр. 25 ^[1]

Таким образом, утверждения о том, что гипотеза ожидаемой полезности не характеризует рациональность, должны отвергнуть одну из аксиом VNM. Возникло множество обобщенных теорий ожидаемой полезности , большинство из которых отбрасывают или ослабляют аксиому независимости.

Последствия для этики и моральной философии

Поскольку теорема ничего не предполагает о природе возможных результатов азартных игр, они могут быть морально значимыми событиями, например, связанными с жизнью, смертью, болезнью или здоровьем других. Рациональный агент фон Неймана–Моргенштерна способен действовать с большой заботой о таких событиях, жертвуя большим количеством личного богатства или благополучия, и все эти действия будут учитываться при построении/определении функции полезности VNM агента. Другими словами, и то, что естественным образом воспринимается как «личная выгода», и то, что естественным образом воспринимается как «альтруизм», неявно сбалансированы в функции полезности VNM рационального человека. Следовательно, полный спектр агентно -ориентированного и агентно-нейтрального поведения возможен с различными функциями полезности VNM ^{[ необходимо разъяснение ]} .

Если полезность равна , то рациональный агент фон Неймана–Моргенштерна должен быть безразличен между и . Поэтому рациональный агент фон Неймана–Моргенштерна, ориентированный на агента, не может отдавать предпочтение более равному или «справедливому» распределению полезности между своими возможными будущими «я». $N$ $pM$ $1N$ $pM+(1-p)0$

Отличие от других понятий полезности

Некоторые утилитаристские моральные теории касаются величин, называемых «общей полезностью» и «средней полезностью» коллективов, и характеризуют мораль с точки зрения предпочтения полезности или счастья других с пренебрежением к своему собственному. Эти понятия могут быть связаны с VNM-полезностью, но отличны от нее:

1) Полезность VNM — это полезность решения : ^[2] это то, в соответствии с чем принимается решение, и, таким образом, по определению, не может быть чем-то, чем можно пренебречь.
2) Полезность VNM не является канонически аддитивной для нескольких индивидуумов (см. Ограничения), поэтому «общая полезность VNM» и «средняя полезность VNM» не имеют непосредственного смысла (требуется некое предположение о нормализации).

Термин E-полезность для «полезности опыта» был придуман ^[2] для обозначения типов «гедонистической» полезности, подобной принципу наибольшего счастья Бентама . Поскольку мораль влияет на решения, мораль VNM-рационального агента будет влиять на определение его собственной функции полезности (см. выше). Таким образом, мораль VNM-рационального агента может быть охарактеризована через корреляцию VNM-полезности агента с VNM-полезностью, E-полезностью или «счастьем» других, среди прочего, но не через игнорирование собственной VNM-полезности агента, противоречие в терминах.

Ограничения

Вложенные азартные игры

Поскольку если L и M являются лотереями, то pL + (1 − p ) M просто «расширяется» и считается лотереей сама по себе, формализм VNM игнорирует то, что может восприниматься как «вложенная азартная игра». Это связано с проблемой Эллсберга , когда люди предпочитают избегать восприятия рисков относительно рисков . Фон Нейман и Моргенштерн осознавали это ограничение:

«... такие концепции, как определенная полезность азартных игр, не могут быть сформулированы без противоречий на этом уровне. Это может показаться парадоксальным утверждением. Но любой, кто серьезно пытался аксиоматизировать эту неуловимую концепцию, вероятно, согласится с ней». – VNM 1953 § 3.7.1, стр. 28. [ ^1]

Несравнимость между агентами

Поскольку для любых двух VNM-агентов X и Y их функции VNM-полезности u _X и u _Y определены только с точностью до аддитивных констант и мультипликативных положительных скаляров, теорема не предоставляет канонического способа сравнить их. Следовательно, выражения типа u _X ( L ) + u _Y ( L ) и u _X ( L ) − u _Y ( L ) не определены канонически, а сравнения типа u _X ( L ) < u _Y ( L ) не являются канонически истинными или ложными. В частности, вышеупомянутые «общая VNM-полезность» и «средняя VNM-полезность» популяции не имеют канонического смысла без предположений нормализации.

Применимость к экономике

Было показано, что гипотеза ожидаемой полезности имеет несовершенную прогностическую точность в ряде лабораторных эмпирических экспериментов, таких как парадокс Алле .

Ссылки и дополнительная литература

^ abcd Нейман, Джон фон и Моргенштерн, Оскар , Теория игр и экономическое поведение . Принстон, Нью-Джерси. Princeton University Press, 1953.
^ abc Канеман; Ваккер; Сарин (1997). «Назад к Бентаму? Исследования опытной полезности». Quarterly Journal of Economics . 112 (2): 375–406. doi :10.1162/003355397555235. hdl : 1765/23011 .
^ ab Kreps, David M. Notes on the Theory of Choice . Westview Press (12 мая 1988 г.), главы 2 и 5.
^ При обозначении безразличия через равенство неявно присутствуют утверждения типа если то . Чтобы сделать такие отношения явными в аксиомах, Крепс (1988) в главе 2 обозначает безразличие через , поэтому его можно кратко рассмотреть для интуитивного смысла. $L\prec M=N$ $L\prec N$ $\,\sim$
^ EconPort, «Теория ожидаемой полезности фон Неймана–Моргенштерна» http://www.econport.org/content/handbook/decisions-uncertainty/basic/von.html
^ Кини, Ральф Л.; Райффа, Ховард (1993). Решения с множественными целями . ISBN 0-521-44185-4.
^ Specimen theoriae novae de mensura sortis или Изложение новой теории измерения риска

Нэш, Джон Ф. младший (1950). «Проблема торга». Econometrica . 18 (2): 155–162. doi :10.2307/1907266. JSTOR 1907266. S2CID 153422092.
Ананд, Пол. Основы рационального выбора в условиях риска Оксфорд, Oxford University Press. 1993 переиздано в 1995, 2002
Фишберн, Питер К. Теория полезности для принятия решений . Хантингтон, Нью-Йорк. Robert E. Krieger Publishing Co. 1970. ISBN 978-0-471-26060-8
Сиксто Риос (1998) Некоторые проблемы и разработки в области науки о принятии решений, Revista Matematica Complutense 11(1):113–41.
Петерсон, Мартин (2009). Введение в теорию принятия решений (Кембриджское введение в философию) . Кембридж: Издательство Кембриджского университета.