Гипотеза ожидаемой полезности является основополагающим предположением в математической экономике относительно принятия решений в условиях неопределенности . Она постулирует, что рациональные агенты максимизируют полезность, то есть субъективную желательность своих действий. Теория рационального выбора , краеугольный камень микроэкономики , строит этот постулат для моделирования совокупного социального поведения.
Гипотеза ожидаемой полезности утверждает, что агент выбирает между рискованными перспективами, сравнивая значения ожидаемой полезности (т. е. взвешенную сумму сложения соответствующих значений полезности выигрышей, умноженных на их вероятности). Обобщенная формула для ожидаемой полезности имеет вид , где — вероятность того, что результат, индексированный с выигрышем, будет реализован, а функция u выражает полезность каждого соответствующего выигрыша. [1] Графически кривизна функции u отражает отношение агента к риску.
Стандартные функции полезности представляют порядковые предпочтения. Гипотеза ожидаемой полезности накладывает ограничения на функцию полезности и делает полезность кардинальной (хотя все еще не сопоставимой между индивидуумами).
Хотя гипотеза ожидаемой полезности является стандартной в экономическом моделировании, было обнаружено, что она нарушается в психологических экспериментах. В течение многих лет психологи и экономисты-теоретики разрабатывали новые теории для объяснения этих недостатков. [2] К ним относятся теория перспектив , теория ранг-зависимой ожидаемой полезности и кумулятивной перспективы , а также ограниченная рациональность .
Николай Бернулли описал парадокс Санкт-Петербурга (включая бесконечные ожидаемые значения) в 1713 году, побудив двух швейцарских математиков разработать теорию ожидаемой полезности в качестве решения. Статья Бернулли была первой формализацией предельной полезности , которая имеет широкое применение в экономике в дополнение к теории ожидаемой полезности. Он использовал эту концепцию, чтобы формализовать идею о том, что та же сумма дополнительных денег была менее полезна для уже богатого человека, чем для бедного человека. Теория также может более точно описывать более реалистичные сценарии (где ожидаемые значения конечны), чем только ожидаемое значение. Он предложил использовать нелинейную функцию полезности результата вместо ожидаемого значения результата , учитывая неприятие риска , когда премия за риск выше для событий с низкой вероятностью, чем разница между уровнем выплаты конкретного результата и его ожидаемым значением. Бернулли далее предположил, что целью игрока является не максимизация его ожидаемого выигрыша, а максимизация логарифма его выигрыша. [ необходима цитата ]
Даниил Бернулли обратил внимание на психологические и поведенческие компоненты, лежащие в основе процесса принятия решений индивидуумом , и предположил, что полезность богатства имеет уменьшающуюся предельную полезность . Например, по мере того, как кто-то становится богаче, дополнительный доллар или дополнительный товар воспринимаются как менее ценные. Другими словами, желательность, связанная с финансовой выгодой, зависит не только от самой выгоды, но и от богатства человека. Бернулли предположил, что люди максимизируют «моральное ожидание», а не ожидаемую денежную ценность. Бернулли провел четкое различие между ожидаемой ценностью и ожидаемой полезностью. Вместо использования взвешенных результатов он использовал взвешенную полезность, умноженную на вероятности. Он доказал, что функция полезности, используемая в реальной жизни, конечна, даже если ее ожидаемое значение бесконечно. [3]
В 1926 году Фрэнк Рэмси представил теорему о представлении Рэмси. Эта теорема о представлении для ожидаемой полезности предполагала, что предпочтения определяются по набору ставок, где каждый вариант имеет разную доходность. Рэмси считал, что мы всегда выбираем решения, чтобы получить наилучший ожидаемый результат в соответствии с нашими личными предпочтениями. Это подразумевает, что если мы способны понять приоритеты и личные предпочтения человека, мы можем предвидеть, какой выбор он сделает. [4] В этой модели он определил числовые полезности для каждого варианта, чтобы использовать богатство пространства цен. Результат каждого предпочтения исключает друг друга. Например, если вы учитесь, то вы не можете видеться со своими друзьями, однако вы получите хорошую оценку по своему курсу. В этом сценарии мы анализируем личные предпочтения и убеждения и сможем предсказать, какой вариант может выбрать человек (например, если кто-то ставит свою социальную жизнь выше академических результатов, он будет встречаться со своими друзьями). Предполагая, что решения человека рациональны , согласно этой теореме, мы должны быть в состоянии узнать убеждения и полезности человека, просто глядя на выбор, который он делает (что неверно). Рэмси определяет предложение как « этически нейтральное », когда два возможных результата имеют одинаковую ценность. Другими словами, если вероятность может быть определена в терминах предпочтения, каждое предложение должно иметь 1/2 для того, чтобы быть безразличным между обоими вариантами. [5] Рэмси показывает, что
В 1950-х годах американский статистик Леонард Джимми Сэвидж вывел структуру для понимания ожидаемой полезности. На тот момент она считалась первой и наиболее основательной основой для понимания концепции. Структура Сэвиджа включала доказательство того, что ожидаемая полезность может быть использована для принятия оптимального выбора среди нескольких действий посредством семи аксиом. [7] В своей книге «Основы статистики» Сэвидж интегрировал нормативное описание принятия решений в условиях риска (когда вероятности известны) и в условиях неопределенности (когда вероятности объективно не известны). Сэвидж пришел к выводу, что люди нейтрально относятся к неопределенности и что наблюдения достаточно для прогнозирования вероятностей неопределенных событий. [8] Важнейшим методологическим аспектом структуры Сэвиджа является ее фокус на наблюдаемых выборах. Когнитивные процессы и другие психологические аспекты принятия решений имеют значение только в той степени, в которой они имеют непосредственно измеримые последствия для выбора.
Теория субъективной ожидаемой полезности объединяет две концепции: во-первых, функцию личной полезности и, во-вторых, распределение личной вероятности (обычно основанное на байесовской теории вероятностей). Эта теоретическая модель известна своей ясной и элегантной структурой, и некоторые исследователи считают ее «самой блестящей аксиоматической теорией полезности из когда-либо разработанных». [9] Вместо того чтобы предполагать вероятность события, Сэвидж определяет ее в терминах предпочтений по отношению к действиям. Сэвидж использовал состояния (то, что человек не контролирует) для расчета вероятности события. С другой стороны, он использовал полезность и внутренние предпочтения для прогнозирования результата события. Сэвидж предполагал, что каждое действие и состояние достаточны для однозначного определения результата. Однако это предположение нарушается в случаях, когда у человека недостаточно информации о событии.
Кроме того, он считал, что результаты должны иметь одинаковую полезность независимо от состояния. По этой причине важно правильно определить, какое утверждение считается результатом. Например, если кто-то говорит: «Я получил работу», это утверждение не считается результатом, поскольку полезность утверждения будет разной для каждого человека в зависимости от внутренних факторов, таких как финансовая необходимость или суждение о компании. По этой причине ни одно состояние не может исключить выполнение действия. Только когда состояние и действие оцениваются одновременно, становится возможным определить результат с уверенностью. [10]
Теорема представления Сэвиджа (Savage, 1954) Предпочтение < удовлетворяет P1–P7 тогда и только тогда, когда существует конечно-аддитивная вероятностная мера P и функция u : C → R, такие, что для каждой пары действий f и g . [10] f < g ⇐⇒ Z Ω u ( f ( ω )) dP ≥ Z Ω u ( g ( ω )) dP [10] *Если и только если все аксиомы выполнены, можно использовать информацию для уменьшения неопределенности относительно событий, которые находятся вне их контроля. Кроме того, теорема ранжирует результат в соответствии с функцией полезности, которая отражает личные предпочтения.
Ключевые элементы теории Сэвиджа:
Существует четыре аксиомы теории ожидаемой полезности, которые определяют рационального человека , принимающего решения: полнота; транзитивность; независимость от нерелевантных альтернатив; и непрерывность. [11]
Полнота предполагает, что у человека есть четко определенные предпочтения, и он всегда может сделать выбор между любыми двумя альтернативами.
Это означает, что индивидуум предпочитает , или ему безразлично между и .
Транзитивность предполагает, что, поскольку индивид принимает решение в соответствии с аксиомой полноты, он также принимает решение последовательно.
Независимость нерелевантных альтернатив также относится к четко определенным предпочтениям. Она предполагает, что две азартные игры, смешанные с нерелевантной третьей, сохранят тот же порядок предпочтений, что и при представлении двух игр независимо от третьей. Аксиома независимости — самая спорная аксиома. [ требуется цитата ] .
Непрерывность предполагает, что когда есть три лотереи ( и ) и индивидуум предпочитает и , то должна быть возможная комбинация и , в которой индивидууму безразлично между этой комбинацией и лотереей .
Если все эти аксиомы выполняются, то говорят, что индивидуум рационален, а предпочтения могут быть представлены функцией полезности, т. е. можно назначить числа (полезности) каждому результату лотереи таким образом, что выбор лучшей лотереи в соответствии с предпочтениями равносилен выбору лотереи с наивысшей ожидаемой полезностью. Этот результат называется теоремой фон Неймана–Моргенштерна о представлении полезности .
Другими словами, если поведение индивидуума всегда удовлетворяет приведенным выше аксиомам, то существует функция полезности, такая, что индивидуум выберет одну игру вместо другой, если и только если ожидаемая полезность одной превышает другую. Ожидаемая полезность любой игры может быть выражена как линейная комбинация полезностей результатов, при этом весами являются соответствующие вероятности. Функции полезности также обычно являются непрерывными функциями. Такие функции полезности также называются функциями полезности фон Неймана–Моргенштерна (vNM). Это центральная тема гипотезы ожидаемой полезности, в которой индивидуум выбирает не наивысшее ожидаемое значение, а скорее наивысшую ожидаемую полезность. Индивидуум, максимизирующий ожидаемую полезность, принимает решения рационально, основываясь на аксиомах теории.
Формулировка фон Неймана–Моргенштерна важна для применения теории множеств в экономике, поскольку она была разработана вскоре после « порядковой революции» Хикса–Аллена 1930-х годов и возродила идею кардинальной полезности в экономической теории. [ требуется ссылка ] Однако, хотя в этом контексте функция полезности является кардинальной, поскольку подразумеваемое поведение было бы изменено нелинейным монотонным преобразованием полезности, ожидаемая функция полезности является порядковой, поскольку любое монотонное возрастающее преобразование ожидаемой полезности дает то же самое поведение.
Функция полезности была первоначально предложена Бернулли (см. выше). Она имеет относительное нежелание риска постоянным и равным единице, и до сих пор иногда принимается в экономическом анализе. Функция полезности
демонстрирует постоянное абсолютное неприятие риска, и по этой причине его часто избегают, хотя он имеет преимущество, предлагая существенную математическую управляемость, когда доходность активов распределена нормально. Обратите внимание, что в соответствии со свойством аффинного преобразования, упомянутым выше, функция полезности дает точно такие же упорядочения предпочтений, как и ; таким образом, не имеет значения, что значения и его ожидаемое значение всегда отрицательны: для упорядочения предпочтений важно, какая из двух игр дает более высокую ожидаемую полезность, а не числовые значения этих ожидаемых полезностей.
Класс функций полезности постоянного относительного неприятия риска содержит три категории. Функция полезности Бернулли
имеет относительное неприятие риска, равное 1. Функции
для имеют относительное неприятие риска, равное . И функции
для имеют относительное неприятие риска, равное
См. также обсуждение функций полезности с гиперболическим абсолютным неприятием риска (HARA).
Когда сущность , ценность которой влияет на полезность человека, принимает одно из множества дискретных значений , формула для ожидаемой полезности, которая предполагается максимизированной, имеет вид
где левая сторона — субъективная оценка игры в целом, — i -й возможный результат, — его оценка, — его вероятность. Может быть либо конечный набор возможных значений, и в этом случае правая сторона этого уравнения имеет конечное число членов; или может быть бесконечный набор дискретных значений, и в этом случае правая сторона имеет бесконечное число членов.
Когда может принимать любое из непрерывного диапазона значений, ожидаемая полезность определяется как
где - функция плотности вероятности Эквивалент определенности , фиксированная сумма, которая сделала бы человека безразличным к ней, в зависимости от распределения , определяется как
Часто люди ссылаются на «риск» в смысле потенциально количественно измеримой сущности. В контексте анализа средней дисперсии дисперсия используется как мера риска для доходности портфеля; однако это справедливо только в том случае, если доходность распределена нормально или иным образом совместно эллиптически распределена , [12] [13] [14] или в маловероятном случае, когда функция полезности имеет квадратичную форму. Однако Дэвид Э. Белл предложил меру риска, которая естественным образом следует из определенного класса функций полезности фон Неймана–Моргенштерна. [15] Пусть полезность богатства задается как
для индивидуальных положительных параметров a и b . Тогда ожидаемая полезность определяется как
Таким образом, мера риска — это , которая различается между двумя людьми, если у них разные значения параметра, что позволяет разным людям не соглашаться относительно степени риска, связанного с любым заданным портфелем. Люди, разделяющие заданную меру риска (на основе заданного значения a ), могут выбирать разные портфели, поскольку у них могут быть разные значения b . См. также Энтропийная мера риска .
Однако для общих функций полезности анализ ожидаемой полезности не позволяет разделить выражение предпочтений на два параметра, один из которых представляет ожидаемое значение рассматриваемой переменной, а другой — ее риск.
Теория ожидаемой полезности учитывает, что люди могут быть не склонны к риску , то есть человек откажется от честной игры (честная игра имеет ожидаемое значение, равное нулю). Неприятие риска подразумевает, что их функции полезности вогнуты и показывают убывающую предельную полезность богатства. Отношение к риску напрямую связано с кривизной функции полезности: нейтральные к риску люди имеют линейные функции полезности, в то время как люди, ищущие риска, имеют выпуклые функции полезности, а люди, не склонные к риску, имеют вогнутые функции полезности. Степень неприятия риска можно измерить с помощью кривизны функции полезности.
Поскольку отношение к риску не меняется при аффинных преобразованиях u , вторая производная u'' не является адекватной мерой неприятия риска функции полезности. Вместо этого ее необходимо нормализовать. Это приводит к определению меры Эрроу-Пратта [16] [17] абсолютного неприятия риска:
где богатство.
Мера относительного неприятия риска Эрроу-Пратта:
Специальные классы функций полезности — это функции CRRA ( constant relative risk aversion ), где RRA(w) является константой, и функции CARA ( constant absolute risk aversion ), где ARA(w) является константой. Они часто используются в экономике для упрощения.
Решение, которое максимизирует ожидаемую полезность, также максимизирует вероятность того, что последствия решения будут предпочтительнее некоторого неопределенного порога. [18] При отсутствии неопределенности относительно порога максимизация ожидаемой полезности упрощается до максимизации вероятности достижения некоторой фиксированной цели. Если неопределенность распределена равномерно, то максимизация ожидаемой полезности становится максимизацией ожидаемого значения. Промежуточные случаи приводят к увеличению неприятия риска выше некоторого фиксированного порога и увеличению стремления к риску ниже фиксированного порога.
Парадокс Санкт-Петербурга, представленный Николаем Бернулли, иллюстрирует, что принятие решений на основе ожидаемого значения денежных выплат приводит к абсурдным выводам. [19] Когда функция распределения вероятностей имеет бесконечное ожидаемое значение , человек, которого волнуют только ожидаемые значения азартной игры, заплатил бы произвольно большую конечную сумму, чтобы принять участие в этой игре. Однако этот эксперимент продемонстрировал, что не существует верхней границы потенциальных вознаграждений от событий с очень низкой вероятностью. В гипотетической установке человек многократно подбрасывает монету. Приз участника определяется количеством последовательных выпадений орла. За каждый раз, когда монета выпадает орлом (вероятность 1/2), приз участника удваивается. Игра заканчивается, когда участник подбрасывает монету, и выпадает решка. Игрок, которого волнует только ожидаемое значение выигрыша, должен быть готов заплатить любую конечную сумму денег, чтобы играть, потому что эта стоимость входа всегда будет меньше ожидаемой бесконечной стоимости игры. Однако в реальности люди этого не делают. «Лишь немногие участники были готовы заплатить максимум 25 долларов за участие в игре, поскольку многие из них были не склонны к риску и не хотели делать ставку на очень маленькую возможность по очень высокой цене. [20]
На заре исчисления вероятностей классические утилитаристы считали, что вариант, имеющий наибольшую полезность, принесет агенту больше удовольствия или счастья и, следовательно, должен быть выбран. [21] Основная проблема с теорией ожидаемой ценности заключается в том, что может не быть единственного правильного способа количественной оценки полезности или определения наилучших компромиссов. Например, некоторые компромиссы могут быть нематериальными или качественными. Вместо денежных стимулов в полезность могут быть включены и другие желаемые цели, такие как удовольствие, знания, дружба и т. д. Первоначально общая полезность потребителя была суммой независимых полезностей товаров. Однако теория ожидаемой ценности была отброшена, поскольку она считалась слишком статичной и детерминированной. [3] Классический контрпример теории ожидаемой ценности (где каждый делает один и тот же «правильный» выбор) — это парадокс Санкт-Петербурга . [3]
В эмпирических приложениях было показано, что ряд нарушений теории ожидаемой полезности носит систематический характер, и эти фальсификации углубили понимание того, как люди на самом деле принимают решения. Дэниел Канеман и Амос Тверски в 1979 году представили свою теорию перспектив , которая эмпирически показала, как предпочтения людей непоследовательны среди одних и тех же выборов, в зависимости от обрамления выборов, т. е. того, как они представлены. [22]
Как и любая математическая модель , теория ожидаемой полезности является упрощением реальности. Математическая корректность теории ожидаемой полезности и значимость ее примитивных концепций не гарантируют, что теория ожидаемой полезности является надежным руководством для человеческого поведения или оптимальной практики. Математическая ясность теории ожидаемой полезности помогла ученым разработать эксперименты для проверки ее адекватности и выделить систематические отклонения от ее предсказаний. Это привело к появлению области поведенческих финансов , которая создала отклонения от теории ожидаемой полезности для объяснения эмпирических фактов.
Другие критики утверждают, что применение ожидаемой полезности к экономическим и политическим решениям привело к ненадлежащим оценкам, особенно в сценариях, в которых денежные единицы используются для масштабирования полезности неденежных результатов, таких как смертность. [23]
Психологи обнаружили систематические нарушения вероятностных расчетов и поведения людей. Это было доказано примерами, такими как проблема Монти Холла , где было продемонстрировано, что люди не пересматривают свои степени убеждений в соответствии с экспериментальными вероятностями, а также что вероятности не могут быть применены к отдельным случаям. С другой стороны, при обновлении распределений вероятностей с использованием доказательств стандартный метод использует условную вероятность , а именно правило Байеса . Эксперимент по пересмотру убеждений показал, что люди меняют свои убеждения быстрее при использовании байесовских методов, чем при использовании неформальных суждений. [24]
Согласно эмпирическим результатам, в теории принятия решений почти не было признания различия между проблемой обоснования ее теоретических утверждений относительно свойств рациональной веры и желания. Одна из главных причин заключается в том, что базовые вкусы и предпочтения людей относительно потерь не могут быть представлены с полезностью, поскольку они изменяются при различных сценариях. [25]
Поведенческие финансы создали несколько обобщенных теорий ожидаемой полезности для учета случаев, когда выбор людей отклоняется от предсказанного теорией ожидаемой полезности. Эти отклонения описываются как « иррациональные », потому что они могут зависеть от способа представления проблемы, а не от фактических затрат, вознаграждений или вероятностей. Конкретные теории включают теорию перспектив , рангозависимую ожидаемую полезность и кумулятивную теорию перспектив, которые считаются недостаточными для прогнозирования предпочтений и ожидаемой полезности. [26] Кроме того, эксперименты показали систематические нарушения и обобщения, основанные на результатах Сэвиджа и фон Неймана–Моргенштерна. Это связано с тем, что предпочтения и функции полезности, построенные в разных контекстах, существенно различаются. Это демонстрируется на контрасте индивидуальных предпочтений в контексте страхования и лотереи, показывающем степень неопределенности теории ожидаемой полезности. Кроме того, эксперименты показали систематические нарушения и обобщения, основанные на результатах Сэвиджа и фон Неймана–Моргенштерна.
На практике будет много ситуаций, когда вероятности неизвестны, и человек работает в условиях неопределенности . В экономике может возникнуть неопределенность или двусмысленность Найта . Таким образом, необходимо делать предположения о вероятностях, но тогда ожидаемые значения различных решений могут быть очень чувствительны к предположениям. Это особенно проблема, когда ожидание определяется редкими экстремальными событиями, как в длиннохвостом распределении . Альтернативные методы принятия решений устойчивы к неопределенности вероятности результатов, либо не зависят от вероятностей результатов и требуют только анализа сценария (как в минимаксе или минимаксном сожалении ), либо менее чувствительны к предположениям.
Байесовские подходы к вероятности рассматривают ее как степень веры и, таким образом, не проводят различия между риском и более широкой концепцией неопределенности: они отрицают существование найтовской неопределенности. Они моделируют неопределенные вероятности с помощью иерархических моделей , т. е. где неопределенные вероятности моделируются как распределения, параметры которых сами берутся из распределения более высокого уровня ( гиперприоры ).
Начиная с таких исследований, как Lichtenstein & Slovic (1971), было обнаружено, что субъекты иногда демонстрируют признаки смены предпочтений в отношении их эквивалентов определенности различных лотерей. В частности, при выявлении эквивалентов определенности субъекты склонны оценивать «ставки p» (лотереи с высоким шансом выиграть низкий приз) ниже, чем «ставки $» (лотереи с небольшим шансом выиграть большой приз). Однако, когда субъектов спрашивают, какие лотереи они предпочитают в прямом сравнении, они часто предпочитают «ставки p» «ставкам $». [27] Во многих исследованиях изучалось это «смены предпочтений» как с экспериментальной (например, Plott & Grether, 1979) [28] , так и с теоретической (например, Holt, 1986) [29] точки зрения, что указывает на то, что это поведение можно привести в соответствие с неоклассической экономической теорией при определенных предположениях.
В области психологии есть три компонента, которые считаются решающими для разработки более точной описательной теории принятия решений в условиях риска. [25] [30]
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite book}}
: CS1 maint: location (link)