Парадокс Санкт-Петербурга или лотерея Санкт-Петербурга [1] — это парадокс , связанный с игрой в подбрасывание монеты, где ожидаемый выигрыш в лотерее бесконечен, но, тем не менее, кажется, что он стоит лишь очень небольшой суммы для участников. Парадокс Санкт-Петербурга — это ситуация, когда наивный критерий принятия решения, который учитывает только ожидаемое значение, предсказывает курс действий, который, предположительно, ни один реальный человек не захочет предпринять. Было предложено несколько решений парадокса, включая невозможную сумму денег, которая понадобится казино, чтобы продолжать игру бесконечно.
Проблема была придумана Николаем Бернулли , [2] который сформулировал ее в письме Пьеру Раймону де Монмору 9 сентября 1713 года. [3] [4] Однако парадокс получил свое название от анализа, проведенного кузеном Николая Даниилом Бернулли , бывшим жителем Санкт-Петербурга , который в 1738 году опубликовал свои мысли о проблеме в « Записках Императорской академии наук Санкт-Петербурга» . [5]
Казино предлагает азартную игру для одного игрока, в которой на каждом этапе подбрасывается честная монета . Начальная ставка начинается с 2 долларов и удваивается каждый раз, когда выпадает решка. Когда выпадает первый орел, игра заканчивается, и игрок выигрывает текущую ставку. Таким образом, игрок выигрывает 2 доллара, если при первом подбрасывании выпадает орел, 4 доллара, если при первом подбрасывании выпадает решка, а при втором — орел, 8 долларов, если при первых двух подбрасываниях выпадает решка, а при третьем — орел, и так далее. Математически игрок выигрывает долларов, где — количество последовательных подбрасываний решки. [5] Какую справедливую цену нужно заплатить казино за участие в игре?
Чтобы ответить на этот вопрос, нужно рассмотреть, какова будет ожидаемая выплата на каждом этапе: с вероятностью 1/2 , игрок выигрывает 2 доллара; с вероятностью 1/4 игрок выигрывает 4 доллара; с вероятностью 1/8 игрок выигрывает 8 долларов и т. д. Предполагая, что игра может продолжаться до тех пор, пока подбрасывание монеты приводит к орлу и, в частности, что казино имеет неограниченные ресурсы, ожидаемое значение , таким образом, составляет
Эта сумма растет неограниченно, поэтому ожидаемый выигрыш — бесконечная сумма денег.
Не принимая во внимание ничего, кроме ожидаемой стоимости чистого изменения своего денежного богатства, следует играть в игру по любой цене, если предоставляется такая возможность. Тем не менее, Даниэль Бернулли , описав игру с начальной ставкой в один дукат , заявил: «Хотя стандартный расчет показывает, что стоимость ожидания [игрока] бесконечно велика, следует ... признать, что любой достаточно разумный человек с большим удовольствием продал бы свой шанс за двадцать дукатов». [5] Роберт Мартин цитирует Яна Хэкинга , который сказал: «Мало кто из нас заплатил бы даже 25 долларов, чтобы войти в такую игру», и он говорит, что большинство комментаторов согласились бы с этим. [6] Очевидный парадокс заключается в несоответствии между тем, что люди, по-видимому, готовы заплатить, чтобы войти в игру, и бесконечной ожидаемой стоимостью. [5]
Для решения этого парадокса было предложено несколько подходов.
Классическое разрешение парадокса включало явное введение функции полезности , гипотезы ожидаемой полезности и предположения об убывающей предельной полезности денег.
Даниил Бернулли;
Определение ценности предмета должно основываться не на цене, а на полезности, которую он приносит... Нет сомнений, что прибыль в тысячу дукатов более значительна для бедняка, чем для богатого человека, хотя оба получают одинаковую сумму.
Распространенная модель полезности, предложенная Даниэлем Бернулли, — это логарифмическая функция U ( w ) = ln( w ) (известная как логарифмическая полезность ). Это функция от общего богатства игрока w , и в нее встроена концепция убывающей предельной полезности денег. Гипотеза ожидаемой полезности утверждает, что существует функция полезности, которая обеспечивает хороший критерий для поведения реальных людей; т. е. функция, которая возвращает положительное или отрицательное значение, указывающее, является ли ставка хорошей игрой. Для каждого возможного события изменение полезности ln(богатство после события) − ln(богатство до события) будет взвешено по вероятности наступления этого события. Пусть c — стоимость, взимаемая за вход в игру. Ожидаемая приростная полезность лотереи теперь сходится к конечному значению:
Эта формула дает неявную связь между богатством игрока и тем, сколько он должен быть готов заплатить (в частности, любое c , которое дает положительное изменение ожидаемой полезности). Например, при натуральной логарифмической полезности миллионер ($1 000 000) должен быть готов заплатить до $20,88, человек с $1 000 должен заплатить до $10,95, человек с $2 должен занять $1,35 и заплатить до $3,35.
До того, как Даниил Бернулли опубликовал свою работу в 1728 году, математик из Женевы Габриэль Крамер уже нашел части этой идеи (также мотивированные петербургским парадоксом), заявив, что
Математики оценивают деньги пропорционально их количеству, а здравомыслящие люди — пропорционально тому использованию, которое они могут из них извлечь.
Он продемонстрировал в письме Николаю Бернулли [7] , что функция квадратного корня, описывающая убывающую предельную выгоду от выигрышей, может решить эту проблему. Однако, в отличие от Даниила Бернулли, он не рассматривал общее богатство человека, а только выигрыш в лотерею.
Однако это решение Крамера и Бернулли не является полностью удовлетворительным, поскольку лотерею можно легко изменить таким образом, что парадокс снова появится. Для этой цели нам просто нужно изменить игру так, чтобы она давала еще более быстро растущие выигрыши. Для любой неограниченной функции полезности можно найти лотерею, которая допускает вариант петербургского парадокса, как впервые указал Менгер. [8]
Недавно теория ожидаемой полезности была расширена для получения более поведенческих моделей принятия решений . В некоторых из этих новых теорий, как в кумулятивной теории перспектив , парадокс Санкт-Петербурга снова появляется в определенных случаях, даже когда функция полезности вогнута, но не если она ограничена. [9]
Сам Николай Бернулли предложил альтернативную идею для решения парадокса. Он предположил, что люди будут игнорировать маловероятные события. [4] Поскольку в лотерее в Санкт-Петербурге только маловероятные события приносят высокие призы, которые приводят к бесконечному ожидаемому значению, это могло бы разрешить парадокс. Идея взвешивания вероятностей всплыла гораздо позже в работе по теории перспектив Даниэля Канемана и Амоса Тверски . Пол Вайрих аналогичным образом писал, что неприятие риска может разрешить парадокс. Вайрих продолжил писать, что увеличение приза на самом деле снижает вероятность того, что кто-то заплатит за игру, заявив, что «есть некоторое количество птиц в руке, которые стоят больше, чем любое количество птиц в кустах». [10] [11] Однако это было отвергнуто некоторыми теоретиками, потому что, как они указывают, некоторые люди наслаждаются риском азартных игр и потому что нелогично предполагать, что увеличение приза приведет к большему риску.
Кумулятивная теория перспектив является одним из популярных обобщений теории ожидаемой полезности , которое может предсказать многие поведенческие закономерности. [12] Однако переоценка маловероятных событий, введенная в кумулятивной теории перспектив, может восстановить парадокс Санкт-Петербурга. Кумулятивная теория перспектив избегает парадокса Санкт-Петербурга только тогда, когда коэффициент мощности функции полезности ниже коэффициента мощности весовой функции вероятности. [13] Интуитивно, функция полезности должна быть не просто вогнутой, но она должна быть вогнутой относительно весовой функции вероятности, чтобы избежать парадокса Санкт-Петербурга. Можно утверждать, что формулы для теории перспектив получены в области менее 400 долларов. [12] Это неприменимо для бесконечно возрастающих сумм в парадоксе Санкт-Петербурга.
Классическая игра в Санкт-Петербурге предполагает, что казино или банкир имеют бесконечные ресурсы. Это предположение долгое время оспаривалось как нереалистичное. [14] [15] Алексис Фонтен де Бертен в 1754 году указал, что ресурсы любого потенциального спонсора игры конечны. [16] Что еще более важно, ожидаемая ценность игры растет только логарифмически с ресурсами казино. В результате ожидаемая ценность игры, даже если играть против казино с самым большим реалистично мыслимым банкроллом, довольно скромна. В 1777 году Жорж-Луи Леклерк, граф де Бюффон подсчитал, что после 29 раундов игры в Королевстве Франция не будет достаточно денег, чтобы покрыть ставку. [17]
Если у казино есть конечные ресурсы, игра должна закончиться, как только эти ресурсы будут исчерпаны. [15] Предположим, что общие ресурсы (или максимальный джекпот) казино составляют W долларов (в более общем смысле W измеряется в единицах половины начальной ставки игры). Тогда максимальное количество раз, которое может сыграть казино, прежде чем оно больше не сможет полностью покрыть следующую ставку, равно L = ⌊ log 2 ( W ) ⌋ . [18] [nb 1] Предполагая, что игра заканчивается, когда казино больше не может покрыть ставку, ожидаемое значение E лотереи становится следующим: [18]
В следующей таблице показано ожидаемое значение E игры с различными потенциальными банкирами и их банкроллом W :
Примечание: Согласно правилам игры, которые определяют, что если игрок выигрывает больше, чем банкролл казино, ему будет выплачено все, что есть у казино, дополнительная ожидаемая стоимость меньше, чем была бы, если бы у казино было достаточно средств, чтобы покрыть еще один раунд, т. е. меньше $1. Чтобы игрок выиграл W, ему должно быть разрешено сыграть раунд L +1 . Таким образом, дополнительная ожидаемая стоимость составляет W /2 L +1 .
Предпосылка бесконечных ресурсов порождает множество очевидных парадоксов в экономике. В системе ставок мартингейл игрок, делающий ставку на подброшенную монету, удваивает свою ставку после каждого проигрыша, чтобы возможный выигрыш покрыл все проигрыши; эта система терпит неудачу при любом конечном банкролле. Концепция разорения игрока показывает, что настойчивый игрок, который повышает свою ставку до фиксированной доли своего банкролла, когда выигрывает, но не уменьшает свою ставку, когда проигрывает, в конечном итоге и неизбежно разорится, даже если игра имеет положительное ожидаемое значение .
Бюффон [17] утверждал, что теория рационального поведения должна соответствовать тому, что рациональный человек, принимающий решения, будет делать в реальной жизни, и поскольку разумные люди регулярно игнорируют события, которые достаточно маловероятны, рациональный человек, принимающий решения, также должен игнорировать такие редкие события.
В качестве оценки порога игнорируемости он утверждал, что, поскольку 56-летний мужчина игнорирует возможность умереть в течение следующих 24 часов, вероятность которой согласно таблицам смертности составляет 1/10189 , события с вероятностью менее 1/10 000 можно игнорировать. Предполагая это, игра в Санкт-Петербурге имеет ожидаемый выигрыш всего .
Различные авторы, включая Жана Лерона Д'Аламбера и Джона Мейнарда Кейнса , отвергали максимизацию ожидания (даже полезности) как надлежащее правило поведения. [23] [24] Кейнс, в частности, настаивал на том, что относительный риск [ необходимо разъяснение ] альтернативы может быть достаточно высоким, чтобы отвергнуть ее, даже если ее ожидание было огромным. [24] Недавно некоторые исследователи предложили заменить ожидаемое значение медианой в качестве справедливого значения. [25] [26]
Ранняя резолюция, содержащая основные математические аргументы, предполагающие мультипликативную динамику, была выдвинута в 1870 году Уильямом Алленом Уитвортом . [27] Явная связь с проблемой эргодичности была установлена Питерсом в 2011 году. [28] Эти решения математически аналогичны использованию критерия Келли или логарифмической полезности. Общая динамика за пределами чисто мультипликативного случая может соответствовать нелогарифмическим функциям полезности, как было указано Карром и Керубини в 2020 году. [29]
Хотя этому парадоксу уже три столетия, в последние годы появляются новые аргументы.
Решение, включающее выборку, было предложено Уильямом Феллером . [30] Интуитивно ответ Феллера - "провести эту игру с большим количеством людей и вычислить ожидаемое значение из выборки". В этом методе, когда возможны игры бесконечного числа раз, ожидаемое значение будет бесконечным, а в случае конечного числа раз ожидаемое значение будет намного меньшим значением.
Пол Самуэльсон разрешает парадокс [31], утверждая, что даже если бы у сущности были бесконечные ресурсы, игра никогда бы не была предложена. Если лотерея представляет бесконечный ожидаемый выигрыш для игрока, то она также представляет бесконечный ожидаемый проигрыш для хозяина. Никто не мог бы быть замечен за оплатой игры, потому что она никогда бы не была предложена. Как резюмировал Самуэльсон аргумент, «Пол никогда не захочет дать столько, сколько Питер потребует за такой контракт; и, следовательно, указанная деятельность будет иметь место на равновесном уровне нулевой интенсивности».
Предлагается множество вариантов игры «Санкт-Петербург», чтобы противостоять предлагаемым решениям игры. [11]
Например, «игра Пасадена»: [32] пусть будет числом подбрасываний монеты; если нечетно, игрок получает единицы ; в противном случае игрок теряет единицы полезности. Ожидаемая полезность от игры тогда равна . Однако, поскольку сумма не является абсолютно сходящейся , ее можно переставить так, чтобы она равнялась любому числу, включая положительную или отрицательную бесконечность. Это говорит о том, что ожидаемая полезность игры Пасадена зависит от порядка суммирования, но стандартная теория принятия решений не дает принципиального способа выбора порядка суммирования.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) CS1 maint: числовые имена: список авторов ( ссылка )[На]ше опровержение парадокса Санкт-Петербурга состоит в замечании, что любой, кто предлагает позволить агенту играть в игру Санкт-Петербурга, является лжецом, поскольку он притворяется, что имеет неопределенно большой банк.