stringtranslate.com

Сверхрациональность

В экономике и теории игр считается, что участник обладает сверхрациональностью (или перенормированной рациональностью ), если он обладает совершенной рациональностью (и, таким образом, максимизирует свою полезность ), но предполагает, что все остальные игроки также сверхрациональны и что сверхрациональный человек всегда будет придумывать ту же стратегию, что и любой другой сверхрациональный мыслитель, столкнувшийся с той же проблемой. Применяя это определение, сверхрациональный игрок, играющий против сверхрационального противника в дилемме заключенного, будет сотрудничать, в то время как рационально корыстный игрок отступит.

Это правило принятия решения не является основной моделью в теории игр и было предложено Дугласом Хофштадтером в его статье, серии и книге «Метамагические темы» [1] как альтернативный тип рационального принятия решений, отличный от широко распространенного в теории игр . Хофштадтер дал такое определение: «Сверхрациональные мыслители по рекурсивному определению включают в свои расчеты тот факт, что они принадлежат к группе сверхрациональных мыслителей». [1]

В отличие от предполагаемого « человека, отвечающего взаимностью », сверхрациональный мыслитель не всегда будет поддерживать равновесие, которое максимизирует общую социальную полезность, и поэтому не является филантропом .

Дилемма заключенного

Идея сверхрациональности заключается в том, что два логических мыслителя, анализирующих одну и ту же проблему, придут к одному и тому же правильному ответу. Например, если два человека хорошо разбираются в математике и им обоим предстоит решить одну и ту же сложную задачу, оба получат одинаковый правильный ответ. В математике знание того, что два ответа будут одинаковыми, не меняет ценности задачи, но в теории игр знание того, что ответ будет одинаковым, может изменить сам ответ.

Дилемма заключенного обычно формулируется с точки зрения тюремного заключения для преступников, но вместо этого ее можно с таким же успехом сформулировать и с помощью денежных призов. Каждому из двух игроков предоставляется выбор: сотрудничать (C) или отказаться (D). Игроки выбирают, не зная, что собирается делать другой. Если оба будут сотрудничать, каждый получит по 100 долларов. Если они оба откажутся, каждый из них получит по 1 доллару. Если один сотрудничает, а другой отказывается, то игрок-дезертир получает 150 долларов, а сотрудничающий игрок не получает ничего.

Четыре исхода и выигрыш для каждого игрока перечислены ниже.

Один из действенных способов рассуждения игроков заключается в следующем:

  1. Если предположить, что другой игрок откажется, то если я буду сотрудничать, я ничего не получу, а если откажусь, то получу доллар.
  2. Предполагая, что другой игрок сотрудничает, я получаю 100 долларов, если я сотрудничаю, и 150 долларов, если я отступлю.
  3. Поэтому, что бы ни делал другой игрок, мой выигрыш увеличивается в случае отказа, хотя бы на один доллар.

Вывод таков: разумнее всего отступить. Этот тип рассуждений определяет теоретико-игровую рациональность, и два теоретико-игровых рациональных игрока, играющие в эту игру, оба отказываются и получают по доллару каждый.

Сверхрациональность — это альтернативный метод рассуждения. Во-первых, предполагается, что ответ на симметричную задачу будет одинаковым для всех сверхрациональных игроков. Таким образом, сходство принимается во внимание, прежде чем узнать, какой будет стратегия. Стратегия находится путем максимизации выигрыша каждого игрока при условии, что все они используют одну и ту же стратегию. Поскольку сверхрациональный игрок знает, что другой сверхрациональный игрок сделает то же самое, что бы это ни было, у двух сверхрациональных игроков есть только два варианта выбора. Оба будут сотрудничать или оба откажутся, в зависимости от ценности сверхрационального ответа. Таким образом, оба сверхрациональных игрока будут сотрудничать, поскольку этот ответ максимизирует их выигрыш. Два сверхрациональных игрока, играющих в эту игру, получат по 100 долларов каждый.

Обратите внимание, что сверхрациональный игрок, играющий против теоретико-игрового рационального игрока, откажется, поскольку стратегия только предполагает, что сверхрациональные игроки согласятся. Сверхрациональный игрок, играющий против игрока с неопределенной сверхрациональностью, иногда отступает, а иногда сотрудничает, основываясь на вероятности того, что другой игрок является сверхрациональным. [ нужна цитата ]

Хотя стандартная теория игр предполагает общеизвестные знания о рациональности, она делает это по-другому. Теоретико-игровой анализ максимизирует выигрыш, позволяя каждому игроку менять стратегии независимо от других, хотя в конечном итоге он предполагает, что ответ в симметричной игре будет одинаковым для всех. Это определение теоретико-игрового равновесия Нэша , которое определяет стабильную стратегию как стратегию, в которой ни один игрок не может улучшить выигрыши путем одностороннего изменения курса. Сверхрациональное равновесие в симметричной игре — это такое равновесие, при котором стратегии всех игроков должны быть одинаковыми перед шагом максимизации. (Не существует общепринятого распространения концепции сверхрациональности на асимметричные игры.)

Некоторые утверждают , [ кто? ] что сверхрациональность подразумевает своего рода магическое мышление, при котором каждый игрок предполагает, что его решение о сотрудничестве заставит другого игрока сотрудничать, даже если коммуникации нет. Хофштадтер отмечает, что концепция «выбора» не применяется, когда цель игрока состоит в том, чтобы что-то выяснить, и что решение не заставляет другого игрока сотрудничать, а скорее та же логика приводит к одному и тому же ответу независимо от коммуникации. или причина и следствие. Эти дебаты ведутся о том, разумно ли для людей действовать сверхрационально, а не о том, что означает сверхрациональность, и аналогичны спорам о том, разумно ли для людей действовать «рационально», как это описано теорией игр. (при этом они могут выяснить, что другие игроки сделают или сделали, задав себе вопрос, что бы я сделал на их месте, и применив обратную индукцию и повторяющееся устранение доминирующих стратегий ).

Вероятностные стратегии

Для простоты вышеизложенное объяснение сверхрациональности игнорировало смешанные стратегии : возможность того, что лучшим выбором может быть подбрасывание монеты или, в более общем смысле, выбор различных результатов с некоторой вероятностью. В дилемме заключенного сотрудничать с вероятностью 1 сверхрационально, даже если допускаются смешанные стратегии, поскольку средний выигрыш, когда один игрок сотрудничает, а другой отказывается, такой же, как и в случае, когда оба игрока сотрудничают и, таким образом, отступают, увеличивает риск отступления обоих, что уменьшает ожидаемую выплату. Но в некоторых случаях сверхрациональная стратегия носит смешанный характер.

Например, если выплаты будут следующими:

CC — 100 долларов США/100 долларов США
Компакт-диск – 0 долларов США/1 000 000 долларов США.
DC – 1 000 000 долларов США/0 долларов США
ДД – 1 доллар/1 доллар

Таким образом, отказ от решения приносит огромную награду: сверхрациональная стратегия предполагает отказ с вероятностью 499 900/999 899 или чуть более 49,995%. По мере того, как вознаграждение увеличивается до бесконечности, вероятность далее приближается только к 1/2, а потери от принятия более простой стратегии 1/2 (которые уже минимальны) приближаются к 0. В менее экстремальном примере, если выигрыш для одного кооператора и стоимость одного перебежчика составляла 400 и 0 долларов соответственно, в сверхрациональном мире смешанной стратегии вероятность перебежки составляет 100/299 или около 1/3.

В аналогичных ситуациях с большим количеством игроков может оказаться необходимым использование устройства рандомизации. Одним из примеров, обсуждаемых Хофштадтером, является дилемма Платонии : эксцентричный триллионер связывается с 20 людьми и сообщает им, что если один и только один из них отправит ему или ей телеграмму (предположительно ничего не стоящую) к полудню следующего дня, этот человек получит миллиард долларов. Если они получат больше одной телеграммы или вообще не получат ни одной, денег никто не получит, а общение между игроками будет запрещено. В этой ситуации сверхрациональным поступком (если известно, что все 20 сверхрациональны) является отправка телеграммы с вероятностью p=1/20, то есть каждый получатель, по сути, бросает 20-гранный кубик и отправляет только телеграмму. если выпадет «1». Это максимизирует вероятность получения ровно одной телеграммы.

Обратите внимание, однако, что это не решение в традиционном теоретико-игровом анализе. Каждый из двадцати теоретически рациональных игроков отправит телеграммы и, следовательно, ничего не получит. Это потому, что отправка телеграмм является доминирующей стратегией ; если отдельный игрок отправляет телеграммы, у него есть шанс получить деньги, но если он не отправляет телеграммы, он ничего не может получить. (Если бы все телеграммы гарантированно доходили, отправляли бы только одну, и никто бы не рассчитывал получить деньги).

Формализации и связанные с ними понятия

Вопрос о том, следует ли сотрудничать при решении одноразовой дилеммы заключённого в некоторых обстоятельствах, также поднимался в литературе по теории принятия решений, вызванной проблемой Ньюкомба . Теория причинного решения предполагает, что сверхрациональность иррациональна, в то время как теория доказательного решения поддерживает ход рассуждений, аналогичный сверхрациональности, и рекомендует сотрудничать в дилемме узника против аналогичного оппонента. [2] [3]

Программное равновесие было предложено как механистическая модель сверхрациональности. [4] [5] [6]

Смотрите также

Рекомендации

  1. ^ аб Хофштадтер, Дуглас (июнь 1983 г.). «Дилеммы для сверхрациональных мыслителей, ведущие к заманчивой лотерее». Научный американец . 248 (6).- перепечатано в: Хофштадтер, Дуглас (1985). Метамагические темы . Основные книги. стр. 737–755. ISBN 0-465-04566-9.
  2. ^ Льюис, Дэвид (1979). «Дилемма заключенных - проблема Ньюкомба». Философия и связи с общественностью . 8 (3): 235–240. дои : 10.1093/0195036468.003.0011. JSTOR  2265034.
  3. ^ Брамс, Стивен Дж. (1975). «Проблема Ньюкомба и дилемма заключенных». Журнал разрешения конфликтов . 19 (4): 596–612.
  4. ^ Ховард, СП (май 1988 г.). «Сотрудничество в дилемме узника». Теория и решение . 24 (3): 203–213. дои : 10.1007/BF00148954.
  5. ^ Бараш, М.; Кристиано, П .; Фалленштейн, Б.; Херрешофф, М.; ЛаВиктуар, П.; Юдковский, Э. (2014). «Надежное сотрудничество в дилемме узника: программное равновесие через логику доказуемости». arXiv : 1401.5577 [cs.GT].
  6. ^ Остерхельд, Каспар; Трейтлейн, Йоханнес; Гросс, Роджер; Конитцер, Винсент; Ферстер, Якоб (2023). «Кооперативное равновесие, основанное на сходстве». Труды по нейронным системам обработки информации (NeurIPS) .