stringtranslate.com

Конструкция механизма

Диаграмма Стэнли Райтера выше иллюстрирует игру в проектирование механизмов. Верхнее левое пространство обозначает пространство типов, а верхнее правое пространство X — пространство результатов. Функция социального выбора сопоставляет профиль типа результату. В играх по проектированию механизмов агенты отправляют сообщения в игровую среду . Равновесие в игре может быть спроектировано таким образом , чтобы реализовать некоторую функцию социального выбора .

Проектирование механизмов — это область экономики и теории игр , в которой применяется подход «сначала цели» к разработке экономических механизмов или стимулов для достижения желаемых целей в стратегических условиях, когда игроки действуют рационально. Поскольку она начинается в конце игры, а затем идет в обратном направлении, ее еще называют обратной теорией игр . Он имеет широкое применение: от экономики и политики в таких областях, как дизайн рынка , теория аукционов и теория социального выбора , до сетевых систем (междоменная маршрутизация в Интернете, спонсируемые поисковые аукционы).

Проектирование механизмов изучает концепции решений для класса игр с конфиденциальной информацией. Леонид Гурвич поясняет, что «в задаче проектирования целевая функция является главным «данным», а механизм — неизвестным. Таким образом, проблема проектирования является «обратной» традиционной экономической теории, которая обычно посвящена анализу эффективности данного механизма». [1] Итак, две отличительные особенности этих игр:

Нобелевская премия по экономике 2007 года была присуждена Леониду Гурвичу , Эрику Маскину и Роджеру Майерсону «за заложение основ теории проектирования механизмов». [2]

Интуиция

В интересном классе байесовских игр один игрок, которого называют «принципалом», хотел бы обусловить свое поведение информацией, известной другим игрокам в частном порядке. Например, директор хотел бы знать истинное качество подержанного автомобиля, который предлагает продавец. Он не может ничему научиться, просто спросив продавца, потому что в интересах продавца исказить правду. Однако при проектировании механизмов у директора есть одно преимущество: он может разработать игру, правила которой могут влиять на других, заставляя их действовать так, как ему хочется.

Без теории проектирования механизмов проблему директора было бы трудно решить. Ему придется рассмотреть все возможные игры и выбрать ту, которая лучше всего повлияет на тактику других игроков. Кроме того, доверителю придется делать выводы от агентов, которые могут ему лгать. Благодаря конструкции механизма и, в частности, принципу раскрытия , директору необходимо учитывать только те игры, в которых агенты правдиво сообщают свою личную информацию.

Фонды

Механизм

Игра в проектирование механизмов — это игра с частной информацией, в которой один из агентов, называемый принципалом, выбирает структуру выплат. Согласно Харсаньи  (1967), агенты получают секретные «сообщения» от природы, содержащие информацию, имеющую отношение к выплате. Например, сообщение может содержать информацию об их предпочтениях или качестве продаваемого товара. Эту информацию мы называем «типом» агента (обычно отмечается и соответственно пространство типов ). Затем агенты сообщают директору тип (обычно отмеченный шляпой ), который может быть стратегической ложью. После отчета принципал и агенты получают оплату в соответствии со структурой выплат, которую выбрал принципал.

Тайминг игры:

  1. Принципал обязуется использовать механизм , который предоставляет результат в зависимости от сообщаемого типа.
  2. Агенты сообщают, возможно, нечестно, о типовом профиле
  3. Механизм выполняется (агенты получают результат )

Чтобы понять, кто и что получает, принято делить результат на распределение товаров и перевод денег, где обозначает распределение оказанных или полученных товаров в зависимости от типа, а денежный перевод как функцию от тип.

В качестве ориентира проектировщик часто определяет, что произойдет при наличии полной информации. Определитефункция социального выбора, отображающая (истинный) профиль типа непосредственно на распределение полученных или оказанных товаров,

Напротив, механизм сопоставляет сообщаемый профиль типа с результатом (опять же, как распределение товаров , так и денежный перевод ).

Принцип откровения

Предлагаемый механизм представляет собой байесовскую игру (игру с частной информацией), и если он ведет себя хорошо, игра имеет байесовское равновесие Нэша . В состоянии равновесия агенты стратегически выбирают свои отчеты в зависимости от типа

В таких условиях трудно найти байесовское равновесие, поскольку это включает в себя поиск стратегий наилучшего ответа агентов и наилучшего вывода из возможной стратегической лжи. Благодаря широкому результату, называемому принципом раскрытия, независимо от механизма, разработчик может [3] ограничить внимание состояниями равновесия, в которых агенты правдиво сообщают о типе. Принцип раскрытия гласит: «Каждому байесовскому равновесию Нэша соответствует байесовская игра с тем же равновесным результатом, но в которой игроки правдиво сообщают о типе».

Это чрезвычайно полезно. Этот принцип позволяет найти байесовское равновесие, предполагая, что все игроки правдиво сообщают о типе (с учетом ограничения совместимости стимулов ). Одним махом это устраняет необходимость учитывать либо стратегическое поведение, либо ложь.

Ее доказательство вполне прямое. Предположим, что это байесовская игра, в которой стратегия и выигрыш агента являются функциями его типа и действий других агентов . По определению, равновесная стратегия агента i — это стратегия Нэша в ожидаемой полезности:

Просто определите механизм, который побуждал бы агентов выбирать одно и то же равновесие. Самый простой для определения — это механизм, который обязуется играть за них равновесные стратегии агентов .

При таком механизме агенты, конечно, считают оптимальным раскрыть тип, поскольку механизм в любом случае использует те стратегии, которые они сочли оптимальными. Формально выберем такое, что

Реализуемость

Разработчик механизма обычно надеется либо

Реализовать функцию социального выбора значит найти некую передаточную функцию , которая мотивирует агентов выбирать . Формально, если профиль равновесной стратегии в рамках этого механизма соответствует тому же распределению благ, что и функция социального выбора,

мы говорим, что механизм реализует функцию социального выбора.

Благодаря принципу раскрытия дизайнер обычно может найти передаточную функцию для реализации социального выбора, решив связанную с ним игру по раскрытию правды. Если агенты считают оптимальным правдиво сообщить тип,

мы говорим, что такой механизм действительно реализуем (или просто «реализуем»). Задача состоит в том, чтобы найти истинно реализуемую и приписать эту передаточную функцию исходной игре. Распределение истинно реализуемо, если существует передаточная функция такая, что

которое также называется ограничением совместимости стимулов (IC).

В приложениях состояние IC является ключом к любому полезному описанию формы . При определенных условиях он может даже аналитически выделить передаточную функцию. Кроме того, иногда добавляется ограничение участия ( индивидуальной рациональности ), если у агентов есть возможность не играть.

Необходимость

Рассмотрим ситуацию, в которой все агенты имеют функцию полезности, зависящую от типа . Рассмотрим также распределение товаров с векторным значением и размером (что допускает количество товаров) и предположим, что оно кусочно-непрерывно относительно своих аргументов.

Функция реализуема только в том случае, если

всякий раз, когда и и x непрерывны в точке . Это необходимое условие, которое выводится из условий первого и второго порядка задачи оптимизации агента, предполагающего, что он говорит правду.

Его смысл можно понять в двух частях. В первой части говорится , что предельная норма замещения агента (MRS) увеличивается в зависимости от типа.

Короче говоря, агенты не скажут правду, если механизм не предложит более высоким типам агентов более выгодную сделку. В противном случае высшие типы, столкнувшиеся с любым механизмом, наказывающим высшие типы за сообщение, будут лгать и заявлять, что они являются низшими типами, нарушая ограничение IC на правдивость. Вторая часть — это условие монотонности, ожидающее своего исполнения.

что, если быть положительным, означает, что высшим типам следует давать больше благ.

Существует вероятность взаимодействия этих двух частей. Если для некоторого диапазона типов контракт предлагает меньшее количество для более высоких типов , возможно, механизм мог бы компенсировать это, предоставляя более высоким типам скидку. Но для агентов низкого типа такой контракт уже существует, поэтому такое решение является патологией. Такое решение иногда встречается в процессе решения механизма. В этих случаях его необходимо «погладить». В среде с несколькими товарами разработчик также может вознаградить агента большим количеством одного товара, чтобы заменить меньшее количество другого (например, масло вместо маргарина ). Многоцелевые механизмы являются постоянной проблемой в теории проектирования механизмов.

Достаточность

В документах по проектированию механизмов обычно делаются два предположения для обеспечения реализуемости:

Это явление известно под несколькими названиями: условие однократного пересечения , условие сортировки и условие Спенса – Миррлиса. Это означает, что функция полезности имеет такую ​​форму, что MRS агента имеет возрастающий тип.

Это техническое условие, ограничивающее скорость роста MRS.

Этих предположений достаточно, чтобы гарантировать, что любая монотонная функция реализуема ( существует существо, которое может ее реализовать). Кроме того, в настройке «одиночный товар» условие одиночного пересечения является достаточным, чтобы обеспечить реализацию только монотонного, поэтому разработчик может ограничить свой поиск монотонным .

Выделенные результаты

Теорема об эквивалентности доходов

Викри  (1961) приводит знаменитый результат: любой участник большого класса аукционов гарантирует продавцу одинаковый ожидаемый доход и что ожидаемый доход — это лучшее, что может сделать продавец. Это тот случай, если

  1. Покупатели имеют одинаковые функции оценки (которые могут быть функцией типа).
  2. Типы покупателей распределяются независимо
  3. Типы покупателей выбираются из непрерывного распределения.
  4. Распределение типов обладает свойством монотонной степени опасности.
  5. Механизм продает товар покупателю с наибольшей оценкой.

Последнее условие является решающим для теоремы. Подразумевается, что для получения более высокого дохода продавец должен рискнуть и передать товар агенту с более низкой оценкой. Обычно это означает, что он должен рискнуть вообще не продать товар.

Механизмы Викри – Кларка – Гроувса

Модель аукциона Викри (1961) позже была расширена Кларком  (1971) и Гроувсом для решения проблемы общественного выбора, в которой стоимость государственного проекта несут все агенты, например, строить ли муниципальный мост. Возникающий в результате механизм «Викри-Кларка-Гроувса» может мотивировать агентов выбирать социально эффективное распределение общественного блага, даже если у агентов есть частные известные оценки. Другими словами, это может решить « трагедию общего достояния » — при определенных условиях, в частности, при квазилинейной полезности или если бюджетный баланс не требуется.

Рассмотрим ситуацию, в которой число агентов имеет квазилинейную полезность с частными оценками, а валюта оценивается линейно. Разработчик VCG разрабатывает механизм, совместимый со стимулами (а значит, правдиво реализуемый), для получения истинного профиля типа, на основе которого он реализует социально оптимальное распределение.

Хитрость механизма VCG заключается в том, как он мотивирует правдивые откровения. Он устраняет стимулы к искажению информации, наказывая любого агента в размере стоимости вызванного им искажения. Среди отчетов, которые может сделать агент, механизм VCG допускает «нулевой» отчет, в котором говорится, что он безразличен к общественному благу и заботится только о денежном переводе. Это эффективно удаляет агента из игры. Если агент решает сообщить о типе, механизм VCG взимает с агента плату, если его отчет является ключевым , то есть если его отчет изменяет оптимальное распределение x так, чтобы нанести вред другим агентам. Оплата рассчитывается

который суммирует искажения в полезностях других агентов (а не его собственных), вызванные отчетностью одного агента.

Теорема Гиббарда – Саттертуэйта

Гиббард  (1973) и Саттертуэйт  (1975) дают результат о невозможности, аналогичный по духу теореме о невозможности Эрроу . Для очень общего класса игр могут быть реализованы только «диктаторские» функции социального выбора.

Функция социального выбора f () является диктаторской, если один агент всегда получает наиболее благоприятствуемое распределение благ.

Теорема утверждает, что при общих условиях любая истинно реализуемая функция общественного выбора должна быть диктаторской, если:

  1. X конечно и содержит не менее трех элементов
  2. Предпочтения рациональны

Теорема Майерсона – Саттертуэйта

Майерсон и Саттертуэйт (1983) показывают, что не существует эффективного способа для двух сторон торговать товаром, если каждая из них имеет тайные и вероятностно различающиеся оценки этого товара, без риска вынудить одну сторону торговать с убытком. Это один из самых замечательных негативных результатов в экономической науке — своего рода негативное зеркало фундаментальных теорем экономики благосостояния .

Значение Шепли

Филлипс и Марден (2018) доказали, что для игр с разделением затрат с вогнутыми функциями затрат оптимальное правило распределения затрат, которое сначала оптимизирует неэффективность игры в наихудшем случае (цена анархии ), а затем, во-вторых, оптимизирует лучший случай. результаты ( цена стабильности ) — это и есть правило разделения затрат по ценности Шепли. [4] Утверждение о симметрии аналогично справедливо и для игр с разделением полезности с выпуклыми функциями полезности.

Примеры

Ценовая дискриминация

Миррлис  (1971) вводит ситуацию, в которой передаточную функцию t () легко найти. Благодаря своей актуальности и доступности, это распространенная ситуация в литературе. Рассмотрим ситуацию с одним товаром и одним агентом, в которой агент имеет квазилинейную полезность с неизвестным параметром типа.

и в котором принципал имеет предшествующий CDF по типу агента . Принципал может производить товары с выпуклыми предельными издержками c ( x ) и хочет максимизировать ожидаемую прибыль от транзакции.

в зависимости от условий IC и IR

Главным здесь является монополист, пытающийся установить схему ценообразования, максимизирующую прибыль, в которой он не может идентифицировать тип клиента. Типичным примером является авиакомпания, устанавливающая тарифы для деловых путешественников, туристов и студентов. Из-за условий IR он должен предоставить каждому типу достаточно выгодную сделку, чтобы побудить к участию. Из-за условия IC он должен предоставить каждому типу достаточно выгодную сделку, чтобы этот тип предпочел свою сделку любой другой.

Уловка, предложенная Миррлисом (1971), состоит в том, чтобы использовать теорему о конверте , чтобы исключить передаточную функцию из ожидания максимизации:

Интеграция,

где какой-то тип индекса. Заменяя стимул-совместимое в максимате,

после интегрирования по частям. Эту функцию можно максимизировать поточечно.

Поскольку проектировщик уже совместим со стимулами, он может отказаться от ограничения IC. Если функция полезности удовлетворяет условию Спенса – Миррлиса, то существует монотонная функция. Ограничение IR можно проверить в равновесии и соответствующим образом повысить или понизить тарифный план. Кроме того, обратите внимание на наличие в выражении коэффициента опасности . Если распределение типов обладает свойством монотонного отношения рисков, FOC достаточно для решения t (). Если нет, то необходимо проверить, выполняется ли ограничение монотонности (см. достаточность выше) повсюду в графиках распределения и комиссий. Если нет, то дизайнер должен использовать глажку Майерсона.

Майерсон гладит

Можно найти такой график товаров или цен, который удовлетворяет условиям первого порядка, но не является монотонным. В этом случае необходимо «сгладить» график, выбрав какое-то значение, при котором можно сгладить функцию.

В некоторых приложениях разработчик может решить условия первого порядка для графиков цен и распределения, но обнаружить, что они не являются монотонными. Например, в квазилинейной ситуации это часто происходит, когда отношение рисков само по себе не является монотонным. По условию Спенса-Мирлиса оптимальные графики цен и распределения должны быть монотонными, поэтому разработчик должен исключить любой интервал, в течение которого график меняет направление, путем его выравнивания.

Интуитивно понятно, что дизайнер считает оптимальным объединить определенные типы вместе и дать им один и тот же контракт. Обычно дизайнер мотивирует более высокие типы выделиться, предлагая им более выгодную сделку. Если на границе имеется недостаточное количество более высоких типов, проектировщик не считает целесообразным предоставлять более низким типам уступку (называемую их информационной рентой), чтобы взимать с более высоких типов контракт, специфичный для типа.

Рассмотрим пример выше, когда принципал-монополист продает товары агентам с квазилинейной полезностью. Предположим, что график распределения , удовлетворяющий условиям первого порядка, имеет один внутренний пик в и один внутренний минимум в , как показано справа.

Доказательство

В доказательстве используется теория оптимального управления. Он рассматривает набор интервалов в немонотонной области, в которых он может сгладить график. Затем он записывает гамильтониан, чтобы получить необходимые условия для a в интервалах

  1. это удовлетворяет монотонности
  2. для которого ограничение монотонности не является обязательным на границах интервала

Второе условие гарантирует, что удовлетворяющая задача оптимального управления повторно соединяется с расписанием исходной задачи на границах интервалов (без скачков). Любой объект, удовлетворяющий необходимым условиям, должен быть плоским, поскольку он должен быть монотонным и при этом пересоединяться на границах.

Как и прежде, максимизируйте ожидаемый выигрыш принципала, но на этот раз с учетом ограничения монотонности.

и для этого используйте гамильтониан с теневой ценой

где — переменная состояния и элемент управления. Как обычно при оптимальном управлении, уравнение эволюции стоимости должно удовлетворять

Воспользовавшись условием 2, обратите внимание, что ограничение монотонности не является обязательным на границах интервала :

это означает, что условие переменной стоимости может быть интегрировано и также равно 0

Среднее искажение профицита основной суммы долга должно быть равно 0. Чтобы сгладить график, найдите такое , что его прообраз соответствует интервалу, удовлетворяющему приведенному выше условию.

Смотрите также

Примечания

  1. ^ Л. Гурвич и С. Рейтер (2006) Разработка экономических механизмов , стр. 30
  2. ^ «Премия Sveriges Riksbank в области экономических наук памяти Альфреда Нобеля 2007» (пресс-релиз). Нобелевский фонд . 15 октября 2007 года . Проверено 15 августа 2008 г.
  3. ^ В необычных обстоятельствах некоторые правдивые игры имеют больше равновесий, чем байесовская игра, из которой они построены. См. Фуденбург-Тироль, гл. 7.2 для некоторых ссылок.
  4. ^ Филлипс, Мэтью; Марден, Джейсон Р. (июль 2018 г.). «Компромиссы в проектировании в вогнутых играх с разделением затрат». Транзакции IEEE при автоматическом управлении . 63 (7): 2242–2247. дои : 10.1109/tac.2017.2765299. ISSN  0018-9286. S2CID  45923961.

Рекомендации

дальнейшее чтение

Внешние ссылки