Гармония аренды [1] [2] — это своего рода проблема справедливого деления , в которой неделимые предметы и фиксированная денежная стоимость должны быть разделены одновременно. Проблема соседей по дому [3] [4] и проблема распределения-аренды-комнаты [5] [6] — это альтернативные названия одной и той же проблемы. [7] [8] : 305–328
В типичной ситуации есть партнеры, которые вместе арендуют дом из 2 комнат по цене, установленной домовладельцем. У каждого из жильцов могут быть разные предпочтения — один может предпочесть большую комнату, другой может предпочесть комнату с видом на главную дорогу и т. д. Следующие две проблемы должны быть решены одновременно:
Мы хотели бы, чтобы задание отвечало нескольким свойствам.
Отсутствие зависти подразумевает эффективность по Парето. Доказательство: Предположим от противного, что существует альтернативное распределение с тем же вектором цен, которое строго лучше по крайней мере для одного партнера. Тогда в текущем распределении этот партнер завидует.
Проблема гармонии в аренде изучалась при двух различных предположениях о предпочтениях партнеров:
Кардинальное предположение подразумевает порядковое предположение, поскольку при заданном векторе оценки всегда можно построить отношение предпочтения. Порядковое предположение является более общим и накладывает меньшую умственную нагрузку на партнеров.
Протокол Фрэнсиса Су [1] делает следующие предположения о предпочтениях партнеров:
Нормализуем общую арендную плату до 1. Тогда каждая схема ценообразования является точкой в -мерном симплексе с вершинами в . Протокол Су работает с дуализированной версией этого симплекса аналогично протоколам Симмонса–Су для разрезания торта: для каждой вершины триангуляции двойственного симплекса, которая соответствует определенной схеме ценообразования, он спрашивает у партнера-владельца «какую комнату вы предпочитаете в этой схеме ценообразования?». Это приводит к раскраске Шпернера двойственного симплекса, и, таким образом, существует небольшой подсимплекс, который соответствует приблизительному распределению комнат и арендной платы без зависти.
Протокол Су возвращает последовательность распределений, которая сходится к распределению без зависти. Цены всегда неотрицательны. Следовательно, результат удовлетворяет требованиям NN и EF.
Протокол Rental Harmony Су был популяризирован в нескольких новостных статьях [9] [10] и имеет несколько онлайн-реализаций. [11] [12]
Азриэли и Шмая [2] обобщают решение Су на ситуацию, в которой вместимость каждой комнаты может быть больше единицы (т. е. в одной комнате могут жить несколько партнеров).
Они доказывают существование распределений без зависти в следующих условиях:
Основными инструментами, используемыми при доказательстве, являются:
Их решение конструктивно в том же смысле, что и решение Су — существует процедура, которая приближает решение с любой заданной точностью.
A. В обоих решениях, Su и Azrieli&Shmaya, отношение предпочтений каждого партнера может (но не обязано) зависеть от всего вектора цен. То есть партнер может сказать: «Если комната A стоит 1000, то я предпочитаю комнату B комнате C, но если комната A стоит всего 700, то я предпочитаю комнату C комнате B».
Есть несколько причин, по которым такая общность может быть полезной. [2]
B. Оба решения, Su и Azrieli&Shmaya, предполагают «скупых арендаторов» — они предполагают, что арендатор всегда предпочитает бесплатную комнату несвободной. Это предположение сильное и не всегда реалистичное. Если одна из комнат очень плохая, возможно, что некоторые арендаторы не захотят жить в этой комнате даже бесплатно. Это легко увидеть в кардинальной версии: если вы считаете, что комната A стоит 0, а комната B стоит 100, и комната A бесплатна, а комната B стоит 50, то вы, безусловно, предпочитаете комнату B.
Su [1] предлагает ослабить это предположение следующим образом: каждый партнер никогда не выбирает самую дорогую комнату, если есть свободная комната. Это не требует от человека выбирать свободную комнату. В частности, это будет справедливо, если человек всегда предпочитает свободную комнату комнате, стоимость которой составляет не менее полной арендной платы. Однако даже это ослабленное предположение может быть нереалистичным, как в приведенном выше примере. [8] : 320–321
Сигал-Халеви [13] показывает, что предположение можно ослабить еще больше. Допустим, что цена T слишком высока для некоторого агента i , если всякий раз, когда некоторая комната стоит T, а некоторая другая комната свободна, ни одна комната не предпочтет комнату, которая стоит T. Гармония аренды существует всякий раз, когда существует цена, которая слишком высока для всех агентов. Это предположение слабее, чем предположение о скупых арендаторах, и слабее, чем квазилинейность. Открытым остается вопрос, существует ли еще более слабое предположение, гарантирующее существование гармонии аренды.
Как объяснялось выше, входные данные для кардинальной версии — это матрица ставок: каждый партнер должен подать заявку на каждую комнату, указав, сколько (в долларах) эта комната стоит для него. Обычно предполагается, что агенты имеют квазилинейные полезности , так что их полезность для комнаты — это их ценность для комнаты за вычетом цены комнаты.
Ключевым понятием в кардинальных решениях является распределение maxsum (также известное как утилитарное ). Это распределение партнеров по комнатам, которое максимизирует сумму ставок. Задача нахождения распределения maxsum известна как задача назначения , и ее можно решить с помощью венгерского алгоритма за время (где — количество партнеров). Каждое распределение EF является maxsum, а каждое распределение maxsum является PE. [4]
Два требования отсутствия зависти и неотрицательных платежей не всегда совместимы. Например, предположим, что общая стоимость составляет 100, а оценки следующие:
Здесь единственным распределением maxsum является предоставление комнаты 1 партнеру 1 и комнаты 2 партнеру 2. Чтобы партнер 2 не завидовал, партнер 1 должен заплатить 115, а партнер 2 должен заплатить -15.
В этом примере сумма оценок больше общей стоимости. Если сумма оценок равна общей стоимости, и есть два или три партнера, то всегда существует распределение EF и NN. [4] : 110–111 Но если есть четыре или более партнеров, то снова EF и NN могут быть несовместимы, как в следующем примере (см. [8] : 318–319 для доказательства):
Обратите внимание, что этот пример не встречается в ординальной версии, поскольку ординальные протоколы делают предположение о «скупых партнерах» — партнеры всегда предпочитают свободные комнаты. Когда это предположение выполняется, всегда существует распределение EF+NN. Но в приведенном выше примере предположение не выполняется, и распределение EF+NN не существует. Поэтому протоколы в кардинальной версии должны идти на компромисс между EF и NN. Каждый протокол делает другой компромисс.
Брамс и Килгур [8] : 305–328 [14] предлагают процедуру зазора :
Идея последнего шага заключается в том, что следующие самые низкие оценки представляют собой «конкуренцию» за комнаты. Если комната более востребована следующим по величине участником торгов, то она должна стоить дороже. Это похоже по духу на аукцион Викри . Однако, в то время как на аукционе Викри оплата полностью независима от ставки партнера, в процедуре Gap оплата независима лишь частично. Поэтому процедура Gap не является стратегической .
Процедура Gap всегда назначает неотрицательные цены. Поскольку назначение является maxsum, оно, очевидно, также является Парето-эффективным. Однако некоторые партнеры могут завидовать. То есть процедура Gap удовлетворяет NN и PE, но не EF.
Более того, процедура Gap может возвращать несвободные от зависти распределения, даже когда существуют распределения EF. Брэмс относится к этой проблеме, говоря, что: «Цены Gap учитывают конкурентоспособность торгов за товары, что делает механизм ценообразования рыночно-ориентированным. Хотя свобода от зависти является желательным свойством, я предпочитаю рыночный механизм, когда между этими двумя свойствами есть конфликт; партнеры должны платить больше, когда ставки конкурентоспособны, даже в ущерб возникновению зависти». [8] : 321
Хааке, Райт и Су [7] представляют процедуру компенсации. Проблема, которую она решает, более общая, чем проблема арендной гармонии в некоторых аспектах:
К партнеру предъявляется «квалификационное требование»: сумма его ставок должна быть не менее общей стоимости.
Процедура выполняется следующим образом.
Когда есть много элементов и сложных ограничений, начальный шаг — поиск распределения maxsum — может быть трудно вычислить без компьютера. В этом случае процедура компенсации может начаться с произвольного распределения. В этом случае процедура может завершиться распределением, содержащим envy-cycles . Эти циклы можно удалить, перемещая пакеты по циклу. Это строго увеличивает общую сумму полезностей. Следовательно, после ограниченного числа итераций будет найдено распределение maxsum, и процедура может продолжаться, как указано выше, для создания распределения без зависти.
Процедура компенсации может взимать с некоторых партнеров отрицательную плату (т.е. давать партнерам положительную сумму денег). Это означает, что процедура компенсации является EF (следовательно, также PE), но не NN. Авторы говорят:
Однако другие авторы утверждают, что в обычном сценарии проживания соседей по дому:
Абдулкадироглу и др. [5] предлагают рыночный подход. Это комбинация восходящего и нисходящего аукционов . Проще всего его описать как аукцион с непрерывной ценой:
На практике нет необходимости изменять цену непрерывно, поскольку единственными интересными ценами являются цены, в которых изменяются наборы спроса одного или нескольких партнеров. Можно заранее рассчитать набор интересных цен и преобразовать аукцион с непрерывной ценой в аукцион с дискретной ценой. Этот аукцион с дискретной ценой останавливается после конечного числа шагов. [5] : 525–528
Возвращаемое распределение всегда свободно от зависти. Цены могут быть отрицательными, как в процедуре Хааке и др. Однако, в отличие от этой процедуры, цены неотрицательны, если существует распределение EF с неотрицательными ценами.
Сунг и Влах [4] доказывают следующие общие свойства распределений:
На основании этих свойств они предлагают следующий алгоритм:
Сложность выполнения как поиска распределения maxsum, так и поиска цен minsum составляет .
Решение Сунга и Влаха, по-видимому, обладает всеми желаемыми свойствами предыдущих протоколов, а именно: PE, EF и NN (если это возможно) и полиномиальным временем выполнения, и, кроме того, оно гарантирует, что каждый завистливый партнер получит бесплатную комнату. [15] предоставляет реализацию похожего решения, также основанную на решении задачи линейного программирования, но ссылаясь на другую статью.
Арагонес [16] представил поливременной алгоритм для поиска решения EF, которое среди всех решений EF максимизирует наименьший платеж агента (это называется решением Money Rawlsian).
Гал, Маш, Прокачча и Зик [17] , основываясь на своем опыте с приложением по разделению ренты на сайте Spliddit, отмечают, что одной лишь свободы от зависти недостаточно, чтобы гарантировать удовлетворение участников. Поэтому они создают алгоритмическую структуру, основанную на линейном программировании, для расчета распределений, которые одновременно свободны от зависти и оптимизируют некоторый критерий. Основываясь на теоретических и экспериментальных тестах, они приходят к выводу, что эгалитарное правило — максимизация минимальной полезности агента, подверженного свободе от зависти, — достигает оптимальных результатов.
Обратите внимание, что поскольку их решение всегда EF, оно может возвращать отрицательные цены.
Решение максимина реализовано на сайте spliddit.org и на сайте pref.tools.
Питерс, Прокачча и Чжу [18] изучают практическую ситуацию, в которой агенты могут быть не уверены в своих оценках.
Большинство статей в кардинальной модели предполагают, что у агентов есть квазилинейные функции полезности — их полезность равна стоимости комнаты за вычетом цены. Но в реальности у агентов есть бюджетные ограничения — если стоимость комнаты выше их бюджета, полезность падает гораздо быстрее, чем линейно. Фактически, агент всегда предпочитает любую комнату с ценой, не превышающей его бюджет, комнате с ценой, превышающей его бюджет.
В этом случае может не существовать ценового вектора, который является как EF, так и доступным. Например, [19] предположим, что общая арендная плата составляет 1000, есть две комнаты и два агента с одинаковыми оценками: 800 и 200, и одинаковым бюджетом: 600. Существует единственный ценовой вектор, в котором оба агента имеют одинаковую квазилинейную полезность: (800,200); но у агента в комнате 1 нет достаточного бюджета, чтобы заплатить. Напротив, существуют доступные ценовые векторы, например (600,400), но они не свободны от зависти.
Обратите внимание, что условие «цена слишком высока» [13] в этом случае все еще выполняется, но предпочтения не являются непрерывными (агенты предпочитают только комнату 2, когда p1>600, и только комнату 1, когда p1<=600).
Прокачча, Велес и Ю [19] представляют эффективный алгоритм для поиска того, существует ли распределение, которое является как EF, так и доступным. Если это так, он находит распределение, которое среди всех доступных распределений EF максимизирует наименьшую полезность (как в эгалитарном распределении предметов ).
Айрио, Жильбер, Гранди, Ланг и Вильчински [20] предлагают два решения для преодоления проблемы несуществования с бюджетными ограничениями:
Оба эти ослабления значительно увеличивают набор распределений EF. Однако даже при каждом из этих ослаблений распределение EF может не существовать.
Велес [21] изучает разделение аренды EF при мягких бюджетных ограничениях . Каждый агент сообщает свои значения для комнат, свой бюджет и свою предельную тягу от необходимости платить больше, чем бюджет (например, процентную ставку ). Он представляет алгоритм, который находит разделение аренды EF, которое, кроме того, является эгалитарным (максимальная минимальная полезность), или денежно-Роулсианским (минимальная-максимальная арендная плата), или удовлетворяет одному из других подобных условий. Время выполнения составляет O( n k + c ), где n — количество агентов, k — количество различных значений тяги (например, различные процентные ставки), а c > 2 — некоторая константа.
Велес [22] изучает стратегические свойства этих алгоритмов. Он показывает, что некооперативные результаты каждого из алгоритмов с полной информацией в точности соответствуют распределениям EF относительно истинных предпочтений, если и только если число разрешенных отрицательных полезностей ограничено.
Аруначалесваран, Барман и Рати [23] изучают настройку, существенно более общую, чем квазилинейная, в которой полезность каждого агента из каждой комнаты может быть любой кусочно-линейной функцией арендной платы. Эта настройка обобщает мягкое бюджетное ограничение. Поскольку существует слишком высокая цена, распределение EF всегда существует. Они показывают FPTAS — алгоритм, который находит распределение, которое является EF до (1+ ε ), за время, полиномиальное по 1/ ε и n k + c , где n — количество агентов, k — количество различных значений отрицательной полезности (например, различные процентные ставки), а c >2 — некоторая константа. Они также показывают, что проблемные линии на пересечении классов сложности PPAD и PLS .
Все рассмотренные до сих пор протоколы предполагают, что партнеры раскрывают свои истинные оценки. Они не являются стратегически защищенными — партнер может выиграть, сообщая ложные оценки. Действительно, стратегическая защищенность несовместима с отсутствием зависти : не существует детерминированного стратегически защищенного протокола, который всегда возвращает распределение без зависти. Это верно даже тогда, когда есть только два партнера и когда цены могут быть отрицательными. Доказательство : предположим, что общая стоимость составляет 100, а оценки партнеров следующие (где — параметры и ):
Единственное распределение maxsum — отдать комнату 1 партнеру 1, а комнату 2 партнеру 2. Пусть будет ценой комнаты 2 (так что цена комнаты 1 будет ). Чтобы партнер 1 не завидовал, мы должны иметь . Чтобы партнер 2 не завидовал, мы должны иметь .
Предположим, что детерминированный протокол устанавливает цену на некоторое значение в . Если цена больше , то у партнера 2 есть стимул сообщить более низкое значение , которое все еще выше , чтобы сместить свой платеж вниз к . Аналогично, если цена меньше , то у партнера 1 есть стимул сообщить более высокое значение , которое все еще ниже , чтобы сместить платеж партнера 2 вверх к (и таким образом сместить свой собственный платеж вниз). Следовательно, механизм не может быть стратегически защищенным.
Исследователи справились с этой невозможностью двумя способами.
Существует вариант проблемы, в котором вместо предположения, что общая стоимость дома фиксирована, мы предполагаем, что существует максимальная стоимость для каждой комнаты. В этом варианте существует механизм, защищенный от стратегии: детерминированное правило распределения, выбирающее минимальную стоимость, защищено от стратегии. [24]
Этот результат можно обобщить для большей гибкости на неделимых объектах и доказательства устойчивости к коалиционным стратегиям. [25] [26]
Возвращаясь к исходной задаче о гармонии аренды, можно рассмотреть рандомизированные механизмы . Рандомизированный механизм возвращает распределение вероятностей по назначению комнат и разделению аренды. Рандомизированный механизм является правдивым в ожидании , если ни один партнер не может увеличить ожидаемое значение своей полезности, неверно сообщив свои оценки комнатам. Справедливость рандомизированного механизма можно измерить несколькими способами: [6]
1. Ex-ante Envy-Freeness означает, что ни один партнер не завидует лотерее другого партнера. Это условие тривиально для достижения в честном механизме: рандомизировать все возможные распределения с равной вероятностью и взимать с каждого партнера общую стоимость. Но это условие не привлекательно, поскольку есть большая вероятность того, что в конечном итоге многие партнеры будут завидовать. Они могут не быть утешены тем фактом, что лотерея была честной.
2. Гарантированная вероятность отсутствия зависти (GPEF) означает, что существует определенная вероятность того, что независимо от оценок партнеров с вероятностью не менее , конечный результат будет свободен от зависти. Можно достичь GPEF следующим образом: найти назначение без зависти; выбрать целое число случайным образом; и циклически перемещать каждого партнера по комнатам вправо. Этот рандомизированный механизм является ожидаемо правдивым, поскольку каждый партнер имеет равную вероятность оказаться в каждой комнате, а ожидаемая выплата составляет общую стоимость, независимо от ставки партнера. Вероятность наличия распределения EF равна вероятности того, что , что в точности равно . Это не обнадеживает, поскольку вероятность отсутствия зависти стремится к 0, когда число партнеров растет. Но сделать лучше невозможно: в каждом ожидаемо правдивом механизме GPEF не превышает .
3. Ожидаемое число партнеров, свободных от зависти (ENEF), означает, что существует определенное целое число, такое что если мы усредним число партнеров, которые не завидуют во всех возможных результатах механизма, то независимо от оценок партнеров ожидание будет не менее . Критерий ENEF кажется более подходящим, чем критерий GPEF, поскольку он измеряет не только вероятность полной свободы от зависти, но и качество случаев, в которых распределение не полностью свободно от зависти. Максимальное ENEF механизма с истинным ожиданием не более . Достичь этой границы можно для . Для существует механизм с истинным ожиданием, который почти достигает этой границы: ENEF равен . Общая идея заключается в следующем. Используйте механизм VCG для расчета назначения максимальной суммы и выплат. Выберите одного партнера случайным образом. Игнорируйте этого партнера и снова используйте VCG. Объедините результаты таким образом, чтобы гарантировать, что общая сумма выплат будет равна общей стоимости (подробности см. в статье). Можно показать, что: (a) механизм является правдивым в ожидании; (b) все партнеры, кроме игнорируемого партнера, не завидуют. Следовательно, ENEF равен . Моделирование показывает, что примерно в 80% случаев GPEF этого механизма также достигает своего максимума и составляет .
Возможным смягчением требования стратегической защищенности является попытка минимизировать «степень манипулируемости». [27] Это определяется путем подсчета для каждого профиля числа агентов, которые могут манипулировать правилом. Максимально предпочтительные справедливые правила распределения — это минимально (индивидуально и коалиционно) манипулируемые справедливые и сбалансированные по бюджету правила распределения согласно этой новой концепции. Такие правила выбирают распределения с максимальным числом агентов, для которых полезность максимальна среди всех справедливых и сбалансированных по бюджету распределений.
Существует несколько задач, в которых есть только неделимые вещи для обмена, без денежных переводов:
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка )