Теорема Эрроу о невозможности является ключевым результатом в теории общественного выбора , показывая, что ни одно правило принятия решений, основанное на ранжировании , не может удовлетворить требованиям теории рационального выбора . [1] В частности, Эрроу показал, что ни одно такое правило не может удовлетворить принципу независимости нерелевантных альтернатив , принципу, согласно которому выбор между двумя альтернативами A и B не должен зависеть от качества какой-то третьей, не связанной с ними опции C. [2] [3] [4 ]
Результат чаще всего цитируется в обсуждениях правил голосования , [5] где он показывает, что никакое правило ранжированного голосования не может устранить эффект спойлера . [6] [7] [8] Однако теорема Эрроу существенно шире и может применяться к методам общественного принятия решений, отличным от голосования. Поэтому она обобщает парадокс голосования Кондорсе и показывает, что подобные проблемы существуют для каждой процедуры коллективного принятия решений, основанной на относительных сравнениях . [1]
Методы большинства , такие как голосование по принципу первого прошедшего мимо голоса и ранжированный выбор (мгновенный тур), очень чувствительны к помехам, [9] [10] особенно в ситуациях , когда они не являются принудительными . [11] [12] Напротив, методы большинства (Кондорсе) ранжированного голосования однозначно минимизируют количество испорченных выборов [12], ограничивая их редкими [13] [14] ситуациями, называемыми циклическими связями . [11] В некоторых идеализированных моделях поведения избирателей (например, спектр левых и правых голосов Блэка ) эффекты помех могут полностью исчезнуть для этих методов. [15] [16]
Правила рейтингового голосования , где избиратели присваивают отдельную оценку каждому кандидату, не подпадают под действие теоремы Эрроу. [6] [7] [17] Первоначально Эрроу утверждал, что информация, предоставляемая этими системами, бессмысленна и, следовательно, не может использоваться для предотвращения парадоксов, что привело его к их игнорированию. [18] Однако позже он и другие авторы признали это ошибкой, [19] [20] при этом Эрроу признал, что правила, основанные на кардинальных полезностях (таких как оценка и одобрение голосования ), не подпадают под действие его теоремы. [21] [22]
Когда Кеннет Эрроу доказал свою теорему в 1950 году, она положила начало современной области теории социального выбора , разделу экономики благосостояния , который занимается агрегированием предпочтений и убеждений для принятия оптимальных решений. [20] Целью теории социального выбора является определение правила социального выбора , математической функции , которая определяет, какой из двух результатов или вариантов лучше, по мнению всех членов общества. [2] Такой процедурой может быть рынок , система голосования , конституция или даже моральная или этическая структура. [1] В идеале такая процедура должна удовлетворять свойствам рационального выбора и избегать любого рода внутренних противоречий . [2]
В контексте теоремы Эрроу предполагается, что граждане имеют порядковые предпочтения , т. е. упорядочения кандидатов . Если A и B — разные кандидаты или альтернативы, то это означает, что A предпочтительнее B. Индивидуальные предпочтения (или бюллетени) должны удовлетворять интуитивным свойствам упорядочений, например, они должны быть транзитивными — если и , то . Тогда функция общественного выбора — это математическая функция , которая отображает индивидуальные упорядочения в новое упорядочение, которое представляет предпочтения всего общества.
Теорема Эрроу предполагает в качестве предпосылки, что любое невырожденное (т.е. фактически применимое) правило общественного выбора будет удовлетворять: [23]
Первоначальное утверждение Эрроу теоремы включало неотрицательную отзывчивость в качестве условия, то есть, что увеличение ранга результата не должно приводить к их проигрышу — другими словами, что правило голосования не должно наказывать кандидата за большую популярность. [2] Однако это предположение не требуется и не используется в его доказательстве (за исключением вывода более слабого условия эффективности по Парето), и поэтому не связано с парадоксом. [3] Хотя Эрроу считал это очевидным требованием любого предлагаемого правила общественного выбора, голосование с ранжированным выбором (RCV) не удовлетворяет этому условию. [26] Позднее Эрроу исправил свое утверждение теоремы, включив в него повторные туры и другие правила голосования, уязвимые для парадокса дополнительной поддержки . [3] [26]
Среди важнейших аксиом рационального выбора — независимость от нерелевантных альтернатив (IIA), которая гласит, что при выборе между вариантами A и B мнение человека о третьем варианте C не должно влиять на его решение. [2]
Иногда IIA иллюстрируется короткой шуткой философа Сиднея Моргенбессера : [27]
Теорема Эрроу показывает, что если общество желает принимать решения, избегая при этом подобных внутренних противоречий, оно не может использовать методы, которые отбрасывают кардинальную информацию . [27]
Пример Кондорсе уже достаточен, чтобы увидеть невозможность справедливой рейтинговой системы голосования , учитывая более сильные условия справедливости, чем предполагает теорема Эрроу. [28] Предположим, у нас есть три кандидата ( , , и ) и три избирателя, предпочтения которых следующие:
Если победителем выбран , можно утверждать, что любая справедливая система голосования сказала бы, что должен победить вместо этого, поскольку два избирателя (1 и 2) предпочитают , и только один избиратель (3) предпочитает . Однако, по тому же аргументу предпочитается , и предпочитается , с разницей два к одному в каждом случае. Таким образом, даже если каждый отдельный избиратель имеет последовательные предпочтения, предпочтения общества противоречивы: предпочтительнее , который предпочтительнее , который предпочтительнее .
Из-за этого примера некоторые авторы приписывают Кондорсе интуитивное рассуждение, которое представляет собой ядро теоремы Эрроу. [28] Однако теорема Эрроу является существенно более общей; она применима к методам принятия решений, отличным от выборов по принципу «один человек — один голос», таким как рынки или взвешенное голосование , основанное на ранжированных бюллетенях .
Пусть будет набором альтернатив . Предпочтения избирателя по являются полным и транзитивным бинарным отношением на (иногда называемым полным предварительным порядком ), то есть подмножеством удовлетворяющих :
Элемент, находящийся в , интерпретируется как означающий, что альтернатива предпочтительнее альтернативы . Эта ситуация часто обозначается или . Обозначим множество всех предпочтений на как . Пусть будет положительным целым числом. Порядковая (ранжированная) функция общественного благосостояния — это функция [2]
который объединяет предпочтения избирателей в единое предпочтение на . Набор предпочтений избирателей называется профилем предпочтений .
Теорема Эрроу о невозможности : если существует по крайней мере три альтернативы, то не существует функции общественного благосостояния, удовлетворяющей всем трем условиям, перечисленным ниже: [29]
Теорема Эрроу о невозможности по-прежнему справедлива, если эффективность по Парето ослабить до следующего условия: [4]
Теорема Эрроу устанавливает, что никакое правило ранжированного голосования не может всегда удовлетворять независимости нерелевантных альтернатив, но ничего не говорит о частоте спойлеров. Это привело Эрроу к замечанию, что «большинство систем не будут работать плохо все время. Все, что я доказал, это то, что все могут работать плохо время от времени». [8] [34]
Попытки справиться с эффектами теоремы Эрроу предполагают один из двух подходов: либо принять его правило и искать методы, наименее подверженные искажениям, либо отказаться от его предположения о рейтинговом голосовании, чтобы сосредоточиться на изучении правил рейтингового голосования . [27]
Первый набор методов, изученных экономистами, — это правило большинства, или методы Кондорсе . Эти правила ограничивают спойлеры ситуациями, когда правило большинства является внутренне противоречивым, называемыми циклами Кондорсе , и в результате однозначно минимизируют возможность эффекта спойлера среди ранжированных правил. (Действительно, многие различные функции общественного благосостояния могут соответствовать условиям Эрроу при таких ограничениях области. Однако было доказано, что при любом таком ограничении, если существует какая-либо функция общественного благосостояния, которая соответствует критериям Эрроу, то метод Кондорсе будет соответствовать критериям Эрроу. [12] ) Кондорсе считал, что правила голосования должны удовлетворять как независимости нерелевантных альтернатив, так и принципу правила большинства , т. е. если большинство избирателей ставят Алису выше Боба , Алиса должна победить Боба на выборах. [28]
К сожалению, как доказал Кондорсе, это правило может быть противоречивым ( нетранзитивным ), поскольку может существовать цикл «камень-ножницы-бумага» с тремя или более кандидатами, побеждающими друг друга в круге. [35] Таким образом, Кондорсе доказал более слабую форму теоремы Эрроу о невозможности задолго до Эрроу, при более сильном предположении, что система голосования в случае двух кандидатов будет согласовываться с простым большинством голосов. [28]
В отличие от плюралистических правил, таких как ранжированный выборный тур (RCV) или первичное предпочтение , [9] методы Кондорсе позволяют избежать эффекта спойлера на нециклических выборах, где кандидаты могут быть выбраны по правилу большинства. Политологи обнаружили, что такие циклы довольно редки, вероятно, в диапазоне нескольких процентов, что предполагает, что они могут иметь ограниченное практическое значение. [14] [ необходимо разъяснение ] Пространственные модели голосования также предполагают, что такие парадоксы, вероятно, будут нечастыми [36] [13] или даже не будут существовать. [15]
Вскоре после того, как Эрроу опубликовал свою теорему, Дункан Блэк продемонстрировал свой собственный замечательный результат — теорему о медианном избирателе . Теорема доказывает, что если избиратели и кандидаты расположены в лево-правом спектре , все условия Эрроу полностью совместимы, и все они будут выполнены любым правилом, удовлетворяющим принципу большинства Кондорсе . [15] [37]
Более формально, теорема Блэка предполагает, что предпочтения имеют один пик : счастье избирателя с кандидатом растет и падает по мере того, как кандидат движется по некоторому спектру. Например, в группе друзей, выбирающих настройки громкости для музыки, у каждого друга, вероятно, будет своя идеальная громкость; по мере того, как громкость становится все более громкой или слишком тихой, они будут все больше недовольны. Если область ограничена профилями, где каждый человек имеет однопиковое предпочтение относительно линейного порядка, то социальные предпочтения ацикличны. В этой ситуации методы Кондорсе удовлетворяют широкому спектру весьма желательных свойств, включая полную защиту от спойлеров. [15] [37] [12]
Правило не полностью обобщает политический спектр на политический компас, результат, связанный с теоремой хаоса Маккелви-Шофилда . [15] [38] Однако, четко определенный победитель Кондорсе существует, если распределение избирателей симметрично вращению или иным образом имеет однозначно определенную медиану . [39] [40] В большинстве реалистичных ситуаций, когда мнения избирателей следуют приблизительно нормальному распределению или могут быть точно суммированы одним или двумя измерениями, циклы Кондорсе редки (хотя и не неслыханны). [36] [11]
Теорема Кэмпбелла-Келли показывает, что методы Кондорсе являются наиболее устойчивым к спойлерам классом ранжированных систем голосования: всякий раз, когда для некоторой ранжированной системы голосования возможно избежать эффекта спойлера, метод Кондорсе сделает это. [12] Другими словами, замена ранжированного метода его вариантом Кондорсе (т. е. выбор победителя по Кондорсе, если он существует, и в противном случае запуск метода) иногда предотвращает эффект спойлера, но никогда не может создать новый. [12]
В 1977 году Эхуд Калай и Эйтан Мюллер дали полную характеристику ограничений домена, допускающих недиктаторскую и стратегическую функцию социального благосостояния. Они соответствуют предпочтениям, для которых есть победитель Кондорсе. [41]
Холлидей и Пакуит разработали систему голосования, которая, как можно доказать, сводит к минимуму количество кандидатов, способных испортить выборы, хотя и ценой периодической потери позитивности голосов (хотя и гораздо более низкой, чем при голосовании с мгновенным повторным голосованием ). [11]
Как показано выше, доказательство теоремы Эрроу в значительной степени опирается на предположение о ранжированном голосовании и не применимо к рейтинговым системам голосования . В результате такие системы, как голосование по баллам и градуированное большинство, пропускают независимость от нерелевантных альтернатив . [34] Эти системы просят избирателей оценить кандидатов по числовой шкале (например, от 0 до 10), а затем выбрать кандидата с наивысшим средним значением (для голосования по баллам) или медианой ( градуированное большинство ). [42] [ нужна страница ]
Хотя теорема Эрроу не применима к градуированным системам, теорема Гиббарда все еще применима: ни одна игра с голосованием не может быть простой (т. е. иметь единственную, ясную, всегда лучшую стратегию) [43] , поэтому неформальное изречение о том, что «ни одна система голосования не идеальна», все еще имеет некоторую математическую основу. [44]
Структура Эрроу предполагала, что индивидуальные и социальные предпочтения являются упорядочениями или ранжированиями , т. е. утверждениями о том, какие результаты лучше или хуже других. [45] Вдохновляясь строгим бихевиоризмом, популярным в психологии, некоторые философы и экономисты отвергли идею сравнения внутреннего человеческого опыта благополучия . [46] [27] Такие философы утверждали, что невозможно сравнить силу предпочтений у людей, которые не согласны; Сен приводит в качестве примера, что было бы невозможно узнать, был ли Великий пожар в Риме хорошим или плохим, потому что, несмотря на гибель тысяч римлян, он имел положительный эффект, позволив Нерону расширить свой дворец. [47]
Эрроу изначально согласился с этими позициями и отверг кардинальную полезность , что привело его к сосредоточению своей теоремы на ранжировании предпочтений; [46] [48] его цель при добавлении аксиомы независимости была, отчасти, в том, чтобы помешать функции социального выбора «прокрасться» в кардинальную информацию, пытаясь вывести ее из ранжирования. [27] В результате Эрроу изначально интерпретировал свою теорему как своего рода математическое доказательство нигилизма или эгоизма . [27] [45] [2] Однако позже он изменил это мнение, признав, что кардинальные методы могут предоставлять полезную информацию, которая позволяет им обойти его теорему. [19] [49] Аналогичным образом, Амартия Сен сначала утверждал, что межличностная сопоставимость необходима для ИИС, но позже стал выступать в пользу кардинальных методов оценки социального выбора, утверждая, что для ее соблюдения на практике потребуются лишь «довольно ограниченные уровни частичной сопоставимости». [47]
Балински и Лараки оспорили, что для рейтинговых правил голосования требуются любые межличностные сравнения , чтобы пройти IIA. Они утверждают, что наличие общего языка с вербальными оценками достаточно для IIA, позволяя избирателям давать последовательные ответы на вопросы о качестве кандидата. Другими словами, они утверждают, что большинство избирателей не изменят свои убеждения о том, является ли кандидат «хорошим», «плохим» или «нейтральным» просто потому, что другой кандидат присоединяется или выбывает из гонки. [42] [ нужна страница ]
Джон Харсани отметил, что теорему Эрроу можно считать более слабой версией его собственной теоремы [50] и других теорем представления полезности , таких как теорема VNM , которые в целом показывают, что рациональное поведение требует последовательных кардинальных полезностей . [51] Харсани [50] и Викри [52] каждый независимо получил результаты, показывающие, что такие межличностные сравнения полезности можно строго определить как индивидуальные предпочтения по сравнению с лотереей рождения . [53] [54]
Другие ученые отметили, что межличностные сравнения полезности не являются уникальными для кардинального голосования, а вместо этого являются необходимостью любой недиктаторской ( или неэгоистичной ) процедуры выбора, при этом кардинальные правила голосования просто делают эти сравнения явными. Дэвид Пирс определил изначальную интерпретацию теоремы Эрроу как математическое доказательство нигилизма или эгоизма с своего рода круговым рассуждением [27], а Хилдрет указал, что «любая процедура, которая расширяет частичное упорядочение [ эффективности по Парето ], должна включать межличностные сравнения полезности». [55] Эти наблюдения привели к возникновению неявного утилитаристского голосования , которое идентифицирует ранжированные процедуры с приближениями утилитаристского правила (т. е. голосование по баллам ), помогая сделать их более явными. [56]
В психометрии существует почти всеобщий научный консенсус относительно полезности и значимости самооценки, которая эмпирически показывает более высокую достоверность и надежность , чем рейтинги при измерении человеческих мнений. [57] [58] Исследования неизменно обнаруживают, что кардинальные рейтинговые шкалы (например, шкалы Лайкерта ) предоставляют больше информации, чем рейтинги в одиночку. [58] [59] Кайзер и Освальд провели эмпирический обзор четырех десятилетий исследований, включающих более 700 000 участников, которые предоставили самооценку полезности, с целью определить, «есть ли у людей чувство реальной базовой шкалы для их самых сокровенных чувств». [60] Они обнаружили, что ответы на эти вопросы соответствовали всем ожиданиям от четко определенной количественной меры. Более того, такие рейтинги были высокопредсказуемы в отношении важных решений (таких как международная миграция и развод) и имели больший размер эффекта, чем стандартные социально-экономические предикторы, такие как доход и демография. [60] В конечном итоге авторы пришли к выводу, что «эта связь чувств с действиями имеет общую форму, последовательно воспроизводима и довольно близка к линейной по структуре. Поэтому кажется, что люди могут успешно операционализировать целочисленную шкалу для чувств». [60]
Поведенческие экономисты показали, что индивидуальная иррациональность включает нарушения ИИС (например, с эффектами отвлечения ), [61] предполагая, что человеческое поведение может вызывать неудачи ИИС, даже если сам метод голосования этого не делает. [62] Однако прошлые исследования обычно обнаруживали, что такие эффекты довольно малы, [63] и такие психологические помехи могут появляться независимо от избирательной системы. Балински и Лараки обсуждают методы дизайна бюллетеней , полученные из психометрии , которые минимизируют эти психологические эффекты, такие как просьба к избирателям дать каждому кандидату устную оценку (например, «плохо», «нейтрально», «хорошо», «отлично») и выдача инструкций избирателям, которые ссылаются на их бюллетени как на суждения об отдельных кандидатах. [42] [ нужна страница ] Подобные методы часто обсуждаются в контексте условной оценки . [49]
Помимо приведенных выше практических решений, существуют необычные (непрактичные) ситуации, в которых требование Эрроу о применении ИИС может быть удовлетворено.
Правила сверхбольшинства могут обойти теорему Эрроу ценой плохой решающей силы (т.е. частой неспособности вернуть результат). В этом случае порог, требующий большинства для упорядочения 3 результатов, для 4 и т.д. не приводит к парадоксам голосования . [64]
В пространственных (n-мерная идеология) моделях голосования это может быть смягчено, чтобы требовать только (примерно 64%) голосов для предотвращения циклов, при условии, что распределение избирателей является благополучным ( квазивогнутым ). [65] Эти результаты дают некоторое обоснование для общего требования большинства в две трети для внесения поправок в конституцию, что достаточно для предотвращения циклических предпочтений в большинстве ситуаций. [65]
Фишберн показывает, что все условия Эрроу могут быть выполнены для несчетного бесконечного множества избирателей, если принять аксиому выбора ; [66] однако Кирман и Зондерман продемонстрировали, что это требует лишения избирательных прав почти всех членов общества (имеющие право голоса избиратели образуют множество меры 0), что привело их к тому, что они стали называть такие общества «невидимыми диктатурами». [67]
Теорема Эрроу не связана со стратегическим голосованием , которое не появляется в его структуре, [3] [1] хотя теорема имеет важные последствия для стратегического голосования (используется как лемма для доказательства теоремы Гиббарда [23] ). Арровианская структура общественного благосостояния предполагает, что все предпочтения избирателей известны, и единственная проблема заключается в их агрегировании. [1]
Монотонность (называемая Эрроу положительной ассоциацией ) не является условием теоремы Эрроу. [3] Это заблуждение вызвано ошибкой самого Эрроу, который включил аксиому в свою первоначальную формулировку теоремы, но не использовал ее. [2] Отказ от предположения не позволяет построить функцию общественного благосостояния, которая удовлетворяет его другим условиям. [3]
Вопреки распространенному заблуждению, теорема Эрроу имеет дело с ограниченным классом систем голосования с ранжированным выбором , а не с системами голосования в целом. [1] [68]
Кандидаты C и D испортили выборы для B... С их участием победил A, тогда как без них победил бы B. ... Мгновенное голосование во втором туре... не устраняет проблему спойлеров полностью
На нынешнем этапе обсуждения проблемы социального выбора должно быть общеизвестно, что общая теорема о невозможности верна, поскольку только порядковые предпочтения учитываются или могут учитываться. Если интенсивность предпочтения или кардинальная полезность могут быть известны или отражены в социальном выборе, парадокс социального выбора может быть решен.
Отказ от Условие 3 позволяет сформулировать процедуру достижения общественного выбора. Такая процедура описана ниже.
Как и в случае с выборами с простым большинством, очевидно, что результат будет крайне чувствителен к распределению кандидатов.
Кандидаты C и D испортили выборы для B... С их участием победил A, тогда как без них победил бы B. ... Мгновенное голосование во втором туре... не устраняет проблему спойлеров полностью, хотя, несомненно, снижает вероятность ее возникновения на практике.
Это своего рода свойство стабильности победителей Кондорсе: вы не можете вытеснить победителя Кондорсе
A
, добавив нового кандидата
B
к выборам, если A побеждает B в голосовании большинства лицом к лицу. Например, хотя на президентских выборах 2000 года в США во Флориде не использовались рейтинговые бюллетени, вполне вероятно (см. Magee 2003), что Эл Гор (A) победил бы без Ральфа Нейдера (B) на выборах, и Гор победил бы Нейдера в очном формате. Таким образом, Гор все равно должен был победить, если бы Нейдер был включен в выборы.
IRV подвержена так называемому «центральному сжатию». Популярный умеренный может получить относительно немного голосов за первое место не по своей вине, а из-за разделения голосов между кандидатами справа и слева. [...] Таким образом, голосование за одобрение, по-видимому, решает проблему разделения голосов просто и элегантно. [...] Голосование по диапазону решает проблемы спойлеров и разделения голосов
Показано, что утилитаристская функция благосостояния удовлетворяет всем постулатам общественного выбора Эрроу — избегая знаменитой теоремы о невозможности, используя информацию, которая
недоступна
в исходной структуре Эрроу.
Доктор Эрроу: Ну, я немного склонен думать, что системы оценок, где вы классифицируете, может быть, по трем или четырем классам (несмотря на то, что я сказал о манипуляции), вероятно, являются лучшими. [...] И некоторые из этих исследований были проведены. Во Франции [Мишель] Балински провел несколько исследований такого рода, которые, кажется, подтверждают эти методы оценки.
Существует ли такая вещь, как идеальная система голосования? Респонденты были единодушны в своем настойчивом утверждении, что ее нет.
{{cite journal}}
: CS1 maint: DOI inactive as of August 2024 (link)фиктивное понятие «исходного положения» было разработано Викери (1945), Харсани (1955) и Роулзом (1971).
Чрезвычайно высокая степень соответствия, обнаруженная между ранжированием и средними рейтинговыми значениями... не оставляет никаких сомнений относительно предпочтительности метода рейтинга для целей описания группы. Очевидное преимущество рейтинга заключается в том, что, хотя его результаты практически идентичны результатам, полученным при ранжировании, он предоставляет больше информации, чем ранжирование.
Многие исследователи ценностей предполагали, что ранжирования ценностей более валидны, чем рейтинги ценностей, поскольку ранжирования заставляют участников более четко различать схожие ценности... Результаты показали, что рейтинги, как правило, демонстрировали большую валидность, чем ранжирования в рамках умеренно и слабо дифференцирующихся участников. Кроме того, валидность рейтингов была выше, чем рейтинги в целом.
Метод шкалы ценностей может использоваться примерно для тех же целей, что и метод порядка заслуг, но метод шкалы ценностей является лучшим средством получения записи суждений