Теорема присяжных — это математическая теорема, доказывающая, что при определенных предположениях решение, принятое с использованием большинства голосов в большой группе, с большей вероятностью будет правильным, чем решение, принятое одним экспертом. Она служит формальным аргументом в пользу идеи мудрости толпы , решения вопросов факта судом присяжных и демократии в целом. [1]
Первая и самая известная теорема о жюри — теорема Кондорсе о жюри . Она предполагает, что все избиратели имеют независимые вероятности проголосовать за правильную альтернативу, эти вероятности больше 1/2 и одинаковы для всех избирателей. При этих предположениях вероятность того, что решение большинства верно, строго больше, чем больше группа; а когда размер группы стремится к бесконечности, вероятность того, что решение большинства верно, стремится к 1.
Существует множество других теорем присяжных, смягчающих некоторые или все эти предположения.
Предпосылка всех теорем присяжных заключается в том, что существует объективная истина , которая неизвестна избирателям. Большинство теорем фокусируются на бинарных вопросах (вопросах с двумя возможными состояниями), например, виновен или невиновен определенный подсудимый , вырастут или упадут определенные акции и т. д. Есть избиратели (или присяжные), и их цель — раскрыть правду. У каждого избирателя есть мнение о том, какой из двух вариантов является правильным. Мнение каждого избирателя либо верно (т. е. равно истинному состоянию), либо неверно (т. е. отличается от истинного состояния). Это контрастирует с другими настройками голосования , в которых мнение каждого избирателя представляет его/ее субъективные предпочтения и, таким образом, всегда «верно» для этого конкретного избирателя. Мнение избирателя можно считать случайной величиной : для каждого избирателя существует положительная вероятность того, что его мнение равно истинному состоянию.
Групповое решение определяется правилом большинства . Например, если большинство избирателей говорит «виновен», то решение «виновен», а если большинство говорит «невиновен», то решение «невиновен». Чтобы избежать ничьих, часто предполагается, что число избирателей нечетное. В качестве альтернативы, если четное, то ничья разрешается подбрасыванием честной монеты .
Теоремы присяжных интересуются вероятностью правильности - вероятностью того, что решение большинства совпадает с объективной истиной. Типичные теоремы присяжных делают два вида утверждений относительно этой вероятности: [1]
Утверждение 1 часто называют неасимптотической частью , а утверждение 2 — асимптотической частью теоремы присяжных.
Очевидно, что эти утверждения не всегда верны, но они верны при определенных предположениях относительно избирателей. Различные теоремы о жюри делают различные предположения.
Теорема Кондорсе о жюри делает следующие три предположения:
Теорема Кондорсе о жюри гласит, что эти три предположения подразумевают растущую надежность и непогрешимость толпы.
Мнения разных избирателей часто коррелируют, поэтому Безусловная независимость может не соблюдаться. В этом случае утверждение Растущей надежности может не сработать.
Пусть будет вероятностью голосования присяжного за правильную альтернативу, а будет коэффициентом корреляции (второго порядка) между любыми двумя правильными голосами. Если все коэффициенты корреляции более высокого порядка в представлении Бахадура [2] совместного распределения вероятностей голосов равны нулю, и является допустимой парой, то вероятность того, что присяжные коллективно примут правильное решение при простом большинстве, определяется как:
где — регуляризованная неполная бета-функция .
Пример: Возьмем коллегию присяжных из трех присяжных с индивидуальной компетентностью и корреляцией второго порядка . Тогда . Компетентность коллегии присяжных ниже компетентности одного присяжного, которая равна . Более того, увеличение коллегии присяжных на двух присяжных еще больше снижает компетентность коллегии присяжных, . Обратите внимание, что и является допустимой парой параметров. Для и максимально допустимый коэффициент корреляции второго порядка равен .
Приведенный выше пример показывает, что когда индивидуальная компетентность низкая, но корреляция высокая:
Вышеуказанный результат принадлежит Каниовски и Заиграеву. Они также обсуждают оптимальную конструкцию жюри для однородных жюри с коррелированными голосами. [3]
Существует несколько теорем присяжных, которые различными способами ослабляют предположение о независимости.
В задачах бинарного принятия решений часто есть один вариант, который легче обнаружить, чем другой. Например, может быть легче обнаружить, что подсудимый виновен (поскольку есть явные доказательства его вины), чем обнаружить, что он невиновен. В этом случае вероятность того, что мнение одного избирателя верно, представлена двумя разными числами: вероятностью при условии, что вариант № 1 верен, и вероятностью при условии, что вариант № 2 верен. Это также подразумевает, что мнения разных избирателей коррелируют . Это мотивирует следующие ослабления приведенных выше предположений:
Растущая надежность и непогрешимость толпы продолжают сохраняться при этих более слабых предположениях. [1]
Одной из критических замечаний к условной компетентности является то, что она зависит от того, как сформулирован вопрос о решении. Например, вместо того, чтобы спрашивать, виновен ли подсудимый или невиновен, можно спросить, виновен ли подсудимый ровно по 10 обвинениям (вариант A) или виновен по другому количеству обвинений (0..9 или более 11). Это меняет условия и, следовательно, условную вероятность. Более того, если штат очень специфичен, то вероятность правильного голосования может быть ниже 1/2, поэтому условная компетентность может не соблюдаться. [4]
Другой причиной корреляции между избирателями является существование лидера мнений . Предположим, что каждый избиратель принимает независимое решение, но затем каждый избиратель с некоторой фиксированной вероятностью меняет свое мнение, чтобы оно совпадало с мнением лидера мнений. Теоремы присяжных Боланда [5] и Боланда, Прошана и Тонга [6] показывают, что если (и только если) вероятность следовать за лидером мнений меньше 1-1/2 p (где p — уровень компетентности всех избирателей), то непогрешимость толпы сохраняется.
Помимо зависимости от истинного варианта, есть много других причин, по которым мнения избирателей могут коррелировать. Например:
Можно ослабить предположение об условной независимости и сделать условием все общие причины голосов (а не только состояние). Другими словами, голоса теперь независимы, обусловленные конкретной проблемой принятия решения . Однако в конкретной проблеме предположение об условной компетентности может быть недействительным. Например, в конкретной проблеме с ложными доказательствами, вероятно, что большинство избирателей будут иметь неправильное мнение. Таким образом, два предположения — условная независимость и условная компетентность — не могут быть оправданы одновременно (при одной и той же обусловленности). [7]
Возможным решением является ослабление Условной Компетентности следующим образом. Для каждого избирателя и каждой проблемы x существует вероятность p ( x ) того, что мнение избирателя верно в этой конкретной проблеме. Поскольку x является случайной величиной, p ( x ) также является случайной величиной. Условная Компетенция требует, чтобы p ( x ) > 1/2 с вероятностью 1. Ослабленное предположение:
Теорема присяжных Дитриха и Шпикермана [8] гласит, что Условная независимость, тенденция к компетентности и условная однородность вместе подразумевают растущую надежность. Обратите внимание, что непогрешимость толпы не подразумевается. Фактически, вероятность правильности стремится к значению ниже 1, если и только если Условная компетентность не выполняется.
Теорема присяжных Пивато [9] показывает, что если средняя ковариация между избирателями становится меньше, когда популяция становится больше, то непогрешимость толпы сохраняется (для некоторого правила голосования). Существуют и другие теоремы присяжных, которые учитывают степень, в которой голоса могут быть коррелированы. [10] [11]
Другие способы справиться с корреляцией избирателей включают причинно-следственные сети , структуры зависимости и взаимозаменяемость. [1] : 2.2
Разные избиратели часто имеют разные уровни компетентности, поэтому предположение о единообразии не выполняется. В этом случае могут не выполняться как Растущая надежность, так и Безошибочность толпы. Это может произойти, если новые избиратели имеют гораздо более низкую компетентность, чем существующие избиратели, так что добавление новых избирателей снижает вероятность правильности группы. В некоторых случаях вероятность правильности может сходиться к 1/2 (- случайное решение), а не к 1. [12]
Единообразие может быть отклонено, если усилить предположение Компетентности. Есть несколько способов усилить его:
Вместо того чтобы предполагать, что личность избирателя фиксирована, можно предположить, что существует большой пул потенциальных избирателей с различным уровнем компетентности, и фактические избиратели выбираются из этого пула случайным образом (как при жеребьевке ).
Теорема о жюри Бена Яшара и Пароуша [15] показывает, что при определенных условиях вероятность правильности жюри или его подмножества, выбранного случайным образом, больше, чем вероятность правильности одного присяжного, выбранного случайным образом. Более общая теорема о жюри Беренда и Сапира [16] доказывает, что в этой ситуации выполняется принцип растущей надежности: вероятность правильности случайного комитета увеличивается с размером комитета. Теорема выполняется при определенных условиях даже с коррелированными голосами. [17]
Теорема присяжных Оуэна, Грофмана и Фелда [18] анализирует обстановку, где уровень компетентности является случайным. Они показывают, какое распределение индивидуальной компетентности максимизирует или минимизирует вероятность правильности.
Когда уровни компетентности избирателей известны, правило простого большинства может не быть лучшим правилом принятия решений. Существуют различные работы по определению оптимального правила принятия решений - правила, максимизирующего вероятность правильности группы. Ницан и Паруш [19] показывают, что при безусловной независимости оптимальным правилом принятия решений является правило взвешенного большинства, где вес каждого избирателя с вероятностью правильности p i равен log( p i /(1- p i )), а альтернатива выбирается, если сумма весов ее сторонников превышает некоторый порог. Грофман и Шепли [20] анализируют влияние взаимозависимостей между избирателями на оптимальное правило принятия решений. Бен-Яшар и Ницан [21] доказывают более общий результат.
Дитрих [22] обобщает этот результат на случай, когда не требуются априорные вероятности «правильности» двух альтернатив. Единственным необходимым предположением является эпистемическая монотонность, которая гласит, что если при определенном профиле выбрана альтернатива x , и профиль изменяется таким образом, что x становится более вероятным, то x все равно выбирается. Дитрих показывает, что эпистемическая монотонность подразумевает, что оптимальное правило принятия решения — это взвешенное большинство с порогом. В той же статье он обобщает оптимальное правило принятия решения на случай, когда не требуется, чтобы входные данные были голосом за одну из альтернатив. Это может быть, например, субъективная степень убеждения. Более того, параметры компетентности не обязательно должны быть известны. Например, если входные данные — это субъективные убеждения x 1 ,..., x n , то оптимальное правило принятия решения суммирует log( x i /(1- x i )) и проверяет, превышает ли сумма некоторый порог. Эпистемической монотонности недостаточно для вычисления самого порога; пороговое значение можно вычислить, предположив максимизацию ожидаемой полезности и априорные вероятности.
Общая проблема с правилами взвешенного большинства заключается в том, что они требуют знания уровней компетентности различных избирателей, что обычно трудно вычислить объективным способом. Бахарад, Голдбергер, Коппель и Ницан [23] представляют алгоритм, который решает эту проблему с помощью статистического машинного обучения . Он требует в качестве входных данных только список прошлых голосов; ему не нужно знать, были ли эти голоса правильными или нет. Если список достаточно большой, то его вероятность правильности сходится к 1, даже если уровни компетентности отдельных избирателей близки к 1/2.
Часто проблемы принятия решений включают три или более вариантов. Это критическое ограничение было фактически признано Кондорсе (см. парадокс Кондорсе ), и в целом очень трудно согласовать индивидуальные решения между тремя или более результатами (см. теорему Эрроу ).
Это ограничение также можно преодолеть с помощью последовательности голосований по парам альтернатив, как это обычно реализуется в процессе внесения поправок в законодательство. (Однако, согласно теореме Эрроу, это создает «зависимость от пути» от точной последовательности пар альтернатив; например, то, какая поправка предложена первой, может повлиять на то, какая поправка в конечном итоге будет принята, или будет ли принят закон — с поправками или без них — вообще.)
При наличии трех и более вариантов условную компетентность можно обобщить следующим образом:
Теорема о присяжных Листа и Гудина показывает, что многовариантная условная компетентность и условная независимость вместе подразумевают непогрешимость толпы. [24] Дитрих и Шпикерман предполагают, что они также подразумевают растущую надежность. [1] Другая связанная теорема о присяжных принадлежит Эвереру, Конечны и Маркизу. [25]
Когда есть более двух вариантов, существуют различные правила голосования , которые могут быть использованы вместо простого большинства. Статистические и утилитарные свойства таких правил анализируются, например, Пивато. [26] [27]
Теорема Кондорсе рассматривает систему прямого большинства , в которой все голоса подсчитываются напрямую в окончательный результат. Во многих странах используется система косвенного большинства , в которой избиратели делятся на группы. Избиратели в каждой группе принимают решение о результате внутренним большинством голосов; затем группы принимают решение об окончательном результате большинством голосов среди них. Например, [5] предположим, что есть 15 избирателей. В системе прямого большинства решение принимается, если его поддерживают не менее 8 голосов. Предположим теперь, что избиратели сгруппированы в 3 группы по 5 человек в каждой. Решение принимается, если его поддерживают не менее 2 групп, и в каждой группе решение принимается, если его поддерживают не менее 3 избирателей. Следовательно, решение может быть принято, даже если его поддерживают только 6 избирателей.
Боланд, Прошан и Тонг [6] доказывают, что когда избиратели независимы и p>1/2, система прямого большинства — как в теореме Кондорсе — всегда имеет более высокие шансы принять правильное решение, чем любая система косвенного большинства.
Берг и Пароуш [28] рассматривают многоуровневые иерархии голосования, которые могут иметь несколько уровней с различными правилами принятия решений на каждом уровне. Они изучают оптимальную структуру голосования и сравнивают компетентность с выгодой от экономии времени и других расходов.
Гудин и Шпикерманн [29] вычисляют, на сколько небольшая группа экспертов должна быть лучше среднего избирателя, чтобы они могли принять более правильные решения.
Хорошо известно, что когда есть три или более альтернатив, и у избирателей разные предпочтения, они могут участвовать в стратегическом голосовании , например, голосовать за второй лучший вариант, чтобы не допустить избрания худшего варианта. Удивительно, но стратегическое голосование может происходить даже при двух альтернативах и когда все избиратели имеют одинаковые предпочтения, а именно раскрытие истины. Например, предположим, что вопрос заключается в том, виновен или невиновен подсудимый, и предположим, что некий присяжный думает, что истинный ответ — «виновен». Однако он также знает, что его голос эффективен только в том случае, если другие голоса разделились поровну. Но если другие голоса разделились поровну, это означает, что вероятность того, что подсудимый виновен, близка к 1/2. Принимая это во внимание, наш присяжный может решить, что эта вероятность недостаточна для принятия решения «виновен», и, таким образом, проголосует «невиновен». Но если все остальные избиратели сделают то же самое, будет получен неправильный ответ. В терминах теории игр правдивое голосование может не быть равновесием Нэша . [30] Эту проблему назвали проклятием колеблющегося избирателя , [31] поскольку она аналогична проклятию победителя в теории аукционов.
Теорема присяжных Пелега и Замира [32] показывает достаточные и необходимые условия для существования равновесия Байеса-Нэша , которое удовлетворяет теореме присяжных Кондорсе. Бозбей, Дитрих и Питерс [33] показывают правила голосования, которые приводят к эффективному агрегированию частной информации избирателей даже при стратегическом голосовании.
На практике эта проблема может быть не очень серьезной, поскольку большинство избирателей заботятся не только о конечном результате, но и о том, чтобы голосовать правильно по совести. Более того, большинство избирателей недостаточно искушены, чтобы голосовать стратегически. [1] : 4.7
Понятие «правильности» может не иметь смысла при принятии политических решений, которые основаны на ценностях или предпочтениях, а не только на фактах.
Некоторые защитники теоремы считают, что она применима, когда голосование направлено на определение того, какая политика лучше всего способствует общественному благу, а не просто на выражение индивидуальных предпочтений. В этом прочтении теорема гласит, что хотя каждый член электората может иметь лишь смутное представление о том, какая из двух политик лучше, голосование большинством имеет усиливающий эффект. «Уровень групповой компетентности», представленный вероятностью того, что большинство выберет лучшую альтернативу, увеличивается до 1 по мере роста размера электората, предполагая, что каждый избиратель чаще бывает прав, чем неправ.
Несколько работ показывают, что при разумных условиях большие группы лучше отслеживают предпочтения большинства. [34] : 323 [35] [36]
Применимость теорем о жюри, в частности, теоремы Кондорсе о жюри (CJT) к демократическим процессам является предметом споров, поскольку она может доказать, что правило большинства является идеальным механизмом или катастрофой в зависимости от индивидуальной компетентности. Недавние исследования показывают, что в неоднородном случае тезис теоремы не выполняется почти наверняка (если только не используется правило взвешенного большинства со стохастическими весами, которые коррелируют с эпистемической рациональностью, но такими, что каждый избиратель имеет минимальный вес, равный единице). [37]