Теорема присяжных Кондорсе — это теорема политической науки об относительной вероятности принятия данной группой лиц правильного решения. Теорема была впервые высказана маркизом де Кондорсе в его работе 1785 года «Опыт о применении анализа к вероятности решений большинства» . [1]
Предположения теоремы таковы, что группа желает принять решение большинством голосов . Один из двух результатов голосования является правильным , и каждый избиратель имеет независимую вероятность p проголосовать за правильное решение. Теорема спрашивает, сколько избирателей мы должны включить в группу. Результат зависит от того, больше или меньше p 1/2:
После Кондорсе многие другие исследователи доказали различные другие теоремы присяжных , ослабив некоторые или все предположения Кондорсе.
Чтобы избежать необходимости в правиле разрешения ничьей, мы предполагаем, что n нечетное. По сути, тот же аргумент работает для четного n , если ничья разрешается добавлением одного избирателя.
Теперь предположим, что мы начинаем с n избирателей, и пусть m из этих избирателей проголосуют правильно.
Рассмотрим, что произойдет, если мы добавим еще двух избирателей (чтобы общее число оставалось нечетным). Большинство голосов изменится только в двух случаях:
В остальное время новые голоса либо отменяют, либо только увеличивают разрыв, либо не оказывают существенного влияния. Поэтому нас волнует только то, что происходит, когда один голос (среди первых n ) отделяет правильное большинство от неправильного.
Ограничивая наше внимание этим случаем, мы можем представить, что первые n -1 голосов аннулируются и что решающий голос отдается n -ным избирателем. В этом случае вероятность получения правильного большинства равна просто p . Теперь предположим, что мы отправляем двух дополнительных избирателей. Вероятность того, что они изменят неправильное большинство на правильное, равна (1- p ) p 2 , в то время как вероятность того, что они изменят правильное большинство на неправильное, равна p (1- p ) 2 . Первая из этих вероятностей больше второй тогда и только тогда, когда p > 1/2, что доказывает теорему.
Это доказательство прямое; оно просто суммирует вероятности большинства. Каждый член суммы умножает количество комбинаций большинства на вероятность этого большинства. Каждое большинство подсчитывается с использованием комбинации , n элементов, взятых по k за раз, где n — размер жюри, а k — размер большинства. Вероятности варьируются от 0 (= голос всегда неправильный) до 1 (= всегда правильный). Каждый человек принимает решение независимо, поэтому вероятности их решений перемножаются. Вероятность каждого правильного решения равна p . Вероятность неправильного решения, q , противоположна p , то есть 1 − p . Запись мощности, ie, является сокращением для x умножений p .
Точность решений комитета или жюри можно легко оценить, используя этот подход в компьютерных таблицах или программах.
В качестве примера возьмем простейший случай n = 3, p = 0,8. Нам нужно показать, что 3 человека имеют шанс быть правыми выше 0,8. Действительно:
Асимптотика — это «исчисление приближений». Оно используется для решения сложных задач, которые не могут быть решены точно, и для предоставления более простых форм сложных результатов, от ранних результатов, таких как формулы Тейлора и Стирлинга, до теоремы о простых числах. Важной темой в изучении асимптотики является асимптотическое распределение, которое является распределением вероятностей, которое в некотором смысле является «предельным» распределением последовательности распределений. Вероятность правильного решения большинства P ( n , p ), когда индивидуальная вероятность p близка к 1/2, растет линейно в терминах p − 1/2. Для n избирателей, каждый из которых имеет вероятность p принять правильное решение, и для нечетного n (где нет возможных ничьих):
где
и асимптотическое приближение в терминах n очень точное. Разложение происходит только в нечетных степенях и . Проще говоря, это означает, что когда решение трудное ( p близко к 1/2), выигрыш от наличия n избирателей растет пропорционально . [2]
Теорема жюри Кондорсе недавно использовалась для концептуализации интеграции оценок, когда несколько врачей-читателей (рентгенологов, эндоскопистов и т. д.) независимо оценивают изображения на предмет активности заболевания. Эта задача возникает при центральном считывании, выполняемом во время клинических испытаний, и имеет сходство с голосованием. По мнению авторов, применение теоремы может перевести индивидуальные оценки читателей в окончательную оценку способом, который является как математически обоснованным (избегая усреднения порядковых данных), так и математически поддающимся дальнейшему анализу, и способом, который соответствует текущей задаче оценки (основанной на решениях о наличии или отсутствии признаков, субъективная задача классификации) [3].
Теорема жюри Кондорсе также используется в ансамблевом обучении в области машинного обучения . [4] Ансамблевой метод объединяет предсказания многих отдельных классификаторов путем голосования большинства. Предполагая, что каждый из отдельных классификаторов предсказывает с точностью чуть больше 50% и их предсказания независимы, тогда ансамбль их предсказаний будет намного больше, чем их индивидуальные предсказательные оценки.
Многие политические теоретики и философы используют теорему Кондорсе о жюри (CJT) для защиты демократии, см. Бреннан [5] и ссылки в ней. Тем не менее, это эмпирический вопрос, выполняется ли теорема в реальной жизни или нет. Обратите внимание, что CJT — это палка о двух концах : она может либо доказать, что правило большинства является (почти) идеальным механизмом для агрегации информации, когда , либо (почти) идеальной катастрофой, когда . Катастрофа будет означать, что систематически выбирается неправильный вариант. Некоторые авторы утверждают, что мы находимся в последнем сценарии. Например, Брайан Каплан подробно доказывал , что знания избирателей систематически смещены в сторону (вероятно) неправильных вариантов. В установке CJT это можно было бы интерпретировать как доказательство .
Недавно был принят другой подход к изучению применимости CJT. [6] Вместо рассмотрения однородного случая каждому избирателю разрешается иметь вероятность , возможно, отличную от других избирателей. Этот случай ранее изучали Дэниел Беренд и Джейкоб Пароуш [7] и включает классическую теорему Кондорсе (когда ) и другие результаты, такие как Чудо агрегации (когда для большинства избирателей и для небольшой их части). Затем, следуя байесовскому подходу, оценивается априорная вероятность (в данном случае априори ) тезиса, предсказанного теоремой. То есть, если мы выберем произвольную последовательность избирателей (т. е. последовательность ), будет ли тезис CJT верен? Ответ — нет. Точнее, если случайная последовательность берется после несмещенного распределения, которое не благоприятствует компетентности, , или некомпетентности, , то тезис, предсказанный теоремой, не будет верен почти наверняка . С этим новым подходом сторонники CJT должны представить веские доказательства компетентности, чтобы преодолеть низкую априорную вероятность. То есть, дело не только в том, что есть доказательства против компетентности (апостериорная вероятность), но и в том, что мы не можем ожидать, что CJT будет работать при отсутствии каких-либо доказательств (априорная вероятность).