В статистике вопрос проверки честности монеты — это вопрос, важность которого заключается, во-первых, в предоставлении простой задачи, на которой можно проиллюстрировать основные идеи статистического вывода , и, во-вторых, в предоставлении простой задачи, которую можно использовать для сравнения различных конкурирующих методов статистического вывода, включая теорию принятия решений . Практическая задача проверки честности монеты может считаться легко решаемой путем проведения достаточно большого количества испытаний, но статистика и теория вероятностей могут дать рекомендации по двум типам вопросов; в частности, по вопросам о том, сколько испытаний следует провести, и по вопросам точности оценки вероятности выпадения орла, полученной из заданной выборки испытаний.
Честная монета — это идеализированное рандомизирующее устройство с двумя состояниями (обычно называемыми «орел» и «решка» ), которые могут возникнуть с равной вероятностью. Оно основано на подбрасывании монеты, широко используемом в спорте и других ситуациях, где требуется дать двум сторонам одинаковые шансы на победу. Используется либо специально разработанный чип , либо, что более типично, простая денежная монета , хотя последняя может быть немного «несправедливой» из-за асимметричного распределения веса, что может привести к тому, что одно состояние будет происходить чаще, чем другое, давая одной из сторон несправедливое преимущество. [1] Поэтому может потребоваться экспериментальная проверка того, является ли монета на самом деле «честной» — то есть, составляет ли вероятность того, что монета упадет на любую сторону при подбрасывании, ровно 50%. Конечно, невозможно исключить произвольно малые отклонения от справедливости, такие, которые, как можно ожидать, повлияют только на одно подбрасывание за всю жизнь подбрасываний; также всегда возможно, что нечестная (или « предвзятая ») монета выпадет ровно 10 орлов за 20 подбрасываний. Поэтому любой тест на справедливость должен устанавливать только определенную степень уверенности в определенной степени справедливости (определенное максимальное смещение). В более строгой терминологии проблема заключается в определении параметров процесса Бернулли , учитывая только ограниченную выборку испытаний Бернулли .
В этой статье описываются экспериментальные процедуры определения честности или нечестности монеты. Существует множество статистических методов анализа такой экспериментальной процедуры. В этой статье проиллюстрированы два из них.
Оба метода предполагают эксперимент (или испытание), в котором монета подбрасывается много раз, и результат каждого подбрасывания записывается. Затем результаты можно проанализировать статистически, чтобы решить, является ли монета «честной» или «вероятно нечестной».
Важное различие между этими двумя подходами заключается в том, что первый подход придает некоторый вес предыдущему опыту подбрасывания монет, а второй — нет. Вопрос о том, какой вес придавать предыдущему опыту в зависимости от качества (достоверности) этого опыта, обсуждается в рамках теории достоверности .
Одним из методов является расчет апостериорной функции плотности вероятности байесовской теории вероятностей .
Тест проводится путем подбрасывания монеты N раз и регистрации наблюдаемых чисел орла, h и решки, t . Символы H и T представляют собой более обобщенные переменные, выражающие число орлов и решек соответственно, которые могли бы наблюдаться в эксперименте. Таким образом, N = H + T = h + t .
Далее, пусть r будет фактической вероятностью получения орла при одном подбрасывании монеты. Это свойство монеты, которое исследуется. Используя теорему Байеса , апостериорная плотность вероятности r, условная на h и t, выражается следующим образом:
где g ( r ) представляет собой априорное распределение плотности вероятности r , которое лежит в диапазоне от 0 до 1.
Априорное распределение плотности вероятности суммирует то, что известно о распределении r при отсутствии какого-либо наблюдения. Мы предположим, что априорное распределение r равномерно на интервале [0, 1]. То есть g ( r ) = 1. (На практике было бы более уместно предположить априорное распределение, которое имеет гораздо больший вес в области около 0,5, чтобы отразить наш опыт с реальными монетами .)
Вероятность выпадения h орлов при N подбрасываниях монеты с вероятностью выпадения орла, равной r, определяется биномиальным распределением :
Подставим это в предыдущую формулу:
Фактически это бета-распределение ( сопряженное априорное распределение для биномиального распределения), знаменатель которого можно выразить через бета-функцию :
Поскольку предполагается равномерное априорное распределение, а h и t являются целыми числами, это также можно записать в терминах факториалов :
Например, пусть N = 10, h = 7, т.е. монета подбрасывается 10 раз и получается 7 орлов:
График справа показывает функцию плотности вероятности r при условии, что за 10 подбрасываний выпало 7 орлов. (Примечание: r — вероятность выпадения орла при однократном подбрасывании одной и той же монеты.)
Вероятность для беспристрастной монеты (определяемой для этой цели как монета, вероятность выпадения орла которой составляет от 45% до 55%)
(незначительно по сравнению с альтернативной гипотезой (смещенная монета). Однако оно недостаточно мало, чтобы заставить нас поверить, что монета имеет значительное смещение. Эта вероятность немного выше, чем наше предположение о вероятности того, что монета была честной, соответствующей равномерному априорному распределению, которое составляло 10%. При использовании априорного распределения, которое отражает наши априорные знания о том, что такое монета и как она действует, апостериорное распределение не будет благоприятствовать гипотезе смещения. Однако количество испытаний в этом примере (10 подбрасываний) очень мало, и при большем количестве испытаний выбор априорного распределения будет несколько менее значимым.)
При равномерном априорном распределении апостериорное распределение вероятностей f ( r | H = 7, T = 3) достигает своего пика при r = h / ( h + t ) = 0,7; это значение называется максимальной апостериорной оценкой (MAP) r . Также при равномерном априорном распределении ожидаемое значение r при апостериорном распределении равно
Используя этот подход, чтобы определить, сколько раз следует подбрасывать монету, требуются два параметра:
где n — количество испытаний (которое было обозначено как N в предыдущем разделе).
Эта стандартная функция ошибок p имеет максимум при . Кроме того, в случае подбрасывания монеты, вероятно, что p будет недалеко от 0,5, поэтому разумно принять p = 0,5 в следующем:
И, следовательно, значение максимальной ошибки (E) определяется как
Решая задачу о необходимом количестве подбрасываний монеты, n ,
1. Если желаемая максимальная погрешность составляет 0,01, сколько раз следует подбросить монету?
2. Если монету подбросить 10000 раз, какова максимальная ошибка оценки значения (фактической вероятности выпадения орла при подбрасывании монеты)?
3. Монета подбрасывается 12000 раз, и в результате выпадает 5961 орел (и 6039 решек). В каком интервале лежит значение (истинная вероятность выпадения орла), если желаемый уровень достоверности составляет 99,999%?
Теперь найдем значение Z, соответствующее уровню достоверности 99,999%.
Теперь вычислите E
Интервал, содержащий r, равен:
Другие подходы к вопросу проверки честности монеты доступны с использованием теории принятия решений , применение которой потребовало бы формулировки функции потерь или функции полезности , описывающей последствия принятия данного решения. Подход, который избегает необходимости либо функции потерь, либо априорной вероятности (как в байесовском подходе), — это «выборка принятия». [2]
Вышеприведенный математический анализ для определения того, является ли монета честной, может быть применен и в других целях. Например: