В теории вероятностей и статистике последовательность независимых испытаний Бернулли с вероятностью успеха 1/2 в каждом испытании метафорически называется честной монетой . Монета, для которой вероятность не равна 1/2, называется предвзятой или нечестной монетой . В теоретических исследованиях предположение о честности монеты часто делается путем ссылки на идеальную монету .
Джон Эдмунд Керрич проводил эксперименты по подбрасыванию монеты и обнаружил, что монета, сделанная из деревянного диска размером с корону и покрытая с одной стороны свинцом, приземлялась орлом (деревянной стороной вверх) 679 раз из 1000. [1] В этом эксперименте монету подбрасывали, удерживая ее на указательном пальце, подбрасывая ее большим пальцем так, чтобы она прокрутилась в воздухе около фута, прежде чем приземлиться на плоскую ткань, расстеленную на столе. Эдвин Томпсон Джейнс утверждал, что когда монету ловят в руку, вместо того, чтобы позволить ей отскочить, физическое смещение в монете незначительно по сравнению с методом подбрасывания, когда при достаточной практике можно заставить монету приземляться орлом в 100% случаев. [2] Исследование проблемы проверки того, является ли монета честной, является общепризнанным педагогическим инструментом в обучении статистике .
В теории вероятностей честная монета определяется как вероятностное пространство , которое в свою очередь определяется пространством выборки , пространством событий и мерой вероятности . Используя для орла и для решки, пространство выборки монеты определяется как:
Пространство событий для монеты включает все наборы результатов из выборочного пространства, которым может быть назначена вероятность, которая является полным набором мощности . Таким образом, пространство событий определяется как:
— это событие, при котором не происходит ни один из результатов (что невозможно и, следовательно, может иметь вероятность 0), и — это событие, при котором происходит любой из результатов (что гарантировано и может иметь вероятность 1). Поскольку монета честная, вероятность любого отдельного результата составляет 50-50. Тогда мера вероятности определяется функцией:
Таким образом, полное вероятностное пространство, которое определяет честную монету, — это триплет, как определено выше. Обратите внимание, что это не случайная величина , поскольку орел и решка не имеют собственных числовых значений, которые вы могли бы найти на честной двузначной кости. Случайная величина добавляет дополнительную структуру присвоения числового значения каждому результату. Обычные варианты — или .
Вероятностные и статистические свойства игр с подбрасыванием монеты часто используются в качестве примеров как в вводных, так и в продвинутых учебниках, и они в основном основаны на предположении, что монета является честной или «идеальной». Например, Феллер использует эту основу для введения как идеи случайных блужданий , так и для разработки тестов на однородность в последовательности наблюдений, рассматривая свойства серий одинаковых значений в последовательности. [3] Последнее приводит к тесту на серии . Временной ряд, состоящий из результата подбрасывания честной монеты, называется процессом Бернулли .
Если мошенник изменил монету, чтобы предпочесть одну сторону другой (необъективная монета), монету все равно можно использовать для честных результатов, немного изменив игру. Джон фон Нейман дал следующую процедуру: [4]
Причина, по которой этот процесс дает справедливый результат, заключается в том, что вероятность выпадения орла, а затем решки должна быть такой же, как вероятность выпадения решки, а затем орла, поскольку монета не меняет своего смещения между подбрасываниями, и два подбрасывания независимы. Это работает только в том случае, если получение одного результата в испытании не меняет смещения в последующих испытаниях, что имеет место для большинства нековких монет (но не для таких процессов, как урна Пойя ). Исключая события двух орлов и двух решек путем повторения процедуры, подбрасывающий монету остается только с двумя оставшимися результатами, имеющими эквивалентную вероятность. Эта процедура работает только в том случае, если броски правильно парные; если часть пары повторно используется в другой паре, справедливость может быть нарушена. Кроме того, монета не должна быть настолько смещена, чтобы одна сторона имела вероятность, равную нулю .
Этот метод можно расширить, также рассмотрев последовательности из четырех бросков. То есть, если монета подбрасывается дважды, но результаты совпадают, и монета подбрасывается еще дважды, но результаты совпадают теперь уже для противоположной стороны, то можно использовать первый результат. Это потому, что HHTT и TTHH равновероятны. Это можно расширить до любого кратного 2.
Ожидаемое значение подбрасываний в n-й игре несложно вычислить, сначала обратите внимание, что на шаге 3, независимо от события , мы подбросили монету дважды, но на шаге 2 ( или ) нам также придется все переделать, так что у нас будет 2 подбрасывания плюс ожидаемое значение подбрасываний следующей игры, то есть, но поскольку мы начинаем заново, ожидаемое значение следующей игры такое же, как и значение предыдущей игры или любой другой игры, поэтому оно на самом деле не зависит от n, таким образом (это можно понять, поскольку процесс является мартингалом , где повторное взятие ожидания дает нам это, но из-за закона полного ожидания мы получаем это ), следовательно, у нас есть:
Чем более предвзята наша монета, тем больше вероятность, что нам придется провести большее количество испытаний, прежде чем будет получен справедливый результат.
Предположим, что смещение известно. В этом разделе мы предоставим простой алгоритм [5] , который улучшает ожидаемое количество подбрасываний монеты. Алгоритм использует идеальную вероятность , которая Сначала рассмотрим алгоритм для генерации произвольной монеты со смещением . Чтобы получить честную монету, алгоритм сначала устанавливает , а затем выполняет следующий алгоритм.
Обратите внимание, что приведенный выше алгоритм не достигает оптимального ожидаемого числа подбрасываний монеты, которое равно , вот бинарная функция энтропии . Существуют алгоритмы, которые достигают этого оптимального значения в ожидании. Однако эти алгоритмы более сложны, чем показанный выше.
Приведенный выше алгоритм имеет ожидаемое количество смещенных подбрасываний монеты , равное , что ровно вдвое меньше по сравнению с трюком фон Неймана.
Корректность вышеприведенного алгоритма является идеальным упражнением условного ожидания. Теперь проанализируем ожидаемое количество подбрасываний монеты.
Учитывая смещение и текущее значение , можно определить функцию , которая представляет ожидаемое количество подбрасываний монеты до возврата результата. Рекуррентное соотношение для можно описать следующим образом.
Это волшебным образом приводит к следующей функции:
Когда , ожидаемое количество подбрасываний монеты равно желаемому.
Идею этого алгоритма можно расширить для генерации любой несимметричной монеты с заданной вероятностью.
любой, кто знаком с законом сохранения момента импульса, может, после некоторой практики, жульничать в обычной игре в подбрасывание монеты и делать броски со 100-процентной точностью. Вы можете получить любую частоту выпадения орла, какую захотите; и смещение монеты вообще не оказывает влияния на результаты!
{{cite book}}
: CS1 maint: bot: original URL status unknown (link)