Закон действительно больших чисел ( статистическая поговорка ), приписываемый Перси Диаконису и Фредерику Мостеллеру , гласит, что при достаточно большом количестве независимых выборок любой крайне неправдоподобный (т. е. маловероятный в любой отдельной выборке, но с постоянной вероятностью, строго большей 0 в любой выборке) результат, скорее всего, будет наблюдаться. [1] Поскольку мы никогда не считаем это примечательным, когда происходят вероятные события, мы выделяем маловероятные события и замечаем их больше. Закон часто используется для фальсификации различных псевдонаучных заявлений; как таковой, он иногда критикуется маргинальными учеными . [2] [3]
Закон можно перефразировать так: «большие числа тоже обманывают». Более конкретно, скептик Пенн Джиллетт сказал: «В Нью-Йорке шансы один к миллиону случаются восемь раз в день » (население около 8 000 000 человек). [4]
Для упрощенного примера закона предположим, что данное событие происходит с вероятностью 0,1% в одном испытании. Тогда вероятность того, что это так называемое маловероятное событие не произойдет ( маловероятность) в одном испытании, составляет 99,9% (0,999).
Однако для выборки всего из 1000 независимых испытаний вероятность того, что событие не произойдет ни в одном из них, даже один раз (маловероятность), составляет всего [5] 0,999 1000 ≈ 0,3677, или 36,77%. Тогда вероятность того, что событие произойдет, по крайней мере, один раз из 1000 испытаний, составляет (1 − 0,999 1000 ≈ 0,6323, или ) 63,23%. Это означает, что это «маловероятное событие» имеет вероятность 63,23% произойти, если будет проведено 1000 независимых испытаний. Если число испытаний увеличить до 10 000, вероятность того, что это произойдет хотя бы один раз из 10 000 испытаний, возрастет до (1 − 0,999 10000 ≈ 0,99995, или ) 99,995%. Другими словами, крайне маловероятное событие, при достаточном количестве независимых испытаний с некоторым фиксированным числом розыгрышей в испытании, произойдет еще более вероятно.
Для события X, которое происходит с очень низкой вероятностью 0,0000001% (в любой отдельной выборке, см. также почти никогда ), рассмотрение 1 000 000 000 как «действительно большого» числа независимых выборок дает вероятность появления X, равную 1 − 0,999999999 10000000000 ≈ 0,63 = 63% , а число независимых выборок, равное размеру человеческой популяции (в 2021 году), дает вероятность события X: 1 − 0,999999999 7900000000 ≈ 0,9996 = 99,96%. [6]
Эти вычисления можно формализовать на математическом языке следующим образом: «вероятность маловероятного события X, происходящего в N независимых испытаниях, может стать сколь угодно близкой к 1, независимо от того, насколько мала вероятность события X в одном отдельном испытании, при условии, что N действительно велико». [7]
Например, когда вероятность маловероятного события X не является малой константой, а уменьшается пропорционально N, см. график.
В системах с высокой доступностью необходимо учитывать даже очень маловероятные события, в последовательных системах даже когда вероятность отказа отдельного элемента очень мала, после их соединения в большом количестве возрастает вероятность отказа всей системы (чтобы сделать отказы системы менее вероятными, можно использовать избыточность — в таких параллельных системах даже крайне ненадежные избыточные части, соединенные в большом количестве, повышают вероятность безотказной работы до требуемого высокого уровня ). [8]
Закон возникает в критике псевдонауки и иногда называется эффектом Джин Диксон (см. также Postdiction ). Он гласит, что чем больше предсказаний делает экстрасенс, тем больше шансов, что одно из них «сбудется». Таким образом, если одно из них сбывается, экстрасенс ожидает, что мы забудем подавляющее большинство того, что не произошло ( предвзятость подтверждения ). [9] Люди могут быть подвержены этому заблуждению.
Другое похожее проявление закона можно найти в азартных играх , где игроки склонны помнить свои выигрыши и забывать свои проигрыши, [10] даже если последние намного превосходят первые (хотя в зависимости от конкретного человека, обратное также может быть верно, когда они думают, что им нужно больше анализа своих проигрышей, чтобы добиться тонкой настройки своей игровой системы [11] ). Микал Аасвед связывает это с «избирательным смещением памяти», позволяющим игрокам мысленно дистанцироваться от последствий своей азартной игры [11] путем поддержания завышенного представления о своих реальных выигрышах (или проигрышах в противоположном случае – «избирательное смещение памяти в любом направлении»).