Сходимость распределения биномиального к нормальному распределению
В системе, ячейки которой заполняются в соответствии с биномиальным распределением (такой как « машина для зерен » Гальтона , показанная здесь), при достаточном количестве испытаний (здесь ряды булавок, каждая из которых заставляет упавший «бобин» падать в сторону слева или справа), форма, представляющая распределение вероятностей k успехов в n испытаниях (см. нижнюю часть рис. 7), примерно соответствует распределению Гаусса со средним значением np и дисперсией np (1− p ), предполагая, что испытания независимы и успехи происходят с вероятностью p .Представьте себе, что вы подбрасываете набор из n монет очень большое количество раз и подсчитываете количество выпадающих «орлов» каждый раз. Возможное количество решек при каждом броске k колеблется от 0 до n вдоль горизонтальной оси, а вертикальная ось представляет относительную частоту появления результата k голов. Таким образом, высота каждой точки — это вероятность наблюдения k решек при подбрасывании n монет ( биномиальное распределение, основанное на n испытаниях). Согласно теореме Муавра-Лапласа, с увеличением n форма дискретного распределения сходится к непрерывной кривой Гаусса нормального распределения .
Теорема появилась во втором издании « Доктрины шансов » Абрахама де Муавра , опубликованном в 1738 году. Хотя де Муавр не использовал термин «испытания Бернулли», он писал о вероятностном распределении количества выпадений «орла», когда монету подбрасывают 3600 раз. [1]
Это один из выводов конкретной функции Гаусса , используемой в нормальном распределении.
Это частный случай центральной предельной теоремы, поскольку процесс Бернулли можно рассматривать как выделение независимых случайных величин из бимодального дискретного распределения с ненулевой вероятностью только для значений 0 и 1. В этом случае модели биномиального распределения количество успехов (т. е. количество единиц), тогда как центральная предельная теорема утверждает, что при достаточно большом n распределение выборочных средних будет приблизительно нормальным. Однако, поскольку в этом случае доля успехов (т. е. количество единиц, разделенное на количество попыток n ) равна выборочному среднему , распределение долей успехов (описываемое биномиальным распределением, разделенным на константу n ) и распределение выборочных средних (приблизительно нормальное при больших n из-за центральной предельной теоремы) эквивалентны.
Теорема
По мере увеличения n для k в окрестности np мы можем аппроксимировать [2] [ 3]
в том смысле, что отношение левой части к правой стремится к 1 при n → ∞.
Доказательство
Более строго теорему можно сформулировать следующим образом: при биномиально распределенной случайной величине приближается к стандартной нормали как , при этом отношение вероятностной массы к предельной нормальной плотности равно 1. Это можно показать для произвольного ненулевого и конечного числа точка . На немасштабированной кривой для это будет точка, заданная формулой
Например, при значении 3 остается 3 стандартных отклонения от среднего значения немасштабированной кривой.
Нормальное распределение со средним и стандартным отклонением определяется дифференциальным уравнением (DE).
с начальным условием, заданным аксиомой вероятности .
Предел биномиального распределения приближается к нормальному, если бином удовлетворяет этому DE. Поскольку бином дискретен, уравнение начинается как разностное уравнение , предел которого превращается в DE. В разностных уравнениях используется дискретная производная , изменение размера шага 1. При дискретная производная становится непрерывной производной . Следовательно, доказательство должно показать только то, что для немасштабированного биномиального распределения
как .
Требуемый результат можно показать непосредственно:
Последнее справедливо, поскольку член доминирует как в знаменателе, так и в числителе, поскольку .
Поскольку константа принимает только целые значения, константа подвержена ошибке округления. Однако максимум этой ошибки , является исчезающей величиной. [4]
Альтернативное доказательство
Доказательство состоит в преобразовании левой части (в формулировке теоремы) в правую тремя приближениями.
Во-первых, согласно формуле Стирлинга факториал большого числа n можно заменить приближением
Таким образом
Затем аппроксимация используется для сопоставления приведенного выше корня с желаемым корнем в правой части.
Наконец, выражение переписывается как экспоненциальное и используется приближение ряда Тейлора для ln(1+x):
Затем
Каждое « » в приведенном выше аргументе представляет собой утверждение о том, что две величины асимптотически эквивалентны по мере увеличения n , в том же смысле, что и в исходном утверждении теоремы, т. е. что отношение каждой пары величин приближается к 1 при n → ∞.
Смотрите также
Предельная теорема Пуассона - альтернативное приближение биномиального распределения для больших значений n .
Примечания
^ Уокер, Хелен М. (1985). «Де Муавр о законе нормальной вероятности» (PDF) . В Смите, Дэвид Юджин (ред.). Справочник по математике. Дувр. п. 78. ИСБН 0-486-64690-4. Но хотя проведение бесконечного числа экспериментов нецелесообразно, предыдущие выводы вполне могут быть применены к конечным числам, при условии, что они велики, например, если провести 3600 экспериментов, получится n = 3600, следовательно, ½ n будет be = 1800 и ½√ n 30, то Вероятность того, что Событие не появится ни чаще, чем 1830 раз, ни реже, чем 1770 раз, будет равна 0,682688.
^ Папулис, Афанасиос ; Пиллаи, С. Унникришна (2002). Вероятность, случайные величины и случайные процессы (4-е изд.). Бостон: МакГроу-Хилл. ISBN0-07-122661-3.
^ Феллер, В. (1968). Введение в теорию вероятностей и ее приложения . Том. 1. Уайли. Раздел VII.3. ISBN0-471-25708-7.