В теории вероятностей центральная предельная теорема утверждает, что при определенных обстоятельствах распределение вероятностей масштабированного среднего случайной выборки сходится к нормальному распределению по мере увеличения размера выборки до бесконечности. При более сильных предположениях теорема Берри-Эссеена или неравенство Берри-Эссеена дает более количественный результат, поскольку она также определяет скорость, с которой происходит эта сходимость, давая оценку максимальной ошибки аппроксимации между нормальным распределением и истинное распределение масштабированного выборочного среднего. Приближение измеряется расстоянием Колмогорова–Смирнова . В случае независимых выборок скорость сходимости равна n −1/2 , где n — размер выборки, а константа оценивается через третий абсолютный нормированный момент .
Формулировка теоремы
Формулировки теоремы различаются, поскольку она была независимо открыта двумя математиками , Эндрю К. Берри (в 1941 году) и Карлом-Густавом Эссеном (1942), которые затем вместе с другими авторами неоднократно уточняли ее в течение последующих десятилетий.
Одинаково распределенные слагаемые
Одна из версий, несколько жертвующая общностью ради ясности, состоит в следующем:
Существует положительная константа C такая, что если X 1 , X 2 , ... являются iid случайными величинами с E ( X 1 ) = 0, E( X 1 2 ) = σ 2 > 0 и E(| X 1 | 3 ) = ρ < ∞, [примечание 1] и если мы определим
выборочное среднее , где F n — кумулятивная функция распределения
и Φ — кумулятивная функция распределения стандартного нормального распределения , тогда для всех x и n
Иллюстрация различия кумулятивных функций распределения, упомянутых в теореме.
То есть: при наличии последовательности независимых и одинаково распределенных случайных величин , каждая из которых имеет нулевое среднее и положительную дисперсию , если дополнительно третий абсолютный момент конечен, то кумулятивные функции распределения стандартизированного выборочного среднего и стандартного нормального распределения различаются (по вертикали, на графике) не более чем на указанную сумму. Обратите внимание, что ошибка аппроксимации для всех n (и, следовательно , предельная скорость сходимости для достаточно большого неопределенного n ) ограничена порядком n −1/2 .
Расчетные значения константы С с годами заметно уменьшились: от первоначального значения 7,59 Эссеена (1942) до 0,7882 ван Бека (1972), затем 0,7655 Шиганова (1986), затем 0,7056 Шевцовой (2007), затем 0,7005 Шевцовой (2008), затем 0,5894 Тюрина (2009), затем 0,5129 Королева и Шевцовой (2010а), затем 0,4785 Тюрина (2010). Подробный обзор можно найти в статьях Королев и Шевцова (2010a) и Королев и Шевцова (2010b). Наилучшая оценка по состоянию на 2012 год [update], C < 0,4748, следует из неравенства
по Шевцовой (2011), поскольку σ 3 ≤ ρ и 0,33554 · 1,415 < 0,4748. Однако если ρ ≥ 1,286σ 3 , то оценка
что также доказано в работе Шевцовой (2011), дает еще более точную оценку сверху.
Эссин (1956) доказал, что константа также удовлетворяет нижней границе
Неидентично распределенные слагаемые
Пусть X 1 , X 2 , ... являются независимыми случайными величинами с E ( X i ) = 0, E ( X i 2 ) = σ i 2 > 0 и E (| X i | 3 ) = ρ i < ∞. Кроме того, пусть
В 1941 году Эндрю Берри доказал, что для всех n существует абсолютная константа C1 такая, что
где
Независимо, в 1942 году Карл-Густав Эссен доказал, что для всех n существует абсолютная константа C 0 такая, что
где
Легко убедиться, что ψ0 ≤ψ1 . В связи с этим обстоятельством неравенство (3) принято называть неравенством Берри–Эссеена, а величину ψ 0 – дробью Ляпунова третьего порядка. Более того, в случае, когда слагаемые X 1 , ..., X n имеют одинаковые распределения
и, таким образом, границы, установленные неравенствами (1), (2) и (3), совпадают, кроме константы.
Что касается C 0 , то, очевидно, остается справедливой нижняя граница, установленная Эссеном (1956):
Нижняя граница точно достигается только для некоторых распределений Бернулли (их явные выражения см. в Esseen (1956)).
Верхние границы C 0 впоследствии были понижены с первоначальной оценки 7,59 Эссеена (1942) до (учитывая только недавние результаты) 0,9051 Золотарева (1967), 0,7975 ван Бека (1972), 0,7915 Шиганова (1986). ), 0,6379 и 0,5606 по Тюрину (2009) и Тюрину (2010). По состоянию на 2011 год [update]лучшая оценка составляет 0,5600, полученная Шевцовой (2010).
Пусть – независимые -значные случайные векторы, каждый из которых имеет нулевое среднее. «Написать и предположить » обратимо. Пусть будет -мерным гауссианом с тем же средним значением и ковариационной матрицей, что и . Тогда для всех выпуклых множеств
,
где – универсальная константа и (третья степень нормы L 2 ) .
Предполагается, что зависимость от оптимальна, но может и не быть таковой. [2]
^ Поскольку случайные величины распределены одинаково, X 2 , X 3 , ... все имеют те же моменты , что и X 1 .
Рекомендации
^ Бенткус, Видмантас. «Связка типа Ляпунова в R d ». Теория вероятностей и ее приложения 49.2 (2005): 311–323.
^ Аб Райч, Мартин (2019). «Многомерная теорема Берри--Эссеена с явными константами». Бернулли . 25 (4А): 2824–2853. arXiv : 1802.06475 . дои : 10.3150/18-BEJ1072. ISSN 1350-7265. S2CID 119607520.
Берри, Эндрю К. (1941). «Точность гауссова приближения суммы независимых переменных». Труды Американского математического общества . 49 (1): 122–136. дои : 10.1090/S0002-9947-1941-0003498-3 . JSTOR 1990053.
Дарретт, Ричард (1991). Вероятность: теория и примеры . Пасифик Гроув, Калифорния: Уодсворт и Брукс/Коул. ISBN 0-534-13206-5 .
Эссен, Карл-Густав (1942). «О пределе погрешности Ляпунова в теории вероятностей». Архив для математики, астрономии и физики . А28 : 1–19. ISSN 0365-4133.
Эссен, Карл-Густав (1956). «Моментное неравенство с применением к центральной предельной теореме». Сканд. Актуариетидскр . 39 : 160–170.
Феллер, Уильям (1972). Введение в теорию вероятностей и ее приложения, том II (2-е изд.). Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-25709-5 .
Королев, В. Ю.; Шевцова, ИГ (2010а). «О верхней оценке абсолютной константы в неравенстве Берри – Эссеена». Теория вероятностей и ее приложения . 54 (4): 638–658. дои : 10.1137/S0040585X97984449.
Королев, Виктор; Шевцова, Ирина (2010б). «Улучшение неравенства Берри – Эссеена с применением к Пуассону и смешанным случайным суммам Пуассона». Скандинавский актуарный журнал . 2012 (2): 1–25. arXiv : 0912.2795 . дои : 10.1080/03461238.2010.485370. S2CID 115164568.
Манукян, Эдвард Б. (1986). Современные понятия и теоремы математической статистики . Нью-Йорк: Springer-Verlag. ISBN 0-387-96186-0 .
Серфлинг, Роберт Дж. (1980). Аппроксимационные теоремы математической статистики . Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-02403-1 .
Шевцова, ИГ (2008). «Об абсолютной константе в неравенстве Берри – Эссеена». Сборник статей молодых ученых факультета вычислительной математики и кибернетики (5): 101–110.
Шевцова, Ирина (2007). «Уточнение верхней границы абсолютной константы в неравенстве Берри – Эссеена». Теория вероятностей и ее приложения . 51 (3): 549–553. дои : 10.1137/S0040585X97982591.
Шевцова, Ирина (2010). «Улучшение оценок скорости сходимости в теореме Ляпунова». Доклады Математики . 82 (3): 862–864. дои : 10.1134/S1064562410060062. S2CID 122973032.
Шевцова, Ирина (2011). «Об абсолютных константах в неравенствах типа Берри Эссеена для одинаково распределенных слагаемых». arXiv : 1111.6554 [мат.PR].
Шиганов, И.С. (1986). «Уточнение верхней границы константы в остаточном члене центральной предельной теоремы». Журнал советской математики . 35 (3): 109–115. дои : 10.1007/BF01121471 . S2CID 120112396.
Тюрин И.С. (2009). «О точности гауссова приближения». Доклады Математики . 80 (3): 840–843. дои : 10.1134/S1064562409060155. S2CID 121383741.
ван Бик, П. (1972). «Применение методов Фурье к проблеме усиления неравенства Берри – Эссеена». Zeitschrift für Wahrscheinlichkeitstheorie und Verwandte Gebiete . 23 (3): 187–196. дои : 10.1007/BF00536558 . S2CID 121036017.