stringtranslate.com

Теорема Берри – Эссеена

В теории вероятностей центральная предельная теорема утверждает, что при определенных обстоятельствах распределение вероятностей масштабированного среднего случайной выборки сходится к нормальному распределению по мере увеличения размера выборки до бесконечности. При более сильных предположениях теорема Берри-Эссеена или неравенство Берри-Эссеена дает более количественный результат, поскольку она также определяет скорость, с которой происходит эта сходимость, давая оценку максимальной ошибки аппроксимации между нормальным распределением и истинное распределение масштабированного выборочного среднего. Приближение измеряется расстоянием Колмогорова–Смирнова . В случае независимых выборок скорость сходимости равна n −1/2 , где n — размер выборки, а константа оценивается через третий абсолютный нормированный момент .

Формулировка теоремы

Формулировки теоремы различаются, поскольку она была независимо открыта двумя математиками , Эндрю К. Берри (в 1941 году) и Карлом-Густавом Эссеном (1942), которые затем вместе с другими авторами неоднократно уточняли ее в течение последующих десятилетий.

Одинаково распределенные слагаемые

Одна из версий, несколько жертвующая общностью ради ясности, состоит в следующем:

Существует положительная константа C такая, что если X 1 , X 2 , ... являются iid случайными величинами с E ( X 1 ) = 0, E( X 1 2 ) = σ 2 > 0 и E(| X 1 | 3 ) = ρ < ∞, [примечание 1] и если мы определим
выборочное среднее , где F n — кумулятивная функция распределения
и Φ — кумулятивная функция распределения стандартного нормального распределения , тогда для всех x и n
Иллюстрация различия кумулятивных функций распределения, упомянутых в теореме.

То есть: при наличии последовательности независимых и одинаково распределенных случайных величин , каждая из которых имеет нулевое среднее и положительную дисперсию , если дополнительно третий абсолютный момент конечен, то кумулятивные функции распределения стандартизированного выборочного среднего и стандартного нормального распределения различаются (по вертикали, на графике) не более чем на указанную сумму. Обратите внимание, что ошибка аппроксимации для всех n (и, следовательно , предельная скорость сходимости для достаточно большого неопределенного n ) ограничена порядком n −1/2 .

Расчетные значения константы С с годами заметно уменьшились: от первоначального значения 7,59 Эссеена (1942) до 0,7882 ван Бека (1972), затем 0,7655 Шиганова (1986), затем 0,7056 Шевцовой (2007), затем 0,7005 Шевцовой (2008), затем 0,5894 Тюрина (2009), затем 0,5129 Королева и Шевцовой (2010а), затем 0,4785 Тюрина (2010). Подробный обзор можно найти в статьях Королев и Шевцова (2010a) и Королев и Шевцова (2010b). Наилучшая оценка по состоянию на 2012 год , C  < 0,4748, следует из неравенства

по Шевцовой (2011), поскольку σ 3  ≤ ρ и 0,33554 · 1,415 < 0,4748. Однако если ρ ≥ 1,286σ 3 , то оценка

что также доказано в работе Шевцовой (2011), дает еще более точную оценку сверху.

Эссин (1956) доказал, что константа также удовлетворяет нижней границе

Неидентично распределенные слагаемые

Пусть X 1 , X 2 , ... являются независимыми случайными величинами с E ( X i ) = 0, E ( X i 2 ) = σ i 2 > 0 и E (| X i | 3 ) = ρ i < ∞. Кроме того, пусть
— нормализованная n -я частичная сумма. Обозначим Fn функцию распределения Sn , а Φ функцию распределения стандартного нормального распределения . Для удобства обозначим
В 1941 году Эндрю Берри доказал, что для всех n существует абсолютная константа C1 такая, что
где
Независимо, в 1942 году Карл-Густав Эссен доказал, что для всех n существует абсолютная константа C 0 такая, что
где

Легко убедиться, что ψ0 ≤ψ1 . В связи с этим обстоятельством неравенство (3) принято называть неравенством Берри–Эссеена, а величину ψ 0 – дробью Ляпунова третьего порядка. Более того, в случае, когда слагаемые X 1 , ..., X n имеют одинаковые распределения

и, таким образом, границы, установленные неравенствами (1), (2) и (3), совпадают, кроме константы.

Что касается C 0 , то, очевидно, остается справедливой нижняя граница, установленная Эссеном (1956):

Нижняя граница точно достигается только для некоторых распределений Бернулли (их явные выражения см. в Esseen (1956)).

Верхние границы C 0 впоследствии были понижены с первоначальной оценки 7,59 Эссеена (1942) до (учитывая только недавние результаты) 0,9051 Золотарева (1967), 0,7975 ван Бека (1972), 0,7915 Шиганова (1986). ), 0,6379 и 0,5606 по Тюрину (2009) и Тюрину (2010). По состоянию на 2011 год лучшая оценка составляет 0,5600, полученная Шевцовой (2010).

Многомерная версия

Как и в случае с многомерной центральной предельной теоремой , существует многомерная версия теоремы Берри–Эссеена. [1] [2]

Пусть – независимые -значные случайные векторы, каждый из которых имеет нулевое среднее. «Написать и предположить » обратимо. Пусть будет -мерным гауссианом с тем же средним значением и ковариационной матрицей, что и . Тогда для всех выпуклых множеств

,

где – универсальная константа и (третья степень нормы L 2 ) .

Предполагается, что зависимость от оптимальна, но может и не быть таковой. [2]

Смотрите также

Примечания

  1. ^ Поскольку случайные величины распределены одинаково, X 2 , X 3 , ... все имеют те же моменты , что и X 1 .

Рекомендации

  1. ^ Бенткус, Видмантас. «Связка типа Ляпунова в R d ». Теория вероятностей и ее приложения 49.2 (2005): 311–323.
  2. ^ Аб Райч, Мартин (2019). «Многомерная теорема Берри--Эссеена с явными константами». Бернулли . 25 (4А): 2824–2853. arXiv : 1802.06475 . дои : 10.3150/18-BEJ1072. ISSN  1350-7265. S2CID  119607520.

Внешние ссылки