stringtranslate.com

Центральная предельная теорема

В теории вероятностей центральная предельная теорема ( ЦПТ ) утверждает, что при соответствующих условиях распределение нормализованной версии выборочного среднего сходится к стандартному нормальному распределению . Это справедливо даже в том случае, если исходные переменные сами по себе не распределены нормально . Существует несколько версий ЦПТ, каждая из которых применяется в контексте различных условий.

Теорема является ключевой концепцией в теории вероятностей, поскольку она подразумевает, что вероятностные и статистические методы, которые работают для нормальных распределений, могут быть применимы ко многим задачам, связанным с другими типами распределений.

Эта теорема претерпела множество изменений в ходе формального развития теории вероятностей. Предыдущие версии теоремы датируются 1811 годом, но в своей современной форме она была точно сформулирована только в 1920 году. [1]

В статистике ЦЛТ можно сформулировать следующим образом: пусть обозначает статистическую выборку размера из совокупности с ожидаемым значением (средним) и конечной положительной дисперсией , и пусть обозначает выборочное среднее (которое само по себе является случайной величиной ). Тогда пределом распределения является нормальное распределение со средним и дисперсией . [2]

Другими словами, предположим, что получена большая выборка наблюдений , каждое наблюдение получено случайным образом, не зависящим от значений других наблюдений, и что вычисляется среднее ( среднее арифметическое ) наблюдаемых значений. Если эта процедура выполняется много раз, что приводит к набору наблюдаемых средних значений, центральная предельная теорема гласит, что если размер выборки достаточно велик, распределение вероятностей этих средних значений будет близко приближаться к нормальному распределению.

Центральная предельная теорема имеет несколько вариантов. В своей общей форме случайные величины должны быть независимыми и одинаково распределенными (iid). Это требование можно ослабить; сходимость среднего к нормальному распределению происходит также для неидентичных распределений или для ненезависимых наблюдений, если они удовлетворяют определенным условиям.

Самая ранняя версия этой теоремы о том, что нормальное распределение может быть использовано в качестве приближения к биномиальному распределению , — это теорема Муавра–Лапласа .

Независимые последовательности

Какова бы ни была форма распределения популяции, распределение выборки стремится к гауссову, а его дисперсия задается центральной предельной теоремой. [3]

Классический CLT

Пусть — последовательность независимых случайных величин, имеющих распределение с ожидаемым значением, заданным как и конечную дисперсию, заданную как Предположим, нас интересует выборочное среднее

По закону больших чисел выборочное среднее сходится почти наверняка (и, следовательно, также сходится по вероятности ) к ожидаемому значению как

Классическая центральная предельная теорема описывает размер и форму распределения стохастических флуктуаций вокруг детерминированного числа во время этой сходимости. Точнее, она утверждает, что по мере увеличения распределение разницы между средним значением выборки и ее пределом при умножении на фактор — то есть, — приближается к нормальному распределению со средним значением и дисперсией Для достаточно большого распределение становится произвольно близким к нормальному распределению со средним значением и дисперсией

Полезность теоремы заключается в том, что распределение приближается к нормальному независимо от формы распределения индивидуума . Формально теорему можно сформулировать следующим образом:

ЦПТ Линдеберга–Леви  —  Предположим, что есть последовательность независимых случайных величин с и Тогда, по мере приближения к бесконечности, случайные величины сходятся по распределению к нормальному : [4]

В этом случае сходимость по распределению означает, что кумулятивные функции распределения сходятся поточечно к функции распределения распределения : для каждого действительного числа , где — стандартная нормальная функция распределения, вычисленная при . Сходимость равномерна по в том смысле, что где обозначает точную верхнюю границу (или супремум ) множества. [5]

Ляпунов ЦЛТ

В этом варианте центральной предельной теоремы случайные величины должны быть независимыми, но не обязательно одинаково распределенными. Теорема также требует, чтобы случайные величины имели моменты некоторого порядка , и чтобы скорость роста этих моментов была ограничена условием Ляпунова, приведенным ниже.

Lyapunov CLT [6]  —  Предположим, что есть последовательность независимых случайных величин, каждая из которых имеет конечное математическое ожидание и дисперсию . Определить

Если для некоторого выполняется условие Ляпунова , то сумма сходится по распределению к стандартной нормальной случайной величине, при этом стремится к бесконечности:

На практике обычно проще всего проверить условие Ляпунова для .

Если последовательность случайных величин удовлетворяет условию Ляпунова, то она также удовлетворяет условию Линдеберга. Обратное, однако, не выполняется.

Lindeberg (-Feller) CLT

В той же постановке и с теми же обозначениями, что и выше, условие Ляпунова можно заменить следующим более слабым условием (от Линдеберга 1920 г.).

Предположим, что для каждого , где есть индикаторная функция . Тогда распределение стандартизированных сумм сходится к стандартному нормальному распределению .

Многомерный CLT

Доказательства, использующие характеристические функции, можно распространить на случаи, когда каждый индивидуум является случайным вектором в , со средним вектором и ковариационной матрицей (среди компонентов вектора), и эти случайные векторы независимы и одинаково распределены. Многомерная центральная предельная теорема утверждает, что при масштабировании суммы сходятся к многомерному нормальному распределению . [7] Суммирование этих векторов выполняется покомпонентно.

Пусть — независимые случайные векторы. Сумма случайных векторов равна , а их среднее значение равно Поэтому,

Многомерная центральная предельная теорема утверждает, что если ковариационная матрица равна

Многомерная центральная предельная теорема может быть доказана с помощью теоремы Крамера–Вольда . [7]

Скорость сходимости определяется следующим результатом типа Берри–Эссеена :

Теорема [8]  —  Пусть будут независимыми -значными случайными векторами, каждый из которых имеет нулевое среднее значение. Запишем и предположим , что обратимо. Пусть будет -мерным гауссовым с тем же средним и той же ковариационной матрицей, что и . Тогда для всех выпуклых множеств , где — универсальная константа, , а обозначает евклидову норму на .

Неизвестно, необходим ли этот фактор. [9]

Обобщенная центральная предельная теорема

Обобщенная центральная предельная теорема (GCLT) была результатом усилий многих математиков ( Бернштейна , Линдеберга , Леви , Феллера , Колмогорова и других) в период с 1920 по 1937 год. [10] Первое опубликованное полное доказательство GCLT было в 1937 году Полем Леви на французском языке. [11] Англоязычная версия полного доказательства GCLT доступна в переводе книги Гнеденко и Колмогорова 1954 года. [12]

Заявление GCLT выглядит следующим образом: [13]

Невырожденная случайная величина Z является α -устойчивой для некоторого 0 < α ≤ 2 тогда и только тогда, когда существует независимая, одинаково распределенная последовательность случайных величин X 1 , X 2 , X 3 , ... и констант a n > 0, b n ∈ ℝ с
а н ( X 1 + ... + X n ) − b nZ .
Здесь → означает, что последовательность сумм случайных величин сходится по распределению, т. е. соответствующие распределения удовлетворяют F n ( y ) → F ( y ) во всех точках непрерывности F.

Другими словами, если суммы независимых одинаково распределенных случайных величин сходятся по распределению к некоторому Z , то Z должно быть устойчивым распределением .

Зависимые процессы

CLT при слабой зависимости

Полезным обобщением последовательности независимых, одинаково распределенных случайных величин является перемешивающий случайный процесс в дискретном времени; «перемешивание» означает, грубо говоря, что случайные величины, временно далеко отстоящие друг от друга, почти независимы. Несколько видов перемешивания используются в эргодической теории и теории вероятностей. См. особенно сильное перемешивание (также называемое α-перемешиванием), определяемое как , где — так называемый коэффициент сильного перемешивания .

Упрощенная формулировка центральной предельной теоремы при сильном перемешивании имеет вид: [14]

Теорема  —  Предположим, что является стационарным и -смешивающим с и что и . Обозначим , тогда предел существует, и если то сходится по распределению к .

На самом деле, там, где ряд сходится абсолютно.

Это предположение нельзя опустить, поскольку асимптотическая нормальность нарушается для , где — другая стационарная последовательность .

Существует более сильная версия теоремы: [15] предположение заменяется на , а предположение заменяется на

Существование таких обеспечивает заключение. Для энциклопедического рассмотрения предельных теорем в условиях смешивания см. (Bradley 2007).

Разница Мартингейла CLT

Теорема  —  Пусть мартингал удовлетворяет

затем сходится по распределению к . [ 16] [17]

Замечания

Доказательство классической CLT

Центральная предельная теорема имеет доказательство с использованием характеристических функций . [18] Оно похоже на доказательство (слабого) закона больших чисел .

Предположим, что являются независимыми и одинаково распределенными случайными величинами, каждая со средним значением и конечной дисперсией . Сумма имеет среднее значение и дисперсию . Рассмотрим случайную величину , где на последнем шаге мы определили новые случайные величины , каждая со средним значением, равным нулю, и дисперсией, равной единице ( ). Характеристическая функция для задается выражением , где на последнем шаге мы использовали тот факт, что все из распределены одинаково. Характеристическая функция для равна, по теореме Тейлора , где — « маленькое обозначение o » для некоторой функции от , которая стремится к нулю быстрее, чем . По пределу экспоненциальной функции ( ), характеристическая функция для равна

Все члены более высокого порядка исчезают в пределе . Правая часть равна характеристической функции стандартного нормального распределения , что подразумевает через теорему Леви о непрерывности , что распределение будет стремиться к . Следовательно, выборочное среднее таково, что сходится к нормальному распределению , из чего следует центральная предельная теорема.

Сходимость к пределу

Центральная предельная теорема дает только асимптотическое распределение . Как приближение для конечного числа наблюдений, оно обеспечивает разумное приближение только тогда, когда близко к пику нормального распределения; для его распространения в хвосты требуется очень большое число наблюдений. [ необходима цитата ]

Сходимость в центральной предельной теореме равномерна, поскольку предельная кумулятивная функция распределения непрерывна. Если третий центральный момент существует и конечен, то скорость сходимости по крайней мере порядка (см. теорему Берри–Эссеена ). Метод Стейна [19] можно использовать не только для доказательства центральной предельной теоремы, но и для предоставления границ скоростей сходимости для выбранных метрик. [20]

Сходимость к нормальному распределению является монотонной в том смысле, что энтропия монотонно возрастает по отношению к энтропии нормального распределения. [21]

Центральная предельная теорема применяется, в частности, к суммам независимых и одинаково распределенных дискретных случайных величин . Сумма дискретных случайных величин по-прежнему является дискретной случайной величиной , так что мы сталкиваемся с последовательностью дискретных случайных величин , кумулятивная функция распределения вероятностей которых сходится к кумулятивной функции распределения вероятностей, соответствующей непрерывной переменной (а именно, функции нормального распределения ). Это означает, что если мы построим гистограмму реализаций суммы n независимых одинаковых дискретных величин, то кусочно-линейная кривая, которая соединяет центры верхних граней прямоугольников, образующих гистограмму, сходится к гауссовой кривой, когда n стремится к бесконечности; это соотношение известно как теорема Муавра–Лапласа . Статья о биномиальном распределении подробно описывает такое применение центральной предельной теоремы в простом случае дискретной переменной, принимающей только два возможных значения.

Распространенные заблуждения

Исследования показали, что центральная предельная теорема подвержена нескольким распространенным, но серьезным заблуждениям, некоторые из которых появляются в широко используемых учебниках. [22] [23] [24] К ним относятся:

Связь с законом больших чисел

Закон больших чисел , а также центральная предельная теорема являются частичными решениями общей проблемы: «Каково предельное поведение S n при стремлении n к бесконечности?» В математическом анализе асимптотические ряды являются одним из самых популярных инструментов, используемых для решения таких вопросов.

Предположим, что у нас есть асимптотическое разложение :

Разделив обе части на φ 1 ( n ) и взяв предел, получим a 1 , коэффициент при члене высшего порядка в разложении, который представляет скорость, с которой f ( n ) изменяется в своем ведущем члене.

Неформально можно сказать: " f ( n ) растет примерно как a 1 φ 1 ( n ) ". Взяв разницу между f ( n ) и ее приближением, а затем разделив на следующий член в разложении, мы приходим к более точному утверждению о f ( n ) :

Здесь можно сказать, что разница между функцией и ее приближением растет примерно как a 2 φ 2 ( n ) . Идея состоит в том, что деление функции на соответствующие нормирующие функции и рассмотрение предельного поведения результата может многое рассказать нам о предельном поведении самой исходной функции.

Неформально, что-то в этом роде происходит, когда сумма S n независимых одинаково распределенных случайных величин X 1 , ..., X n изучается в классической теории вероятностей. [ необходима ссылка ] Если каждое X i имеет конечное среднее значение μ , то по закону больших чисел С н/нμ . [26] Если вдобавок каждый X i имеет конечную дисперсию σ 2 , то по центральной предельной теореме, где ξ распределена как N (0, σ 2 ) . Это дает значения первых двух констант в неформальном разложении

В случае, когда X i не имеет конечного среднего значения или дисперсии, сходимость смещенной и перемасштабированной суммы может также происходить с различными центрирующими и масштабирующими факторами: или неформально

Распределения Ξ, которые могут возникнуть таким образом, называются устойчивыми . [27] Очевидно, что нормальное распределение устойчиво, но существуют и другие устойчивые распределения, такие как распределение Коши , для которого среднее значение или дисперсия не определены. Масштабный коэффициент b n может быть пропорционален n c для любого c1/2 ; его также можно умножить на медленно меняющуюся функцию n .[ 28] [29]

Закон повторного логарифма определяет, что происходит «между» законом больших чисел и центральной предельной теоремой. В частности, он говорит, что нормирующая функция n log log n , промежуточная по размеру между n закона больших чисел и n центральной предельной теоремы, обеспечивает нетривиальное предельное поведение.

Альтернативные утверждения теоремы

Плотность функций

Плотность суммы двух или более независимых переменных является сверткой их плотностей (если эти плотности существуют). Таким образом, центральную предельную теорему можно интерпретировать как утверждение о свойствах функций плотности при свертке: свертка ряда функций плотности стремится к нормальной плотности, когда число функций плотности неограниченно возрастает. Эти теоремы требуют более сильных гипотез, чем формы центральной предельной теоремы, приведенные выше. Теоремы этого типа часто называют локальными предельными теоремами. См. Петров [30] для получения частной локальной предельной теоремы для сумм независимых и одинаково распределенных случайных величин .

Характерные функции

Поскольку характеристическая функция свертки является произведением характеристических функций плотностей, центральная предельная теорема имеет еще одну переформулировку: произведение характеристических функций ряда функций плотности становится близким к характеристической функции нормальной плотности, когда число функций плотности неограниченно увеличивается при условиях, указанных выше. В частности, к аргументу характеристической функции необходимо применить соответствующий масштабный коэффициент.

Эквивалентное утверждение можно сделать относительно преобразований Фурье , поскольку характеристическая функция по сути является преобразованием Фурье.

Расчет дисперсии

Пусть S n будет суммой n случайных величин. Многие центральные предельные теоремы предоставляют условия, при которых S n / Var( S n ) сходится по распределению к N (0,1) (нормальное распределение со средним 0, дисперсией 1) при n → ∞ . В некоторых случаях можно найти константу σ 2 и функцию f(n) такие, что S n /(σ n⋅f ( n ) ) сходится по распределению к N (0,1) при n → ∞ .

Лемма [31]  —  Предположим, что есть последовательность действительных и строго стационарных случайных величин с для всех , и . Построить

  1. Если абсолютно сходится, то , а затем как , где .
  2. Если вдобавок и сходится по распределению к , то также сходится по распределению к .

Расширения

Произведения положительных случайных величин

Логарифм произведения — это просто сумма логарифмов множителей. Поэтому, когда логарифм произведения случайных величин, принимающих только положительные значения, приближается к нормальному распределению, само произведение приближается к логнормальному распределению . Многие физические величины (особенно масса или длина, которые являются вопросом масштаба и не могут быть отрицательными) являются произведениями различных случайных множителей, поэтому они следуют логнормальному распределению. Эту мультипликативную версию центральной предельной теоремы иногда называют законом Жибра .

В то время как центральная предельная теорема для сумм случайных величин требует условия конечной дисперсии, соответствующая теорема для произведений требует соответствующего условия, чтобы функция плотности была квадратично интегрируемой. [32]

За пределами классических рамок

Асимптотическая нормальность, то есть сходимость к нормальному распределению после соответствующего сдвига и масштабирования, является явлением гораздо более общим, чем классическая структура, рассмотренная выше, а именно, суммы независимых случайных величин (или векторов). Время от времени появляются новые структуры; на данный момент не существует единой объединяющей структуры.

Выпуклое тело

Теорема  —  Существует последовательность ε n ↓ 0 , для которой выполняется следующее. Пусть n ≥ 1 , и пусть случайные величины X 1 , ..., X n имеют логарифмически вогнутую совместную плотность f такую, что f ( x 1 , ..., x n ) = f (| x 1 |, ..., | x n |) для всех x 1 , ..., x n , и E( X2
тыс.
) = 1
для всех k = 1, ..., n . Тогда распределение ε n -близко к по расстоянию полной вариации . [33]

Эти два ε n -близких распределения имеют плотности (фактически логарифмически вогнутые плотности), таким образом, расстояние полной дисперсии между ними является интегралом абсолютного значения разности плотностей. Сходимость по полной дисперсии сильнее слабой сходимости.

Важным примером логарифмически вогнутой плотности является функция, постоянная внутри заданного выпуклого тела и исчезающая снаружи; она соответствует равномерному распределению на выпуклом теле, что объясняет термин «центральная предельная теорема для выпуклых тел».

Другой пример: f ( x 1 , ..., x n ) = const · exp(−(| x 1 | α + ⋯ + | x n | α ) β ) , где α > 1 и αβ > 1 . Если β = 1, то f ( x 1 , ..., x n ) раскладывается на множители const · exp (−| x 1 | α ) … exp(−| x n | α ), что означает, что X 1 , ..., X n независимы. Однако в общем случае они зависимы.

Условие f ( x 1 , ..., x n ) = f (| x 1 |, ..., | x n |) гарантирует, что X 1 , ..., X n имеют нулевое среднее значение и некоррелированы ; [ требуется ссылка ] тем не менее, они не обязаны быть независимыми или даже попарно независимыми . [ требуется ссылка ] Кстати, попарная независимость не может заменить независимость в классической центральной предельной теореме. [34]

Вот результат типа Берри–Эссеена .

Теорема  —  Пусть X 1 , ..., X n удовлетворяют условиям предыдущей теоремы, тогда [35] для всех a < b ; здесь Cуниверсальная (абсолютная) константа . Более того, для каждого c 1 , ..., c nR такого, что c2
1
+ ⋯ + с2
н
= 1
,

Распределение X 1 + ⋯ + X n/н не обязательно должно быть приблизительно нормальным (на самом деле, оно может быть равномерным). [36] Однако распределение c 1 X 1 + ⋯ + c n X n близко к(по общему расстоянию вариации) для большинства векторов ( c 1 , ..., c n ) в соответствии с равномерным распределением на сфере c2
1
+ ⋯ + с2
н
= 1
.

Лакунарный тригонометрический ряд

Теорема ( СейлемаЗигмунда )  —  Пусть U — случайная величина, равномерно распределенная на (0,2π) , и X k = r k cos( n k U + a k ) , где

Тогда [37] [38] сходится по распределению к .

Гауссовы многогранники

Теорема  —  Пусть A 1 , ..., A n — независимые случайные точки на плоскости R 2 , каждая из которых имеет двумерное стандартное нормальное распределение. Пусть K nвыпуклая оболочка этих точек, а X n — площадь K n Тогда [39] сходится по распределению к при n, стремящемся к бесконечности.

То же самое справедливо и для всех измерений больше 2.

Многогранник K n называется гауссовым случайным многогранником .

Аналогичный результат справедлив для числа вершин (гауссовского многогранника), числа ребер и, по сути, граней всех измерений. [40]

Линейные функции ортогональных матриц

Линейная функция матрицы M — это линейная комбинация ее элементов (с заданными коэффициентами), M ↦ tr( AM ) , где A — матрица коэффициентов; см. След (линейная алгебра)#Внутреннее произведение .

Говорят, что случайная ортогональная матрица распределена равномерно, если ее распределение является нормализованной мерой Хаара на ортогональной группе O( n , R ) ; см. Матрица вращения#Равномерные случайные матрицы вращения .

Теорема  —  Пусть M — случайная ортогональная матрица n × n, распределенная равномерно, а A — фиксированная матрица n × n, такая, что tr( AA *) = n , и пусть X = tr( AM ) . Тогда [41] распределение X близко к в метрике полной вариации с точностью до [ необходимо разъяснение ] 2 3/н − 1 .

Подпоследовательности

Теорема  —  Пусть случайные величины X 1 , X 2 , ... ∈ L 2 (Ω) таковы, что X n → 0 слабо в L 2 (Ω) и X
н
→ 1
слабо в L 1 (Ω) . Тогда существуют целые числа n 1 < n 2 < ⋯ такие, что сходится по распределению к при стремлении k к бесконечности. [42]

Случайное блуждание по кристаллической решетке

Центральная предельная теорема может быть установлена ​​для простого случайного блуждания по кристаллической решетке (бесконечнократный абелев покрывающий граф над конечным графом) и используется для проектирования кристаллических структур. [43] [44]

Приложения и примеры

Простым примером центральной предельной теоремы является бросание множества одинаковых, непредвзятых игральных костей. Распределение суммы (или среднего) выпавших чисел будет хорошо аппроксимироваться нормальным распределением. Поскольку реальные величины часто являются сбалансированной суммой многих ненаблюдаемых случайных событий, центральная предельная теорема также дает частичное объяснение распространенности нормального распределения вероятностей. Она также оправдывает приближение статистики большой выборки к нормальному распределению в контролируемых экспериментах.

Еще одна симуляция с использованием биномиального распределения. Были сгенерированы случайные 0 и 1, а затем их средние значения были рассчитаны для размеров выборки от 1 до 2048. Обратите внимание, что по мере увеличения размера выборки хвосты становятся тоньше, а распределение становится более сконцентрированным вокруг среднего значения.

Регрессия

Регрессионный анализ , и в частности, обычный метод наименьших квадратов , определяет, что зависимая переменная зависит в соответствии с некоторой функцией от одной или нескольких независимых переменных с аддитивным членом ошибки . Различные типы статистического вывода по регрессии предполагают, что член ошибки распределен нормально. Это предположение можно обосновать, предположив, что член ошибки на самом деле является суммой многих независимых членов ошибки; даже если отдельные члены ошибки не распределены нормально, по центральной предельной теореме их сумма может быть хорошо аппроксимирована нормальным распределением.

Другие иллюстрации

Учитывая ее важность для статистики, существует ряд статей и компьютерных пакетов, демонстрирующих сходимость, содержащуюся в центральной предельной теореме. [45]

История

Голландский математик Хенк Теймс пишет: [46]

Центральная предельная теорема имеет интересную историю. Первая версия этой теоремы была постулирована французским математиком Абрахамом де Муавром , который в замечательной статье, опубликованной в 1733 году, использовал нормальное распределение для аппроксимации распределения числа орлов, выпавших в результате многих подбрасываний честной монеты. Это открытие намного опередило свое время и было почти забыто, пока знаменитый французский математик Пьер-Симон Лаплас не спас его от забвения в своей монументальной работе Théorie analytique des probabilités , опубликованной в 1812 году. Лаплас расширил открытие Муавра, аппроксимировав биномиальное распределение нормальным распределением. Но, как и в случае с Муавром, открытие Лапласа не привлекло особого внимания в его время. Только в конце девятнадцатого века важность центральной предельной теоремы была распознана, когда в 1901 году русский математик Александр Ляпунов определил ее в общих чертах и ​​доказал, как именно она работает математически. В настоящее время центральная предельная теорема считается неофициальным сувереном теории вероятностей.

Сэр Фрэнсис Гальтон описал Центральную предельную теорему следующим образом: [47]

Я едва ли знаю что-либо, способное так поразить воображение, как замечательная форма космического порядка, выраженная «Законом частоты ошибок». Этот закон был бы олицетворен греками и обожествлен, если бы они знали о нем. Он царит с безмятежностью и полным самоуничижением среди дичайшего беспорядка. Чем больше толпа и чем больше кажущаяся анархия, тем совершеннее ее власть. Это высший закон неразумности. Всякий раз, когда большой образец хаотических элементов берется в руки и выстраивается в порядке их величины, неожиданная и самая прекрасная форма регулярности оказывается скрытой все это время.

Фактический термин «центральная предельная теорема» (на немецком: «zentraler Grenzwertsatz») был впервые использован Джорджем Полиа в 1920 году в названии статьи. [48] [49] Полиа назвал теорему «центральной» из-за ее важности в теории вероятностей. По словам Ле Кама, французская школа вероятности интерпретирует слово « центральный» в том смысле, что «он описывает поведение центра распределения в отличие от его хвостов». [49] Аннотация статьи Полиа «О центральной предельной теореме исчисления вероятностей и проблеме моментов » [48] в 1920 году переводится следующим образом.

Появление гауссовой плотности вероятности 1 = e x 2 в повторных экспериментах, в ошибках измерений, которые приводят к комбинации очень многих и очень малых элементарных ошибок, в диффузионных процессах и т. д., можно объяснить, как хорошо известно, той же самой предельной теоремой, которая играет центральную роль в исчислении вероятностей. Фактическим первооткрывателем этой предельной теоремы следует назвать Лапласа; вероятно, ее строгое доказательство впервые дал Чебышев, а ее наиболее четкую формулировку можно найти, насколько мне известно, в статье Ляпунова . ...

Подробный отчет об истории теоремы, подробно описывающий основополагающую работу Лапласа, а также вклады Коши , Бесселя и Пуассона , предоставлен Хальдом. [50] Два исторических отчета, один из которых охватывает развитие от Лапласа до Коши, а второй — вклад фон Мизеса , Полиа , Линдеберга , Леви и Крамера в 1920-х годах, предоставлены Гансом Фишером. [51] Ле Кам описывает период около 1935 года . [49] Бернштейн [52] представляет историческое обсуждение, сосредоточенное на работе Пафнутия Чебышева и его учеников Андрея Маркова и Александра Ляпунова , которая привела к первым доказательствам центральной предельной теоремы в общей постановке.

Любопытное примечание к истории Центральной предельной теоремы заключается в том, что доказательство результата, похожего на ЦПТ Линдеберга 1922 года, было предметом диссертации Алана Тьюринга 1934 года для Королевского колледжа Кембриджского университета . Только после представления работы Тьюринг узнал, что она уже доказана. Следовательно, диссертация Тьюринга не была опубликована. [53]

Смотрите также

Примечания

  1. ^ Фишер (2011), стр.  [ нужна страница ] .
  2. ^ Монтгомери, Дуглас С.; Рангер, Джордж С. (2014). Прикладная статистика и вероятность для инженеров (6-е изд.). Wiley. стр. 241. ISBN 9781118539712.
  3. ^ Руо, Матье (2013). Вероятность, статистика и оценка (PDF) . стр. 10. Архивировано (PDF) из оригинала 2022-10-09.
  4. ^ Биллингсли (1995), стр. 357.
  5. ^ Бауэр (2001), с. 199, Теорема 30.13.
  6. ^ Биллингсли (1995), стр. 362.
  7. ^ Аб ван дер Ваарт, AW (1998). Асимптотическая статистика . Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-49603-2. LCCN  98015176.
  8. ^ О'Доннелл, Райан (2014). "Теорема 5.38". Архивировано из оригинала 2019-04-08 . Получено 2017-10-18 .
  9. ^ Бенткус, В. (2005). «Связанное по Ляпунову в ». Теория вероятн. Прилож . 49 (2): 311–323. doi :10.1137/S0040585X97981123.
  10. ^ Le Cam, L. (февраль 1986 г.). «Центральная предельная теорема около 1935 г.». Статистическая наука . 1 (1): 78–91. JSTOR  2245503.
  11. ^ Леви, Поль (1937). Теория сложения непредсказуемых переменных . Париж: Готье-Виллар.
  12. ^ Гнеденко, Борис Владимирович; Кологоров, Андрей Николаевич; Дуб, Джозеф Л.; Сюй, Пао-Лу (1968). Предельные распределения для сумм независимых случайных величин . Reading, MA: Addison-wesley.
  13. ^ Нолан, Джон П. (2020). Одномерные стабильные распределения, модели для данных с тяжелыми хвостами. Серия Springer по исследованию операций и финансовому инжинирингу. Швейцария: Springer. doi : 10.1007/978-3-030-52915-4. ISBN 978-3-030-52914-7. S2CID  226648987.
  14. ^ Биллинсли (1995), Теорема 27.4.
  15. ^ Дарретт (2004), Раздел 7.7(c), Теорема 7.8.
  16. ^ Дарретт (2004), раздел 7.7, теорема 7.4.
  17. ^ Биллинсли (1995), Теорема 35.12.
  18. ^ Лемонс, Дон (2003). Введение в стохастические процессы в физике. Johns Hopkins University Press. doi :10.56021/9780801868665. ISBN 9780801876387. Получено 11 августа 2016 г.
  19. ^ Stein, C. (1972). «Граница ошибки в нормальном приближении к распределению суммы зависимых случайных величин». Труды Шестого симпозиума в Беркли по математической статистике и вероятности . 6 (2): 583–602. MR  0402873. Zbl  0278.60026.
  20. ^ Chen, LHY; Goldstein, L.; Shao, QM (2011). Нормальное приближение методом Штейна . Springer. ISBN 978-3-642-15006-7.
  21. ^ Артштейн, С.; Болл , К.; Барт , Ф.; Наор , А. (2004). «Решение проблемы Шеннона о монотонности энтропии». Журнал Американского математического общества . 17 (4): 975–982. doi : 10.1090/S0894-0347-04-00459-X .
  22. ^ Брюэр, Дж. К. (1985). «Учебники поведенческой статистики: источник мифов и заблуждений?». Журнал образовательной статистики . 10 (3): 252–268. doi :10.3102/10769986010003252. S2CID  119611584.
  23. ^ Ю, К.; Беренс, Дж.; Спенсер, А. Выявление заблуждений в центральной предельной теореме и связанных с ней концепциях, лекция Американской ассоциации образовательных исследований , 19 апреля 1995 г.
  24. ^ Сотос, АЭК; Ванхуф, С.; Ван ден Ноортгейт, В.; Онгена, П. (2007). «Заблуждения студентов о статистических выводах: обзор эмпирических данных исследований в области статистического образования». Educational Research Review . 2 (2): 98–113. doi :10.1016/j.edurev.2007.04.001.
  25. ^ "Выборочное распределение выборочного среднего (видео) | Khan Academy". 2 июня 2023 г. Архивировано из оригинала 2023-06-02 . Получено 2023-10-08 .
  26. ^ Розенталь, Джеффри Сет (2000). Первый взгляд на строгую теорию вероятностей . World Scientific. Теорема 5.3.4, стр. 47. ISBN 981-02-4322-7.
  27. ^ Джонсон, Оливер Томас (2004). Теория информации и центральная предельная теорема . Imperial College Press. стр. 88. ISBN 1-86094-473-6.
  28. ^ Учайкин, Владимир В.; Золотарев, В. М. (1999). Случайность и устойчивость: Устойчивые распределения и их приложения . VSP. С. 61–62. ISBN 90-6764-301-7.
  29. ^ Бородин, АН; Ибрагимов, ИА; Судаков, ВН (1995). Предельные теоремы для функционалов случайных блужданий . AMS Bookstore. Теорема 1.1, стр. 8. ISBN 0-8218-0438-3.
  30. ^ Петров, В. В. (1976). Суммы независимых случайных величин. Нью-Йорк-Гейдельберг: Springer-Verlag. Гл. 7. ISBN 9783642658099.
  31. ^ Хью, Патрик Чисан (2017). «Асимптотическое распределение вознаграждений, накопленных чередующимися процессами обновления». Statistics and Probability Letters . 129 : 355–359. doi :10.1016/j.spl.2017.06.027.
  32. ^ Rempala, G.; Wesolowski, J. (2002). "Асимптотика произведений сумм и U-статистик" (PDF) . Electronic Communications in Probability . 7 : 47–54. doi : 10.1214/ecp.v7-1046 .
  33. ^ Клартаг (2007), Теорема 1.2.
  34. ^ Дарретт (2004), Раздел 2.4, Пример 4.5.
  35. ^ Клартаг (2008), Теорема 1.
  36. ^ Клартаг (2007), Теорема 1.1.
  37. ^ Зигмунд, Антони (2003) [1959]. Тригонометрические ряды . Cambridge University Press. т. II, раздел XVI.5, теорема 5-5. ISBN 0-521-89053-5.
  38. ^ Гапошкин (1966), Теорема 2.1.13.
  39. ^ Барань и Ву (2007), Теорема 1.1.
  40. ^ Барань и Ву (2007), Теорема 1.2.
  41. ^ Меккес, Элизабет (2008). «Линейные функции на классических матричных группах». Труды Американского математического общества . 360 (10): 5355–5366. arXiv : math/0509441 . doi :10.1090/S0002-9947-08-04444-9. S2CID  11981408.
  42. ^ Гапошкин (1966), раздел 1.5.
  43. ^ Котани, М.; Сунада, Тошиказу (2003). Спектральная геометрия кристаллических решеток . Т. 338. Contemporary Math. С. 271–305. ISBN 978-0-8218-4269-0.
  44. ^ Сунады, Тошикадзу (2012). Топологическая кристаллография – с видом на дискретный геометрический анализ . Обзоры и руководства по прикладным математическим наукам. Том 6. Springer. ISBN 978-4-431-54177-6.
  45. ^ Марасингхе, М.; Микер, В.; Кук, Д.; Шин, Т.С. (август 1994 г.). Использование графики и моделирования для обучения статистическим концепциям . Ежегодное собрание Американской ассоциации статистиков, Торонто, Канада.
  46. ^ Хенк, Теймс (2004). Понимание вероятности: случайные правила в повседневной жизни . Кембридж: Cambridge University Press. стр. 169. ISBN 0-521-54036-4.
  47. ^ Гальтон, Ф. (1889). Естественное наследование. стр. 66.
  48. ^ аб Полиа, Джордж (1920). «Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem» [О центральной предельной теореме вычисления вероятностей и проблеме моментов]. Mathematische Zeitschrift (на немецком языке). 8 (3–4): 171–181. дои : 10.1007/BF01206525. S2CID  123063388.
  49. ^ abc Le Cam, Lucien (1986). «Центральная предельная теорема около 1935 года». Статистическая наука . 1 (1): 78–91. doi : 10.1214/ss/1177013818 .
  50. ^ Хальд, Андреас (22 апреля 1998 г.). История математической статистики с 1750 по 1930 г. (PDF) . Wiley. Глава 17. ISBN 978-0471179122. Архивировано (PDF) из оригинала 2022-10-09.
  51. ^ Фишер (2011), Глава 2; Глава 5.2.
  52. ^ Бернштейн, С. Н. (1945). «О работах П. Л. Чебышева по теории вероятностей». В Бернштейн., С. Н. (ред.). Научное наследие П. Л. Чебышева . Выпуск Первый : Математика . М. и Л.: Академия наук СССР. С. 174.
  53. ^ Zabell, SL (1995). «Алан Тьюринг и центральная предельная теорема». American Mathematical Monthly . 102 (6): 483–494. doi :10.1080/00029890.1995.12004608.
  54. ^ Йоргенсен, Бент (1997). Теория дисперсионных моделей . Chapman & Hall. ISBN 978-0412997112.

Ссылки

Внешние ссылки