Понятия вероятностной сходимости, применяемые к оценке и асимптотическому анализу
В теории вероятностей существует несколько различных понятий сходимости последовательностей случайных величин , включая сходимость по вероятности , сходимость по распределению и почти наверняка сходимость . Различные понятия сходимости охватывают различные свойства последовательности, при этом некоторые понятия сходимости сильнее других. Например, сходимость по распределению говорит нам о предельном распределении последовательности случайных величин. Это более слабое понятие, чем сходимость по вероятности, которое говорит нам о значении, которое примет случайная величина, а не только о распределении.
Эта концепция важна в теории вероятностей и ее приложениях к статистике и стохастическим процессам . Те же концепции известны в более общей математике как стохастическая сходимость , и они формализуют идею о том, что некоторые свойства последовательности по существу случайных или непредсказуемых событий иногда могут, как ожидается, прийти к поведению, которое по существу не меняется, когда элементы достаточно далеко в последовательности изучаются. Различные возможные понятия сходимости связаны с тем, как такое поведение может быть охарактеризовано: два легко понимаемых поведения заключаются в том, что последовательность в конечном итоге принимает постоянное значение, и что значения в последовательности продолжают меняться, но могут быть описаны неизменным распределением вероятностей.
Фон
«Стохастическая сходимость» формализует идею о том, что последовательность по существу случайных или непредсказуемых событий иногда может, как ожидается, уложиться в шаблон. Шаблон может быть, например,
- Сходимость в классическом смысле к фиксированному значению, возможно, сама происходящая из случайного события
- Все большее сходство результатов с тем, что могла бы дать чисто детерминированная функция
- Растущее предпочтение определенного результата
- Растущее «отвращение» к слишком большому отклонению от определенного результата
- Что распределение вероятностей, описывающее следующий результат, может становиться все более похожим на определенное распределение
Некоторые менее очевидные, более теоретические закономерности могут быть
- Что ряд, сформированный путем вычисления ожидаемого значения расстояния результата от конкретного значения, может сходиться к 0
- Что дисперсия случайной величины, описывающей следующее событие, становится все меньше и меньше.
Эти другие типы закономерностей, которые могут возникнуть, отражены в различных типах стохастической конвергенции, которые были изучены.
Хотя приведенное выше обсуждение касалось сходимости одного ряда к предельному значению, понятие сходимости двух рядов друг к другу также важно, но с этим легко справиться, изучая последовательность, определяемую либо как разность, либо как отношение двух рядов.
Например, если среднее значение n независимых случайных величин , имеющих одинаковое конечное среднее значение и дисперсию , определяется как
то при стремлении к бесконечности сходится по вероятности (см. ниже) к общему среднему , , случайных величин . Этот результат известен как слабый закон больших чисел . Другие формы сходимости важны в других полезных теоремах, включая центральную предельную теорему .
Далее мы предполагаем, что — последовательность случайных величин, а — случайная величина, и все они определены в одном и том же вероятностном пространстве .
Конвергенция в распределении
Грубо говоря, при таком режиме сходимости мы все больше ожидаем увидеть, как следующий результат в последовательности случайных экспериментов становится все лучше и лучше моделируемым заданным распределением вероятностей . Точнее, распределение связанной случайной величины в последовательности становится произвольно близким к указанному фиксированному распределению.
Сходимость в распределении является самой слабой формой сходимости, обычно обсуждаемой, поскольку она подразумевается всеми другими типами сходимости, упомянутыми в этой статье. Однако сходимость в распределении очень часто используется на практике; чаще всего она возникает из применения центральной предельной теоремы .
Определение
Говорят, что последовательность действительных случайных величин с кумулятивными функциями распределения сходится по распределению , или сходится слабо , или сходится по закону к случайной величине X с кумулятивной функцией распределения F , если
для каждого числа, при котором является непрерывным .
Требование того, чтобы рассматривались только точки непрерывности, является существенным. Например, если распределены равномерно на интервалах , то эта последовательность сходится по распределению к вырожденной случайной величине . Действительно, для всех , когда , и для всех , когда . Однако для этой предельной случайной величины , хотя для всех . Таким образом, сходимость cdfs нарушается в точке , где является разрывной.
Сходимость в распределении можно обозначить как
где — закон (распределение вероятностей) X. Например, если X — стандартно нормальное, мы можем записать .
Для случайных векторов сходимость по распределению определяется аналогично. Мы говорим, что эта последовательность сходится по распределению к случайному k -вектору X, если
для каждого , который является непрерывным множеством X .
Определение сходимости в распределении может быть расширено от случайных векторов до более общих случайных элементов в произвольных метрических пространствах и даже до «случайных величин», которые не поддаются измерению — ситуация, которая возникает, например, при изучении эмпирических процессов . Это «слабая сходимость законов без определения законов» — за исключением асимптотики. [1]
В этом случае термин слабая сходимость является предпочтительным (см. слабая сходимость мер ), и мы говорим, что последовательность случайных элементов { X n } слабо сходится к X (обозначается как X n ⇒ X ), если
для всех непрерывных ограниченных функций h . [2] Здесь E* обозначает внешнее ожидание , то есть ожидание «наименьшей измеримой функции g , которая доминирует над h ( X n ) ».
Характеристики
- Поскольку , сходимость в распределении означает, что вероятность того, что X n находится в заданном диапазоне, приблизительно равна вероятности того, что значение X находится в этом диапазоне, при условии, что n достаточно велико .
- В общем случае сходимость в распределении не означает, что последовательность соответствующих функций плотности вероятности также будет сходиться. В качестве примера можно рассмотреть случайные величины с плотностями f n ( x ) = (1 + cos(2 πnx )) 1 (0,1) . Эти случайные величины сходятся в распределении к равномерному U (0, 1), тогда как их плотности вообще не сходятся. [3]
- Лемма о портманто дает несколько эквивалентных определений сходимости в распределении. Хотя эти определения менее интуитивны, они используются для доказательства ряда статистических теорем. Лемма утверждает, что { X n } сходится в распределении к X тогда и только тогда, когда верно любое из следующих утверждений: [5]
- для всех точек непрерывности ;
- для всех ограниченных непрерывных функций (где обозначает оператор ожидаемого значения ) ;
- для всех ограниченных липшицевых функций ;
- для всех неотрицательных, непрерывных функций ;
- для каждого открытого множества ;
- для каждого замкнутого множества ;
- для всех множеств непрерывности случайной величины ;
- для каждой полунепрерывной сверху функции , ограниченной сверху; [ необходима ссылка ]
- для каждой полунепрерывной снизу функции , ограниченной снизу. [ необходима ссылка ]
- Теорема о непрерывном отображении утверждает, что для непрерывной функции g , если последовательность { X n } сходится по распределению к X , то { g ( X n )} сходится по распределению к g ( X ) .
- Однако следует отметить, что сходимость в распределении { X n } к X и { Y n } к Y в общем случае не подразумевает сходимость в распределении { X n + Y n } к X + Y или { X n Y n } к XY .
- Теорема Леви о непрерывности : Последовательность { X n } сходится по распределению к X тогда и только тогда, когда последовательность соответствующих характеристических функций { φ n } поточечно сходится к характеристической функции φ множества X.
- Сходимость по распределению метризуема метрикой Леви–Прохорова .
- Естественной связью со сходимостью по распределению является теорема Скорохода о представлении .
Сходимость по вероятности
Основная идея этого типа сходимости заключается в том, что вероятность «необычного» результата становится все меньше и меньше по мере развития последовательности.
Понятие сходимости по вероятности очень часто используется в статистике. Например, оценщик называется состоятельным , если он сходится по вероятности к оцениваемой величине. Сходимость по вероятности также является типом сходимости, установленным слабым законом больших чисел .
Определение
Последовательность { X n } случайных величин сходится по вероятности к случайной величине X, если для всех ε > 0
Более конкретно, пусть P n ( ε ) будет вероятностью того, что X n находится вне шара радиуса ε с центром в точке X . Тогда говорят, что X n сходится по вероятности к X , если для любого ε > 0 и любого δ > 0 существует число N (которое может зависеть от ε и δ ) такое, что для всех n ≥ N , P n ( ε ) < δ (определение предела).
Обратите внимание, что для выполнения условия невозможно, чтобы для каждого n случайные величины X и X n были независимыми (и, таким образом, сходимость по вероятности является условием для совместных cdf, в отличие от сходимости по распределению, которая является условием для индивидуальных cdf), если только X не является детерминированным, как для слабого закона больших чисел. В то же время случай детерминированного X не может, когда детерминированное значение является точкой разрыва (не изолированной), обрабатываться сходимостью по распределению, где точки разрыва должны быть явно исключены.
Сходимость по вероятности обозначается добавлением буквы p над стрелкой, указывающей на сходимость, или использованием оператора предела вероятности «plim»:
Для случайных элементов { X n } на сепарабельном метрическом пространстве ( S , d ) сходимость по вероятности определяется аналогично [6]
Характеристики
- Сходимость по вероятности подразумевает сходимость по распределению. [доказательство]
- В противоположном направлении, сходимость по распределению подразумевает сходимость по вероятности, когда предельная случайная величина X является константой. [доказательство]
- Сходимость по вероятности не подразумевает почти наверняка сходимость. [доказательство]
- Теорема о непрерывном отображении утверждает, что для каждой непрерывной функции , если , то также .
- Сходимость по вероятности определяет топологию на пространстве случайных величин над фиксированным вероятностным пространством. Эта топология метризуема метрикой Ки Фана : [7] или альтернативно этой метрикой
Контрпримеры
Не каждая последовательность случайных величин, которая сходится к другой случайной величине по распределению, также сходится по вероятности к этой случайной величине. В качестве примера рассмотрим последовательность стандартных нормальных случайных величин и вторую последовательность . Обратите внимание, что распределение равно распределению для всех , но:
который не сходится к . Таким образом, у нас нет сходимости по вероятности.
Почти наверняка сходимость
Это тип стохастической сходимости, который наиболее похож на поточечную сходимость, известную из элементарного вещественного анализа .
Определение
Сказать, что последовательность X n сходится почти наверняка или почти всюду , или с вероятностью 1 , или строго к X, означает, что
Это означает, что значения X n приближаются к значению X , в том смысле, что события, для которых X n не сходится к X , имеют вероятность 0 (см. Почти наверняка ). Используя вероятностное пространство и концепцию случайной величины как функции от Ω до R , это эквивалентно утверждению
Используя понятие предельного значения последовательности множеств , почти наверняка сходимость можно также определить следующим образом:
Почти наверняка сходимость часто обозначается добавлением букв над стрелкой, указывающей на сходимость:
Для общих случайных элементов { X n } на метрическом пространстве сходимость почти наверняка определяется аналогично:
Характеристики
- Почти наверняка сходимость подразумевает сходимость по вероятности (по лемме Фату ), и, следовательно, подразумевает сходимость по распределению. Это понятие сходимости используется в усиленном законе больших чисел .
- Понятие почти наверняка сходимости не исходит из топологии пространства случайных величин. Это означает, что не существует топологии пространства случайных величин, такой, что почти наверняка сходящиеся последовательности являются в точности сходящимися последовательностями относительно этой топологии. В частности, не существует метрики почти наверняка сходимости.
Контрпримеры
Рассмотрим последовательность независимых случайных величин, такую, что и . Для имеем что сходится к , следовательно, по вероятности.
Поскольку и события независимы, вторая лемма Бореля-Кантелли гарантирует, что, следовательно, последовательность не сходится к почти всюду (фактически множество, на котором эта последовательность не сходится к , имеет вероятность ).
Уверенная сходимость или поточечная сходимость
Сказать, что последовательность случайных величин ( X n ), определенная в одном и том же вероятностном пространстве (т. е. случайный процесс ), сходится наверняка или всюду , или поточечно к X , означает
где Ω — выборочное пространство базового вероятностного пространства , в котором определены случайные величины.
Это понятие поточечной сходимости последовательности функций, расширенной до последовательности случайных величин . (Обратите внимание, что случайные величины сами по себе являются функциями).
Уверенная сходимость случайной величины подразумевает все другие виды сходимости, указанные выше, но в теории вероятностей нет выигрыша от использования уверенной сходимости по сравнению с использованием почти уверенной сходимости. Разница между ними существует только на множествах с нулевой вероятностью. Вот почему концепция уверенной сходимости случайных величин используется очень редко.
Сходимость в среднем
При заданном действительном числе r ≥ 1 мы говорим, что последовательность X n сходится в r -м среднем значении (или в L r -норме ) к случайной величине X , если r -е абсолютные моменты (| X n | r ) и (| X | r ) величин X n и X существуют, и
где оператор E обозначает ожидаемое значение . Сходимость по r -му среднему говорит нам, что ожидание r -й степени разности между и сходится к нулю.
Этот тип конвергенции часто обозначается добавлением буквы L r над стрелкой, указывающей на конвергенцию:
Наиболее важными случаями сходимости в r -ом среднем являются:
- Когда X n сходится в r -ом среднем к X при r = 1, мы говорим, что X n сходится в среднем к X .
- Когда X n сходится в r -ом среднем к X при r = 2, мы говорим, что X n сходится в среднем квадратичном (или в среднем квадратичном ) к X .
Сходимость в r -ом среднем, для r ≥ 1, подразумевает сходимость по вероятности (по неравенству Маркова ). Более того, если r > s ≥ 1, сходимость в r -ом среднем подразумевает сходимость в s -ом среднем. Следовательно, сходимость в среднем квадратичном подразумевает сходимость в среднем.
Кроме того,
Обратное утверждение не обязательно верно, однако оно верно, если (по более общей версии леммы Шеффе ).
Характеристики
При условии, что вероятностное пространство является полным :
- Если и , то почти наверняка .
- Если и , то почти наверняка.
- Если и , то почти наверняка.
- Если и , то (для любых действительных чисел a и b ) и .
- Если и , то (для любых действительных чисел a и b ) и .
- Если и , то (для любых действительных чисел a и b ).
- Ни одно из вышеприведенных утверждений не является верным для конвергенции в распределении.
Цепочка импликаций между различными понятиями конвергенции отмечена в соответствующих разделах. Они, используя стрелочные обозначения:
Эти свойства, а также ряд других особых случаев, обобщены в следующем списке:
- Почти наверняка сходимость подразумевает сходимость по вероятности: [8] [доказательство]
- Сходимость по вероятности подразумевает, что существует подпоследовательность , которая почти наверняка сходится: [9]
- Сходимость по вероятности подразумевает сходимость по распределению: [8] [доказательство]
- Сходимость по среднему r -го порядка подразумевает сходимость по вероятности:
- Сходимость в среднем r -го порядка подразумевает сходимость в среднем низшего порядка, предполагая, что оба порядка больше или равны единице:
- при условии, что r ≥ s ≥ 1.
- Если X n сходится по распределению к константе c , то X n сходится по вероятности к c : [8] [доказательство]
- при условии, что c является константой.
- Если X n сходится по распределению к X и разность между X n и Y n сходится по вероятности к нулю, то Y n также сходится по распределению к X : [8] [доказательство]
- Если X n сходится по распределению к X , а Y n сходится по распределению к константе c , то совместный вектор ( X n , Y n ) сходится по распределению к : [8] [доказательство]
- при условии, что c является константой.
- Обратите внимание, что условие сходимости Y n к константе важно; если бы оно сходилось к случайной величине Y , то мы не смогли бы сделать вывод, что ( X n , Y n ) сходится к .
- Если X n сходится по вероятности к X , а Y n сходится по вероятности к Y , то совместный вектор ( X n , Y n ) сходится по вероятности к ( X , Y ) : [8] [доказательство]
- Если X n сходится по вероятности к X , и если P (| X n | ≤ b ) = 1 для всех n и некоторых b , то X n сходится в r -м среднем к X для всех r ≥ 1 . Другими словами, если X n сходится по вероятности к X и все случайные величины X n почти наверняка ограничены сверху и снизу, то X n сходится к X также в любом r -м среднем. [10]
- Почти наверняка представление . Обычно сходимость по распределению не подразумевает сходимость почти наверняка. Однако для заданной последовательности { X n }, которая сходится по распределению к X 0 , всегда можно найти новое вероятностное пространство (Ω, F , P) и случайные величины { Y n , n = 0, 1, ...}, определенные на нем, такие, что Y n равно по распределению X n для каждого n ≥ 0 , а Y n сходится к Y 0 почти наверняка. [11] [12]
- Если для всех ε > 0,
- то мы говорим, что X n сходится почти полностью или почти по вероятности к X . Когда X n сходится почти полностью к X , то он также сходится почти наверняка к X . Другими словами, если X n сходится по вероятности к X достаточно быстро (т. е. указанная выше последовательность хвостовых вероятностей суммируема для всех ε > 0 ), то X n также сходится почти наверняка к X . Это прямое следствие из леммы Бореля–Кантелли .
- Если S n представляет собой сумму n действительных независимых случайных величин:
- тогда S n сходится почти наверняка тогда и только тогда, когда S n сходится по вероятности. Доказательство можно найти на странице 126 (теорема 5.3.4) книги Кай Лай Чуна . [13]
- Однако для последовательности взаимно независимых случайных величин сходимость по вероятности не подразумевает почти наверняка сходимость. [14]
- Теорема о доминируемой сходимости дает достаточные условия для почти наверняка сходимости, чтобы подразумевать L 1 -сходимость:
- Необходимым и достаточным условием сходимости L 1 является то, что последовательность ( X n ) равномерно интегрируема .
- Если , то следующие условия эквивалентны [15]
- ,
- ,
- равномерно интегрируема .
Смотрите также
В Wikibook Econometric Theory есть страница на тему: Сходимость случайных величин.
Примечания
- ^ Бикель и др. 1998, A.8, стр. 475
- ^ ван дер Ваарт и Веллнер 1996, стр. 4
- ^ Романо и Сигел 1985, Пример 5.26
- ^ Дарретт, Рик (2010). Вероятность: теория и примеры . стр. 84.
- ^ ван дер Ваарт 1998, Лемма 2.2.
- ^ Дадли 2002, Глава 9.2, стр. 287
- ^ Дадли 2002, стр. 289
- ^ abcdef ван дер Ваарт 1998, Теорема 2.7
- ^ Гут, Аллан (2005). Вероятность: аспирантский курс . Теорема 3.4: Springer. ISBN 978-0-387-22833-4.
{{cite book}}
: CS1 maint: location (link) - ^ Гримметт и Стирзакер 2020, стр. 354
- ^ ван дер Варт 1998, Чт.2.19
- ^ Фристедт и Грей 1997, Теорема 14.5
- ^ Чунг, Кай-лай (2001). Курс теории вероятностей . стр. 126.
- ^ "Доказательства сходимости случайных величин". Википедия . Получено 2024-09-23 .
- ^ "реальный анализ - обобщение леммы Шеффе с использованием только сходимости по вероятности". Mathematics Stack Exchange . Получено 2022-03-12 .
Ссылки
- Бикель, Питер Дж.; Клаассен, Крис А. Дж.; Ритов, Яаков; Веллнер, Джон А. (1998). Эффективная и адаптивная оценка для полупараметрических моделей . Нью-Йорк: Springer-Verlag. ISBN 978-0-387-98473-5.
- Биллингсли, Патрик (1986). Вероятность и мера . Wiley Series in Probability and Mathematical Statistics (2-е изд.). Wiley.
- Биллингсли, Патрик (1999). Сходимость вероятностных мер (2-е изд.). John Wiley & Sons. стр. 1–28. ISBN 978-0-471-19745-4.
- Дадли, Р. М. (2002). Реальный анализ и вероятность . Кембридж, Великобритания: Cambridge University Press. ISBN 978-0-521-80972-6.
- Фристедт, Берт; Грей, Лоуренс (1997). Современный подход к теории вероятностей . Нью-Йорк: Springer Science+Business Media. doi :10.1007/978-1-4899-2837-5. ISBN 978-1-4899-2837-5.
- Grimmett, GR; Stirzaker, DR (1992). Вероятность и случайные процессы (2-е изд.). Clarendon Press, Oxford. стр. 271–285. ISBN 978-0-19-853665-9.
- Якобсен, М. (1992). Videregående Sandsynlighedsregning (Расширенная теория вероятностей) (3-е изд.). HCØ-tryk, Копенгаген. стр. 18–20. ISBN 978-87-91180-71-2.
- Леду, Мишель; Талагран, Мишель (1991). Вероятность в банаховых пространствах . Берлин: Springer-Verlag. С. xii+480. ISBN 978-3-540-52013-9. МР 1102015.
- Романо, Джозеф П.; Сигел, Эндрю Ф. (1985). Контрпримеры в теории вероятностей и статистике . Великобритания: Chapman & Hall. ISBN 978-0-412-98901-8.
- Гримметт, Джеффри Р.; Стирзакер, Дэвид Р. (2020). Вероятность и случайные процессы (4-е изд.). Oxford University Press. ISBN 978-0-198-84760-1.
- ван дер Ваарт, Аад В .; Веллнер, Джон А. (1996). Слабая сходимость и эмпирические процессы . Нью-Йорк: Springer-Verlag. ISBN 978-0-387-94640-5.
- ван дер Ваарт, Аад В. (1998). Асимптотическая статистика . Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-49603-2.
- Уильямс, Д. (1991). Вероятность с Мартингалами . Cambridge University Press. ISBN 978-0-521-40605-5.
- Вонг, Э.; Хаек, Б. (1985). Стохастические процессы в инженерных системах . Нью-Йорк: Springer–Verlag.
- Житкович, Гордан (17 ноября 2013 г.). «Лекция 7: Слабая сходимость» (PDF) .
В данной статье использованы материалы статьи Citizendium «Стохастическая конвергенция», которая распространяется по лицензии Creative Commons Attribution-ShareAlike 3.0 Unported License , но не по лицензии GFDL .