stringtranslate.com

Теорема Гливенко–Кантелли

Левая диаграмма иллюстрирует теорему Гливенко–Кантелли для равномерных распределений. Правая диаграмма иллюстрирует теорему Донскера–Скорохода–Колмогорова.
Та же диаграмма для нормальных распределений

В теории вероятностей теорема Гливенко –Кантелли (иногда называемая Основной теоремой статистики ), названная в честь Валерия Ивановича Гливенко и Франческо Паоло Кантелли , описывает асимптотическое поведение эмпирической функции распределения по мере роста числа независимых и одинаково распределенных наблюдений. [1] В частности, эмпирическая функция распределения сходится равномерно к истинной функции распределения почти наверняка .

Равномерная сходимость более общих эмпирических мер становится важным свойством классов функций или множеств Гливенко–Кантелли . [2] Классы Гливенко–Кантелли возникают в теории Вапника–Червоненкиса с приложениями к машинному обучению . Приложения можно найти в эконометрике, использующей М-оценщики .

Заявление

Предположим, что являются независимыми и одинаково распределенными случайными величинами с общей кумулятивной функцией распределения . Эмпирическая функция распределения для определяется как

где — индикаторная функция множества Для каждого (фиксированного) — последовательность случайных величин, которая сходится к почти наверняка по усиленному закону больших чисел . Гливенко и Кантелли усилили этот результат, доказав равномерную сходимость к

Теорема

почти наверняка. [3] (стр. 265)

Эта теорема была сформулирована Валерием Гливенко [4] и Франческо Кантелли [ 5] в 1933 году.

Замечания

Доказательство

Для простоты рассмотрим случай непрерывной случайной величины . Зафиксируем такое, что для . Теперь для всех существует такое, что .

Поэтому,

Так как по сильному закону больших чисел мы можем гарантировать, что для любого положительного и любого целого числа такого, что , мы можем найти такое, что для всех , мы имеем . В сочетании с приведенным выше результатом это далее подразумевает, что , что является определением почти наверняка сходимости.

Эмпирические измерения

Можно обобщить эмпирическую функцию распределения , заменив множество произвольным множеством C из класса множеств, чтобы получить эмпирическую меру , индексированную множествами

Где - индикаторная функция каждого набора .

Дальнейшее обобщение — это отображение, индуцированное измеримыми действительными функциями f , которое задается формулой

Тогда важным свойством этих классов становится то, выполняется ли усиленный закон больших чисел равномерно на или .

Класс Гливенко–Кантелли

Рассмотрим множество с сигма-алгеброй борелевских подмножеств A и вероятностной мерой для класса подмножеств,

и класс функций

определить случайные величины

где — эмпирическая мера, — соответствующая карта, а

при условии, что он существует.

Определения

почти наверняка как
по вероятности как
как
как

Аналогично определяются классы функций Гливенко–Кантелли (а также их равномерные и универсальные формы), заменяя все экземпляры на .

Слабые и сильные версии различных свойств Гливенко-Кантелли часто совпадают при определенных условиях регулярности. Следующее определение обычно появляется в таких условиях регулярности:


Теоремы

Следующие две теоремы дают достаточные условия для того, чтобы слабая и сильная версии свойства Гливенко-Кантелли были эквивалентны.

Теорема ( Талагранд , 1987) [6]

Пусть будет классом функций, который интегрируем , и определите . Тогда следующие условия эквивалентны:


Теорема ( Дадли , Джине и Зинн, 1991) [7]

Предположим, что класс функций ограничен. Также предположим, что множество является допустимым по образу Суслиным. Тогда является слабым равномерным классом Гливенко-Кантелли тогда и только тогда, когда он является сильным равномерным классом Гливенко-Кантелли.

Следующая теорема является центральной для статистического обучения задачам бинарной классификации.

Теорема ( Вапник и Червоненкис , 1968) [8]

При определенных условиях согласованности универсально измеримый класс множеств является однородным классом Гливенко–Кантелли тогда и только тогда, когда он является классом Вапника–Червоненкиса .

Существует множество условий согласованности для эквивалентности однородных классов Гливенко-Кантелли и Вапника-Червоненкиса. В частности, достаточно любого из следующих условий для класса: [9]

Примеры

, то есть равномерно принадлежит классу Гливенко–Кантелли.

Смотрите также

Ссылки

  1. ^ Говард Г. Такер (1959). «Обобщение теоремы Гливенко–Кантелли». Анналы математической статистики . 30 (3): 828–830. doi : 10.1214/aoms/1177706212 . JSTOR  2237422.
  2. ^ ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. п. 279. ИСБН 978-0-521-78450-4.
  3. ^ Аб ван дер Ваарт, AW (1998). Асимптотическая статистика . Издательство Кембриджского университета. ISBN 978-0-521-78450-4.
  4. ^ Гливенко, В. (1933). «Эмпирическое определение вероятностей». Гиорн. Ист. Итал. Аттуари (на итальянском языке). 4 : 92–99.
  5. ^ Кантелли, Ф.П. (1933). «Эмпирическое определение вероятностей». Гиорн. Ист. Итал. Аттуари . 4 : 421–424.
  6. ^ Талагранд, М. (1987). «Проблема Гливенко-Кантелли». Annals of Probability . 15 : 837–870. doi :10.1214/AOP/1176992069.
  7. ^ Дадли, Ричард М.; Джине, Ева; Зинн, Джоэл К. (1991). «Равномерные и универсальные классы Гливенко-Кантелли». Журнал теоретической вероятности . 4 : 485–510. doi :10.1007/BF01210321.
  8. ^ Вапник, В. Н.; Червоненкис , А. Я. (1971). «О равномерной сходимости относительных частот событий к их вероятностям». Теория вероятностей и ее приложения . 16 (2): 264–280. doi :10.1137/1116025.
  9. ^ Пестов, Владимир (2011). «Обучаемость PAC против измерения VC: примечание к основному результату статистического обучения». Международная объединенная конференция по нейронным сетям 2011 г. . стр. 1141–1145. arXiv : 1104.2097 . doi : 10.1109/IJCNN.2011.6033352.

Дальнейшее чтение