В статистике заменяемая последовательность случайных величин (иногда также взаимозаменяемая ) [1] — это последовательность X 1 , X 2 , X 3 , ... (которая может быть конечной или бесконечной длины), совместное распределение вероятностей которой не меняется при изменении позиций в последовательности, в которых появляется конечное число из них. Другими словами, совместное распределение инвариантно к конечной перестановке. Так, например, последовательности
оба имеют одинаковое совместное распределение вероятностей.
Он тесно связан с использованием независимых и одинаково распределенных случайных величин в статистических моделях. Обменные последовательности случайных величин возникают в случаях простой случайной выборки .
Формально, заменяемая последовательность случайных величин — это конечная или бесконечная последовательность X 1 , X 2 , X 3 , ... случайных величин, такая, что для любой конечной перестановки σ индексов 1, 2, 3, ..., (перестановка действует только на конечное число индексов, а остальные фиксированы), совместное распределение вероятностей переставленной последовательности
совпадает с совместным распределением вероятностей исходной последовательности. [1] [2]
(Последовательность событий E 1 , E 2 , E 3 , ... называется заменяемой в точности тогда, когда заменяема последовательность ее индикаторных функций .) Функция распределения F X 1 ,..., X n ( x 1 , ..., x n ) конечной последовательности заменяемых случайных величин симметрична относительно своих аргументов x 1 , ..., x n . Олав Калленберг дал подходящее определение заменяемости для непрерывных во времени стохастических процессов. [3] [4]
Эта концепция была введена Уильямом Эрнестом Джонсоном в его книге 1924 года «Логика, часть III: Логические основы науки» . [5] Взаимозаменяемость эквивалентна концепции статистического контроля, введенной Уолтером Шухартом также в 1924 году. [6] [7]
Свойство взаимозаменяемости тесно связано с использованием независимых и одинаково распределенных (iid) случайных величин в статистических моделях. [8] Последовательность случайных величин, которые являются iid, обусловленная некоторой базовой формой распределения, является взаимозаменяемой. Это следует непосредственно из структуры совместного распределения вероятностей, генерируемого формой iid.
Смеси заменяемых последовательностей (в частности, последовательности переменных iid) заменяемы. Обратное может быть установлено для бесконечных последовательностей с помощью важной теоремы о представлении Бруно де Финетти (позже расширенной другими теоретиками вероятности, такими как Халмош и Сэвидж ). [9] Расширенные версии теоремы показывают, что в любой бесконечной последовательности заменяемых случайных величин случайные величины условно независимы и одинаково распределены , учитывая базовую форму распределения. Эта теорема кратко изложена ниже. (Исходная теорема Де Финетти показала, что это верно только для случайных индикаторных переменных, но позже это было расширено, чтобы охватить все последовательности случайных величин.) Другой способ выразить это заключается в том, что теорема Де Финетти характеризует заменяемые последовательности как смеси последовательностей iid — в то время как заменяемая последовательность сама по себе не обязательно должна быть безусловно iid, она может быть выражена как смесь базовых последовательностей iid. [1]
Это означает, что бесконечные последовательности заменяемых случайных величин можно рассматривать эквивалентно как последовательности условно iid случайных величин, основанные на некоторой базовой форме распределения. (Обратите внимание, что эта эквивалентность не совсем выполняется для конечной заменяемости. Однако для конечных векторов случайных величин существует близкое приближение к модели iid.) Бесконечная заменяемая последовательность строго стационарна , и поэтому применяется закон больших чисел в форме теоремы Биркгофа–Хинчина . [4] Это означает, что базовому распределению можно дать операциональную интерпретацию как предельное эмпирическое распределение последовательности значений. Тесная связь между заменяемыми последовательностями случайных величин и формой iid означает, что последняя может быть обоснована на основе бесконечной заменяемости. Это понятие является центральным для разработки Бруно де Финетти предсказательного вывода и байесовской статистики . Можно также показать, что это полезное основополагающее предположение в частотной статистике и для связи двух парадигм. [10]
Теорема представления: Это утверждение основано на представлении в O'Neill (2009) в ссылках ниже. Учитывая бесконечную последовательность случайных величин, мы определяем предельную эмпирическую функцию распределения как
(Это предел Чезаро индикаторных функций. В случаях, когда предел Чезаро не существует, эта функция фактически может быть определена как предел Банаха индикаторных функций, который является расширением этого предела. Этот последний предел всегда существует для сумм индикаторных функций, так что эмпирическое распределение всегда хорошо определено.) Это означает, что для любого вектора случайных величин в последовательности мы имеем совместную функцию распределения, заданную как
Если функция распределения индексируется другим параметром , то (при правильно определенных плотностях) мы имеем
Эти уравнения показывают совместное распределение или плотность, характеризуемую как распределение смеси, основанное на базовом предельном эмпирическом распределении (или параметре, индексирующем это распределение).
Обратите внимание, что не все конечные заменяемые последовательности являются смесями iid Чтобы увидеть это, рассмотрим выборку без замены из конечного набора до тех пор, пока не останется ни одного элемента. Полученная последовательность является заменяемой, но не смесью iid Действительно, при условии всех других элементов в последовательности, оставшийся элемент известен.
Сменные последовательности имеют некоторые основные свойства ковариации и корреляции, которые означают, что они, как правило, положительно коррелированы. Для бесконечных последовательностей сменных случайных величин ковариация между случайными величинами равна дисперсии среднего значения базовой функции распределения. [10] Для конечных сменных последовательностей ковариация также является фиксированным значением, которое не зависит от конкретных случайных величин в последовательности. Существует более слабая нижняя граница, чем для бесконечной сменной величины, и возможно существование отрицательной корреляции.
Ковариация для заменяемых последовательностей (бесконечная): Если последовательность заменяема, то
Ковариация для заменяемых последовательностей (конечная): Если заменяемо с , то
Конечный результат последовательности может быть доказан следующим образом. Используя тот факт, что значения являются взаимозаменяемыми, мы имеем
Затем мы можем решить неравенство для ковариации, получая указанную нижнюю границу. Неотрицательность ковариации для бесконечной последовательности может быть получена как предельный результат из этого конечного результата последовательности.
Равенство нижней границы для конечных последовательностей достигается в простой модели урны: урна содержит 1 красный шарик и n − 1 зеленый шарик, и они выбираются без замены до тех пор, пока урна не опустеет. Пусть X i = 1, если красный шарик вытаскивается в i -й попытке, и 0 в противном случае. Конечная последовательность, которая достигает нижней границы ковариации, не может быть расширена до более длинной заменяемой последовательности. [11]
Экстрактор фон Неймана — это экстрактор случайности , который зависит от взаимозаменяемости: он дает метод, позволяющий взять взаимозаменяемую последовательность нулей и единиц ( испытания Бернулли ) с некоторой вероятностью p, равной 0 и 1, и создать (более короткую) взаимозаменяемую последовательность нулей и единиц с вероятностью 1/2.
Разбейте последовательность на непересекающиеся пары: если два элемента пары равны (00 или 11), отбросьте ее; если два элемента пары не равны (01 или 10), оставьте первый. Это дает последовательность испытаний Бернулли с так как, по принципу взаимозаменяемости, шансы данной пары быть 01 или 10 равны.
Случайные величины, допускающие обмен, возникают при изучении статистики U , в частности, при разложении Хеффдинга. [13]
Обмениваемость является ключевым предположением метода вывода без распределения конформного предсказания . [14]