Вероятностное интегральное преобразование

В теории вероятностей интегральное преобразование вероятности ( также известное как универсальность равномерного распределения ) относится к результату, согласно которому значения данных, которые моделируются как случайные величины из любого заданного непрерывного распределения, могут быть преобразованы в случайные величины, имеющие стандартное равномерное распределение . ^[1] Это выполняется в точности при условии, что используемое распределение является истинным распределением случайных величин; если распределение соответствует данным, результат будет приблизительно верен в больших выборках.

Иногда результат модифицируется или расширяется таким образом, что результатом преобразования становится стандартное распределение, отличное от равномерного распределения, например, экспоненциальное распределение .

Преобразование было введено Рональдом Фишером в его книге «Статистические методы для научных работников» издания 1932 года . ^[2]

Приложения

Одним из вариантов использования вероятностного интегрального преобразования в статистическом анализе данных является обеспечение основы для проверки того, можно ли разумно смоделировать набор наблюдений как результат определенного распределения. В частности, вероятностное интегральное преобразование применяется для построения эквивалентного набора значений, а затем проводится проверка того, подходит ли равномерное распределение для построенного набора данных. Примерами этого являются графики P–P и тесты Колмогорова–Смирнова .

Второе применение преобразования — в теории, связанной с копулами , которые являются средством как определения, так и работы с распределениями для статистически зависимых многомерных данных. Здесь проблема определения или манипулирования совместным распределением вероятностей для набора случайных величин упрощается или сокращается в кажущейся сложности путем применения интегрального преобразования вероятности к каждому из компонентов, а затем работы с совместным распределением, для которого маргинальные переменные имеют равномерные распределения.

Третий вариант использования основан на применении обратного преобразования интегрального вероятностного преобразования для преобразования случайных величин из равномерного распределения в выбранное распределение: это известно как выборка обратного преобразования .

Заявление

Предположим, что случайная величина имеет непрерывное распределение , для которого кумулятивная функция распределения (CDF) равна Тогда случайная величина определяется как $X$ $F_{X}.$ $Y$

Y:=F_{X}(X)\,,

имеет стандартное равномерное распределение . ^[1]^[3]

Эквивалентно, если — равномерная мера на , то распределение на является прямой мерой . $\мю$ $[0,1]$ $X$ $\mathbb {R}$ $\mu \circ F_{X}^{-1}$

Доказательство

Для любой случайной непрерывной величины , определим . Для , если существует (т.е. если существует единственный такой, что ), то: $X$ $Y=F_{X}(X)$ $y\in [0,1]$ $F_{X}^{-1}(y)$ $x$ $F_{X}(x)=y$

{\begin{align}F_{Y}(y)&=\operatorname {P} (Y\leq y)\\&=\operatorname {P} (F_{X}(X)\leq y)\\&=\operatorname {P} (X\leq F_{X}^{-1}(y))\\&=F_{X}(F_{X}^{-1}(y))\\&=y\end{align}}

Если не существует, то в этом доказательстве ее можно заменить функцией , где мы определяем , , и для , с тем же результатом, что . Таким образом, — это просто CDF случайной величины, так что имеет равномерное распределение на интервале . $F_{X}^{-1}(y)$ $\чи$ $\chi (0)=-\infty$ $\chi (1)=\infty$ $\chi (y)\equiv \inf\{x:F_{X} (x)\geq y\}$ $y\in (0,1)$ $F_{Y}(y)=y$ $F_{Y}$ $\mathrm {Униформа} (0,1)$ $Y$ $[0,1]$

Примеры

Для первого наглядного примера пусть будет случайной величиной со стандартным нормальным распределением . Тогда ее CDF будет $X$ ${\mathcal {N}}(0,1)$

\Phi (x)={\frac {1}{\sqrt {2\pi }}}\int _{-\infty }^{x}{\rm {e}}^{-t^{2}/2}\,{\rm {d}}t={\frac {1}{2}}{\Big [}\,1+\operatorname {erf} {\Big (}{\frac {x}{\sqrt {2}}}{\Big )}\,{\Big ]},\quad x\in \mathbb {R} ,\,

где — функция ошибок . Тогда новая случайная величина, определяемая как, распределена равномерно. $\operatorname {erf} (),$ $Y,$ $Y:=\Фи (X),$

В качестве второго примера, если имеет экспоненциальное распределение с единичным средним, то его CDF равен $X$

F(x)=1-\exp(-x),

и непосредственный результат преобразования интеграла вероятности заключается в том, что

Y=1-\exp(-X)

имеет равномерное распределение. Более того, по симметрии равномерного распределения,

Z=\exp(-X)

также имеет равномерное распределение.

Смотрите также

Обратное преобразование выборки

Ссылки

^ ab Dodge, Y. (2006) Оксфордский словарь статистических терминов , Oxford University Press
^ Дэвид, Ф. Н.; Джонсон, Н. Л. (1948). «Преобразование интеграла вероятности при оценке параметров по выборке». Biometrika . 35 (1/2): 182. doi :10.2307/2332638. JSTOR 2332638.
^ Казелла, Джордж; Бергер, Роджер Л. (2002). Статистический вывод (2-е изд.). Теорема 2.1.10, стр.54.