В теории вероятностей интегральное преобразование вероятности ( также известное как универсальность равномерного распределения ) относится к результату, согласно которому значения данных, которые моделируются как случайные величины из любого заданного непрерывного распределения, могут быть преобразованы в случайные величины, имеющие стандартное равномерное распределение . [1] Это выполняется в точности при условии, что используемое распределение является истинным распределением случайных величин; если распределение соответствует данным, результат будет приблизительно верен в больших выборках.
Иногда результат модифицируется или расширяется таким образом, что результатом преобразования становится стандартное распределение, отличное от равномерного распределения, например, экспоненциальное распределение .
Преобразование было введено Рональдом Фишером в его книге «Статистические методы для научных работников» издания 1932 года . [2]
Одним из вариантов использования вероятностного интегрального преобразования в статистическом анализе данных является обеспечение основы для проверки того, можно ли разумно смоделировать набор наблюдений как результат определенного распределения. В частности, вероятностное интегральное преобразование применяется для построения эквивалентного набора значений, а затем проводится проверка того, подходит ли равномерное распределение для построенного набора данных. Примерами этого являются графики P–P и тесты Колмогорова–Смирнова .
Второе применение преобразования — в теории, связанной с копулами , которые являются средством как определения, так и работы с распределениями для статистически зависимых многомерных данных. Здесь проблема определения или манипулирования совместным распределением вероятностей для набора случайных величин упрощается или сокращается в кажущейся сложности путем применения интегрального преобразования вероятности к каждому из компонентов, а затем работы с совместным распределением, для которого маргинальные переменные имеют равномерные распределения.
Третий вариант использования основан на применении обратного преобразования интегрального вероятностного преобразования для преобразования случайных величин из равномерного распределения в выбранное распределение: это известно как выборка обратного преобразования .
Предположим, что случайная величина имеет непрерывное распределение , для которого кумулятивная функция распределения (CDF) равна Тогда случайная величина определяется как
имеет стандартное равномерное распределение . [1] [3]
Эквивалентно, если — равномерная мера на , то распределение на является прямой мерой .
Для любой случайной непрерывной величины , определим . Для , если существует (т.е. если существует единственный такой, что ), то:
Если не существует, то в этом доказательстве ее можно заменить функцией , где мы определяем , , и для , с тем же результатом, что . Таким образом, — это просто CDF случайной величины, так что имеет равномерное распределение на интервале .
Для первого наглядного примера пусть будет случайной величиной со стандартным нормальным распределением . Тогда ее CDF будет
где — функция ошибок . Тогда новая случайная величина, определяемая как, распределена равномерно.
В качестве второго примера, если имеет экспоненциальное распределение с единичным средним, то его CDF равен
и непосредственный результат преобразования интеграла вероятности заключается в том, что
имеет равномерное распределение. Более того, по симметрии равномерного распределения,
также имеет равномерное распределение.