Выборка с обратным преобразованием берет однородные выборки чисел от 0 до 1, интерпретируемых как вероятность, а затем возвращает наименьшее число, соответствующее кумулятивной функции распределения случайной величины. Например, представьте, что это стандартное нормальное распределение с нулевым средним значением и единицей стандартного отклонения. В таблице ниже показаны выборки, взятые из равномерного распределения, и их представление в стандартном нормальном распределении.
Мы случайным образом выбираем долю площади под кривой и возвращаем число в области определения так, чтобы именно эта доля площади находилась слева от этого числа. Интуитивно мы вряд ли выберем число в дальнем конце хвостов, потому что в них очень маленькая область, которая потребует выбора числа, очень близкого к нулю или единице.
В вычислительном отношении этот метод включает в себя вычисление функции квантиля распределения — другими словами, вычисление кумулятивной функции распределения (CDF) распределения (которая сопоставляет число в области значений с вероятностью от 0 до 1), а затем инвертирование этой функции. Это источник термина «инверсия» или «инверсия» в большинстве названий этого метода. Обратите внимание, что для дискретного распределения вычисление CDF, как правило, не слишком сложно: мы просто складываем отдельные вероятности для различных точек распределения. Однако для непрерывного распределения нам необходимо интегрировать функцию плотности вероятности (PDF) распределения, что невозможно сделать аналитически для большинства распределений (включая нормальное распределение ). В результате этот метод может оказаться неэффективным в вычислительном отношении для многих распределений, и другие методы являются предпочтительными; тем не менее, это полезный метод для создания более широко применимых пробоотборников, например, основанных на браковочной выборке .
Для нормального распределения отсутствие аналитического выражения для соответствующей функции квантиля означает, что другие методы (например, преобразование Бокса-Мюллера ) могут быть предпочтительными в вычислительном отношении. Часто даже для простых распределений метод выборки с обратным преобразованием можно улучшить: [2] см., например, алгоритм зиккурата и выборку с отклонением . С другой стороны, можно очень точно аппроксимировать функцию квантиля нормального распределения, используя полиномы умеренной степени, и на самом деле метод сделать это достаточно быстрый, поэтому инверсионная выборка теперь является методом по умолчанию для выборки из нормального распределения. в статистическом пакете R. [3]
Вычислить . Вычисленная случайная величина имеет распределение и, следовательно, тот же закон, что и .
Другими словами, при наличии кумулятивной функции распределения и однородной переменной случайная величина имеет распределение . [4]
В непрерывном случае можно рассматривать такие обратные функции как объекты, удовлетворяющие дифференциальным уравнениям. [5] Некоторые такие дифференциальные уравнения допускают явные решения в виде степенных рядов , несмотря на их нелинейность. [6]
В качестве другого примера мы используем экспоненциальное распределение при x ≥ 0 (и 0 в противном случае). Решая y=F(x), мы получаем обратную функцию
Это означает, что если мы возьмем некоторое значение из a и вычислим, оно будет иметь экспоненциальное распределение.
Идея иллюстрируется следующим графиком:
Обратите внимание, что распределение не изменится, если мы начнем с 1-y вместо y. Поэтому для вычислительных целей достаточно сгенерировать случайные числа y в [0, 1], а затем просто вычислить
Утверждение: если является однородной случайной величиной, то ее CDF является ее CDF.
Доказательство:
Усеченное распространение
Выборку с обратным преобразованием можно просто расширить на случаи усеченных распределений на интервале без затрат на отбраковку выборки: можно следовать тому же алгоритму, но вместо генерации случайного числа, равномерно распределенного между 0 и 1, генерировать равномерно распределенную между и , и потом снова возьми .
Уменьшение количества инверсий
Чтобы получить большое количество выборок, необходимо выполнить такое же количество инверсий распределения. Одним из возможных способов уменьшить количество инверсий при получении большого количества выборок является применение так называемого сэмплера стохастической коллокации Монте-Карло (семплера SCMC) в рамках структуры полиномиального расширения хаоса. Это позволяет нам генерировать любое количество выборок Монте-Карло всего лишь с несколькими инверсиями исходного распределения с независимыми выборками переменной, для которой инверсии доступны аналитически, например, стандартной нормальной переменной. [8]
^ Университет Аалто, Н. Хивонен, Вычислительные методы в обратных задачах. Двенадцатая лекция https://noppa.tkk.fi/noppa/kurssi/mat-1.3626/luennot/Mat-1_3626_lecture12.pdf [ постоянная мертвая ссылка ]
^ Люк Деврой (1986). Генерация неравномерных случайных переменных (PDF) . Нью-Йорк: Springer-Verlag. Архивировано из оригинала (PDF) 18 августа 2014 г. Проверено 12 апреля 2012 г.
^ «R: Генерация случайных чисел» .
^ Аб МакНил, Александр Дж.; Фрей, Рюдигер; Эмбрехтс, Пол (2005). Количественный риск-менеджмент . Принстонская серия по финансам. Издательство Принстонского университета, Принстон, Нью-Джерси. п. 186. ИСБН0-691-12255-5.
^ Штайнбрехер, Дьёрдь; Шоу, Уильям Т. (19 марта 2008 г.). «Квантильная механика». Европейский журнал прикладной математики . 19 (2). дои : 10.1017/S0956792508007341. S2CID 6899308.
^ Люк Деврой (1986). «Раздел 2.2. Инверсия путем численного решения задачи F(X) = U» (PDF) . Генерация неоднородной случайной переменной . Нью-Йорк: Springer-Verlag.
^ LA Grzelak, JAS Witteveen, M. Suarez и CW Oosterlee. Стохастический сэмплер Монте-Карло: высокоэффективная выборка из «дорогих» распределений. https://ssrn.com/abstract=2529691