В математике , а точнее в теории методов Монте-Карло , уменьшение дисперсии — это процедура, используемая для повышения точности оценок , полученных для заданного моделирования или вычислительных усилий. [1] Каждая выходная случайная величина из моделирования связана с дисперсией , которая ограничивает точность результатов моделирования. Для того чтобы сделать моделирование статистически эффективным, т. е. получить большую точность и меньшие доверительные интервалы для интересующей выходной случайной величины, можно использовать методы уменьшения дисперсии. Основными методами уменьшения дисперсии являются
Для моделирования с моделями черного ящика также можно использовать моделирование подмножества и линейную выборку . Под этими заголовками находятся различные специализированные методы; например, моделирование переноса частиц широко использует методы «весовых окон» и «разделения/русской рулетки», которые являются формой выборки по важности.
Предположим, что кто-то хочет вычислить случайную величину, определенную в вероятностном пространстве . Монте-Карло делает это путем выборки iid . копий и затем оценивает с помощью оценщика выборочного среднего
При более мягких условиях, таких как , будет применяться центральная предельная теорема , так что для больших распределение сходится к нормальному распределению со средним значением и стандартной ошибкой . Поскольку стандартное отклонение сходится только к со скоростью , что подразумевает необходимость увеличения числа симуляций ( ) в раз, чтобы уменьшить стандартное отклонение вдвое , методы уменьшения дисперсии часто полезны для получения более точных оценок для без необходимости очень большого числа симуляций.
Метод снижения дисперсии обычных случайных чисел — это популярный и полезный метод снижения дисперсии, который применяется, когда мы сравниваем две или более альтернативных конфигурации (системы) вместо исследования одной конфигурации. CRN также называют коррелированной выборкой , согласованными потоками или согласованными парами .
CRN требует синхронизации потоков случайных чисел, что гарантирует, что в дополнение к использованию одних и тех же случайных чисел для моделирования всех конфигураций, определенное случайное число, используемое для определенной цели в одной конфигурации, используется для точно такой же цели во всех других конфигурациях. Например, в теории очередей, если мы сравниваем две разные конфигурации кассиров в банке, мы хотели бы, чтобы (случайное) время прибытия N- го клиента генерировалось с использованием одного и того же выбора из потока случайных чисел для обеих конфигураций.
Предположим, что и являются наблюдениями из первой и второй конфигураций в j -й независимой репликации.
Мы хотим оценить
Если мы выполним n репликаций каждой конфигурации и допустим
тогда и является несмещенной оценкой .
И поскольку ' являются независимыми одинаково распределенными случайными величинами,
В случае независимой выборки, т.е. когда не используются общие случайные числа, то Cov( X 1 j , X 2 j ) = 0. Но если нам удастся ввести элемент положительной корреляции между X 1 и X 2 такой, что Cov( X 1 j , X 2 j ) > 0, из приведенного выше уравнения видно, что дисперсия уменьшается.
Также можно заметить, что если CRN вызывает отрицательную корреляцию, т. е. Cov( X 1 j , X 2 j ) < 0, этот метод может фактически иметь обратный эффект, когда дисперсия увеличивается, а не уменьшается (как предполагалось). [2]