Метод Монте-Карло для выборки по значимости и оптимизации
Метод кросс-энтропии ( CE ) — это метод Монте-Карло для выборки и оптимизации важности . Он применим как к комбинаторным , так и к непрерывным задачам, как со статической, так и с шумовой целью.
Метод приближает оптимальную оценку выборки важности путем повторения двух фаз: [1]
- Сделайте выборку из распределения вероятностей .
- Минимизируйте перекрестную энтропию между этим распределением и целевым распределением, чтобы получить лучшую выборку в следующей итерации.
Реувен Рубинштейн разработал метод в контексте моделирования редких событий , где необходимо оценить крошечные вероятности, например, в анализе надежности сети, моделях очередей или анализе производительности телекоммуникационных систем. Метод также применялся к задачам коммивояжера , квадратичного назначения , выравнивания последовательностей ДНК , максимального разреза и распределения буфера.
Оценка посредством выборки по важности
Рассмотрим общую задачу оценки количества
,
где — некоторая функция производительности , а — член некоторого параметрического семейства распределений. Используя выборку по важности, эту величину можно оценить как
,
где — случайная выборка из . Для положительного значения теоретически оптимальная плотность выборки по важности (PDF) определяется как
.
Однако это зависит от неизвестного . Метод CE направлен на приближение оптимальной PDF путем адаптивного выбора членов параметрического семейства, которые наиболее близки (в смысле Кульбака–Лейблера ) к оптимальной PDF .
Общий алгоритм CE
- Выбрать начальный вектор параметров ; установить t = 1.
- Сгенерировать случайную выборку из
- Решить для , где
- Если сходимость достигнута, то остановиться ; в противном случае увеличить t на 1 и повторить с шага 2.
В ряде случаев решение шага 3 можно найти аналитически . Ситуации, в которых это происходит, следующие:
- Когда принадлежит к естественному экспоненциальному семейству
- Когда дискретно с конечным носителем
- Когда и , то соответствует оценке максимального правдоподобия, основанной на тех .
Непрерывная оптимизация — пример
Тот же алгоритм CE может быть использован для оптимизации, а не для оценки. Предположим, что задача заключается в максимизации некоторой функции , например, . Чтобы применить CE, сначала рассмотрим связанную стохастическую задачу оценки
для заданного уровня и параметрического семейства , например, одномерного гауссовского распределения , параметризованного его средним значением и дисперсией (так здесь). Следовательно, для заданного цель состоит в том, чтобы найти так, чтобы
было минимизировано. Это делается путем решения выборочной версии (стохастического аналога) задачи минимизации расхождения KL, как на шаге 3 выше. Оказывается, что параметры, которые минимизируют стохастический аналог для этого выбора целевого распределения и параметрического семейства, являются выборочным средним значением и выборочной дисперсией, соответствующими элитным образцам , которые являются теми образцами, которые имеют значение целевой функции . Худший из элитных образцов затем используется в качестве параметра уровня для следующей итерации. Это дает следующий рандомизированный алгоритм, который совпадает с так называемым алгоритмом оценки многомерного нормального распределения (EMNA), алгоритмом оценки распределения .
Псевдокод
// Инициализация параметровμ := −6σ2 := 100т := 0макситы := 100N := 100Не := 10// Пока maxits не превышены и не сошлись , пока t < maxits и σ2 > ε // Получаем N выборок из текущего распределения выборок X := SampleGaussian(μ, σ2, N) // Оценить целевую функцию в выбранных точках S := ехр(−(X − 2) ^ 2) + 0,8 ехр(−(X + 2) ^ 2) // Сортировать X по значениям целевой функции в порядке убывания X := сорт(X, S) // Обновить параметры распределения выборки через элитные выборки μ := среднее(X(1:Ne)) σ2 := var(X(1:Ne)) т := т + 1// Возвращает среднее значение окончательного распределения выборки как решение return μ
Связанные методы
Смотрите также
Журнальные статьи
- Де Бур, П.-Т., Кроезе, Д.П., Маннор, С. и Рубинштейн, Р.Й. (2005). Учебное пособие по методу кросс-энтропии. Annals of Operations Research , 134 (1), 19–67.[1]
- Рубинштейн, Р.Ю. (1997). Оптимизация моделей компьютерного моделирования с редкими событиями, Европейский журнал операционных исследований , 99 , 89–112.
Реализации программного обеспечения
- Пакет CEoptim R
- Библиотека Novacta.Analytics .NET
Ссылки
- ^ Рубинштейн, Р.Ю. и Крез, Д.П. (2004), Метод кросс-энтропии: унифицированный подход к комбинаторной оптимизации, моделированию Монте-Карло и машинному обучению, Springer-Verlag, Нью-Йорк ISBN 978-0-387-21240-1 .