stringtranslate.com

Метод кросс-энтропии

Метод кросс-энтропии ( CE ) — это метод Монте-Карло для выборки и оптимизации важности . Он применим как к комбинаторным , так и к непрерывным задачам, как со статической, так и с шумовой целью.

Метод приближает оптимальную оценку выборки важности путем повторения двух фаз: [1]

  1. Сделайте выборку из распределения вероятностей .
  2. Минимизируйте перекрестную энтропию между этим распределением и целевым распределением, чтобы получить лучшую выборку в следующей итерации.

Реувен Рубинштейн разработал метод в контексте моделирования редких событий , где необходимо оценить крошечные вероятности, например, в анализе надежности сети, моделях очередей или анализе производительности телекоммуникационных систем. Метод также применялся к задачам коммивояжера , квадратичного назначения , выравнивания последовательностей ДНК , максимального разреза и распределения буфера.

Оценка посредством выборки по важности

Рассмотрим общую задачу оценки количества

,

где — некоторая функция производительности , а — член некоторого параметрического семейства распределений. Используя выборку по важности, эту величину можно оценить как

,

где — случайная выборка из . Для положительного значения теоретически оптимальная плотность выборки по важности (PDF) определяется как

.

Однако это зависит от неизвестного . Метод CE направлен на приближение оптимальной PDF путем адаптивного выбора членов параметрического семейства, которые наиболее близки (в смысле Кульбака–Лейблера ) к оптимальной PDF .

Общий алгоритм CE

  1. Выбрать начальный вектор параметров ; установить t = 1.
  2. Сгенерировать случайную выборку из
  3. Решить для , где
  4. Если сходимость достигнута, то остановиться ; в противном случае увеличить t на 1 и повторить с шага 2.

В ряде случаев решение шага 3 можно найти аналитически . Ситуации, в которых это происходит, следующие:

Непрерывная оптимизация — пример

Тот же алгоритм CE может быть использован для оптимизации, а не для оценки. Предположим, что задача заключается в максимизации некоторой функции , например, . Чтобы применить CE, сначала рассмотрим связанную стохастическую задачу оценки для заданного уровня и параметрического семейства , например, одномерного гауссовского распределения , параметризованного его средним значением и дисперсией (так здесь). Следовательно, для заданного цель состоит в том, чтобы найти так, чтобы было минимизировано. Это делается путем решения выборочной версии (стохастического аналога) задачи минимизации расхождения KL, как на шаге 3 выше. Оказывается, что параметры, которые минимизируют стохастический аналог для этого выбора целевого распределения и параметрического семейства, являются выборочным средним значением и выборочной дисперсией, соответствующими элитным образцам , которые являются теми образцами, которые имеют значение целевой функции . Худший из элитных образцов затем используется в качестве параметра уровня для следующей итерации. Это дает следующий рандомизированный алгоритм, который совпадает с так называемым алгоритмом оценки многомерного нормального распределения (EMNA), алгоритмом оценки распределения .

Псевдокод

// Инициализация параметровμ := −6σ2 := 100т := 0макситы := 100N := 100Не := 10// Пока maxits не превышены и не сошлись , пока t < maxits и σ2 > ε // Получаем  N выборок из текущего распределения выборок X := SampleGaussian(μ, σ2, N) // Оценить целевую функцию в выбранных точках S := ехр(−(X − 2) ^ 2) + 0,8 ехр(−(X + 2) ^ 2) // Сортировать X по значениям целевой функции в порядке убывания X := сорт(X, S) // Обновить параметры распределения выборки через элитные выборки  μ := среднее(X(1:Ne)) σ2 := var(X(1:Ne)) т := т + 1// Возвращает среднее значение окончательного распределения выборки как решение return μ

Связанные методы

Смотрите также

Журнальные статьи

Реализации программного обеспечения

Ссылки

  1. ^ Рубинштейн, Р.Ю. и Крез, Д.П. (2004), Метод кросс-энтропии: унифицированный подход к комбинаторной оптимизации, моделированию Монте-Карло и машинному обучению, Springer-Verlag, Нью-Йорк ISBN  978-0-387-21240-1 .