Алгоритм шансов

В теории принятия решений алгоритм шансов (или алгоритм Брюсса ) — это математический метод вычисления оптимальных стратегий для класса задач, принадлежащих к области задач оптимальной остановки . Их решение следует из стратегии шансов , а важность стратегии шансов заключается в ее оптимальности, как объяснено ниже.

Алгоритм шансов применяется к классу задач, называемых проблемами последнего успеха . Формально целью этих задач является максимизация вероятности выделения в последовательности последовательно наблюдаемых независимых событий последнего события, удовлетворяющего определенному критерию («конкретное событие»). Эта идентификация должна быть сделана во время наблюдения. Пересмотр предыдущих наблюдений не допускается. Обычно конкретное событие определяется лицом, принимающим решения, как событие, представляющее подлинный интерес с точки зрения «остановки» для совершения четко определенного действия. Подобные проблемы встречаются в ряде ситуаций.

Примеры

Две разные ситуации иллюстрируют заинтересованность в максимизации вероятности остановки на последнем конкретном событии.

Предположим, что автомобиль выставлен на продажу тому, кто предложит самую высокую цену (лучшее «предложение»). Пусть потенциальные покупатели ответят и попросят показать машину. Каждый настаивает на немедленном решении продавца принять предложение или нет. Определите ставку как интересную и присвойте ей код 1, если она лучше всех предыдущих ставок, и код 0 в противном случае. Ставки будут формировать случайную последовательность 0 и 1. Только 1 интересуют продавца, который может опасаться, что каждая последующая 1 может оказаться последней. Из определения следует, что самая последняя 1 – это наибольшая ставка. Таким образом, максимизация вероятности продажи на последней единице означает максимизацию вероятности лучшей продажи . $п$
Врач, применяющий специальное лечение, может использовать код 1 для успешного лечения, в противном случае — 0. Врач лечит последовательность пациентов одинаковым образом и хочет свести к минимуму любые страдания и лечить каждого отзывчивого пациента в последовательности. Остановка на последней единице в такой случайной последовательности нулей и единиц позволит достичь этой цели. Поскольку врач не пророк, цель состоит в том, чтобы максимизировать вероятность остановки на последней единице. (См. Сострадательное использование .) $п$

Определения

Рассмотрим последовательность независимых событий . Свяжите с этой последовательностью другую последовательность независимых событий со значениями 1 или 0. Здесь , называемый успехом, обозначает событие, когда k-е наблюдение является интересным (по определению лица, принимающего решение), и неинтересным. Эти случайные величины наблюдаются последовательно, и цель состоит в том, чтобы правильно выбрать последний успех, когда он наблюдается. $п$ $I_{1},\,I_{2},\,\dots,\,I_{n}$ $\,I_{k}=1$ $\,I_{k}=0$ $I_{1},\,I_{2},\,\dots,\,I_{n}$

Пусть – вероятность того, что k-е событие будет интересным. Дальше пусть и . Обратите внимание, что здесь представлены шансы на то, что k-е событие окажется интересным, что объясняет название алгоритма определения шансов. $\,p_{k}=P(\,I_{k}\,=1)$ $\,q_{k}=\,1-p_{k}$ $\,r_{k}=p_{k}/q_{k}$ $\,r_{k}$

Алгоритмическая процедура

Алгоритм шансов суммирует шансы в обратном порядке.

r_{n}+r_{n-1}+r_{n-2}\,+\cdots,\,

до тех пор, пока эта сумма впервые не достигнет или не превысит значение 1. Если это происходит с индексом s , сохраняется s и соответствующая сумма.

R_{s}=\,r_{n}+r_{n-1}+r_{n-2}+\cdots +r_{s}.\,

Если сумма шансов не достигает 1, он устанавливает s = 1. В то же время он вычисляет

Q_{s}=q_{n}q_{n-1}\cdots q_{s}.\,

Результат:

$\,s$ , порог остановки
$\,w=Q_{s}R_{s}$ , вероятность победы.

Стратегия шансов

Стратегия шансов — это правило наблюдать события одно за другим и останавливаться на первом интересном событии, начиная с индекса s (если таковой имеется), где s — порог остановки выхода a.

Важность стратегии шансов и, следовательно, алгоритма шансов заключается в следующей теореме о шансах.

Теорема о шансах

Теорема шансов утверждает, что

Стратегия шансов оптимальна , то есть максимизирует вероятность остановки на последней 1.
Вероятность выигрыша стратегии шансов равна $w=Q_{s}R_{s}$
Если , вероятность выигрыша всегда равна как минимум $1/$ $e$ $= 0,367879...$ , и эта нижняя граница является наилучшей . $R_{s}\geq 1$ $ш$

Функции

Алгоритм шансов одновременно вычисляет оптимальную стратегию и оптимальную вероятность выигрыша . Кроме того, количество операций алгоритма шансов (суб)линейно по n. Следовательно, для всех последовательностей не может существовать более быстрого алгоритма, так что алгоритм шансов в то же время является оптимальным как алгоритм.

Источники

Брюсс в 2000 году разработал алгоритм шансов и придумал ему название. Он также известен как алгоритм (стратегия) Брюсса. Бесплатные реализации можно найти в Интернете.

Приложения

Приложения варьируются от медицинских вопросов в клинических испытаниях , таких как проблемы продаж, проблемы секретаря , выбор портфеля , стратегии (одностороннего) поиска, проблемы траектории и проблемы парковки, до проблем онлайн-обслуживания и других.

В том же духе существует теорема о шансах для непрерывных процессов прибытия с независимыми приращениями , таких как процесс Пуассона (Bruss 2000). В некоторых случаях шансы не обязательно известны заранее (как в примере 2 выше), так что применение алгоритма шансов напрямую невозможно. В этом случае на каждом этапе можно использовать последовательные оценки шансов. Это имеет смысл, если количество неизвестных параметров не велико по сравнению с количеством наблюдений n. Однако в этом случае вопрос оптимальности более сложен и требует дополнительных исследований. Обобщения алгоритма шансов допускают различные вознаграждения за неспособность остановиться и неправильные остановки, а также замену предположений о независимости более слабыми (Фергюсон, 2008).

Вариации

Bruss & Paindaveine 2000 обсуждали проблему отбора последних успехов. $k$

Тамаки в 2010 году доказал теорему о мультипликативных шансах, которая решает проблему остановки на любом из последних успехов. Точная нижняя граница вероятности победы получена Мацуи и Ано в 2014 году. $\ell$

Мацуи и Ано в 2017 году обсудили проблему выбора из последних успехов и получили точную нижнюю границу вероятности победы. Когда проблема эквивалентна проблеме шансов Брюсса. Если проблема эквивалентна задаче Bruss & Paindaveine 2000. Проблема, обсуждаемая Тамаки 2010, получается путем установки $k$ $\ell$ $\ell =k=1,$ $\ell =k\geq 1,$ $\ell \geq k = 1.$

Проблема с множественным выбором

Игроку предоставляется выбор, и он выигрывает, если какой-либо выбор является последним успехом. Гилберт и Мостеллер, 1966, рассмотрели случаи классической задачи секретаря . Проблема шансов обсуждается Ано, Какинума и Миёси, 2010. Дополнительные случаи проблемы шансов см. в Matsui & Ano 2016. $г$ $r=2,3,4$ $r=2,3$

Оптимальная стратегия для этой задачи принадлежит классу стратегий, определяемых набором пороговых чисел , где . $(a_{1},a_{2},...,a_{r})$ $a_{1}>a_{2}>\cdots >a_{r}$

В частности, представьте, что у вас есть письма о принятии с пометкой от до . У вас будут сотрудники, занимающиеся рассмотрением заявок, у каждого из которых будет по одному письму. Вы продолжаете проводить собеседования с кандидатами и ранжировать их в таблице, которую может видеть каждый специалист по подаче заявлений. Теперь офицер отправит письмо о принятии первому кандидату, который лучше всех кандидатов . (Неотправленные письма о зачислении по умолчанию передаются последним претендентам, как и в стандартной задаче о секретаре.) $г$ $1$ $г$ $г$ $я$ $1$ $a_{i}$

Когда Ано, Какинума и Миёси 2010 показали, что точная нижняя граница вероятности победы равна Для общего положительного целого числа , Мацуи и Ано 2016 доказали, что точная нижняя граница вероятности победы — это вероятность победы варианта задачи о секретаре, где нужно выберите k лучших кандидатов, используя всего k попыток . $r=2$ $e^{-1}+e^{-{\frac {3}{2}}}.$ $г$

При , точные нижние границы вероятностей выигрыша равны , и соответственно. $r=3,4,5$ $e^{-1}+e^{-{\frac {3}{2}}}+e^{-{\frac {47}{24}}}$ $e^{-1}+e^{-{\frac {3}{2}}}+e^{-{\frac {47}{24}}}+e^{-{\frac {2761}{1152}}}$ $e^{-1}+e^{-{\frac {3}{2}}}+e^{-{\frac {47}{24}}}+e^{-{\frac {2761}{1152}}}+e^{-{\frac {4162637}{1474560}}},$