stringtranslate.com

Модель урны Пойя

В статистике модель урн Полиа (также известная как схема урн Полиа или просто как урна Полиа ), названная в честь Джорджа Полиа , представляет собой семейство моделей урн , которые можно использовать для интерпретации многих часто используемых статистических моделей .

Модель представляет интересующие объекты (такие как атомы, люди, автомобили и т. д.) как цветные шары в урне . В базовой модели урны Пойя экспериментатор кладет x белых и y черных шаров в урну. На каждом шаге один шар вытаскивается из урны случайным образом и определяется его цвет; затем он возвращается в урну, а в урну добавляется дополнительный шар того же цвета.

Если по случайности в первых нескольких розыгрышах вытащатся больше черных шаров, чем белых, то вероятность того, что черных шаров будет вытащено больше позже, будет выше. Аналогично и для белых шаров. Таким образом, урна обладает самоусиливающимся свойством (« богатые становятся богаче »). Это противоположно выборке без замены , где каждый раз, когда наблюдается определенное значение, вероятность того, что оно будет наблюдаться снова, меньше, тогда как в модели урны Пойа наблюдаемое значение с большей вероятностью будет наблюдаться снова. В модели урны Пойа последовательные акты измерения с течением времени оказывают все меньшее и меньшее влияние на будущие измерения, тогда как в выборке без замены верно обратное: после определенного количества измерений определенного значения это значение больше никогда не будет наблюдаться.

Это также отличается от выборки с заменой, где шар возвращается в урну, но без добавления новых шаров. В этом случае нет ни самоусиления, ни антисамоусиления.

Основные результаты

Интерес представляют вопросы эволюции заполнения урн и последовательности цветов вынимаемых шаров.

После розыгрышей вероятность того, что урна содержит белые и черные шары (для ), равна , где черта сверху обозначает возрастающий факториал . Это можно доказать, нарисовав треугольник Паскаля всех возможных конфигураций.

В частности, если начать с одного белого и одного черного шара (т.е. ), вероятность того, что после розыгрыша в урне окажется любое количество белых шаров, одинакова, .

В более общем случае, если урна изначально содержит шары цвета , при этом , то после розыгрышей вероятность того, что урна содержит шары цвета , равна , где мы используем мультиномиальный коэффициент .

При условии, что после розыгрышей в урне окажутся цветные шары , существуют различные траектории, которые могли бы привести к такому конечному состоянию. Условная вероятность каждой траектории одинакова: .

Интерпретация

Одна из причин интереса к этой конкретной довольно сложной модели урны (т. е. с дублированием и последующей заменой каждого вытащенного шара) заключается в том, что она дает пример, в котором количество (первоначально x черных и y белых) шаров в урне не скрывается, что позволяет аппроксимировать правильное обновление субъективных вероятностей, соответствующих другому случаю, в котором исходное содержимое урны скрывается, в то время как проводится обычная выборка с заменой (без дублирования шаров Пойя). Из-за простой схемы «выборка с заменой» в этом втором случае содержимое урны теперь статично , но эта большая простота компенсируется предположением, что содержимое урны теперь неизвестно наблюдателю. Байесовский анализ неопределенности наблюдателя относительно начального содержимого урны может быть выполнен с использованием конкретного выбора (сопряженного) априорного распределения. В частности, предположим, что наблюдатель знает, что урна содержит только идентичные шары, каждый из которых окрашен либо в черный, либо в белый цвет, но он не знает абсолютного числа присутствующих шаров, ни пропорции каждого цвета. Предположим, что у него есть априорные убеждения относительно этих неизвестных: для него распределение вероятностей содержимого урны хорошо аппроксимируется некоторым априорным распределением для общего числа шаров в урне и априорным бета-распределением с параметрами (x,y) для начальной доли тех, которые являются черными, причем эта пропорция (для него) считается приблизительно независимой от общего числа. Тогда процесс результатов последовательности извлечений из урны (с заменой, но без дублирования) имеет примерно тот же закон вероятности, что и вышеприведенная схема Пойа, в которой фактическое содержимое урны не было скрыто от него. Ошибка аппроксимации здесь связана с тем фактом, что урна, содержащая известное конечное число m шаров, конечно, не может иметь точно бета-распределенную неизвестную пропорцию черных шаров, поскольку область возможных значений для этой пропорции ограничена кратностью , а не имеет полной свободы принимать любое значение в непрерывном единичном интервале, как это было бы в случае точно бета-распределенной пропорции. Этот слегка неформальный отчет предоставляется по причине мотивации и может быть сделан более математически точным.

Эта базовая модель урны Пойя была обобщена во многих отношениях.

Распределения, связанные с урной Пойя

Взаимозаменяемость

Урна Полии — типичный пример обменного процесса .

Предположим, у нас есть урна, содержащая белые и черные шары. Мы начинаем вытаскивать шары из урны случайным образом. На -м вытягивании мы определяем случайную величину, , по , если шар черный, и в противном случае. Затем мы возвращаем шар в урну с дополнительным шаром того же цвета. Для заданного , если у нас есть это для многих , то более вероятно, что , поскольку в урну было добавлено больше черных шаров. Следовательно, эти переменные не являются независимыми друг от друга.

Однако последовательность проявляет более слабое свойство взаимозаменяемости. [2] Напомним, что (конечная или бесконечная) последовательность случайных величин называется взаимозаменяемой, если ее совместное распределение инвариантно относительно перестановок индексов.

Чтобы показать взаимозаменяемость последовательности , предположим, что из урны вынимаются шары, и среди них есть черные и белые. При первом извлечении количество шаров в урне равно ; при втором извлечении оно равно и так далее. При -ом извлечении количество шаров будет равно . Вероятность того, что сначала будут вынуты все черные шары, а затем все белые шары, определяется по формуле

Теперь мы должны показать, что если порядок черных и белых шаров переставить, вероятность не изменится. Как и в выражении выше, даже после перестановки розыгрышей знаменатель th всегда будет , поскольку это количество шаров в урне в этом раунде.

Если мы увидим -й черный шар в раунде , вероятность будет равна , т.е. числитель будет равен . С тем же аргументом мы можем вычислить вероятность для белых шаров. Таким образом, для любой последовательности , в которой встречается раз и встречается раз (т.е. последовательности с черными шарами и белыми шарами, вытащенными в некотором порядке), окончательная вероятность будет равна следующему выражению, где мы воспользовались коммутативностью умножения в числителе: Эта вероятность не связана с порядком появления черных и белых шаров и зависит только от общего количества белых шаров и общего количества черных шаров. [2]

Согласно теореме Де Финетти , должно существовать уникальное априорное распределение, такое, что совместное распределение наблюдения последовательности является байесовской смесью вероятностей Бернулли. Можно показать, что это априорное распределение является бета-распределением с параметрами . В теореме Де Финетти, если мы заменим на , то получим предыдущее уравнение: [2] В этом уравнении .

Смотрите также

Ссылки

  1. ^ Хоппе, Фред (1984). «Подобные Полиа урны и формула выборки Эвенса». Журнал математической биологии . 20 : 91. doi : 10.1007/BF00275863. hdl : 2027.42/46944 . S2CID  122994288.
  2. ^ abc Hoppe, Fred M (1984). «Полиаподобные урны и формула выборки Юэнса». Журнал математической биологии . 20 (1): 91–94. doi : 10.1007/bf00275863. hdl : 2027.42/46944 . ISSN  0303-6812. S2CID  122994288.[ мертвая ссылка ]

Дальнейшее чтение

Библиография