распределение Пуассона

В теории вероятностей и статистике распределение Пуассона — дискретное распределение вероятностей , выражающее вероятность того, что заданное количество событий произойдет за фиксированный интервал времени, если эти события происходят с известной постоянной средней скоростью и независимо от времени, прошедшего с момента последнего события. . ^[1] Его также можно использовать для количества событий в других типах интервалов, кроме времени, и в размерности больше 1 (например, количество событий в данной области или объеме).

Распределение Пуассона названо в честь французского математика Симеона Дени Пуассона ( / ˈ p w ɑː s ɒ n / ; французское произношение: [pwasɔ̃] ). Это играет важную роль для дискретно-устойчивых распределений .

При распределении Пуассона с ожиданием λ событий в данном интервале вероятность k событий в том же интервале равна: ^[2]^{: 60}

{\frac {\lambda ^{k}e^{-\lambda }}{k!}}.

Например, рассмотрим колл-центр, который случайным образом принимает в среднем λ = 3 звонка в минуту в любое время суток. Если вызовы независимы, прием одного не меняет вероятность того, когда поступит следующий. При этих предположениях количество k звонков, полученных в течение любой минуты, имеет распределение вероятностей Пуассона. Получение от k = 1 до 4 вызовов имеет вероятность около 0,77, а получение 0 или хотя бы 5 вызовов имеет вероятность около 0,23.

Другой пример, для которого распределение Пуассона является полезной моделью, — это количество событий радиоактивного распада за фиксированный период наблюдения. ^{[ нужна цитата ]}

История

Распределение было впервые введено Симеоном Дени Пуассоном (1781–1840) и опубликовано вместе с его теорией вероятностей в его работе « Recherches sur la probilité des jugements en matière Criminelle et en Matière Civile» (1837). ^[3]^{: 205-207} В работе были выдвинуты теории о количестве неправомерных приговоров в данной стране, сосредоточив внимание на определенных случайных величинах $N$ , которые подсчитывают, среди прочего, количество дискретных происшествий (иногда называемых «событиями» или «прибытиями»). происходящие в течение интервала времени заданной длины. Результат уже был дан в 1711 году Авраамом де Муавром в De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus . ^[4]^{: 219}^[5]^{: 14-15}^[6]^{: 193}^[7]^{: 157} Это делает его примером закона Стиглера и побудило некоторых авторов утверждать, что распределение Пуассона должно носить имя де Муавра. ^[8]^[9]

В 1860 году Саймон Ньюкомб подогнал распределение Пуассона к числу звезд, находящихся в единице пространства. ^[10] Дальнейшее практическое применение этого распределения было сделано Ладиславом Борткевичем в 1898 году, когда ему было поручено исследовать количество солдат в прусской армии, случайно убитых ударами лошади; ^[11]^{: 23-25} этот эксперимент представил распределение Пуассона в области техники надежности .

Определения

Функция массы вероятности

Говорят, что дискретная случайная величина $X$ имеет распределение Пуассона с параметром, если она имеет функцию массы вероятности , определяемую следующим образом: ^[2]^{: 60} $\lambda >0,$

f(k;\lambda)=\Pr(X{=}k)={\frac {\lambda ^{k}e^{-\lambda }}{k!}},

где

$k$ — количество вхождений ( ) $k=0,1,2,\ldots$
$e$ — число Эйлера ( ) $e=2.71828\ldots$
к ! = k ( k– 1) ··· (3)(2)(1) – факториал .

Положительное действительное число $λ$ равно ожидаемому значению X $,$ а также его дисперсии . ^[12]

\lambda =\operatorname {E} (X)=\operatorname {Var} (X).

Распределение Пуассона можно применять к системам с большим количеством возможных событий, каждое из которых является редким . Число таких событий, происходящих в течение фиксированного интервала времени, при определенных обстоятельствах является случайным числом с распределением Пуассона.

Уравнение можно адаптировать, если вместо среднего числа событий нам будет задана средняя скорость , с которой события происходят. Тогда и: ^[13] $\lambda ,$ $r$ $\lambda =rt,$

P(k{\text{ events in interval }}t)={\frac {(rt)^{k}e^{-rt}}{k!}}.

Пример

Распределение Пуассона может быть полезно для моделирования таких событий, как:

количество метеоритов диаметром более 1 метра, падающих на Землю за год;
количество лазерных фотонов, попадающих в детектор за определенный интервал времени;
количество студентов, получивших низкую и высокую оценку на экзамене; и
места дефектов и дислокаций в материалах.

Примерами появления случайных точек в космосе являются: места столкновений астероидов с Землей (2-мерные), места дефектов материала (3-мерные) и места деревьев в лесу (2-мерные). . ^[14]

Предположения и обоснованность

Распределение Пуассона является подходящей моделью, если верны следующие предположения: ^[15]

$k$ — это количество раз, когда событие происходит в интервале, и $k$ может принимать значения 0, 1, 2,... .
Возникновение одного события не влияет на вероятность возникновения второго события. То есть события происходят независимо.
Средняя скорость, с которой происходят события, не зависит от каких-либо событий. Для простоты обычно предполагается, что оно постоянно, но на практике может меняться со временем.
Два события не могут произойти в один и тот же момент; вместо этого в каждом очень маленьком подинтервале либо происходит ровно одно событие, либо не происходит ни одного события.

Если эти условия верны, то $k$ — случайная величина Пуассона, а распределение $k$ — распределение Пуассона.

Распределение Пуассона также является пределом биномиального распределения , для которого вероятность успеха каждого испытания равна $λ$ , деленной на количество испытаний, поскольку количество испытаний приближается к бесконечности (см. Связанные распределения).

Примеры вероятностей для распределений Пуассона

События раз в интервале: частный случай $λ$ = 1 и $k$ = 0

Предположим, что астрономы подсчитали, что крупные метеориты (больше определенного размера) падают на Землю в среднем раз в 100 лет ( $λ$ = 1 событие в 100 лет), и что число попаданий метеоритов подчиняется распределению Пуассона. Какова вероятность падения $k$ = 0 метеоритов в ближайшие 100 лет?

P(k={\text{0 meteorites hit in next 100 years}})={\frac {1^{0}e^{-1}}{0!}}={\frac {1}{e}}\approx 0.37.

При этих предположениях вероятность того, что в ближайшие 100 лет на Землю не упадут крупные метеориты, составляет примерно 0,37. Оставшиеся 1–0,37 = 0,63 — это вероятность падения 1, 2, 3 или более крупных метеоритов в ближайшие 100 лет. В приведенном выше примере наводнение происходило раз в 100 лет ( $λ$ = 1). По тем же расчетам вероятность отсутствия паводков через 100 лет составила примерно 0,37.

В общем, если событие происходит в среднем один раз за интервал ( $λ$ = 1) и события подчиняются распределению Пуассона, то $P$ (0 событий в следующем интервале) = 0,37. Кроме того, $P$ (ровно одно событие в следующем интервале) = 0,37, как показано в таблице для наводнений.

Примеры, нарушающие предположения Пуассона

Число студентов, прибывающих в студенческий союз в минуту, скорее всего, не будет подчиняться распределению Пуассона, поскольку этот показатель не является постоянным (низкий показатель во время занятий, высокий показатель между занятиями), а прибытие отдельных учащихся не является независимым (студенты обычно приходят группами). Непостоянная скорость прибытия может быть смоделирована как смешанное распределение Пуассона , а прибытие групп, а не отдельных студентов, как составной процесс Пуассона .

Число землетрясений магнитудой 5 баллов в год в стране может не соответствовать распределению Пуассона, если одно сильное землетрясение увеличивает вероятность афтершоков аналогичной магнитуды.

Примеры, в которых гарантировано хотя бы одно событие, не являются распределенными по Пуассону; но может быть смоделировано с использованием распределения Пуассона, усеченного до нуля .

Распределения подсчетов, в которых количество интервалов с нулевыми событиями выше, чем предсказано моделью Пуассона, можно смоделировать с использованием модели с нулевым расширением .

Характеристики

Описательная статистика

Ожидаемое значение и дисперсия случайной величины с распределением Пуассона равны $λ$ .
Коэффициент вариации равен 1 , индекс дисперсии равен 1. ^[7]^{: 163} ${\textstyle \lambda ^{-1/2},}$
Среднее абсолютное отклонение от среднего составляет ^[7]^{: 163.} $\operatorname {E} [\ |X-\lambda |\ ]={\frac {2\lambda ^{\lfloor \lambda \rfloor +1}e^{-\lambda }}{\lfloor \lambda \rfloor !}}.$
Мода случайной величины, распределенной по Пуассону, с нецелым числом $λ$ равна наибольшему целому числу , меньшему или равному $λ$ . Это также записывается как пол ( $λ$ ). Когда $λ$ — целое положительное число, режимами являются $λ$ и $λ$ − 1. $\lfloor \lambda \rfloor ,$
Все кумулянты распределения Пуассона равны ожидаемому значению $λ$ . n $-$ й факториальный момент распределения Пуассона равен $λ$ ^$n$ .
Ожидаемое значение процесса Пуассона иногда разлагается на произведение интенсивности и воздействия (или, в более общем смысле, выражается как интеграл «функции интенсивности» во времени или пространстве, иногда описываемой как «воздействие»). ^[17]

медиана

Границы медианы ( ) распределения известны и точны : ^[18] $\nu$

\lambda -\ln 2\leq \nu <\lambda +{\frac {1}{3}}.

Высшие моменты

Высшие нецентрированные моменты $m$ _$k$ распределения Пуассона представляют собой полиномы Тушара от $λ$ :

m_{k}=\sum _{i=0}^{k}\lambda ^{i}{\begin{Bmatrix}k\\i\end{Bmatrix}},

числа Стирлинга второго рода^[19]^[1]^{: 6}

E[X]=\lambda ,\quad E[X(X-1)]=\lambda ^{2},\quad E[X(X-1)(X-2)]=\lambda ^{3},\cdots

λ =формула Добински

n

разделов набора

n

Простая верхняя граница: ^[20]

m_{k}=E[X^{k}]\leq \left({\frac {k}{\log(k/\lambda +1)}}\right)^{k}\leq \lambda ^{k}\exp \left({\frac {k^{2}}{2\lambda }}\right).

Суммы случайных величин, распределенных по Пуассону

Если for независимы , то ^[21]^{: 65} Обратной является теорема Райкова , которая гласит, что если сумма двух независимых случайных величин распределена по Пуассону, то таковой является и каждая из этих двух независимых случайных величин . ^[22]^[23] $X_{i}\sim \operatorname {Pois} (\lambda _{i})$ $i=1,\dotsc ,n$ ${\textstyle \sum _{i=1}^{n}X_{i}\sim \operatorname {Pois} \left(\sum _{i=1}^{n}\lambda _{i}\right).}$

Максимальная энтропия

Это распределение максимальной энтропии среди набора обобщенных биномиальных распределений со средним и , ^[24] где обобщенное биномиальное распределение определяется как распределение суммы N независимых, но не одинаково распределенных переменных Бернулли. $B_{n}(\lambda )$ $\lambda$ $n\rightarrow \infty$

Другие объекты недвижимости

Распределения Пуассона представляют собой бесконечно делимые распределения вероятностей. ^[25]^{: 233}^[7]^{: 164}
Направленное расхождение Кульбака–Лейблера от определяется выражением $P=\operatorname {Pois} (\lambda )$ $P_{0}=\operatorname {Pois} (\lambda _{0})$ $\operatorname {D} _{\text{KL}}(P\parallel P_{0})=\lambda _{0}-\lambda +\lambda \log {\frac {\lambda }{\lambda _{0}}}.$
Если целое число, то удовлетворяет и ^[26]^[^{не удалось проверить}^–^{см. обсуждение}^] $\lambda \geq 1$ $Y\sim \operatorname {Pois} (\lambda )$ $\Pr(Y\geq E[Y])\geq {\frac {1}{2}}$ $\Pr(Y\leq E[Y])\geq {\frac {1}{2}}.$
Оценки хвостовых вероятностей пуассоновой случайной величины можно получить, используя аргумент границы Чернова . ^[27]^{: 97-98} $X\sim \operatorname {Pois} (\lambda )$ $P(X\geq x)\leq {\frac {(e\lambda )^{x}e^{-\lambda }}{x^{x}}},{\text{ for }}x>\lambda ,$ $P(X\leq x)\leq {\frac {(e\lambda )^{x}e^{-\lambda }}{x^{x}}},{\text{ for }}x<\lambda .$
Вероятность верхнего хвоста можно увеличить (как минимум в два раза) следующим образом: ^[28]

P(X\geq x)\leq {\frac {e^{-\operatorname {D} _{\text{KL}}(Q\parallel P)}}{\max {(2,{\sqrt {4\pi \operatorname {D} _{\text{KL}}(Q\parallel P)}}})}},{\text{ for }}x>\lambda ,

\operatorname {D} _{\text{KL}}(Q\parallel P)

Q=\operatorname {Pois} (x)

P=\operatorname {Pois} (\lambda )

Неравенства, связывающие функцию распределения случайной величины Пуассона со стандартной функцией нормального распределения, следующие: ^[29] $X\sim \operatorname {Pois} (\lambda )$ $\Phi (x)$ $\Phi \left(\operatorname {sign} (k-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)}}\right)<P(X\leq k)<\Phi \left(\operatorname {sign} (k+1-\lambda ){\sqrt {2\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)}}\right),{\text{ for }}k>0,$ где – расходимость Кульбака–Лейблера from и – расходимость Кульбака–Лейблера from . $\operatorname {D} _{\text{KL}}(Q_{-}\parallel P)$ $Q_{-}=\operatorname {Pois} (k)$ $P=\operatorname {Pois} (\lambda )$ $\operatorname {D} _{\text{KL}}(Q_{+}\parallel P)$ $Q_{+}=\operatorname {Pois} (k+1)$ $P$

Пуассоновые гонки

Пусть и – независимые случайные величины, тогда имеем $X\sim \operatorname {Pois} (\lambda )$ $Y\sim \operatorname {Pois} (\mu )$ $\lambda <\mu ,$

{\frac {e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}}{(\lambda +\mu )^{2}}}-{\frac {e^{-(\lambda +\mu )}}{2{\sqrt {\lambda \mu }}}}-{\frac {e^{-(\lambda +\mu )}}{4\lambda \mu }}\leq P(X-Y\geq 0)\leq e^{-({\sqrt {\mu }}-{\sqrt {\lambda }})^{2}}

Верхняя оценка доказывается с использованием стандартной оценки Чернова.

Нижнюю оценку можно доказать, отметив, что это вероятность того, что где которая ограничена снизу где является относительной энтропией ( подробности см. в статье об границах хвостов биномиальных распределений ). Далее отметив это и вычисление нижней границы безусловной вероятности дает результат. Более подробную информацию можно найти в приложении Kamath et al. . ^[30] $P(X-Y\geq 0\mid X+Y=i)$ ${\textstyle Z\geq {\frac {i}{2}},}$ ${\textstyle Z\sim \operatorname {Bin} \left(i,{\frac {\lambda }{\lambda +\mu }}\right),}$ ${\textstyle {\frac {1}{(i+1)^{2}}}e^{-iD\left(0.5\|{\frac {\lambda }{\lambda +\mu }}\right)},}$ $D$ $X+Y\sim \operatorname {Pois} (\lambda +\mu ),$

Связанные дистрибутивы

Как биномиальное распределение с бесконечно малыми временными шагами

Распределение Пуассона можно вывести как предельный случай биномиального распределения , поскольку количество испытаний стремится к бесконечности, а ожидаемое количество успехов остается фиксированным — см. Закон редких событий ниже. Следовательно, его можно использовать как аппроксимацию биномиального распределения, если $n$ достаточно велико, а p достаточно мало. Распределение Пуассона является хорошим приближением биномиального распределения, если $n$ равно 20, а p меньше или равно 0,05, и отличным приближением, если $n$ ≥ 100 и $np$ ≤ 10. ^[31] Пусть и – соответствующая кумулятивная плотность . функций биномиального и пуассоновского распределений имеем: $F_{\mathrm {B} }$ $F_{\mathrm {P} }$

F_{\mathrm {B} }(k;n,p)\ \approx \ F_{\mathrm {P} }(k;\lambda =np).

функции, генерирующие вероятность^[32]испытание Бернуллиnkn

\lambda \leq 1

{\tfrac {\lambda }{n}}

$p_{k}^{(n)}={\binom {n}{k}}\left({\frac {\lambda }{n}}\right)^{\!k}\left(1{-}{\frac {\lambda }{n}}\right)^{\!n-k}$ ,

производящая функция которого:

$P^{(n)}(x)=\sum _{k=0}^{n}p_{k}^{(n)}x^{k}=\left(1-{\frac {\lambda }{n}}+{\frac {\lambda }{n}}x\right)^{n}.$

Взяв предел при увеличении n до бесконечности (при фиксированном x ) и применив определение предела произведения экспоненциальной функции , это сводится к производящей функции распределения Пуассона:

$\lim _{n\to \infty }P^{(n)}(x)=\lim _{n\to \infty }\left(1{+}{\tfrac {\lambda (x-1)}{n}}\right)^{n}=e^{\lambda (x-1)}=\sum _{k=0}^{\infty }e^{-\lambda }{\frac {\lambda ^{k}}{k!}}x^{k}.$

Общий

Если и независимы, то разница соответствует распределению Скеллама . $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $Y=X_{1}-X_{2}$
Если и независимы, то распределение условного on является биномиальным . $X_{1}\sim \mathrm {Pois} (\lambda _{1})\,$ $X_{2}\sim \mathrm {Pois} (\lambda _{2})\,$ $X_{1}$ $X_{1}+X_{2}$
В частности, если тогда $X_{1}+X_{2}=k,$ $X_{1}|X_{1}+X_{2}=k\sim \mathrm {Binom} (k,\lambda _{1}/(\lambda _{1}+\lambda _{2})).$
В более общем смысле, если X ₁ , X ₂ , ..., X _$n$ являются независимыми случайными величинами Пуассона с параметрами $λ$ ₁ , $λ$ ₂ , ..., $λ$ _$n$ , то
из этого следует, что на самом деле $\sum _{j=1}^{n}X_{j}=k,$ $X_{i}{\Big |}\sum _{j=1}^{n}X_{j}=k\sim \mathrm {Binom} \left(k,{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right).$ $\{X_{i}\}\sim \mathrm {Multinom} \left(k,\left\{{\frac {\lambda _{i}}{\sum _{j=1}^{n}\lambda _{j}}}\right\}\right).$
Если и распределение условного на X = $k$ является биномиальным распределением , то распределение Y следует распределению Пуассона. Фактически, если условное на следует полиномиальному распределению , то каждое следует независимому распределению Пуассона. $X\sim \mathrm {Pois} (\lambda )\,$ $Y$ $Y\mid (X=k)\sim \mathrm {Binom} (k,p),$ $Y\sim \mathrm {Pois} (\lambda \cdot p).$ $\{X=k\},$ $\{Y_{i}\}$ $\{Y_{i}\}\mid (X=k)\sim \mathrm {Multinom} \left(k,p_{i}\right),$ $Y_{i}$ $Y_{i}\sim \mathrm {Pois} (\lambda \cdot p_{i}),\rho (Y_{i},Y_{j})=0.$
Распределение Пуассона является частным случаем дискретного составного распределения Пуассона (или распределения Пуассона заикания) только с параметром. ^[33]^[34] Дискретное составное распределение Пуассона можно вывести из предельного распределения одномерного полиномиального распределения. Это также частный случай составного распределения Пуассона .
Для достаточно больших значений $λ$ (скажем, $λ$ > 1000) нормальное распределение со средним значением $λ$ и дисперсией $λ$ (стандартное отклонение ) является отличным приближением к распределению Пуассона. Если $λ$ больше примерно 10, то нормальное распределение является хорошим приближением, если выполняется соответствующая коррекция непрерывности , т. е. если $P($ $X$ $\leq$ $x$ $)$ , где x – неотрицательное целое число, заменяется на $P ($ $X$ $\leq x ).$ $х$ $+ 0,5)$ . ${\sqrt {\lambda }}$ $F_{\mathrm {Poisson} }(x;\lambda )\approx F_{\mathrm {normal} }(x;\mu =\lambda ,\sigma ^{2}=\lambda )$
Преобразование, стабилизирующее дисперсию : Если , то ^[7]^{: 168} $X\sim \mathrm {Pois} (\lambda ),$ $Y=2{\sqrt {X}}\approx {\mathcal {N}}(2{\sqrt {\lambda }};1),$ и ^[35]^{: 196} $Y={\sqrt {X}}\approx {\mathcal {N}}({\sqrt {\lambda }};1/4).$ При этом преобразовании сходимость к нормальности (по мере увеличения) происходит намного быстрее, чем при использовании непреобразованной переменной. ^[^{нужна цитата}^] Доступны и другие, немного более сложные преобразования, стабилизирующие дисперсию, ^[7]^{: 168,} одно из которых — преобразование Анскомба . ^[36] См. Преобразование данных (статистика) для более общего использования преобразований. $\lambda$
Если для каждого t > 0 количество поступлений во временном интервале $[0, t]$ следует распределению Пуассона со средним значением λt , то последовательность времен между поступлениями представляет собой независимые и одинаково распределенные экспоненциальные случайные величины со средним значением 1/ $λ$ . ^[37]^{: 317–319.}
Кумулятивные функции распределения распределений Пуассона и хи-квадрат связаны следующим образом: ^[7]^{: 167} $F_{\text{Poisson}}(k;\lambda )=1-F_{\chi ^{2}}(2\lambda ;2(k+1))\quad \quad {\text{ integer }}k,$ и ^[7]^{: 158} $P(X=k)=F_{\chi ^{2}}(2\lambda ;2(k+1))-F_{\chi ^{2}}(2\lambda ;2k).$

Пуассоновское приближение

Предположим , где тогда ^[38]полиномиально распределено при условии $X_{1}\sim \operatorname {Pois} (\lambda _{1}),X_{2}\sim \operatorname {Pois} (\lambda _{2}),\dots ,X_{n}\sim \operatorname {Pois} (\lambda _{n})$ $\lambda _{1}+\lambda _{2}+\dots +\lambda _{n}=1,$ $(X_{1},X_{2},\dots ,X_{n})$ $(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Mult} (N,\lambda _{1},\lambda _{2},\dots ,\lambda _{n})$ $N=X_{1}+X_{2}+\dots X_{n}.$

Это означает ^[27]^:101-102 , среди прочего, что для любой неотрицательной функции если полиномиально распределено, то $f(x_{1},x_{2},\dots ,x_{n}),$ $(Y_{1},Y_{2},\dots ,Y_{n})\sim \operatorname {Mult} (m,\mathbf {p} )$

\operatorname {E} [f(Y_{1},Y_{2},\dots ,Y_{n})]\leq e{\sqrt {m}}\operatorname {E} [f(X_{1},X_{2},\dots ,X_{n})]

(X_{1},X_{2},\dots ,X_{n})\sim \operatorname {Pois} (\mathbf {p} ).

Коэффициент можно заменить на 2, если далее предполагается, что он монотонно возрастает или убывает. $e{\sqrt {m}}$ $f$

Двумерное распределение Пуассона

Это распределение было распространено на двумерный случай. ^[39] Производящая функция для этого распределения равна

g(u,v)=\exp[(\theta _{1}-\theta _{12})(u-1)+(\theta _{2}-\theta _{12})(v-1)+\theta _{12}(uv-1)]

\theta _{1},\theta _{2}>\theta _{12}>0

Маргинальными распределениями являются Пуассон ( θ ₁ ) и Пуассон ( θ ₂ ), а коэффициент корреляции ограничен диапазоном

0\leq \rho \leq \min \left\{{\sqrt {\frac {\theta _{1}}{\theta _{2}}}},{\sqrt {\frac {\theta _{2}}{\theta _{1}}}}\right\}

Простой способ создать двумерное распределение Пуассона — взять три независимых распределения Пуассона со средними значениями , а затем установить. Функция вероятности двумерного распределения Пуассона равна $X_{1},X_{2}$ $Y_{1},Y_{2},Y_{3}$ $\lambda _{1},\lambda _{2},\lambda _{3}$ $X_{1}=Y_{1}+Y_{3},X_{2}=Y_{2}+Y_{3}.$

\Pr(X_{1}=k_{1},X_{2}=k_{2})=\exp \left(-\lambda _{1}-\lambda _{2}-\lambda _{3}\right){\frac {\lambda _{1}^{k_{1}}}{k_{1}!}}{\frac {\lambda _{2}^{k_{2}}}{k_{2}!}}\sum _{k=0}^{\min(k_{1},k_{2})}{\binom {k_{1}}{k}}{\binom {k_{2}}{k}}k!\left({\frac {\lambda _{3}}{\lambda _{1}\lambda _{2}}}\right)^{k}

Бесплатное распределение Пуассона

Свободное распределение Пуассона ^[40] с размером и скоростью скачка возникает в свободной теории вероятностей как предел повторяющейся свободной свертки $\alpha$ $\lambda$

\left(\left(1-{\frac {\lambda }{N}}\right)\delta _{0}+{\frac {\lambda }{N}}\delta _{\alpha }\right)^{\boxplus N}

N \to \infty

Другими словами, пусть это случайные величины, имеющие значение с вероятностью и значение 0 с оставшейся вероятностью. Предположим также, что семья свободно независима . Тогда предел по закону дается законом Свободного Пуассона с параметрами $X_{N}$ $X_{N}$ $\alpha$ ${\textstyle {\frac {\lambda }{N}}}$ $X_{1},X_{2},\ldots$ $N\to \infty$ $X_{1}+\cdots +X_{N}$ $\lambda ,\alpha .$

Это определение аналогично одному из способов получения классического распределения Пуассона из (классического) пуассоновского процесса.

Мера, связанная со свободным законом Пуассона, определяется формулой ^[41]

\mu ={\begin{cases}(1-\lambda )\delta _{0}+\nu ,&{\text{if }}0\leq \lambda \leq 1\\\nu ,&{\text{if }}\lambda >1,\end{cases}}

\nu ={\frac {1}{2\pi \alpha t}}{\sqrt {4\lambda \alpha ^{2}-(t-\alpha (1+\lambda ))^{2}}}\,dt

[\alpha (1-{\sqrt {\lambda }})^{2},\alpha (1+{\sqrt {\lambda }})^{2}].

Этот закон также возникает в теории случайных матриц как закон Марченко-Пастура . Его свободные кумулянты равны $\kappa _{n}=\lambda \alpha ^{n}.$

Некоторые преобразования этого закона

Мы приводим значения некоторых важных преобразований свободного закона Пуассона; вычисление можно найти, например, в книге « Лекции по комбинаторике свободной вероятности» А. Ники и Р. Спайхера ^[42]

R-преобразование свободного закона Пуассона имеет вид

R(z)={\frac {\lambda \alpha }{1-\alpha z}}.

Преобразование Коши (которое является отрицательным преобразованием Стилтьеса ) определяется выражением

G(z)={\frac {z+\alpha -\lambda \alpha -{\sqrt {(z-\alpha (1+\lambda ))^{2}-4\lambda \alpha ^{2}}}}{2\alpha z}}

S-преобразование определяется выражением

S(z)={\frac {1}{z+\lambda }}

\alpha =1.

Количество Вейбулла и Стабиля

Массовая функция вероятности Пуассона может быть выражена в форме, аналогичной распределению произведений распределения Вейбулла и варианту формы стабильного распределения количества . Переменную можно рассматривать как обратную параметру устойчивости Леви в стабильном распределении количества: $f(k;\lambda )$ $(k+1)$

f(k;\lambda )=\displaystyle \int _{0}^{\infty }{\frac {1}{u}}\,W_{k+1}({\frac {\lambda }{u}})\left[\left(k+1\right)u^{k}\,{\mathfrak {N}}_{\frac {1}{k+1}}\left(u^{k+1}\right)\right]\,du,

{\mathfrak {N}}_{\alpha }(\nu )

\alpha =1/\left(k+1\right),

W_{k+1}(x)

k+1.

Статистические выводы

Оценка параметров

Имея выборку из $n$ измеренных значений для $i$ $= 1,...,$ $n$ , мы хотим оценить значение параметра $λ$ пуассоновской популяции, из которой была взята выборка. Оценка максимального правдоподобия равна ^[43] $k_{i}\in \{0,1,\dots \},$

{\widehat {\lambda }}_{\mathrm {MLE} }={\frac {1}{n}}\sum _{i=1}^{n}k_{i}\ .

Поскольку каждое наблюдение имеет математическое ожидание $λ,$ то же самое имеет и среднее значение выборки. $Следовательно$ , оценка максимального правдоподобия является несмещенной оценкой λ . Это также эффективный инструмент оценки, поскольку его дисперсия достигает нижней границы Крамера – Рао (CRLB). ^[44] Следовательно, это несмещенный метод с минимальной дисперсией . Также можно доказать, что сумма (и, следовательно, выборочное среднее, поскольку оно является взаимно однозначной функцией суммы) является полной и достаточной статистикой для $λ$ .

Для доказательства достаточности можно воспользоваться теоремой факторизации . Рассмотрим разделение функции массы вероятности совместного распределения Пуассона для выборки на две части: одну, которая зависит исключительно от выборки , называемую , и другую, которая зависит от параметра и выборки только через функцию Тогда является достаточной статистикой для $\mathbf {x}$ $h(\mathbf {x} )$ $\lambda$ $\mathbf {x}$ $T(\mathbf {x} ).$ $T(\mathbf {x} )$ $\lambda .$

P(\mathbf {x} )=\prod _{i=1}^{n}{\frac {\lambda ^{x_{i}}e^{-\lambda }}{x_{i}!}}={\frac {1}{\prod _{i=1}^{n}x_{i}!}}\times \lambda ^{\sum _{i=1}^{n}x_{i}}e^{-n\lambda }

Первое слагаемое зависит только от . Второе слагаемое зависит от выборки только через. Таким образом, является достаточным. $h(\mathbf {x} )$ $\mathbf {x}$ $g(T(\mathbf {x} )|\lambda )$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}x_{i}.}$ $T(\mathbf {x} )$

Чтобы найти параметр $λ$ , который максимизирует функцию вероятности для популяции Пуассона, мы можем использовать логарифм функции правдоподобия:

{\begin{aligned}\ell (\lambda )&=\ln \prod _{i=1}^{n}f(k_{i}\mid \lambda )\\&=\sum _{i=1}^{n}\ln \!\left({\frac {e^{-\lambda }\lambda ^{k_{i}}}{k_{i}!}}\right)\\&=-n\lambda +\left(\sum _{i=1}^{n}k_{i}\right)\ln(\lambda )-\sum _{i=1}^{n}\ln(k_{i}!).\end{aligned}}

Берем производную по $λ$ и сравниваем ее с нулем: $\ell$

{\frac {\mathrm {d} }{\mathrm {d} \lambda }}\ell (\lambda )=0\iff -n+\left(\sum _{i=1}^{n}k_{i}\right){\frac {1}{\lambda }}=0.\!

Решение для $λ$ дает стационарную точку.

\lambda ={\frac {\sum _{i=1}^{n}k_{i}}{n}}

Таким образом, $λ$ — это среднее значение $k$ _i . Получение знака второй производной L в стационарной точке определит, какое экстремальное значение представляет собой $λ$ .

{\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-\lambda ^{-2}\sum _{i=1}^{n}k_{i}

Оценка второй производной в стационарной точке дает:

{\frac {\partial ^{2}\ell }{\partial \lambda ^{2}}}=-{\frac {n^{2}}{\sum _{i=1}^{n}k_{i}}}

что является отрицательным значением, $умноженным$ на обратную величину среднего значения k _i . Это выражение является отрицательным, когда среднее значение положительное. Если это выполняется, то стационарная точка максимизирует функцию вероятности.

Для полноты семейство распределений считается полным тогда и только тогда, когда подразумевается, что для всех . Если индивидуумы iid , то Зная распределение, которое мы хотим исследовать, легко увидеть, что статистика полная. $E(g(T))=0$ $P_{\lambda }(g(T)=0)=1$ $\lambda .$ $X_{i}$ $\mathrm {Po} (\lambda ),$ ${\textstyle T(\mathbf {x} )=\sum _{i=1}^{n}X_{i}\sim \mathrm {Po} (n\lambda ).}$

E(g(T))=\sum _{t=0}^{\infty }g(t){\frac {(n\lambda )^{t}e^{-n\lambda }}{t!}}=0

Чтобы это равенство выполнялось, оно должно быть равно 0. Это следует из того факта, что ни одно из других слагаемых не будет равно 0 для всех в сумме и для всех возможных значений . Следовательно, для всех подразумевается, что и статистика была показана полной. . $g(t)$ $t$ $\lambda .$ $E(g(T))=0$ $\lambda$ $P_{\lambda }(g(T)=0)=1,$

Доверительный интервал

Доверительный интервал для среднего значения распределения Пуассона можно выразить с помощью соотношения между кумулятивными функциями распределения распределения Пуассона и распределения хи-квадрат . Распределение хи-квадрат само по себе тесно связано с гамма-распределением , и это приводит к альтернативному выражению. Учитывая наблюдение $k$ из распределения Пуассона со средним значением µ , доверительный интервал для µ с уровнем достоверности $1 - α$ равен

{\tfrac {1}{2}}\chi ^{2}(\alpha /2;2k)\leq \mu \leq {\tfrac {1}{2}}\chi ^{2}(1-\alpha /2;2k+2),

или эквивалентно,

F^{-1}(\alpha /2;k,1)\leq \mu \leq F^{-1}(1-\alpha /2;k+1,1),

где - функция квантиля (соответствующая нижней области хвоста p ) распределения хи-квадрат с $n$ степенями свободы и - функция квантиля гамма-распределения с параметром формы n и параметром масштаба 1. ^[7]^{: 176-178}^[45] Этот интервал является « точным » в том смысле, что вероятность его охвата никогда не меньше номинального $1 -$ $α$ . $\chi ^{2}(p;n)$ $F^{-1}(p;n,1)$

Когда квантили гамма-распределения недоступны, была предложена точная аппроксимация этого точного интервала (на основе преобразования Вильсона-Хилферти ): ^[46]

k\left(1-{\frac {1}{9k}}-{\frac {z_{\alpha /2}}{3{\sqrt {k}}}}\right)^{3}\leq \mu \leq (k+1)\left(1-{\frac {1}{9(k+1)}}+{\frac {z_{\alpha /2}}{3{\sqrt {k+1}}}}\right)^{3},

где обозначает стандартное нормальное отклонение с площадью верхнего хвоста $α/2$ . $z_{\alpha /2}$

Для применения этих формул в том же контексте, что и выше (с учетом выборки из $n$ измеренных значений $k$ _i , каждое из которых взято из распределения Пуассона со средним значением $λ$ ), можно было бы установить

k=\sum _{i=1}^{n}k_{i},

вычислите интервал для $µ$ = $n λ$ , а затем выведите интервал для $λ$ .

Байесовский вывод

В байесовском выводе априорным параметром скорости $λ$ распределения Пуассона является гамма-распределение . ^[47] Пусть

\lambda \sim \mathrm {Gamma} (\alpha ,\beta )

обозначаем, что $λ$ распределяется в соответствии с плотностью гамма-излучения g , параметризованной параметром формы α и обратным параметром масштаба β :

g(\lambda \mid \alpha ,\beta )={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\;\lambda ^{\alpha -1}\;e^{-\beta \,\lambda }\qquad {\text{ for }}\lambda >0\,\!.

Затем, учитывая ту же выборку из $n$ измеренных значений $k$ _i , что и раньше, и априорное значение Gamma( α , β ), апостериорное распределение будет

\lambda \sim \mathrm {Gamma} \left(\alpha +\sum _{i=1}^{n}k_{i},\beta +n\right).

Обратите внимание, что апостериорное среднее линейно и определяется выражением

E[\lambda |k_{1},\ldots ,k_{n}]={\frac {\alpha +\sum _{i=1}^{n}k_{i}}{\beta +n}}.

Можно показать, что гамма-распределение является единственным априором, который вызывает линейность условного среднего. Более того, существует обратный результат, который гласит, что если условное среднее близко к линейной функции на расстоянии , то априорное распределение $λ$ должно быть близко к гамма-распределению на расстоянии Леви . ^[48] $L_{2}$

Апостериорное среднее E[ $λ$ ] приближается к оценке максимального правдоподобия в пределе, который непосредственно следует из общего выражения среднего значения гамма-распределения . ${\widehat {\lambda }}_{\mathrm {MLE} }$ $\alpha \to 0,\beta \to 0,$

Апостериорное прогнозирующее распределение для одного дополнительного наблюдения представляет собой отрицательное биномиальное распределение ^[49]^:53, которое иногда называют распределением гамма-Пуассона.

Одновременная оценка нескольких средних Пуассона

Предположим , это набор независимых случайных величин из набора распределений Пуассона, каждая из которых имеет параметр , и мы хотели бы оценить эти параметры. Затем Клевенсон и Зидек показывают, что при нормализованной квадратичной потере ошибки, когда тогда , как и в примере Штейна для нормальных средних, оценка MLE недопустима . ^[50] $X_{1},X_{2},\dots ,X_{p}$ $p$ $\lambda _{i},$ $i=1,\dots ,p,$ ${\textstyle L(\lambda ,{\hat {\lambda }})=\sum _{i=1}^{p}\lambda _{i}^{-1}({\hat {\lambda }}_{i}-\lambda _{i})^{2},}$ $p>1,$ ${\hat {\lambda }}_{i}=X_{i}$

В этом случае задается семейство минимаксных оценок для любых и при ^[51] $0<c\leq 2(p-1)$ $b\geq (p-2+p^{-1})$

{\hat {\lambda }}_{i}=\left(1-{\frac {c}{b+\sum _{i=1}^{p}X_{i}}}\right)X_{i},\qquad i=1,\dots ,p.

Возникновение и применение

Некоторые применения распределения Пуассона для подсчета данных (количества событий): ^[52]

телекоммуникации : телефонные звонки, поступающие в систему,
астрономия : фотоны, попадающие в телескоп,
химия : распределение молярной массы живой полимеризации , ^[53]
биология : количество мутаций в цепи ДНК на единицу длины,
управление : клиенты, приходящие к стойке или колл-центру,
финансы и страхование : количество убытков или претензий, произошедших за определенный период времени,
сейсмология : асимптотическая модель Пуассона риска сильных землетрясений, ^[54]
радиоактивность : распадается за заданный интервал времени в радиоактивном образце,
оптика : количество фотонов, испускаемых за один лазерный импульс (основная уязвимость протоколов распределения квантовых ключей , известная как расщепление числа фотонов).

Дополнительные примеры подсчета событий, которые можно смоделировать как процессы Пуассона, включают:

каждый год в каждом корпусе прусской кавалерии погибают солдаты от ударов лошадьми . Этот пример был использован в книге Ладислава Борткевича (1868–1931), ^[11]^{: 23-25.}
дрожжевые клетки, используемые при варке пива Guinness . Этот пример использовал Уильям Сили Госсет (1876–1937), ^[55]^[56]
телефонные звонки поступают в колл-центр в течение минуты. Этот пример описал А. К. Эрланг (1878–1929) ^[57].
цели в спорте с участием двух конкурирующих команд, ^[58]
смертей в год в данной возрастной группе,
скачки цены акций в заданном интервале времени,
количество обращений к веб-серверу в минуту (при условии однородности ),
мутации на данном участке ДНК после определенного количества радиации,
клетки , инфицированные при заданной множественности заражения ,
бактерии в определенном количестве жидкости, ^[59]
фотоны , поступающие в схему пикселя при заданном освещении в течение заданного периода времени,
посадка летающих бомб Фау-1 на Лондон во время Второй мировой войны, расследованная Р.Д. Кларком в 1946 году. ^[60]

В вероятностной теории чисел Галлахер показал в 1976 году , что если верна определенная версия недоказанной гипотезы о простых r-кортежах ^[61] , то подсчет простых чисел на коротких интервалах будет подчиняться распределению Пуассона. ^[62]

Закон редких событий

Скорость события связана с вероятностью того, что событие произойдет в каком-то небольшом подинтервале (времени, пространстве или иным образом). В случае распределения Пуассона предполагается, что существует достаточно малый подинтервал, для которого вероятность того, что событие произойдет дважды, «незначительна». С этим предположением можно получить распределение Пуассона из биномиального, учитывая только информацию об ожидаемом количестве общих событий во всем интервале.

Обозначим общее количество событий во всем интервале как Разделите весь интервал на подинтервалы одинакового размера, так что (поскольку нас интересуют только очень малые части интервала, это предположение имеет смысл). Это означает, что ожидаемое количество событий в каждом из $n$ подинтервалов равно $\lambda .$ $n$ $I_{1},\dots ,I_{n}$ $n>\lambda$ $\lambda /n.$

Теперь предположим, что возникновение события на всем интервале можно рассматривать как последовательность $n$ испытаний Бернулли , где -е испытание Бернулли соответствует проверке того, произойдет ли событие на подинтервале с вероятностью . Ожидаемое число полных событий в таком испытаний будет ожидаемым числом общих событий за весь интервал. Следовательно, для каждого подразделения интервала мы аппроксимировали появление события как процесс Бернулли вида. Как мы уже отмечали ранее, мы хотим рассматривать только очень маленькие подинтервалы. Поэтому возьмем предел, стремящийся к бесконечности. $i$ $I_{i}$ $\lambda /n.$ $n$ $\lambda ,$ ${\textrm {B}}(n,\lambda /n).$ $n$

В этом случае биномиальное распределение сходится к так называемому распределению Пуассона по предельной теореме Пуассона .

В некоторых из приведенных выше примеров, таких как количество мутаций в данной последовательности ДНК, подсчитываемые события на самом деле являются результатами дискретных испытаний и более точно могут быть смоделированы с использованием биномиального распределения , то есть

X\sim {\textrm {B}}(n,p).

В таких случаях $n$ очень велико, а $p$ очень мало (поэтому математическое ожидание $np$ имеет промежуточную величину). Тогда распределение можно аппроксимировать менее громоздким распределением Пуассона

X\sim {\textrm {Pois}}(np).

Это приближение иногда называют законом редких событий ^[63]^:5 , поскольку каждое из $n$ отдельных событий Бернулли происходит редко.

Название «закон редких событий» может ввести в заблуждение, поскольку общее количество успешных событий в пуассоновском процессе не обязательно должно быть редким, если параметр $np$ не мал. Например, количество телефонных звонков на занятой коммутатор за один час соответствует распределению Пуассона, при этом оператору события кажутся частыми, но они редки с точки зрения среднего члена населения, который вряд ли что-то сделает. звонок на этот коммутатор в этот час.

Дисперсия биномиального распределения в 1 - p раз больше, чем у распределения Пуассона, поэтому почти равна, когда p очень мало.

Слово закон иногда используется как синоним распределения вероятностей , а конвергенция в законе означает конвергенцию в распределении . Соответственно, распределение Пуассона иногда называют «законом малых чисел», поскольку оно представляет собой распределение вероятностей числа появлений события, которое случается редко, но имеет очень много возможностей произойти. «Закон малых чисел» — книга Ладислава Борткевича о распределении Пуассона, опубликованная в 1898 году. ^[11]^[64]

Точный процесс Пуассона

Распределение Пуассона возникает как количество точек точечного процесса Пуассона , расположенных в некоторой конечной области. Точнее, если D — некоторое региональное пространство, например евклидово пространство R ^d , для которого | D |, площадь, объём или, в более общем плане, мера Лебега области конечна, и если $N$ $($ $D$ $)$ обозначает количество точек в D , то

P(N(D)=k)={\frac {(\lambda |D|)^{k}e^{-\lambda |D|}}{k!}}.

Регрессия Пуассона и отрицательная биномиальная регрессия

Регрессия Пуассона и отрицательная биномиальная регрессия полезны для анализа, где зависимой переменной (откликом) является количество (0, 1, 2,...) количества событий или вхождений в интервале.

Другие применения в науке

В пуассоновском процессе количество наблюдаемых событий колеблется вокруг среднего значения $λ$ со стандартным отклонением. Эти колебания обозначаются как пуассоновский шум или (особенно в электронике) как дробовой шум . $\sigma _{k}={\sqrt {\lambda }}.$

Корреляция среднего и стандартного отклонения при подсчете независимых дискретных событий полезна с научной точки зрения. Отслеживая, как колебания изменяются в зависимости от среднего сигнала, можно оценить вклад одного события, даже если этот вклад слишком мал, чтобы его можно было обнаружить напрямую . Например, заряд электрона e можно оценить, сопоставив величину электрического тока с его дробовым шумом . Если N электронов проходят точку в среднем за заданное время t , средний ток равен ; поскольку колебания тока должны быть порядка (т ^. е. стандартного отклонения процесса Пуассона ⁾ , заряд можно оценить из ^{соотношения} $I=eN/t$ $\sigma _{I}=e{\sqrt {N}}/t$ $e$ $t\sigma _{I}^{2}/I.$

Повседневный пример — зернистость, появляющаяся при увеличении фотографий; зернистость обусловлена пуассоновскими колебаниями количества восстановленных зерен серебра , а не самими отдельными зернами. Сопоставляя зернистость со степенью увеличения, можно оценить вклад отдельного зерна (которое в противном случае слишком мало, чтобы его можно было увидеть без посторонней помощи) . ^[65] Были разработаны многие другие молекулярные применения пуассоновского шума, например, оценка плотности числа рецепторных молекул в клеточной мембране .

\Pr(N_{t}=k)=f(k;\lambda t)={\frac {(\lambda t)^{k}e^{-\lambda t}}{k!}}.

В теории причинных множеств дискретные элементы пространства-времени подчиняются распределению Пуассона в объеме.

Распределение Пуассона появляется также в квантовой механике , особенно в квантовой оптике . А именно, для системы квантовых гармонических осцилляторов в когерентном состоянии вероятность измерения определенного уровня энергии имеет распределение Пуассона.

Вычислительные методы

Распределение Пуассона ставит перед специализированными программными библиотеками две разные задачи: оценку распределения и рисование случайных чисел в соответствии с этим распределением. $P(k;\lambda )$

Оценка распределения Пуассона

Вычисление для данного и является тривиальной задачей, которую можно выполнить, используя стандартное определение в терминах экспоненциальной, степенной и факториальной функций. Однако традиционное определение распределения Пуассона содержит два термина, которые могут легко переполниться на компьютерах: $λ$ ^$k$ и $k$ $!$ . Доля от $λ$ ^$k$ до $k$ ! также может привести к очень большой ошибке округления по сравнению с e ⁻^$λ$ и, следовательно, к ошибочному результату. Поэтому для численной стабильности функцию массы вероятности Пуассона следует оценивать как $P(k;\lambda )$ $k$ $\lambda$ $P(k;\lambda )$

\!f(k;\lambda )=\exp \left[k\ln \lambda -\lambda -\ln \Gamma (k+1)\right],

что математически эквивалентно, но численно стабильно. Натуральный логарифм функции Gamma можно получить с помощью lgammaфункции в стандартной библиотеке C (версия C99) или R , gammalnфункции в MATLAB или SciPy или log_gammaфункции в Fortran 2008 и более поздних версиях.

Некоторые компьютерные языки предоставляют встроенные функции для оценки распределения Пуассона, а именно:

Р : функция dpois(x, lambda);
Excel : функция POISSON( x, mean, cumulative)с флагом, указывающим совокупное распределение;
Mathematica : одномерное распределение Пуассона как , ^[66] двумерное распределение Пуассона как ,. ^[67]PoissonDistribution[ $\lambda$ ]MultivariatePoissonDistribution[ $\theta _{12},$ { $\theta _{1}-\theta _{12},$ $\theta _{2}-\theta _{12}$ }]

Генерация случайной переменной

Менее тривиальная задача — извлечь целочисленную случайную величину из распределения Пуассона с заданными $\lambda .$

Решения предоставляют:

Р : функция rpois(n, lambda);
Научная библиотека GNU (GSL): функция gsl_ran_poisson

Простой алгоритм генерации случайных чисел с распределением Пуассона ( выборка псевдослучайных чисел ) был предложен Кнутом : ^[68]^{: 137-138.}

Алгоритм  случайного числа Пуассона (Кнут) : init : Пусть L ← e ^−λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в [0,1] и пусть p ← p × u. пока p > L. верните k - 1.

Сложность линейна по возвращаемому значению $k$ , которое в среднем равно $λ$ . Есть много других алгоритмов для улучшения этого. Некоторые из них приведены у Аренса и Дитера, см. § Ссылки ниже.

Для больших значений $λ$ значение $L$ = e ^{− $λ$} может быть настолько малым, что его трудно представить. Эту проблему можно решить, изменив алгоритм, который использует дополнительный параметр STEP, чтобы ^e- ^STEP не ^{опустошался}^:

алгоритм  случайного числа Пуассона (Цзюньхао, на основе Кнута) : init : пусть   $λ$  Left ←  $λ$  , k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в (0,1) и пусть p ← p × u. в то время как p < 1 и  $λ$  Left > 0: если   $λ$  Left > STEP: p ← p × e ^STEP  $λ$  Left ←  $λ$  Left − STEP else : p ← p × e ^{$λ$  Влево}  $λ$  Влево ← 0 , пока p > 1. Верните k - 1.

Выбор STEP зависит от порога переполнения. Для формата с плавающей запятой двойной точности порог близок к e ⁷⁰⁰ , поэтому 500 должно быть безопасным шагом .

Другие решения для больших значений $λ$ включают браковочную выборку и использование гауссовой аппроксимации.

Выборка с обратным преобразованием проста и эффективна для малых значений $λ$ и требует только одного равномерного случайного числа u на выборку. Кумулятивные вероятности проверяются по очереди, пока одна из них не превысит u .

Алгоритм  Генератор Пуассона, основанный на инверсии последовательным поиском : ^[69]^{: 505}  init : Пусть x ← 0, p ← e ^−λ , s ← p. Сгенерируйте равномерное случайное число u в [0,1]. пока ты > делаешь : х ← х + 1. р ← р ×  $λ$  / х. с ← с + р. вернуть х.