В теории вероятностей и статистике распределение Пуассона — дискретное распределение вероятностей , выражающее вероятность того, что заданное количество событий произойдет за фиксированный интервал времени, если эти события происходят с известной постоянной средней скоростью и независимо от времени, прошедшего с момента последнего события. . [1] Его также можно использовать для количества событий в других типах интервалов, кроме времени, и в размерности больше 1 (например, количество событий в данной области или объеме).
При распределении Пуассона с ожиданием λ событий в данном интервале вероятность k событий в том же интервале равна: [2] : 60
Например, рассмотрим колл-центр, который случайным образом принимает в среднем λ = 3 звонка в минуту в любое время суток. Если вызовы независимы, прием одного не меняет вероятность того, когда поступит следующий. При этих предположениях количество k звонков, полученных в течение любой минуты, имеет распределение вероятностей Пуассона. Получение от k = 1 до 4 вызовов имеет вероятность около 0,77, а получение 0 или хотя бы 5 вызовов имеет вероятность около 0,23.
Другой пример, для которого распределение Пуассона является полезной моделью, — это количество событий радиоактивного распада за фиксированный период наблюдения. [ нужна цитата ]
История
Распределение было впервые введено Симеоном Дени Пуассоном (1781–1840) и опубликовано вместе с его теорией вероятностей в его работе « Recherches sur la probilité des jugements en matière Criminelle et en Matière Civile» (1837). [3] : 205-207 В работе были выдвинуты теории о количестве неправомерных приговоров в данной стране, сосредоточив внимание на определенных случайных величинах N , которые подсчитывают, среди прочего, количество дискретных происшествий (иногда называемых «событиями» или «прибытиями»). происходящие в течение интервала времени заданной длины. Результат уже был дан в 1711 году Авраамом де Муавром в De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus . [4] : 219 [5] : 14-15 [6] : 193 [7] : 157 Это делает его примером закона Стиглера и побудило некоторых авторов утверждать, что распределение Пуассона должно носить имя де Муавра. [8] [9]
В 1860 году Саймон Ньюкомб подогнал распределение Пуассона к числу звезд, находящихся в единице пространства. [10]
Дальнейшее практическое применение этого распределения было сделано Ладиславом Борткевичем в 1898 году, когда ему было поручено исследовать количество солдат в прусской армии, случайно убитых ударами лошади; [11] : 23-25 этот эксперимент представил распределение Пуассона в области техники надежности .
Распределение Пуассона можно применять к системам с большим количеством возможных событий, каждое из которых является редким . Число таких событий, происходящих в течение фиксированного интервала времени, при определенных обстоятельствах является случайным числом с распределением Пуассона.
Уравнение можно адаптировать, если вместо среднего числа событий нам будет задана средняя скорость , с которой события происходят. Тогда и: [13]
Пример
Жевательная резинка на тротуаре. Количество жевательных резинок на одной плитке приблизительно распределено по Пуассону.
Распределение Пуассона может быть полезно для моделирования таких событий, как:
количество метеоритов диаметром более 1 метра, падающих на Землю за год;
количество лазерных фотонов, попадающих в детектор за определенный интервал времени;
количество студентов, получивших низкую и высокую оценку на экзамене; и
места дефектов и дислокаций в материалах.
Примерами появления случайных точек в космосе являются: места столкновений астероидов с Землей (2-мерные), места дефектов материала (3-мерные) и места деревьев в лесу (2-мерные). . [14]
Предположения и обоснованность
Распределение Пуассона является подходящей моделью, если верны следующие предположения: [15]
k — это количество раз, когда событие происходит в интервале, и k может принимать значения 0, 1, 2,... .
Возникновение одного события не влияет на вероятность возникновения второго события. То есть события происходят независимо.
Средняя скорость, с которой происходят события, не зависит от каких-либо событий. Для простоты обычно предполагается, что оно постоянно, но на практике может меняться со временем.
Два события не могут произойти в один и тот же момент; вместо этого в каждом очень маленьком подинтервале либо происходит ровно одно событие, либо не происходит ни одного события.
Если эти условия верны, то k — случайная величина Пуассона, а распределение k — распределение Пуассона.
Распределение Пуассона также является пределом биномиального распределения , для которого вероятность успеха каждого испытания равна λ , деленной на количество испытаний, поскольку количество испытаний приближается к бесконечности (см. Связанные распределения).
Примеры вероятностей для распределений Пуассона
События раз в интервале: частный случай λ = 1 и k = 0
Предположим, что астрономы подсчитали, что крупные метеориты (больше определенного размера) падают на Землю в среднем раз в 100 лет ( λ = 1 событие в 100 лет), и что число попаданий метеоритов подчиняется распределению Пуассона. Какова вероятность падения k = 0 метеоритов в ближайшие 100 лет?
При этих предположениях вероятность того, что в ближайшие 100 лет на Землю не упадут крупные метеориты, составляет примерно 0,37. Оставшиеся 1–0,37 = 0,63 — это вероятность падения 1, 2, 3 или более крупных метеоритов в ближайшие 100 лет. В приведенном выше примере наводнение происходило раз в 100 лет ( λ = 1). По тем же расчетам вероятность отсутствия паводков через 100 лет составила примерно 0,37.
В общем, если событие происходит в среднем один раз за интервал ( λ = 1) и события подчиняются распределению Пуассона, то P (0 событий в следующем интервале) = 0,37. Кроме того, P (ровно одно событие в следующем интервале) = 0,37, как показано в таблице для наводнений.
Примеры, нарушающие предположения Пуассона
Число студентов, прибывающих в студенческий союз в минуту, скорее всего, не будет подчиняться распределению Пуассона, поскольку этот показатель не является постоянным (низкий показатель во время занятий, высокий показатель между занятиями), а прибытие отдельных учащихся не является независимым (студенты обычно приходят группами). Непостоянная скорость прибытия может быть смоделирована как смешанное распределение Пуассона , а прибытие групп, а не отдельных студентов, как составной процесс Пуассона .
Число землетрясений магнитудой 5 баллов в год в стране может не соответствовать распределению Пуассона, если одно сильное землетрясение увеличивает вероятность афтершоков аналогичной магнитуды.
Примеры, в которых гарантировано хотя бы одно событие, не являются распределенными по Пуассону; но может быть смоделировано с использованием распределения Пуассона, усеченного до нуля .
Распределения подсчетов, в которых количество интервалов с нулевыми событиями выше, чем предсказано моделью Пуассона, можно смоделировать с использованием модели с нулевым расширением .
Характеристики
Описательная статистика
Ожидаемое значение и дисперсия случайной величины с распределением Пуассона равны λ .
Мода случайной величины, распределенной по Пуассону, с нецелым числом λ равна наибольшему целому числу , меньшему или равному λ . Это также записывается как пол ( λ ). Когда λ — целое положительное число, режимами являются λ и λ − 1.
Все кумулянты распределения Пуассона равны ожидаемому значению λ . n - й факториальный момент распределения Пуассона равен λ n .
Ожидаемое значение процесса Пуассона иногда разлагается на произведение интенсивности и воздействия (или, в более общем смысле, выражается как интеграл «функции интенсивности» во времени или пространстве, иногда описываемой как «воздействие»). [17]
медиана
Границы медианы ( ) распределения известны и точны : [18]
Высшие моменты
Высшие нецентрированные моменты m k распределения Пуассона представляют собой полиномы Тушара от λ :
Суммы случайных величин, распределенных по Пуассону
Если for независимы , то [21] : 65 Обратной является теорема Райкова , которая гласит, что если сумма двух независимых случайных величин распределена по Пуассону, то таковой является и каждая из этих двух независимых случайных величин . [22] [23]
Максимальная энтропия
Это распределение максимальной энтропии среди набора обобщенных биномиальных распределений со средним и , [24] где обобщенное биномиальное распределение определяется как распределение суммы N независимых, но не одинаково распределенных переменных Бернулли.
Другие объекты недвижимости
Распределения Пуассона представляют собой бесконечно делимые распределения вероятностей. [25] : 233 [7] : 164
где – расходимость Кульбака–Лейблера from и – расходимость Кульбака–Лейблера from .
Пуассоновые гонки
Пусть и – независимые случайные величины, тогда имеем
Верхняя оценка доказывается с использованием стандартной оценки Чернова.
Нижнюю оценку можно доказать, отметив, что это вероятность того, что где которая ограничена снизу где является относительной энтропией ( подробности см. в статье об границах хвостов биномиальных распределений ). Далее отметив это и вычисление нижней границы безусловной вероятности дает результат. Более подробную информацию можно найти в приложении Kamath et al. . [30]
Связанные дистрибутивы
Как биномиальное распределение с бесконечно малыми временными шагами
Распределение Пуассона можно вывести как предельный случай биномиального распределения , поскольку количество испытаний стремится к бесконечности, а ожидаемое количество успехов остается фиксированным — см. Закон редких событий ниже. Следовательно, его можно использовать как аппроксимацию биномиального распределения, если n достаточно велико, а p достаточно мало. Распределение Пуассона является хорошим приближением биномиального распределения, если n равно 20, а p меньше или равно 0,05, и отличным приближением, если n ≥ 100 и np ≤ 10. [31] Пусть и – соответствующая кумулятивная плотность . функций биномиального и пуассоновского распределений имеем:
Взяв предел при увеличении n до бесконечности (при фиксированном x ) и применив определение предела произведения экспоненциальной функции , это сводится к производящей функции распределения Пуассона:
Если и независимы, то распределение условного on является биномиальным .В частности, если тогда В более общем смысле, если X 1 , X 2 , ..., X n являются независимыми случайными величинами Пуассона с параметрами λ 1 , λ 2 , ..., λ n , то
из этого следует, что на самом деле
Если и распределение условного на X = k является биномиальным распределением , то распределение Y следует распределению Пуассона. Фактически, если условное на следует полиномиальному распределению , то каждое следует независимому распределению Пуассона.
Распределение Пуассона является частным случаем дискретного составного распределения Пуассона (или распределения Пуассона заикания) только с параметром. [33] [34] Дискретное составное распределение Пуассона можно вывести из предельного распределения одномерного полиномиального распределения. Это также частный случай составного распределения Пуассона .
Для достаточно больших значений λ (скажем, λ > 1000) нормальное распределение со средним значением λ и дисперсией λ (стандартное отклонение ) является отличным приближением к распределению Пуассона. Если λ больше примерно 10, то нормальное распределение является хорошим приближением, если выполняется соответствующая коррекция непрерывности , т. е. если P( X ≤ x ) , где x – неотрицательное целое число, заменяется на P ( X ≤ x ). х + 0,5) .
При этом преобразовании сходимость к нормальности (по мере увеличения) происходит намного быстрее, чем при использовании непреобразованной переменной. [ нужна цитата ] Доступны и другие, немного более сложные преобразования, стабилизирующие дисперсию, [7] : 168, одно из которых — преобразование Анскомба . [36] См. Преобразование данных (статистика) для более общего использования преобразований.
Если для каждого t > 0 количество поступлений во временном интервале [0, t ] следует распределению Пуассона со средним значением λt , то последовательность времен между поступлениями представляет собой независимые и одинаково распределенные экспоненциальные случайные величины со средним значением 1/ λ . [37] : 317–319.
Это означает [27] :101-102 , среди прочего, что для любой неотрицательной функции
если полиномиально распределено, то
Коэффициент можно заменить на 2, если далее предполагается, что он монотонно возрастает или убывает.
Двумерное распределение Пуассона
Это распределение было распространено на двумерный случай. [39] Производящая функция для этого распределения равна
с
Маргинальными распределениями являются Пуассон ( θ 1 ) и Пуассон ( θ 2 ), а коэффициент корреляции ограничен диапазоном
Простой способ создать двумерное распределение Пуассона — взять три независимых распределения Пуассона со средними значениями , а затем установить. Функция вероятности двумерного распределения Пуассона равна
Бесплатное распределение Пуассона
Свободное распределение Пуассона [40] с размером и скоростью скачка возникает в свободной теории вероятностей как предел повторяющейся свободной свертки
N → ∞
Другими словами, пусть это случайные величины, имеющие значение с вероятностью и значение 0 с оставшейся вероятностью. Предположим также, что семья свободно независима . Тогда предел по закону дается законом Свободного Пуассона с параметрами
Это определение аналогично одному из способов получения классического распределения Пуассона из (классического) пуассоновского процесса.
Мера, связанная со свободным законом Пуассона, определяется формулой [41]
Мы приводим значения некоторых важных преобразований свободного закона Пуассона; вычисление можно найти, например, в книге « Лекции по комбинаторике свободной вероятности» А. Ники и Р. Спайхера [42]
R-преобразование свободного закона Пуассона имеет вид
Преобразование Коши (которое является отрицательным преобразованием Стилтьеса ) определяется выражением
S-преобразование определяется выражением
Количество Вейбулла и Стабиля
Массовая функция вероятности Пуассона может быть выражена в форме, аналогичной распределению произведений распределения Вейбулла и варианту формы стабильного распределения количества . Переменную можно рассматривать как обратную параметру устойчивости Леви в стабильном распределении количества:
Статистические выводы
Оценка параметров
Имея выборку из n измеренных значений для i = 1,..., n , мы хотим оценить значение параметра λ пуассоновской популяции, из которой была взята выборка. Оценка максимального правдоподобия равна [43]
Поскольку каждое наблюдение имеет математическое ожидание λ, то же самое имеет и среднее значение выборки. Следовательно , оценка максимального правдоподобия является несмещенной оценкой λ . Это также эффективный инструмент оценки, поскольку его дисперсия достигает нижней границы Крамера – Рао (CRLB). [44] Следовательно, это несмещенный метод с минимальной дисперсией . Также можно доказать, что сумма (и, следовательно, выборочное среднее, поскольку оно является взаимно однозначной функцией суммы) является полной и достаточной статистикой для λ .
Для доказательства достаточности можно воспользоваться теоремой факторизации . Рассмотрим разделение функции массы вероятности совместного распределения Пуассона для выборки на две части: одну, которая зависит исключительно от выборки , называемую , и другую, которая зависит от параметра и выборки только через функцию Тогда является достаточной статистикой для
Первое слагаемое зависит только от . Второе слагаемое зависит от выборки только через. Таким образом, является достаточным.
Чтобы найти параметр λ , который максимизирует функцию вероятности для популяции Пуассона, мы можем использовать логарифм функции правдоподобия:
Берем производную по λ и сравниваем ее с нулем:
Решение для λ дает стационарную точку.
Таким образом, λ — это среднее значение k i . Получение знака второй производной L в стационарной точке определит, какое экстремальное значение представляет собой λ .
Оценка второй производной в стационарной точке дает:
что является отрицательным значением, умноженным на обратную величину среднего значения k i . Это выражение является отрицательным, когда среднее значение положительное. Если это выполняется, то стационарная точка максимизирует функцию вероятности.
Для полноты семейство распределений считается полным тогда и только тогда, когда подразумевается, что для всех . Если индивидуумы iid , то Зная распределение, которое мы хотим исследовать, легко увидеть, что статистика полная.
Чтобы это равенство выполнялось, оно должно быть равно 0. Это следует из того факта, что ни одно из других слагаемых не будет равно 0 для всех в сумме и для всех возможных значений . Следовательно, для всех подразумевается, что и статистика была показана полной. .
Доверительный интервал
Доверительный интервал для среднего значения распределения Пуассона можно выразить с помощью соотношения между кумулятивными функциями распределения распределения Пуассона и распределения хи-квадрат . Распределение хи-квадрат само по себе тесно связано с гамма-распределением , и это приводит к альтернативному выражению. Учитывая наблюдение k из распределения Пуассона со средним значением µ , доверительный интервал для µ с уровнем достоверности 1 – α равен
или эквивалентно,
где - функция квантиля (соответствующая нижней области хвоста p ) распределения хи-квадрат с n степенями свободы и - функция квантиля гамма-распределения с параметром формы n и параметром масштаба 1. [7] : 176-178 [45] Этот интервал является « точным » в том смысле, что вероятность его охвата никогда не меньше номинального 1 – α .
Когда квантили гамма-распределения недоступны, была предложена точная аппроксимация этого точного интервала (на основе преобразования Вильсона-Хилферти ): [46]
Для применения этих формул в том же контексте, что и выше (с учетом выборки из n измеренных значений k i , каждое из которых взято из распределения Пуассона со средним значением λ ), можно было бы установить
вычислите интервал для µ = n λ , а затем выведите интервал для λ .
Затем, учитывая ту же выборку из n измеренных значений k i , что и раньше, и априорное значение Gamma( α , β ), апостериорное распределение будет
Обратите внимание, что апостериорное среднее линейно и определяется выражением
Можно показать, что гамма-распределение является единственным априором, который вызывает линейность условного среднего. Более того, существует обратный результат, который гласит, что если условное среднее близко к линейной функции на расстоянии , то априорное распределение λ должно быть близко к гамма-распределению на расстоянии Леви . [48]
Апостериорное среднее E[ λ ] приближается к оценке максимального правдоподобия в пределе, который непосредственно следует из общего выражения среднего значения гамма-распределения .
Предположим , это набор независимых случайных величин из набора распределений Пуассона, каждая из которых имеет параметр , и мы хотели бы оценить эти параметры. Затем Клевенсон и Зидек показывают, что при нормализованной квадратичной потере ошибки, когда тогда , как и в примере Штейна для нормальных средних, оценка MLE недопустима . [50]
В этом случае задается семейство минимаксных оценок для любых и при [51]
Возникновение и применение
Некоторые применения распределения Пуассона для подсчета данных (количества событий): [52]
биология : количество мутаций в цепи ДНК на единицу длины,
управление : клиенты, приходящие к стойке или колл-центру,
финансы и страхование : количество убытков или претензий, произошедших за определенный период времени,
сейсмология : асимптотическая модель Пуассона риска сильных землетрясений, [54]
радиоактивность : распадается за заданный интервал времени в радиоактивном образце,
оптика : количество фотонов, испускаемых за один лазерный импульс (основная уязвимость протоколов распределения квантовых ключей , известная как расщепление числа фотонов).
Дополнительные примеры подсчета событий, которые можно смоделировать как процессы Пуассона, включают:
Сравнение распределения Пуассона (черные линии) и биномиального распределения с n = 10 (красные кружки), n = 20 (синие кружки), n = 1000 (зеленые кружки). Все распределения имеют среднее значение 5. Горизонтальная ось показывает количество событий k . По мере увеличения n распределение Пуассона становится все более лучшим приближением биномиального распределения с тем же средним значением.
Скорость события связана с вероятностью того, что событие произойдет в каком-то небольшом подинтервале (времени, пространстве или иным образом). В случае распределения Пуассона предполагается, что существует достаточно малый подинтервал, для которого вероятность того, что событие произойдет дважды, «незначительна». С этим предположением можно получить распределение Пуассона из биномиального, учитывая только информацию об ожидаемом количестве общих событий во всем интервале.
Обозначим общее количество событий во всем интервале как Разделите весь интервал на подинтервалы одинакового размера, так что (поскольку нас интересуют только очень малые части интервала, это предположение имеет смысл). Это означает, что ожидаемое количество событий в каждом из n подинтервалов равно
Теперь предположим, что возникновение события на всем интервале можно рассматривать как последовательность n испытаний Бернулли , где -е испытание Бернулли соответствует проверке того, произойдет ли событие на подинтервале с вероятностью . Ожидаемое число полных событий в таком испытаний будет ожидаемым числом общих событий за весь интервал. Следовательно, для каждого подразделения интервала мы аппроксимировали появление события как процесс Бернулли вида. Как мы уже отмечали ранее, мы хотим рассматривать только очень маленькие подинтервалы. Поэтому возьмем предел, стремящийся к бесконечности.
В некоторых из приведенных выше примеров, таких как количество мутаций в данной последовательности ДНК, подсчитываемые события на самом деле являются результатами дискретных испытаний и более точно могут быть смоделированы с использованием биномиального распределения , то есть
В таких случаях n очень велико, а p очень мало (поэтому математическое ожидание np имеет промежуточную величину). Тогда распределение можно аппроксимировать менее громоздким распределением Пуассона
Это приближение иногда называют законом редких событий [63] :5 , поскольку каждое из n отдельных событий Бернулли происходит редко.
Название «закон редких событий» может ввести в заблуждение, поскольку общее количество успешных событий в пуассоновском процессе не обязательно должно быть редким, если параметр np не мал. Например, количество телефонных звонков на занятой коммутатор за один час соответствует распределению Пуассона, при этом оператору события кажутся частыми, но они редки с точки зрения среднего члена населения, который вряд ли что-то сделает. звонок на этот коммутатор в этот час.
Дисперсия биномиального распределения в 1 - p раз больше, чем у распределения Пуассона, поэтому почти равна, когда p очень мало.
Слово закон иногда используется как синоним распределения вероятностей , а конвергенция в законе означает конвергенцию в распределении . Соответственно, распределение Пуассона иногда называют «законом малых чисел», поскольку оно представляет собой распределение вероятностей числа появлений события, которое случается редко, но имеет очень много возможностей произойти. «Закон малых чисел» — книга Ладислава Борткевича о распределении Пуассона, опубликованная в 1898 году. [11] [64]
Точный процесс Пуассона
Распределение Пуассона возникает как количество точек точечного процесса Пуассона , расположенных в некоторой конечной области. Точнее, если D — некоторое региональное пространство, например евклидово пространство R d , для которого | D |, площадь, объём или, в более общем плане, мера Лебега области конечна, и если N ( D ) обозначает количество точек в D , то
Регрессия Пуассона и отрицательная биномиальная регрессия
Регрессия Пуассона и отрицательная биномиальная регрессия полезны для анализа, где зависимой переменной (откликом) является количество (0, 1, 2,...) количества событий или вхождений в интервале.
Другие применения в науке
В пуассоновском процессе количество наблюдаемых событий колеблется вокруг среднего значения λ со стандартным отклонением. Эти колебания обозначаются как пуассоновский шум или (особенно в электронике) как дробовой шум .
Корреляция среднего и стандартного отклонения при подсчете независимых дискретных событий полезна с научной точки зрения. Отслеживая, как колебания изменяются в зависимости от среднего сигнала, можно оценить вклад одного события, даже если этот вклад слишком мал, чтобы его можно было обнаружить напрямую . Например, заряд электрона e можно оценить, сопоставив величину электрического тока с его дробовым шумом . Если N электронов проходят точку в среднем за заданное время t , средний ток равен ; поскольку колебания тока должны быть порядка (т . е. стандартного отклонения процесса Пуассона ) , заряд можно оценить из соотношения
Повседневный пример — зернистость, появляющаяся при увеличении фотографий; зернистость обусловлена пуассоновскими колебаниями количества восстановленных зерен серебра , а не самими отдельными зернами. Сопоставляя зернистость со степенью увеличения, можно оценить вклад отдельного зерна (которое в противном случае слишком мало, чтобы его можно было увидеть без посторонней помощи) . [65] Были разработаны многие другие молекулярные применения пуассоновского шума, например, оценка плотности числа рецепторных молекул в клеточной мембране .
В теории причинных множеств дискретные элементы пространства-времени подчиняются распределению Пуассона в объеме.
Распределение Пуассона ставит перед специализированными программными библиотеками две разные задачи: оценку распределения и рисование случайных чисел в соответствии с этим распределением.
Оценка распределения Пуассона
Вычисление для данного и является тривиальной задачей, которую можно выполнить, используя стандартное определение в терминах экспоненциальной, степенной и факториальной функций. Однако традиционное определение распределения Пуассона содержит два термина, которые могут легко переполниться на компьютерах: λ k и k ! . Доля от λ k до k ! также может привести к очень большой ошибке округления по сравнению с e − λ и, следовательно, к ошибочному результату. Поэтому для численной стабильности функцию массы вероятности Пуассона следует оценивать как
что математически эквивалентно, но численно стабильно. Натуральный логарифм функции Gamma можно получить с помощью lgammaфункции в стандартной библиотеке C (версия C99) или R , gammalnфункции в MATLAB или SciPy или log_gammaфункции в Fortran 2008 и более поздних версиях.
Некоторые компьютерные языки предоставляют встроенные функции для оценки распределения Пуассона, а именно:
Простой алгоритм генерации случайных чисел с распределением Пуассона ( выборка псевдослучайных чисел ) был предложен Кнутом : [68] : 137-138.
Алгоритм случайного числа Пуассона (Кнут) : init : Пусть L ← e −λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в [0,1] и пусть p ← p × u. пока p > L. верните k - 1.
Сложность линейна по возвращаемому значению k , которое в среднем равно λ . Есть много других алгоритмов для улучшения этого. Некоторые из них приведены у Аренса и Дитера, см. § Ссылки ниже.
Для больших значений λ значение L = e − λ может быть настолько малым, что его трудно представить. Эту проблему можно решить, изменив алгоритм, который использует дополнительный параметр STEP, чтобы e - STEP не опустошался :
алгоритм случайного числа Пуассона (Цзюньхао, на основе Кнута) : init : пусть λ Left ← λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерируйте равномерное случайное число u в (0,1) и пусть p ← p × u. в то время как p < 1 и λ Left > 0: если λ Left > STEP: p ← p × e STEP λ Left ← λ Left − STEP else : p ← p × e λ Влево λ Влево ← 0 , пока p > 1. Верните k - 1.
Выбор STEP зависит от порога переполнения. Для формата с плавающей запятой двойной точности порог близок к e 700 , поэтому 500 должно быть безопасным шагом .
Другие решения для больших значений λ включают браковочную выборку и использование гауссовой аппроксимации.
Выборка с обратным преобразованием проста и эффективна для малых значений λ и требует только одного равномерного случайного числа u на выборку. Кумулятивные вероятности проверяются по очереди, пока одна из них не превысит u .
Алгоритм Генератор Пуассона, основанный на инверсии последовательным поиском : [69] : 505 init : Пусть x ← 0, p ← e −λ , s ← p. Сгенерируйте равномерное случайное число u в [0,1]. пока ты > делаешь : х ← х + 1. р ← р × λ / х. с ← с + р. вернуть х.
^ аб Хейт, Фрэнк А. (1967). Справочник по распределению Пуассона . Нью-Йорк, штат Нью-Йорк, США: John Wiley & Sons. ISBN978-0-471-33932-8.
^ Аб Йейтс, Рой Д.; Гудман, Дэвид Дж. (2014). Вероятность и случайные процессы: дружественное введение для инженеров-электриков и вычислительных машин (2-е изд.). Хобокен, Нью-Джерси: Уайли. ISBN978-0-471-45259-1.
^ Пуассон, Симеон Д. (1837). Probabilité des jugements en matière criminel et en matière Civile, precédées des regles générales du Calcul des probilités [ Исследование вероятности вынесения судебных решений по уголовным и гражданским делам ] (на французском языке). Париж, Франция: Башелье.
^ де Муавр, Авраам (1711). «De mensura sortis, seu, de probilitate eventuum in ludis a casu fortuito pendentibus» [Об измерении случайности, или о вероятности событий в играх, зависящих от случайного случая]. Философские труды Королевского общества (на латыни). 27 (329): 213–264. дои : 10.1098/rstl.1710.0018 .
^ де Муавр, Авраам (1718). Доктрина шансов, или метод расчета вероятности событий в игре. Лондон, Великобритания: У. Пирсон. ISBN9780598843753.
^ де Муавр, Авраам (1721). «О законах случая». В Мотте, Бенджамин (ред.). Философские труды от года MDCC (где заканчивается мистер Лоуторп) до года MDCCXX. Сокращено и распределено под общим руководством (на латыни). Том. I. Лондон, Великобритания: Р. Уилкин, Р. Робинсон, С. Баллард, У. и Дж. Иннис, Дж. Осборн. стр. 190–219.
^ Стиглер, Стивен М. (1982). «Пуассон о распределении Пуассона». Статистика и вероятностные буквы . 1 (1): 33–35. дои : 10.1016/0167-7152(82)90010-4.
^ Хальд, Андерс; де Муавр, Авраам; МакКлинток, Брюс (1984). «А. де Муавр: «De Mensura Sortis», или «Об измерении случайности».". International Statistical Review / Revue Internationale de Statistique . 52 (3): 229–262. doi : 10.2307/1403045. JSTOR 1403045.
^ Ньюкомб, Саймон (1860). «Заметки по теории вероятностей». Математический ежемесячник . 2 (4): 134–140.
^ abc фон Борткевич, Ладислав (1898). Das Gesetz der kleinen Zahlen [ Закон малых чисел ] (на немецком языке). Лейпциг, Германия: Б. Г. Тойбнер. стр. 1, 23–25.
На странице 1 Борткевич представляет распределение Пуассона.
На страницах 23–25 Борткевич представляет свой анализ книги «4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten». [4. Пример: убитые в прусской армии ударом лошади.]
^ Доказательство см.: Вики-доказательство: ожидание и Вики-доказательство: дисперсия.
^ Хельске, Йоуни (2017). «KFAS: Экспоненциальные модели пространства семейных состояний в R». Журнал статистического программного обеспечения . 78 (10). arXiv : 1612.01907 . doi : 10.18637/jss.v078.i10. S2CID 14379617.
^ Чой, Квок П. (1994). «О медианах гамма-распределений и уравнении Рамануджана». Труды Американского математического общества . 121 (1): 245–251. дои : 10.2307/2160389 . JSTOR 2160389.
^ Риордан, Джон (1937). «Моментные рекуррентные соотношения для биномиального, пуассоновского и гипергеометрического распределений частот» (PDF) . Анналы математической статистики . 8 (2): 103–111. дои : 10.1214/aoms/1177732430 . JSTOR 2957598.
^ Д. Але, Томас (2022). «Точные и простые оценки исходных моментов биномиального и пуассоновского распределений». Статистика и вероятностные буквы . 182 : 109306. arXiv : 2103.17027 . дои : 10.1016/j.spl.2021.109306.
^ Райков, Дмитрий (1937). «О разложении законов Пуассона». Comptes Rendus de l'Académie des Sciences de l'URSS . 14 : 9–11.
^ фон Мизес, Ричард (1964). Математическая теория вероятностей и статистика . Нью-Йорк, Нью-Джерси, США: Academic Press. дои : 10.1016/C2013-0-12460-9. ISBN978-1-4832-3213-3.
^ Харремос, П. (июль 2001 г.). «Биномиальное распределение и распределение Пуассона как распределение максимальной энтропии». Транзакции IEEE по теории информации . 47 (5): 2039–2041. дои : 10.1109/18.930936. S2CID 16171405.
^ Лаха, Радха Г.; Рохатги, Виджай К. (1979). Теория вероятности . Нью-Йорк, Нью-Джерси, США: John Wiley & Sons. ISBN978-0-471-03262-5.
^ Митценмахер, Майкл (2017). Вероятность и вычисления: Рандомизация и вероятностные методы в алгоритмах и анализе данных . Эли Упфал (2-е изд.). Кембридж, Великобритания. Упражнение 5.14. ISBN978-1-107-15488-9. ОСЛК 960841613.{{cite book}}: CS1 maint: location missing publisher (link)
^ Аб Митценмахер, Майкл ; Упфал, Эли (2005). Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN978-0-521-83540-4.
^ Коротко, Майкл (2013). «Улучшенные неравенства для распределения Пуассона, биномиального распределения и квантильных функций верхнего хвоста». ISRN Вероятность и статистика . 2013 . Следствие 6. doi : 10.1155/2013/412958 .
^ Коротко, Майкл (2013). «Улучшенные неравенства для распределения Пуассона, биномиального распределения и квантильных функций верхнего хвоста». ISRN Вероятность и статистика . 2013 . Теорема 2. doi : 10.1155/2013/412958 .
^ Камат, Говинда М.; Шашоглу, Эрен; Це, Дэвид (14–19 июня 2015 г.). Оптимальная сборка гаплотипов из считываний парных пар с высокой пропускной способностью . Международный симпозиум IEEE по теории информации (ISIT), 2015 г. Гонконг, Китай. стр. 914–918. arXiv : 1502.01975 . дои : 10.1109/ISIT.2015.7282588. S2CID 128634.
^ Принс, Джек (2012). «6.3.3.1. Таблицы контроля подсчетов». Электронный справочник по статистическим методам . НИСТ/СЕМАТЕХ . Проверено 20 сентября 2019 г.
^ Феллер, Уильям. Введение в теорию вероятностей и ее приложения .
^ Чжан, Хуэймин; Лю, Юньсяо; Ли, Бо (2014). «Заметки о дискретной составной модели Пуассона с приложениями к теории риска». Страхование: Математика и Экономика . 59 : 325–336. doi :10.1016/j.insmatheco.2014.09.012.
^ Чжан, Хуэймин; Ли, Бо (2016). «Характеристика дискретных составных распределений Пуассона». Коммуникации в статистике - теория и методы . 45 (22): 6789–6802. дои : 10.1080/03610926.2014.901375. S2CID 125475756.
^ МакКаллах, Питер ; Нелдер, Джон (1989). Обобщенные линейные модели . Монографии по статистике и прикладной теории вероятности. Том. 37. Лондон, Великобритания: Чепмен и Холл. ISBN978-0-412-31760-6.
^ Росс, Шелдон М. (2010). Введение в вероятностные модели (10-е изд.). Бостон, Массачусетс: Академическая пресса. ISBN978-0-12-375686-2.
^ «1.7.7 - Связь между многочленом и Пуассоном | STAT 504» .
^ Лукас, Сотириос; Кемп, К. Дэвид (1986). «Индекс дисперсии для двумерного распределения Пуассона». Биометрия . 42 (4): 941–948. дои : 10.2307/2530708. JSTOR 2530708.
^ Свободные случайные переменные Д. Войкулеску, К. Дикема, А. Ника, Серия монографий CRM, Американское математическое общество, Провиденс, Род-Айленд, 1992
^ Александру Ника, Роланд Спейчер: Лекции по комбинаторике свободной вероятности. Серия лекций Лондонского математического общества, Vol. 335, Издательство Кембриджского университета, 2006.
^ Лекции А. Ники и Р. Спейчера по комбинаторике свободной вероятности, стр. 203–204, Cambridge Univ. Пресс 2006
^ Ван Трис, Гарри Л. (2013). Оценка обнаружения и теория модуляции. Кристин Л. Белл, Чжи Тянь (второе изд.). Хобокен, Нью-Джерси ISBN978-1-299-66515-6. ОСЛК 851161356.{{cite book}}: CS1 maint: location missing publisher (link)
^ Финк, Дэниел (1997). Сборник сопряженных априорных значений .
^ Дитсо, Алекс; Бедный, Х. Винсент (2020). «Оценка в пуассоновском шуме: свойства условной оценки среднего». Транзакции IEEE по теории информации . 66 (7): 4304–4323. arXiv : 1911.03744 . дои : 10.1109/TIT.2020.2979978 . S2CID 207853178.
^ Гельман; Карлин, Джон Б.; Стерн, Хэл С.; Рубин, Дональд Б. (2003). Байесовский анализ данных (2-е изд.). Бока-Ратон, Флорида, США: Chapman & Hall/CRC. ISBN1-58488-388-Х.
^ Клевенсон, М. Лоуренс; Зидек, Джеймс В. (1975). «Одновременная оценка средств независимых законов Пуассона». Журнал Американской статистической ассоциации . 70 (351): 698–705. дои : 10.1080/01621459.1975.10482497. JSTOR 2285958.
^ Бергер, Джеймс О. (1985). Статистическая теория принятия решений и байесовский анализ . Серия Спрингера по статистике (2-е изд.). Нью-Йорк, штат Нью-Йорк: Springer-Verlag. Бибкод : 1985sdtb.book.....B. дои : 10.1007/978-1-4757-4286-2. ISBN978-0-387-96098-2.
^ Раш, Георг (1963). Пуассоновский процесс как модель разнообразия поведенческих явлений (PDF) . 17-й Международный психологический конгресс. Том. 2. Вашингтон, округ Колумбия: Американская психологическая ассоциация. дои : 10.1037/e685262012-108.
^ Флори, Пол Дж. (1940). «Распределение молекулярных размеров в полимерах оксида этилена». Журнал Американского химического общества . 62 (6): 1561–1565. дои : 10.1021/ja01863a066.
^ Ломниц, Цинна (1994). Основы прогнозирования землетрясений . Нью-Йорк, штат Нью-Йорк: Джон Уайли и сыновья. ISBN0-471-57419-8. ОСЛК 647404423.
^ Боланд, Филип Дж. (1984). «Биографический взгляд на Уильяма Сили Госсета». Американский статистик . 38 (3): 179–183. дои : 10.1080/00031305.1984.10483195. JSTOR 2683648.
^ Эрланг, Агнер К. (1909). «Sandsynlighedsregning og Telefonsamtaler» [Вычисление вероятностей и телефонные разговоры]. Nyt Tidsskrift для Matematik (на датском языке). 20 (Б): 33–39. JSTOR 24528622.
^ Хорнби, Дэйв (2014). «Модель футбольного прогнозирования: распределение Пуассона». Ставки на спорт онлайн . Проверено 19 сентября 2014 г.
^ Кояма, Кенто; Хокунан, Хидекадзу; Хасэгава, Маюми; Кавамура, Сюсо; Косеки, Сигенобу (2016). «Соответствует ли количество бактериальных клеток теоретическому распределению Пуассона? Сравнение экспериментально полученного количества отдельных клеток с генерацией случайных чисел посредством компьютерного моделирования». Пищевая микробиология . 60 : 49–53. дои : 10.1016/j.fm.2016.05.019. ПМИД 27554145.
^ Кларк, Р.Д. (1946). «Применение распределения Пуассона» (PDF) . Журнал Института актуариев . 72 (3): 481. doi : 10.1017/S0020268100035435 .
^ Харди, Годфри Х .; Литтлвуд, Джон Э. (1923). «О некоторых проблемах «partitio numerorum» III: О выражении числа в виде суммы простых чисел». Акта Математика . 44 : 1–70. дои : 10.1007/BF02403921 .
^ Галлахер, Патрик X. (1976). «О распределении простых чисел на коротких промежутках». Математика . 23 (1): 4–9. дои : 10.1112/s0025579300016442.
^ Кэмерон, А. Колин; Триведи, Правин К. (1998). Регрессионный анализ данных подсчета. Кембридж, Великобритания: Издательство Кембриджского университета. ISBN978-0-521-63567-7.