stringtranslate.com

Распределение Пуассона

В теории вероятностей и статистике распределение Пуассона ( / ˈ p w ɑː s ɒ n / ; французское произношение: [pwasɔ̃] ) — это дискретное распределение вероятностей , которое выражает вероятность заданного числа событий, происходящих в фиксированном интервале времени, если эти события происходят с известной постоянной средней скоростью и независимо от времени, прошедшего с момента последнего события. [1] Его также можно использовать для числа событий в других типах интервалов, отличных от времени, и в размерности больше 1 (например, число событий в заданной области или объеме).

Распределение Пуассона названо в честь французского математика Симеона Дени Пуассона . Оно играет важную роль для дискретно-устойчивых распределений .

При распределении Пуассона с ожиданием λ событий в заданном интервале вероятность k событий в том же интервале равна: [2] : 60 

Например, рассмотрим колл-центр, который получает в среднем λ = 3 звонка в минуту в любое время дня. Если звонки независимы, получение одного звонка не изменяет вероятность того, когда поступит следующий. При этих предположениях число звонков k , полученных в течение любой минуты, имеет распределение вероятности Пуассона. Получение k = от 1 до 4 звонков имеет вероятность около 0,77, в то время как получение 0 или по крайней мере 5 звонков имеет вероятность около 0,23.

Классическим примером, используемым для обоснования распределения Пуассона, является число событий радиоактивного распада в течение фиксированного периода наблюдения. [3]

История

Распределение было впервые введено Симеоном Дени Пуассоном (1781–1840) и опубликовано вместе со своей теорией вероятностей в его работе Recherches sur la probabilité des jugements en matière criminelle et en matière civile (1837). [4] : 205-207  Работа теоретизировала о количестве неправомерных осуждений в данной стране, сосредоточившись на определенных случайных величинах N , которые подсчитывают, среди прочего, количество дискретных событий (иногда называемых «событиями» или «прибытиями»), которые происходят в течение временного интервала заданной длины. Результат уже был дан в 1711 году Авраамом де Муавром в De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus . [5] : 219  [6] : 14-15  [7] : 193  [8] : 157  Это делает его примером закона Стиглера и побудило некоторых авторов утверждать, что распределение Пуассона должно носить имя Муавра. [9] [10]

В 1860 году Саймон Ньюкомб подогнал распределение Пуассона к числу звезд, обнаруженных в единице пространства. [11] Дальнейшее практическое применение было сделано Ладиславом Борткевичем в 1898 году. Борткевич показал, что частота, с которой солдаты прусской армии случайно погибали от ударов лошади, может быть хорошо смоделирована с помощью распределения Пуассона. [12] : 23-25  ​​.

Определения

Функция массы вероятности

Говорят, что дискретная случайная величина X имеет распределение Пуассона с параметром , если ее функция массы вероятности задается следующим образом: [2] : 60 

где

Положительное действительное число λ равно ожидаемому значению X , а также его дисперсии . [13]

Распределение Пуассона может быть применено к системам с большим числом возможных событий, каждое из которых является редким . Число таких событий, которые происходят в течение фиксированного интервала времени, при правильных обстоятельствах является случайным числом с распределением Пуассона.

Уравнение можно адаптировать, если вместо среднего числа событий нам дана средняя скорость , с которой происходят события. Тогда и: [14]

Примеры

Жевательная резинка на тротуаре в Рейкьявике.
Жевательная резинка на тротуаре. Количество кусочков на одной плитке приблизительно распределено по закону Пуассона.

Распределение Пуассона может быть полезно для моделирования таких событий, как:

Примерами появления случайных точек в пространстве являются: места падения астероидов на Землю (двумерные), места дефектов в материале (трехмерные) и места расположения деревьев в лесу (двумерные). [15]

Предположения и обоснованность

Распределение Пуассона является подходящей моделью, если верны следующие предположения:

Если эти условия верны, то k является пуассоновской случайной величиной; распределение k является распределением Пуассона.

Распределение Пуассона также является пределом биномиального распределения , для которого вероятность успеха для каждой попытки равна λ, деленной на число попыток, поскольку число попыток стремится к бесконечности (см. Связанные распределения).

Примеры вероятностей для распределений Пуассона

Однажды в интервале событий: Частный случайλ= 1 ик= 0

Предположим, что астрономы подсчитали, что крупные метеориты (больше определенного размера) падают на Землю в среднем раз в 100 лет ( λ = 1 событие за 100 лет), и что количество падений метеоритов следует распределению Пуассона. Какова вероятность k = 0 падений метеоритов в течение следующих 100 лет?

При этих предположениях вероятность того, что в течение следующих 100 лет на Землю не упадет ни одного крупного метеорита, составляет примерно 0,37. Оставшиеся 1 − 0,37 = 0,63 представляют собой вероятность падения 1, 2, 3 или более крупных метеоритов в течение следующих 100 лет. В приведенном выше примере наводнение из-за разлива происходило раз в 100 лет ( λ = 1). Вероятность отсутствия наводнений из-за разлива в течение 100 лет составила примерно 0,37 по тем же расчетам.

В общем, если событие происходит в среднем один раз за интервал ( λ  = 1), и события следуют распределению Пуассона, то P (0 событий в следующем интервале) = 0,37. Кроме того, P (ровно одно событие в следующем интервале) = 0,37, как показано в таблице для паводков.

Примеры, нарушающие предположения Пуассона

Число студентов, прибывающих в студенческий союз в минуту, скорее всего, не будет подчиняться распределению Пуассона, поскольку скорость не является постоянной (низкая скорость во время занятий, высокая скорость между занятиями), а прибытие отдельных студентов не является независимым (студенты, как правило, приходят группами). Непостоянная скорость прибытия может быть смоделирована как смешанное распределение Пуассона , а прибытие групп, а не отдельных студентов, как сложный процесс Пуассона .

Число землетрясений магнитудой 5 в год в стране может не подчиняться распределению Пуассона, если одно крупное землетрясение увеличивает вероятность повторных толчков аналогичной магнитуды.

Примеры, в которых гарантировано хотя бы одно событие, не распределены по закону Пуассона, но могут быть смоделированы с использованием усеченного до нуля распределения Пуассона .

Распределения количества, в которых число интервалов с нулевыми событиями выше, чем предсказывает модель Пуассона, можно смоделировать с помощью модели с завышением нуля .

Характеристики

Описательная статистика

Медиана

Границы для медианы ( ) распределения известны и являются точными : [18]

Высшие моменты

Высшие нецентрированные моменты m k распределения Пуассона являются полиномами Тушара по λ : где фигурные скобки { } обозначают числа Стирлинга второго рода . [19] [1] : 6  Другими словами, когда ожидаемое значение установлено равным λ = 1, формула Добински подразумевает, что n -й момент равен числу разбиений множества размера n .

Простая верхняя граница: [20]

Суммы случайных величин, распределенных по закону Пуассона

Если для независимы , то [21] : 65  Обратной теоремой является теорема Райкова , которая гласит, что если сумма двух независимых случайных величин распределена по закону Пуассона, то таковыми являются и каждая из этих двух независимых случайных величин. [22] [23]

Максимальная энтропия

Это распределение с максимальной энтропией среди множества обобщенных биномиальных распределений со средним значением и , [24] где обобщенное биномиальное распределение определяется как распределение суммы N независимых, но не одинаково распределенных переменных Бернулли.

Другие свойства

где — расхождение Кульбака–Лейблера от .

Пуассоновские гонки

Пусть и — независимые случайные величины, тогда имеем, что

Верхняя граница доказана с использованием стандартной границы Чернова.

Нижнюю границу можно доказать, заметив, что есть вероятность того, что где , которая ограничена снизу где есть относительная энтропия (см. статью о границах хвостов биномиальных распределений для получения подробной информации). Далее отметив, что и вычислив нижнюю границу безусловной вероятности, получаем результат. Более подробную информацию можно найти в приложении к Kamath et al. [30]

Связанные дистрибутивы

Как биномиальное распределение с бесконечно малыми временными шагами

Распределение Пуассона можно вывести как предельный случай биномиального распределения , когда число попыток стремится к бесконечности, а ожидаемое число успехов остается фиксированным — см. закон редких событий ниже. Следовательно, его можно использовать в качестве приближения биномиального распределения, если n достаточно велико, а p достаточно мало. Распределение Пуассона является хорошим приближением биномиального распределения, если n не менее 20, а p меньше или равно 0,05, и превосходным приближением, если n  ≥ 100 и np  ≤ 10. [31] Позволяя и быть соответствующими функциями кумулятивной плотности биномиального и пуассоновского распределений, имеем: Один вывод этого использует функции генерации вероятности . [32] Рассмотрим испытание Бернулли (подбрасывание монеты), вероятность одного успеха (или ожидаемое число успехов) которого находится в пределах заданного интервала. Разбейте интервал на n частей и выполните испытание в каждом подынтервале с вероятностью . Вероятность k успехов из n попыток на всем интервале затем определяется биномиальным распределением

,

производящая функция которой:

Принимая предел при увеличении n до бесконечности (при фиксированном x ) и применяя определение предела произведения экспоненциальной функции , это сводится к производящей функции распределения Пуассона:

Общий

приближение Пуассона

Предположим , что где тогда [38] распределено мультиномиально при условии

Это означает [27] : 101-102  , среди прочего, что для любой неотрицательной функции, если она распределена мультиномиально, то где

Множитель можно заменить на 2, если дополнительно предположить, что он монотонно возрастает или убывает.

Двумерное распределение Пуассона

Это распределение было распространено на двумерный случай. [39] Производящая функция для этого распределения имеет вид

с

Предельные распределения — это распределения Пуассона ( θ 1 ) и Пуассона ( θ 2 ), а коэффициент корреляции ограничен диапазоном

Простой способ создания двумерного распределения Пуассона — взять три независимых распределения Пуассона со средними значениями , а затем задать Вероятностную функцию двумерного распределения Пуассона:

Свободное распределение Пуассона

Свободное распределение Пуассона [40] с размером и скоростью скачка возникает в свободной теории вероятностей как предел повторной свободной свертки при N → ∞ .

Другими словами, пусть будут случайными величинами, так что имеет значение с вероятностью и значение 0 с оставшейся вероятностью. Предположим также, что семейство свободно независимо . Тогда предел по закону задается свободным законом Пуассона с параметрами

Это определение аналогично одному из способов, с помощью которого классическое распределение Пуассона получается из (классического) процесса Пуассона.

Мера, связанная со свободным законом Пуассона, определяется выражением [41] , где и имеет поддержку

Этот закон также возникает в теории случайных матриц как закон Марченко–Пастура . Его свободные кумулянты равны

Некоторые преобразования этого закона

Мы приводим значения некоторых важных преобразований свободного закона Пуассона; вычисление можно найти, например, в книге « Лекции по комбинаторике свободной вероятности» А. Ники и Р. Шпайхера [42].

R-преобразование свободного закона Пуассона определяется выражением

Преобразование Коши (которое является отрицательным преобразованием Стилтьеса ) определяется выражением

S-преобразование задается в случае, если

Расчет Вейбулла и Стабиля

Функция массы вероятности Пуассона может быть выражена в форме, аналогичной распределению произведения распределения Вейбулла и варианту формы устойчивого распределения счета . Переменная может рассматриваться как обратная параметру устойчивости Леви в устойчивом распределении счета: где — стандартное устойчивое распределение счета формы , а — стандартное распределение Вейбулла формы

Статистический вывод

Оценка параметров

Учитывая выборку из n измеренных значений для i = 1, ..., n , мы хотим оценить значение параметра λ пуассоновской популяции, из которой была взята выборка. Оценка максимального правдоподобия равна [43]

Поскольку каждое наблюдение имеет ожидание λ, то же самое относится и к выборочному среднему. Следовательно, оценка максимального правдоподобия является несмещенной оценкой λ . Она также является эффективной оценкой, поскольку ее дисперсия достигает нижней границы Крамера–Рао (CRLB). [44] Следовательно, она является несмещенной с минимальной дисперсией . Также можно доказать, что сумма (и, следовательно, выборочное среднее, поскольку оно является функцией суммы один к одному) является полной и достаточной статистикой для λ .

Для доказательства достаточности можно использовать теорему о факторизации . Рассмотрим разбиение функции массы вероятности совместного распределения Пуассона для выборки на две части: одну, которая зависит исключительно от выборки , называемую , и другую, которая зависит от параметра и выборки только через функцию Тогда является достаточной статистикой для

Первый член зависит только от . Второй член зависит от выборки только через Таким образом, достаточно.

Чтобы найти параметр λ , который максимизирует функцию вероятности для популяции Пуассона, мы можем использовать логарифм функции правдоподобия:

Берем производную по λ и сравниваем ее с нулем:

Решение относительно λ дает стационарную точку.

Итак, λ — это среднее значение k i . Получение знака второй производной L в стационарной точке определит, каким экстремальным значением является λ .

Оценка второй производной в стационарной точке дает:

что является отрицательным значением n , умноженным на обратную величину среднего значения k i . Это выражение отрицательно, когда среднее значение положительно. Если это выполняется, то стационарная точка максимизирует функцию вероятности.

Для полноты семейство распределений называется полным тогда и только тогда, когда подразумевается, что для всех Если индивидуумы являются независимыми , то Зная распределение, которое мы хотим исследовать, легко видеть, что статистика является полной.

Для того чтобы это равенство выполнялось, должно быть равно 0. Это следует из того факта, что ни один из других членов не будет равен 0 для всех в сумме и для всех возможных значений Следовательно, для всех следует, что и было показано, что статистика является полной.

Доверительный интервал

Доверительный интервал для среднего значения распределения Пуассона может быть выражен с использованием соотношения между кумулятивными функциями распределения Пуассона и распределения хи-квадрат . Распределение хи-квадрат само по себе тесно связано с гамма-распределением , и это приводит к альтернативному выражению. При наличии наблюдения k из распределения Пуассона со средним значением μ доверительный интервал для μ с уровнем достоверности 1 – α равен

или эквивалентно,

где — квантильная функция (соответствующая нижней хвостовой области p ) распределения хи-квадрат с n степенями свободы, а — квантильная функция гамма -распределения с параметром формы n и параметром масштаба 1. [8] : 176-178  [45] Этот интервал является « точным » в том смысле, что его вероятность покрытия никогда не бывает меньше номинала 1 – α .

Когда квантили гамма-распределения недоступны, была предложена точная аппроксимация этого точного интервала (основанная на преобразовании Уилсона-Хилферти ): [46]

где обозначает стандартное нормальное отклонение с верхней зоной хвоста α / 2 .

Для применения этих формул в том же контексте, что и выше (при наличии выборки из n измеренных значений k i , каждое из которых взято из распределения Пуассона со средним λ ), можно установить

вычислить интервал для μ = n λ , а затем вывести интервал для λ .

Байесовский вывод

В байесовском выводе сопряженное априорное распределение для параметра скорости λ распределения Пуассона представляет собой гамма-распределение . [47] Пусть

обозначим, что λ распределена в соответствии с плотностью гамма-излучения g, параметризованной с помощью параметра формы α и обратного масштабного параметра β :

Тогда, учитывая ту же выборку из n измеренных значений k i , что и раньше, и априорную величину Gamma( α , β ), апостериорное распределение будет иметь вид

Обратите внимание, что апостериорное среднее является линейным и определяется как

Можно показать, что гамма-распределение является единственным априорным распределением, которое индуцирует линейность условного среднего. Более того, существует обратный результат, который утверждает, что если условное среднее близко к линейной функции по расстоянию, то априорное распределение λ должно быть близко к гамма-распределению по расстоянию Леви . [48]

Апостериорное среднее E[ λ ] приближается к оценке максимального правдоподобия в пределе, что немедленно следует из общего выражения среднего значения гамма -распределения .

Апостериорное предсказательное распределение для одного дополнительного наблюдения представляет собой отрицательное биномиальное распределение , [49] : 53  иногда называемое распределением гамма-Пуассона.

Одновременная оценка нескольких средних значений Пуассона

Предположим, что есть набор независимых случайных величин из набора распределений Пуассона, каждое из которых имеет параметр , и мы хотели бы оценить эти параметры. Затем Клевенсон и Зидек показывают, что при нормализованной квадратичной ошибке потери , когда тогда, подобно примеру Штейна для нормальных средних , оценка MLE недопустима . [50]

В этом случае семейство минимаксных оценок дается для любого и как [51]

Возникновение и применение

Некоторые применения распределения Пуассона для подсчета данных (количества событий): [52]

Дополнительные примеры подсчета событий, которые можно смоделировать как пуассоновские процессы, включают:

В теории вероятностных чисел Галлахер в 1976 году показал, что если определенная версия недоказанной гипотезы о простых r-кортежах верна [61] , то количество простых чисел в короткие интервалы будет подчиняться распределению Пуассона. [62]

Закон редких событий

Сравнение распределения Пуассона (черные линии) и биномиального распределения при n = 10 (красные круги), n = 20 (синие круги), n = 1000 (зеленые круги). Все распределения имеют среднее значение 5. Горизонтальная ось показывает количество событий  k . По мере увеличения n распределение Пуассона становится все более лучшим приближением для биномиального распределения с тем же средним значением.

Скорость события связана с вероятностью события, происходящего в некотором малом подынтервале (времени, пространства или иного). В случае распределения Пуассона предполагается, что существует достаточно малый подынтервал, для которого вероятность события дважды «ничтожна». При таком предположении можно вывести распределение Пуассона из биномиального, имея только информацию об ожидаемом числе общих событий во всем интервале.

Пусть общее число событий во всем интервале будет обозначено как Разделим весь интервал на подынтервалы одинакового размера, так что (поскольку нас интересуют только очень малые части интервала, это предположение имеет смысл). Это означает, что ожидаемое число событий в каждом из n подынтервалов равно

Теперь предположим, что возникновение события на всем интервале можно рассматривать как последовательность из n испытаний Бернулли , где -ое испытание Бернулли соответствует проверке того, произойдет ли событие на подынтервале с вероятностью Ожидаемое количество общих событий в таких испытаниях будет ожидаемым количеством общих событий на всем интервале. Следовательно, для каждого подразделения интервала мы аппроксимировали возникновение события как процесс Бернулли вида Как мы уже отмечали ранее, мы хотим рассматривать только очень малые подынтервалы. Поэтому мы берем предел при стремящемся к бесконечности.

В этом случае биномиальное распределение сходится к так называемому распределению Пуассона по предельной теореме Пуассона .

В нескольких из приведенных выше примеров, таких как число мутаций в заданной последовательности ДНК, подсчитываемые события на самом деле являются результатами дискретных испытаний и могут быть более точно смоделированы с использованием биномиального распределения , то есть

В таких случаях n очень велико, а p очень мало (и поэтому ожидание np имеет промежуточную величину). Тогда распределение может быть аппроксимировано менее громоздким распределением Пуассона

Это приближение иногда называют законом редких событий [ 63] : 5,  поскольку каждое из n отдельных событий Бернулли происходит редко.

Название «закон редких событий» может вводить в заблуждение, поскольку общее количество успешных событий в процессе Пуассона не обязательно должно быть редким, если параметр np не мал. Например, количество телефонных звонков на загруженный коммутатор в течение одного часа следует распределению Пуассона, при этом события кажутся оператору частыми, но они редки с точки зрения среднестатистического члена населения, который вряд ли позвонит на этот коммутатор в этот час.

Дисперсия биномиального распределения в 1 − p раз больше дисперсии распределения Пуассона, поэтому они почти равны, когда p очень мало.

Слово закон иногда используется как синоним распределения вероятностей , а конвергенция в законе означает сходимость в распределении . Соответственно, распределение Пуассона иногда называют «законом малых чисел», потому что это распределение вероятностей числа появлений события, которое случается редко, но имеет очень много возможностей произойти. Закон малых чисел — книга Ладислава Борткевича о распределении Пуассона, опубликованная в 1898 году. [12] [64]

Процесс точки Пуассона

Распределение Пуассона возникает как число точек точечного процесса Пуассона , расположенных в некоторой конечной области. Более конкретно, если D — это некоторое пространство области, например, евклидово пространство R d , для которого | D |, площадь, объем или, в более общем смысле, мера Лебега области конечна, и если N ( D ) обозначает число точек в D , то

Регрессия Пуассона и отрицательная биномиальная регрессия

Регрессия Пуассона и отрицательная биномиальная регрессия полезны для анализов, где зависимая (отзывная) переменная представляет собой количество (0, 1, 2, ... ) событий или появлений в интервале.

Биология

Эксперимент Лурии –Дельбрюка проверял гипотезу ламарковской эволюции, которая должна приводить к распределению Пуассона.

Кац и Миледи измерили мембранный потенциал с присутствием ацетилхолина (ACh) и без него. [65] Когда присутствует ACh, ионные каналы на мембране будут открываться случайным образом в течение небольшой доли времени. Поскольку существует большое количество ионных каналов, каждый из которых открыт в течение небольшой доли времени, общее количество ионных каналов, открытых в любой момент, распределено по закону Пуассона. Когда ACh отсутствует, фактически ни один ионный канал не открыт. Мембранный потенциал равен . Вычитая эффект шума, Кац и Миледи обнаружили, что среднее значение и дисперсия мембранного потенциала составляют , что дает . (стр. 94-95 [66] )

Во время каждого события клеточной репликации число мутаций приблизительно распределено по закону Пуассона. [67] Например, вирус ВИЧ имеет 10 000 пар оснований и имеет частоту мутаций около 1 на 30 000 пар оснований, то есть число мутаций на событие репликации распределено как . (стр. 64 [66] )

Другие применения в науке

В пуассоновском процессе число наблюдаемых событий колеблется вокруг своего среднего значения λ со стандартным отклонением. Эти колебания обозначаются как пуассоновский шум или (особенно в электронике) как дробовой шум .

Корреляция среднего и стандартного отклонения при подсчете независимых дискретных событий полезна с научной точки зрения. Наблюдая за тем, как флуктуации изменяются в зависимости от среднего сигнала, можно оценить вклад отдельного события, даже если этот вклад слишком мал, чтобы его можно было обнаружить напрямую . Например, заряд e на электроне можно оценить, сопоставив величину электрического тока с его дробовым шумом . Если N электронов проходят точку за заданное время t в среднем, средний ток равен ; поскольку флуктуации тока должны быть порядка (т. е. стандартного отклонения процесса Пуассона ), заряд можно оценить из соотношения [ необходима цитата ]

Повседневным примером является зернистость, которая появляется при увеличении фотографий; зернистость обусловлена ​​флуктуациями Пуассона в количестве уменьшенных зерен серебра , а не самими отдельными зернами. Соотнося зернистость со степенью увеличения, можно оценить вклад отдельного зерна (который в противном случае слишком мал, чтобы его можно было увидеть без посторонней помощи). [ необходима цитата ]

В теории причинных множеств дискретные элементы пространства-времени следуют распределению Пуассона в объеме.

Распределение Пуассона также появляется в квантовой механике , особенно в квантовой оптике . А именно, для квантовой гармонической осцилляционной системы в когерентном состоянии вероятность измерения определенного уровня энергии имеет распределение Пуассона.

Методы расчета

Распределение Пуассона ставит перед специализированными программными библиотеками две различные задачи: оценка распределения и построение случайных чисел в соответствии с этим распределением.

Оценка распределения Пуассона

Вычисление для заданных и является тривиальной задачей, которая может быть выполнена с использованием стандартного определения в терминах экспоненциальной, степенной и факториальной функций. Однако общепринятое определение распределения Пуассона содержит два термина, которые могут легко переполняться на компьютерах: λ k и k ! . Дробь λ k к k ! также может привести к ошибке округления, которая очень велика по сравнению с e λ , и, следовательно, дать ошибочный результат. Для числовой устойчивости функция массы вероятности Пуассона должна поэтому оцениваться как

что математически эквивалентно, но численно стабильно. Натуральный логарифм гамма-функции можно получить с помощью lgammaфункции в стандартной библиотеке C (версия C99) или R , gammalnфункции в MATLAB или SciPy , или log_gammaфункции в Fortran 2008 и более поздних версиях.

Некоторые языки программирования предоставляют встроенные функции для оценки распределения Пуассона, а именно:

Генерация случайных величин

Менее тривиальная задача — извлечь целочисленную случайную величину из распределения Пуассона с заданными

Решения предоставлены:

Простой алгоритм генерации случайных чисел, распределенных по закону Пуассона ( выборка псевдослучайных чисел ), был предложен Кнутом : [70] : 137-138 

алгоритм  случайных чисел Пуассона (Кнут) : init : Пусть L ← e −λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерировать равномерное случайное число u в интервале [0,1] и пусть p ← p × u. пока p > L. вернуть k − 1.

Сложность линейна по возвращаемому значению k , которое в среднем равно λ . Существует много других алгоритмов для улучшения этого. Некоторые из них приведены в Ahrens & Dieter, см. § Ссылки ниже.

Для больших значений λ значение L = e λ может быть настолько малым, что его трудно представить. Это можно решить, изменив алгоритм, который использует дополнительный параметр STEP, так что e − STEP не теряет значимость: [ необходима цитата ]

алгоритм  случайных чисел Пуассона (Junhao, основанный на Кнуте) : init : Пусть  λ слева ← λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерировать равномерное случайное число u в (0,1) и пусть p ← p × u. пока p < 1 и λ Left > 0: если  λ Left > STEP: p ← p × e ШАГ  λ Влево ← λ Влево − ШАГ иначе : p ← p × e λ Влево  λ Влево ← 0 пока p > 1. вернуть k − 1.

Выбор STEP зависит от порога переполнения. Для формата с плавающей точкой двойной точности порог близок к e 700 , поэтому 500 должно быть безопасным STEP .

Другие решения для больших значений λ включают выборку с отклонением и использование гауссовой аппроксимации.

Выборка обратного преобразования проста и эффективна для малых значений λ и требует только одного равномерного случайного числа u на выборку. Кумулятивные вероятности проверяются по очереди, пока одна из них не превзойдет u .

Алгоритм  Генератор Пуассона, основанный на инверсии последовательным поиском : [71] : 505   init : Пусть x ← 0, p ← e −λ , s ← p. Сгенерировать равномерное случайное число u в диапазоне [0,1]. пока вы делаете : х ← х + 1. р ← р × λ / х. с ← с + п. вернуть х.

Смотрите также

Ссылки

Цитаты

  1. ^ ab Haight, Frank A. (1967). Справочник по распределению Пуассона . Нью-Йорк, США: John Wiley & Sons. ISBN 978-0-471-33932-8.
  2. ^ ab Yates, Roy D.; Goodman, David J. (2014). Вероятность и стохастические процессы: Дружественное введение для инженеров-электриков и компьютерщиков (2-е изд.). Hoboken, NJ: Wiley. ISBN 978-0-471-45259-1.
  3. ^ Росс, Шелдон М. (2014). Введение в вероятностные модели (11-е изд.). Academic Press.
  4. ^ Пуассон, Симеон Д. (1837). Probabilité des jugements en matière criminel et en matière Civile, precédées des regles générales du Calcul des probilités [ Исследование вероятности вынесения судебных решений по уголовным и гражданским делам ] (на французском языке). Париж, Франция: Башелье.
  5. ^ де Муавр, Авраам (1711). «De mensura sortis, seu, de probilitate eventuum in ludis a casu fortuito pendentibus» [Об измерении случайности, или о вероятности событий в играх, зависящих от случайного случая]. Философские труды Королевского общества (на латыни). 27 (329): 213–264. дои : 10.1098/rstl.1710.0018 .
  6. ^ Муавр, Абрахам (1718). Учение о шансах: или Метод расчета вероятности событий в игре. Лондон, Великобритания: W. Pearson. ISBN 9780598843753.
  7. ^ де Муавр, Авраам (1721). «О законах случая». В Motte, Benjamin (ред.). Философские труды с года MDCC (где заканчивается Mr. Lowthorp) по год MDCCXX. Сокращено и размещено под общими заголовками (на латыни). Том I. Лондон, Великобритания: R. Wilkin, R. Robinson, S. Ballard, W. и J. Innys, и J. Osborn. стр. 190–219.
  8. ^ abcdefghi Джонсон, Норман Л.; Кемп, Адриенн В.; Коц, Сэмюэл (2005). «Распределение Пуассона». Одномерные дискретные распределения (3-е изд.). Нью-Йорк, штат Нью-Йорк, США: John Wiley & Sons, Inc. стр. 156–207. doi :10.1002/0471715816. ISBN 978-0-471-27246-5.
  9. ^ Стиглер, Стивен М. (1982). «Пуассон на распределении Пуассона». Statistics & Probability Letters . 1 (1): 33–35. doi :10.1016/0167-7152(82)90010-4.
  10. ^ Хальд, Андерс; де Муавр, Авраам; МакКлинток, Брюс (1984). «А. де Муавр: «De Mensura Sortis», или «Об измерении случайности».". International Statistical Review / Revue Internationale de Statistique . 52 (3): 229–262. doi : 10.2307/1403045. JSTOR  1403045.
  11. ^ Ньюкомб, Саймон (1860). «Заметки о теории вероятностей». The Mathematical Monthly . 2 (4): 134–140.
  12. ^ abc фон Борткевич, Ладислав (1898). Das Gesetz der kleinen Zahlen [ Закон малых чисел ] (на немецком языке). Лейпциг, Германия: Б. Г. Тойбнер. стр. 1, 23–25.
    На странице 1 Борткевич представляет распределение Пуассона.
    На страницах 23–25 Борткевич представляет свой анализ книги «4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten». [4. Пример: убитые в прусской армии ударом лошади.]
  13. ^ Доказательство см. в: Доказательство вики: ожидание и Доказательство вики: дисперсия
  14. ^ Кардар, Мехран (2007). Статистическая физика частиц . Cambridge University Press . стр. 42. ISBN 978-0-521-87342-0. OCLC  860391091.
  15. ^ Деккинг, Фредерик Мишель; Краайкамп, Корнелис; Лопухаа, Хендрик Пауль; Местер, Людольф Эрвин (2005). Современное введение в вероятность и статистику. Тексты Спрингера в статистике. п. 167. дои : 10.1007/1-84628-168-7. ISBN 978-1-85233-896-1.
  16. ^ Угарте, MD ; Милитино, AF ; Арнхольт, AT (2016). Вероятность и статистика с R (2-е изд.). Бока-Ратон, Флорида, США: CRC Press. ISBN 978-1-4665-0439-4.
  17. ^ Хельске, Йоуни (2017). "KFAS: Модели пространства состояний экспоненциального семейства в R". Журнал статистического программного обеспечения . 78 (10). arXiv : 1612.01907 . doi : 10.18637/jss.v078.i10. S2CID  14379617.
  18. ^ Чой, Квок П. (1994). «О медианах гамма-распределений и уравнении Рамануджана». Труды Американского математического общества . 121 (1): 245–251. doi : 10.2307/2160389 . JSTOR  2160389.
  19. ^ Риордан, Джон (1937). "Соотношения моментов для биномиального, пуассоновского и гипергеометрического распределений частот" (PDF) . Annals of Mathematical Statistics . 8 (2): 103–111. doi : 10.1214/aoms/1177732430 . JSTOR  2957598.
  20. ^ Д. Ахле, Томас (2022). «Точные и простые границы для необработанных моментов биномиального и пуассоновского распределений». Statistics & Probability Letters . 182 : 109306. arXiv : 2103.17027 . doi : 10.1016/j.spl.2021.109306.
  21. ^ Леманн, Эрих Лео (1986). Проверка статистических гипотез (2-е изд.). Нью-Йорк, Нью-Джерси, США: Springer Verlag. ISBN 978-0-387-94919-2.
  22. ^ Райков, Дмитрий (1937). «О разложении законов Пуассона». Comptes Rendus de l'Académie des Sciences de l'URSS . 14 : 9–11.
  23. ^ фон Мизес, Ричард (1964). Математическая теория вероятностей и статистика . Нью-Йорк, Нью-Джерси, США: Academic Press. doi :10.1016/C2013-0-12460-9. ISBN 978-1-4832-3213-3.
  24. ^ Harremoes, P. (июль 2001 г.). «Биномиальное и пуассоновское распределения как распределения с максимальной энтропией». Труды IEEE по теории информации . 47 (5): 2039–2041. doi :10.1109/18.930936. S2CID  16171405.
  25. ^ Лаха, Радха Г.; Рохатги, Виджай К. (1979). Теория вероятностей . Нью-Йорк, Нью-Джерси, США: John Wiley & Sons. ISBN 978-0-471-03262-5.
  26. ^ Митценмахер, Майкл (2017). Вероятность и вычисления: Рандомизация и вероятностные методы в алгоритмах и анализе данных . Эли Упфал (2-е изд.). Кембридж, Великобритания. Упражнение 5.14. ISBN 978-1-107-15488-9. OCLC  960841613.{{cite book}}: CS1 maint: location missing publisher (link)
  27. ^ ab Mitzenmacher, Michael ; Upfal, Eli (2005). Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ . Кембридж, Великобритания: Cambridge University Press. ISBN 978-0-521-83540-4.
  28. ^ Short, Michael (2013). «Улучшенные неравенства для распределения Пуассона и биномиального распределения и функций квантилей верхнего хвоста». ISRN Вероятность и статистика . 2013. Следствие 6. doi : 10.1155/2013/412958 .
  29. ^ Short, Michael (2013). «Улучшенные неравенства для распределения Пуассона и биномиального распределения и функций квантилей верхнего хвоста». ISRN Вероятность и статистика . 2013. Теорема 2. doi : 10.1155/2013/412958 .
  30. ^ Камат, Говинда М.; Шашоглу, Эрен; Це, Дэвид (14–19 июня 2015 г.). Оптимальная сборка гаплотипа из высокопроизводительных чтений пар-пар . Международный симпозиум IEEE по теории информации (ISIT) 2015 г. Гонконг, Китай. стр. 914–918. arXiv : 1502.01975 . doi :10.1109/ISIT.2015.7282588. S2CID  128634.
  31. ^ Prins, Jack (2012). "6.3.3.1. Контрольные карты подсчетов". Электронный справочник статистических методов . NIST/SEMATECH . Получено 20 сентября 2019 г.
  32. ^ Феллер, Уильям. Введение в теорию вероятностей и ее приложения .
  33. ^ Чжан, Хуэймин; Лю, Юньсяо; Ли, Бо (2014). «Заметки о дискретной составной модели Пуассона с приложениями к теории риска». Страхование: Математика и экономика . 59 : 325–336. doi :10.1016/j.insmatheco.2014.09.012.
  34. ^ Чжан, Хуэймин; Ли, Бо (2016). «Характеристики дискретных составных распределений Пуассона». Communications in Statistics - Theory and Methods . 45 (22): 6789–6802. doi :10.1080/03610926.2014.901375. S2CID  125475756.
  35. ^ МакКаллах, Питер ; Нелдер, Джон (1989). Обобщенные линейные модели . Монографии по статистике и прикладной вероятности. Том 37. Лондон, Великобритания: Chapman and Hall. ISBN 978-0-412-31760-6.
  36. ^ Anscombe, Francis J. (1948). «Преобразование пуассоновских, биномиальных и отрицательных биномиальных данных». Biometrika . 35 (3–4): 246–254. doi :10.1093/biomet/35.3-4.246. JSTOR  2332343.
  37. ^ Росс, Шелдон М. (2010). Введение в вероятностные модели (10-е изд.). Бостон, Массачусетс: Academic Press. ISBN 978-0-12-375686-2.
  38. ^ "1.7.7 – Связь между многочленом и Пуассоном | STAT 504". Архивировано из оригинала 6 августа 2019 г. Получено 6 августа 2019 г.
  39. ^ Лукас, Сотириос; Кемп, К. Дэвид (1986). «Тест индекса дисперсии для двумерного распределения Пуассона». Биометрия . 42 (4): 941–948. doi :10.2307/2530708. JSTOR  2530708.
  40. ^ Свободные случайные величины Д. Войкулеску, К. Дайкема, А. Ника, CRM Monograph Series, Американское математическое общество, Провиденс, Род-Айленд, 1992
  41. ^ Александру Ника, Роланд Шпайхер: Лекции по комбинаторике свободной вероятности. Серия заметок лекций Лондонского математического общества, том 335, Cambridge University Press, 2006.
  42. Лекции по комбинаторике свободной вероятности А. Ники и Р. Спейчера, стр. 203–204, Cambridge Univ. Press 2006
  43. ^ Пашек, Эва. «Оценка максимального правдоподобия – примеры». cnx.org .
  44. ^ Ван Трис, Гарри Л. (2013). Оценка обнаружения и теория модуляции. Кристин Л. Белл, Чжи Тянь (Второе изд.). Хобокен, Нью-Джерси ISBN 978-1-299-66515-6. OCLC  851161356.{{cite book}}: CS1 maint: location missing publisher (link)
  45. ^ Гарвуд, Фрэнк (1936). «Доверительные пределы для распределения Пуассона». Biometrika . 28 (3/4): 437–442. doi :10.1093/biomet/28.3-4.437. JSTOR  2333958.
  46. ^ Бреслоу, Норман Э.; Дэй , Ник Э. (1987). Статистические методы в исследовании рака. Том 2 — Разработка и анализ когортных исследований. Лион, Франция: Международное агентство по исследованию рака . ISBN 978-92-832-0182-3. Архивировано из оригинала 8 августа 2018 . Получено 11 марта 2012 .
  47. ^ Финк, Дэниел (1997). Сборник сопряженных априорных вероятностей .
  48. ^ Dytso, Alex; Poor, H. Vincent (2020). «Оценка в пуассоновском шуме: свойства условной средней оценки». IEEE Transactions on Information Theory . 66 (7): 4304–4323. arXiv : 1911.03744 . doi : 10.1109/TIT.2020.2979978 . S2CID  207853178.
  49. ^ Гельман; Карлин, Джон Б.; Стерн, Хэл С.; Рубин, Дональд Б. (2003). Байесовский анализ данных (2-е изд.). Бока-Ратон, Флорида, США: Chapman & Hall/CRC. ISBN 1-58488-388-X.
  50. ^ Клевенсон, М. Лоуренс; Зайдек, Джеймс В. (1975). «Одновременная оценка средних значений независимых законов Пуассона». Журнал Американской статистической ассоциации . 70 (351): 698–705. doi :10.1080/01621459.1975.10482497. JSTOR  2285958.
  51. ^ Бергер, Джеймс О. (1985). Статистическая теория принятия решений и байесовский анализ . Springer Series in Statistics (2-е изд.). Нью-Йорк, Нью-Йорк: Springer-Verlag. Bibcode : 1985sdtb.book.....B. doi : 10.1007/978-1-4757-4286-2. ISBN 978-0-387-96098-2.
  52. ^ Раш, Георг (1963). Пуассоновский процесс как модель для разнообразия поведенческих явлений (PDF) . 17-й Международный психологический конгресс. Том 2. Вашингтон, округ Колумбия: Американская психологическая ассоциация. doi :10.1037/e685262012-108.
  53. ^ Флори, Пол Дж. (1940). «Распределение размеров молекул в полимерах окиси этилена». Журнал Американского химического общества . 62 (6): 1561–1565. doi :10.1021/ja01863a066.
  54. ^ Ломниц, Цинна (1994). Основы прогнозирования землетрясений . Нью-Йорк, штат Нью-Йорк: Джон Уайли и сыновья. ISBN 0-471-57419-8. OCLC  647404423.
  55. ^ студент (1907). «О погрешности подсчета с помощью гемоцитометра». Biometrika . 5 (3): 351–360. doi :10.2307/2331633. JSTOR  2331633.
  56. ^ Боланд, Филип Дж. (1984). «Биографический взгляд на Уильяма Сили Госсета». The American Statistician . 38 (3): 179–183. doi :10.1080/00031305.1984.10483195. JSTOR  2683648.
  57. ^ Эрланг, Агнер К. (1909). «Sandsynlighedsregning og Telefonsamtaler» [Вычисление вероятностей и телефонные разговоры]. Nyt Tidsskrift для Matematik (на датском языке). 20 (Б): 33–39. JSTOR  24528622.
  58. ^ Хорнби, Дэйв (2014). "Модель футбольного прогнозирования: распределение Пуассона". Ставки на спорт онлайн . Получено 19 сентября 2014 г.
  59. ^ Кояма, Кенто; Хокунан, Хидекадзу; Хасегава, Маюми; Кавамура, Шусо; Косеки, Сигенобу (2016). «Соответствуют ли числа бактериальных клеток теоретическому распределению Пуассона? Сравнение экспериментально полученных чисел отдельных клеток с генерацией случайных чисел посредством компьютерного моделирования». Пищевая микробиология . 60 : 49–53. doi :10.1016/j.fm.2016.05.019. PMID  27554145.
  60. ^ Кларк, RD (1946). "Применение распределения Пуассона" (PDF) . Журнал Института актуариев . 72 (3): 481. doi : 10.1017/S0020268100035435 .
  61. ^ Харди, Годфри Х .; Литтлвуд, Джон Э. (1923). «О некоторых проблемах «partitio numerorum» III: О выражении числа в виде суммы простых чисел». Acta Mathematica . 44 : 1–70. doi : 10.1007/BF02403921 .
  62. ^ Галлахер, Патрик X. (1976). «О распределении простых чисел на коротких интервалах». Mathematika . 23 (1): 4–9. doi :10.1112/s0025579300016442.
  63. ^ Кэмерон, А. Колин; Триведи, Правин К. (1998). Регрессионный анализ данных подсчета. Кембридж, Великобритания: Cambridge University Press. ISBN 978-0-521-63567-7.
  64. ^ Эджворт, Ф.И. (1913). «Об использовании теории вероятностей в статистике, касающейся общества». Журнал Королевского статистического общества . 76 (2): 165–193. doi :10.2307/2340091. JSTOR  2340091.
  65. ^ Katz, B.; Miledi, R. (август 1972 г.). «Статистическая природа потенциала ацетилхолина и его молекулярных компонентов». Журнал физиологии . 224 (3): 665–699. doi :10.1113/jphysiol.1972.sp009918. ISSN  0022-3751. PMC 1331515. PMID 5071933  . 
  66. ^ ab Нельсон, Филип Чарльз; Бромберг, Сарина; Хермундстад, Энн; Прентис, Джейсон (2015). Физические модели живых систем. Нью-Йорк, штат Нью-Йорк: WH Freeman & Company, издательство Macmillan Education. ISBN 978-1-4641-4029-7. OCLC  891121698.
  67. ^ Фостер, Патрисия Л. (1 января 2006 г.), «Методы определения частоты спонтанных мутаций», Репарация ДНК, часть B , Методы в энзимологии, т. 409, Academic Press, стр. 195–213, doi :10.1016/S0076-6879(05)09012-9, ISBN 978-0-12-182814-1, PMC  2041832 , PMID  16793403
  68. ^ "Wolfram Language: PoissonDistribution справочная страница". wolfram.com . Получено 8 апреля 2016 г. .
  69. ^ "Wolfram Language: MultivariatePoissonDistribution справочная страница". wolfram.com . Получено 8 апреля 2016 г. .
  70. ^ Кнут, Дональд Эрвин (1997). Получисленные алгоритмы . Искусство программирования . Том 2 (3-е изд.). Эддисон Уэсли . ISBN 978-0-201-89684-8.
  71. ^ Деврой, Люк (1986). «Дискретные одномерные распределения» (PDF) . Генерация неравномерных случайных величин. Нью-Йорк, Нью-Йорк: Springer-Verlag. С. 485–553. doi :10.1007/978-1-4613-8643-8_10. ISBN 978-1-4613-8645-2.

Источники