В теории вероятностей и статистике распределение Пуассона ( / ˈ p w ɑː s ɒ n / ; французское произношение: [pwasɔ̃] ) — это дискретное распределение вероятностей , которое выражает вероятность заданного числа событий, происходящих в фиксированном интервале времени, если эти события происходят с известной постоянной средней скоростью и независимо от времени, прошедшего с момента последнего события. [1] Его также можно использовать для числа событий в других типах интервалов, отличных от времени, и в размерности больше 1 (например, число событий в заданной области или объеме).
При распределении Пуассона с ожиданием λ событий в заданном интервале вероятность k событий в том же интервале равна: [2] : 60
Например, рассмотрим колл-центр, который получает в среднем λ = 3 звонка в минуту в любое время дня. Если звонки независимы, получение одного звонка не изменяет вероятность того, когда поступит следующий. При этих предположениях число звонков k , полученных в течение любой минуты, имеет распределение вероятности Пуассона. Получение k = от 1 до 4 звонков имеет вероятность около 0,77, в то время как получение 0 или по крайней мере 5 звонков имеет вероятность около 0,23.
Классическим примером, используемым для обоснования распределения Пуассона, является число событий радиоактивного распада в течение фиксированного периода наблюдения. [3]
История
Распределение было впервые введено Симеоном Дени Пуассоном (1781–1840) и опубликовано вместе со своей теорией вероятностей в его работе Recherches sur la probabilité des jugements en matière criminelle et en matière civile (1837). [4] : 205-207 Работа теоретизировала о количестве неправомерных осуждений в данной стране, сосредоточившись на определенных случайных величинах N , которые подсчитывают, среди прочего, количество дискретных событий (иногда называемых «событиями» или «прибытиями»), которые происходят в течение временного интервала заданной длины. Результат уже был дан в 1711 году Авраамом де Муавром в De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus . [5] : 219 [6] : 14-15 [7] : 193 [8] : 157 Это делает его примером закона Стиглера и побудило некоторых авторов утверждать, что распределение Пуассона должно носить имя Муавра. [9] [10]
В 1860 году Саймон Ньюкомб подогнал распределение Пуассона к числу звезд, обнаруженных в единице пространства. [11]
Дальнейшее практическое применение было сделано Ладиславом Борткевичем в 1898 году. Борткевич показал, что частота, с которой солдаты прусской армии случайно погибали от ударов лошади, может быть хорошо смоделирована с помощью распределения Пуассона. [12] : 23-25 .
Распределение Пуассона может быть применено к системам с большим числом возможных событий, каждое из которых является редким . Число таких событий, которые происходят в течение фиксированного интервала времени, при правильных обстоятельствах является случайным числом с распределением Пуассона.
Уравнение можно адаптировать, если вместо среднего числа событий нам дана средняя скорость , с которой происходят события. Тогда и: [14]
Примеры
Распределение Пуассона может быть полезно для моделирования таких событий, как:
количество метеоритов диаметром более 1 метра, падающих на Землю за год;
количество лазерных фотонов, попадающих на детектор за определенный промежуток времени;
количество студентов, получивших низкую и высокую оценку на экзамене; и
места расположения дефектов и дислокаций в материалах.
Примерами появления случайных точек в пространстве являются: места падения астероидов на Землю (двумерные), места дефектов в материале (трехмерные) и места расположения деревьев в лесу (двумерные). [15]
Предположения и обоснованность
Распределение Пуассона является подходящей моделью, если верны следующие предположения:
k — неотрицательное целое число, представляющее собой количество раз, когда событие происходит в течение интервала.
Средняя скорость, с которой происходят события, не зависит от каких-либо происшествий.
Два события не могут произойти в один и тот же момент.
Если эти условия верны, то k является пуассоновской случайной величиной; распределение k является распределением Пуассона.
Распределение Пуассона также является пределом биномиального распределения , для которого вероятность успеха для каждой попытки равна λ, деленной на число попыток, поскольку число попыток стремится к бесконечности (см. Связанные распределения).
Примеры вероятностей для распределений Пуассона
Однажды в интервале событий: Частный случайλ= 1 ик= 0
Предположим, что астрономы подсчитали, что крупные метеориты (больше определенного размера) падают на Землю в среднем раз в 100 лет ( λ = 1 событие за 100 лет), и что количество падений метеоритов следует распределению Пуассона. Какова вероятность k = 0 падений метеоритов в течение следующих 100 лет?
При этих предположениях вероятность того, что в течение следующих 100 лет на Землю не упадет ни одного крупного метеорита, составляет примерно 0,37. Оставшиеся 1 − 0,37 = 0,63 представляют собой вероятность падения 1, 2, 3 или более крупных метеоритов в течение следующих 100 лет. В приведенном выше примере наводнение из-за разлива происходило раз в 100 лет ( λ = 1). Вероятность отсутствия наводнений из-за разлива в течение 100 лет составила примерно 0,37 по тем же расчетам.
В общем, если событие происходит в среднем один раз за интервал ( λ = 1), и события следуют распределению Пуассона, то P (0 событий в следующем интервале) = 0,37. Кроме того, P (ровно одно событие в следующем интервале) = 0,37, как показано в таблице для паводков.
Примеры, нарушающие предположения Пуассона
Число студентов, прибывающих в студенческий союз в минуту, скорее всего, не будет подчиняться распределению Пуассона, поскольку скорость не является постоянной (низкая скорость во время занятий, высокая скорость между занятиями), а прибытие отдельных студентов не является независимым (студенты, как правило, приходят группами). Непостоянная скорость прибытия может быть смоделирована как смешанное распределение Пуассона , а прибытие групп, а не отдельных студентов, как сложный процесс Пуассона .
Число землетрясений магнитудой 5 в год в стране может не подчиняться распределению Пуассона, если одно крупное землетрясение увеличивает вероятность повторных толчков аналогичной магнитуды.
Примеры, в которых гарантировано хотя бы одно событие, не распределены по закону Пуассона, но могут быть смоделированы с использованием усеченного до нуля распределения Пуассона .
Распределения количества, в которых число интервалов с нулевыми событиями выше, чем предсказывает модель Пуассона, можно смоделировать с помощью модели с завышением нуля .
Мода случайной величины , распределенной по Пуассону, с нецелым λ равна наибольшему целому числу, меньшему или равному λ . Это также записывается как floor ( λ ). Когда λ — положительное целое число, моды равны λ и λ − 1.
Все кумулянты распределения Пуассона равны ожидаемому значению λ . Факториальный момент n распределения Пуассона равен λ n .
Ожидаемое значение процесса Пуассона иногда разлагается на произведение интенсивности и экспозиции (или, в более общем смысле, выражается как интеграл «функции интенсивности» по времени или пространству, иногда описываемый как «экспозиция»). [17]
Медиана
Границы для медианы ( ) распределения известны и являются точными : [18]
Суммы случайных величин, распределенных по закону Пуассона
Если для независимы , то [21] : 65 Обратной теоремой является теорема Райкова , которая гласит, что если сумма двух независимых случайных величин распределена по закону Пуассона, то таковыми являются и каждая из этих двух независимых случайных величин. [22] [23]
Максимальная энтропия
Это распределение с максимальной энтропией среди множества обобщенных биномиальных распределений со средним значением и , [24] где обобщенное биномиальное распределение определяется как распределение суммы N независимых, но не одинаково распределенных переменных Бернулли.
Границы для хвостовых вероятностей случайной величины Пуассона можно вывести с использованием аргумента границы Чернова . [27] : 97-98
Вероятность верхнего хвоста может быть сужена (по крайней мере, в два раза) следующим образом: [28]
где — расхождение Кульбака–Лейблера от .
Неравенства, связывающие функцию распределения случайной величины Пуассона со стандартной нормальной функцией распределения , следующие: [29] где — расхождение Кульбака–Лейблера от , а — расхождение Кульбака–Лейблера от .
Пуассоновские гонки
Пусть и — независимые случайные величины, тогда имеем, что
Верхняя граница доказана с использованием стандартной границы Чернова.
Нижнюю границу можно доказать, заметив, что есть вероятность того, что где , которая ограничена снизу где есть относительная энтропия (см. статью о границах хвостов биномиальных распределений для получения подробной информации). Далее отметив, что и вычислив нижнюю границу безусловной вероятности, получаем результат. Более подробную информацию можно найти в приложении к Kamath et al. [30]
Связанные дистрибутивы
Как биномиальное распределение с бесконечно малыми временными шагами
Распределение Пуассона можно вывести как предельный случай биномиального распределения , когда число попыток стремится к бесконечности, а ожидаемое число успехов остается фиксированным — см. закон редких событий ниже. Следовательно, его можно использовать в качестве приближения биномиального распределения, если n достаточно велико, а p достаточно мало. Распределение Пуассона является хорошим приближением биномиального распределения, если n не менее 20, а p меньше или равно 0,05, и превосходным приближением, если n ≥ 100 и np ≤ 10. [31] Позволяя и быть соответствующими функциями кумулятивной плотности биномиального и пуассоновского распределений, имеем: Один вывод этого использует функции генерации вероятности . [32] Рассмотрим испытание Бернулли (подбрасывание монеты), вероятность одного успеха (или ожидаемое число успехов) которого находится в пределах заданного интервала. Разбейте интервал на n частей и выполните испытание в каждом подынтервале с вероятностью . Вероятность k успехов из n попыток на всем интервале затем определяется биномиальным распределением
,
производящая функция которой:
Принимая предел при увеличении n до бесконечности (при фиксированном x ) и применяя определение предела произведения экспоненциальной функции , это сводится к производящей функции распределения Пуассона:
Если и независимы, то распределение условного значения является биномиальным .В частности, если тогда В более общем случае, если X 1 , X 2 , ..., X n являются независимыми случайными величинами Пуассона с параметрами λ 1 , λ 2 , ..., λ n , то
учитывая , что следует, что на самом деле,
Если и распределение условного на X = k является биномиальным распределением , то распределение Y следует распределению Пуассона. Фактически, если условное на следует полиномиальному распределению , то каждое следует независимому распределению Пуассона.
Распределение Пуассона является частным случаем дискретного составного распределения Пуассона (или прерывистого распределения Пуассона) только с одним параметром. [33] [34] Дискретное составное распределение Пуассона может быть выведено из предельного распределения одномерного полиномиального распределения. Это также частный случай составного распределения Пуассона .
Для достаточно больших значений λ (скажем, λ >1000) нормальное распределение со средним λ и дисперсией λ (стандартное отклонение ) является отличным приближением к распределению Пуассона. Если λ больше примерно 10, то нормальное распределение является хорошим приближением, если выполняется соответствующая коррекция непрерывности , т. е. если P( X ≤ x ) , где x — неотрицательное целое число, заменяется на P( X ≤ x + 0,5) .
Преобразование, стабилизирующее дисперсию : Если то [8] : 168 и [35] : 196 При этом преобразовании сходимость к нормальности (при увеличении) происходит гораздо быстрее, чем для непреобразованной переменной. [ необходима ссылка ] Доступны и другие, немного более сложные преобразования, стабилизирующие дисперсию, [8] : 168 одним из которых является преобразование Анскомба . [36] См. Преобразование данных (статистика) для более общего использования преобразований.
Если для каждого t > 0 число прибытий в интервале времени [0, t ] следует распределению Пуассона со средним значением λt , то последовательность времен между прибытиями является независимыми и одинаково распределенными экспоненциальными случайными величинами со средним значением 1/ λ . [37] : 317–319
Предположим , что где тогда [38] распределено мультиномиально при условии
Это означает [27] : 101-102 , среди прочего, что для любой неотрицательной функции,
если она распределена мультиномиально, то
где
Множитель можно заменить на 2, если дополнительно предположить, что он монотонно возрастает или убывает.
Двумерное распределение Пуассона
Это распределение было распространено на двумерный случай. [39] Производящая функция для этого распределения имеет вид
с
Предельные распределения — это распределения Пуассона ( θ 1 ) и Пуассона ( θ 2 ), а коэффициент корреляции ограничен диапазоном
Простой способ создания двумерного распределения Пуассона — взять три независимых распределения Пуассона со средними значениями , а затем задать Вероятностную функцию двумерного распределения Пуассона:
Свободное распределение Пуассона
Свободное распределение Пуассона [40] с размером и скоростью скачка возникает в свободной теории вероятностей как предел повторной свободной свертки
при N → ∞ .
Другими словами, пусть будут случайными величинами, так что имеет значение с вероятностью и значение 0 с оставшейся вероятностью. Предположим также, что семейство свободно независимо . Тогда предел по закону задается свободным законом Пуассона с параметрами
Это определение аналогично одному из способов, с помощью которого классическое распределение Пуассона получается из (классического) процесса Пуассона.
Мера, связанная со свободным законом Пуассона, определяется выражением [41]
, где и имеет поддержку
Мы приводим значения некоторых важных преобразований свободного закона Пуассона; вычисление можно найти, например, в книге « Лекции по комбинаторике свободной вероятности» А. Ники и Р. Шпайхера [42].
R-преобразование свободного закона Пуассона определяется выражением
Преобразование Коши (которое является отрицательным преобразованием Стилтьеса ) определяется выражением
S-преобразование задается
в случае, если
Расчет Вейбулла и Стабиля
Функция массы вероятности Пуассона может быть выражена в форме, аналогичной распределению произведения распределения Вейбулла и варианту формы устойчивого распределения счета . Переменная может рассматриваться как обратная параметру устойчивости Леви в устойчивом распределении счета:
где — стандартное устойчивое распределение счета формы , а — стандартное распределение Вейбулла формы
Статистический вывод
Оценка параметров
Учитывая выборку из n измеренных значений для i = 1, ..., n , мы хотим оценить значение параметра λ пуассоновской популяции, из которой была взята выборка. Оценка максимального правдоподобия равна [43]
Поскольку каждое наблюдение имеет ожидание λ, то же самое относится и к выборочному среднему. Следовательно, оценка максимального правдоподобия является несмещенной оценкой λ . Она также является эффективной оценкой, поскольку ее дисперсия достигает нижней границы Крамера–Рао (CRLB). [44] Следовательно, она является несмещенной с минимальной дисперсией . Также можно доказать, что сумма (и, следовательно, выборочное среднее, поскольку оно является функцией суммы один к одному) является полной и достаточной статистикой для λ .
Для доказательства достаточности можно использовать теорему о факторизации . Рассмотрим разбиение функции массы вероятности совместного распределения Пуассона для выборки на две части: одну, которая зависит исключительно от выборки , называемую , и другую, которая зависит от параметра и выборки только через функцию Тогда является достаточной статистикой для
Первый член зависит только от . Второй член зависит от выборки только через Таким образом, достаточно.
Чтобы найти параметр λ , который максимизирует функцию вероятности для популяции Пуассона, мы можем использовать логарифм функции правдоподобия:
Берем производную по λ и сравниваем ее с нулем:
Решение относительно λ дает стационарную точку.
Итак, λ — это среднее значение k i . Получение знака второй производной L в стационарной точке определит, каким экстремальным значением является λ .
Оценка второй производной в стационарной точке дает:
что является отрицательным значением n , умноженным на обратную величину среднего значения k i . Это выражение отрицательно, когда среднее значение положительно. Если это выполняется, то стационарная точка максимизирует функцию вероятности.
Для полноты семейство распределений называется полным тогда и только тогда, когда подразумевается, что для всех Если индивидуумы являются независимыми , то Зная распределение, которое мы хотим исследовать, легко видеть, что статистика является полной.
Для того чтобы это равенство выполнялось, должно быть равно 0. Это следует из того факта, что ни один из других членов не будет равен 0 для всех в сумме и для всех возможных значений Следовательно, для всех следует, что и было показано, что статистика является полной.
Доверительный интервал
Доверительный интервал для среднего значения распределения Пуассона может быть выражен с использованием соотношения между кумулятивными функциями распределения Пуассона и распределения хи-квадрат . Распределение хи-квадрат само по себе тесно связано с гамма-распределением , и это приводит к альтернативному выражению. При наличии наблюдения k из распределения Пуассона со средним значением μ доверительный интервал для μ с уровнем достоверности 1 – α равен
или эквивалентно,
где — квантильная функция (соответствующая нижней хвостовой области p ) распределения хи-квадрат с n степенями свободы, а — квантильная функция гамма -распределения с параметром формы n и параметром масштаба 1. [8] : 176-178 [45] Этот интервал является « точным » в том смысле, что его вероятность покрытия никогда не бывает меньше номинала 1 – α .
Когда квантили гамма-распределения недоступны, была предложена точная аппроксимация этого точного интервала (основанная на преобразовании Уилсона-Хилферти ): [46]
Для применения этих формул в том же контексте, что и выше (при наличии выборки из n измеренных значений k i , каждое из которых взято из распределения Пуассона со средним λ ), можно установить
вычислить интервал для μ = n λ , а затем вывести интервал для λ .
Тогда, учитывая ту же выборку из n измеренных значений k i , что и раньше, и априорную величину Gamma( α , β ), апостериорное распределение будет иметь вид
Обратите внимание, что апостериорное среднее является линейным и определяется как
Можно показать, что гамма-распределение является единственным априорным распределением, которое индуцирует линейность условного среднего. Более того, существует обратный результат, который утверждает, что если условное среднее близко к линейной функции по расстоянию, то априорное распределение λ должно быть близко к гамма-распределению по расстоянию Леви . [48]
Апостериорное среднее E[ λ ] приближается к оценке максимального правдоподобия в пределе, что немедленно следует из общего выражения среднего значения гамма -распределения .
Одновременная оценка нескольких средних значений Пуассона
Предположим, что есть набор независимых случайных величин из набора распределений Пуассона, каждое из которых имеет параметр , и мы хотели бы оценить эти параметры. Затем Клевенсон и Зидек показывают, что при нормализованной квадратичной ошибке потери , когда тогда, подобно примеру Штейна для нормальных средних , оценка MLE недопустима . [50]
биология : количество мутаций в цепи ДНК на единицу длины,
управление : клиенты, приходящие на стойку или в колл-центр,
финансы и страхование : количество убытков или претензий, возникших за определенный период времени,
сейсмология : асимптотическая модель Пуассона риска крупных землетрясений, [54]
радиоактивность : распадается в течение заданного интервала времени в радиоактивном образце,
оптика : количество фотонов, испускаемых за один лазерный импульс (основная уязвимость протоколов распределения квантовых ключей , известная как разделение числа фотонов).
Дополнительные примеры подсчета событий, которые можно смоделировать как пуассоновские процессы, включают:
солдат, убитых копытами лошадей каждый год в каждом корпусе прусской кавалерии . Этот пример был использован в книге Ладислава Борткевича (1868–1931), [12] : 23-25
Дрожжевые клетки, используемые при варке пива Guinness . Этот пример был использован Уильямом Сили Госсетом (1876–1937), [55] [56]
Телефонные звонки, поступающие в колл-центр в течение минуты. Этот пример был описан А. К. Эрлангом (1878–1929), [57]
голы в спорте с участием двух соревнующихся команд, [58]
Скорость события связана с вероятностью события, происходящего в некотором малом подынтервале (времени, пространства или иного). В случае распределения Пуассона предполагается, что существует достаточно малый подынтервал, для которого вероятность события дважды «ничтожна». При таком предположении можно вывести распределение Пуассона из биномиального, имея только информацию об ожидаемом числе общих событий во всем интервале.
Пусть общее число событий во всем интервале будет обозначено как Разделим весь интервал на подынтервалы одинакового размера, так что (поскольку нас интересуют только очень малые части интервала, это предположение имеет смысл). Это означает, что ожидаемое число событий в каждом из n подынтервалов равно
Теперь предположим, что возникновение события на всем интервале можно рассматривать как последовательность из n испытаний Бернулли , где -ое испытание Бернулли соответствует проверке того, произойдет ли событие на подынтервале с вероятностью Ожидаемое количество общих событий в таких испытаниях будет ожидаемым количеством общих событий на всем интервале. Следовательно, для каждого подразделения интервала мы аппроксимировали возникновение события как процесс Бернулли вида Как мы уже отмечали ранее, мы хотим рассматривать только очень малые подынтервалы. Поэтому мы берем предел при стремящемся к бесконечности.
В нескольких из приведенных выше примеров, таких как число мутаций в заданной последовательности ДНК, подсчитываемые события на самом деле являются результатами дискретных испытаний и могут быть более точно смоделированы с использованием биномиального распределения , то есть
В таких случаях n очень велико, а p очень мало (и поэтому ожидание np имеет промежуточную величину). Тогда распределение может быть аппроксимировано менее громоздким распределением Пуассона
Это приближение иногда называют законом редких событий [ 63] : 5, поскольку каждое из n отдельных событий Бернулли происходит редко.
Название «закон редких событий» может вводить в заблуждение, поскольку общее количество успешных событий в процессе Пуассона не обязательно должно быть редким, если параметр np не мал. Например, количество телефонных звонков на загруженный коммутатор в течение одного часа следует распределению Пуассона, при этом события кажутся оператору частыми, но они редки с точки зрения среднестатистического члена населения, который вряд ли позвонит на этот коммутатор в этот час.
Дисперсия биномиального распределения в 1 − p раз больше дисперсии распределения Пуассона, поэтому они почти равны, когда p очень мало.
Слово закон иногда используется как синоним распределения вероятностей , а конвергенция в законе означает сходимость в распределении . Соответственно, распределение Пуассона иногда называют «законом малых чисел», потому что это распределение вероятностей числа появлений события, которое случается редко, но имеет очень много возможностей произойти. Закон малых чисел — книга Ладислава Борткевича о распределении Пуассона, опубликованная в 1898 году. [12] [64]
Процесс точки Пуассона
Распределение Пуассона возникает как число точек точечного процесса Пуассона , расположенных в некоторой конечной области. Более конкретно, если D — это некоторое пространство области, например, евклидово пространство R d , для которого | D |, площадь, объем или, в более общем смысле, мера Лебега области конечна, и если N ( D ) обозначает число точек в D , то
Регрессия Пуассона и отрицательная биномиальная регрессия
Регрессия Пуассона и отрицательная биномиальная регрессия полезны для анализов, где зависимая (отзывная) переменная представляет собой количество (0, 1, 2, ... ) событий или появлений в интервале.
Биология
Эксперимент Лурии –Дельбрюка проверял гипотезу ламарковской эволюции, которая должна приводить к распределению Пуассона.
Кац и Миледи измерили мембранный потенциал с присутствием ацетилхолина (ACh) и без него. [65] Когда присутствует ACh, ионные каналы на мембране будут открываться случайным образом в течение небольшой доли времени. Поскольку существует большое количество ионных каналов, каждый из которых открыт в течение небольшой доли времени, общее количество ионных каналов, открытых в любой момент, распределено по закону Пуассона. Когда ACh отсутствует, фактически ни один ионный канал не открыт. Мембранный потенциал равен . Вычитая эффект шума, Кац и Миледи обнаружили, что среднее значение и дисперсия мембранного потенциала составляют , что дает . (стр. 94-95 [66] )
Во время каждого события клеточной репликации число мутаций приблизительно распределено по закону Пуассона. [67] Например, вирус ВИЧ имеет 10 000 пар оснований и имеет частоту мутаций около 1 на 30 000 пар оснований, то есть число мутаций на событие репликации распределено как . (стр. 64 [66] )
Другие применения в науке
В пуассоновском процессе число наблюдаемых событий колеблется вокруг своего среднего значения λ со стандартным отклонением. Эти колебания обозначаются как пуассоновский шум или (особенно в электронике) как дробовой шум .
Корреляция среднего и стандартного отклонения при подсчете независимых дискретных событий полезна с научной точки зрения. Наблюдая за тем, как флуктуации изменяются в зависимости от среднего сигнала, можно оценить вклад отдельного события, даже если этот вклад слишком мал, чтобы его можно было обнаружить напрямую . Например, заряд e на электроне можно оценить, сопоставив величину электрического тока с его дробовым шумом . Если N электронов проходят точку за заданное время t в среднем, средний ток равен ; поскольку флуктуации тока должны быть порядка (т. е. стандартного отклонения процесса Пуассона ), заряд можно оценить из соотношения [ необходима цитата ]
Повседневным примером является зернистость, которая появляется при увеличении фотографий; зернистость обусловлена флуктуациями Пуассона в количестве уменьшенных зерен серебра , а не самими отдельными зернами. Соотнося зернистость со степенью увеличения, можно оценить вклад отдельного зерна (который в противном случае слишком мал, чтобы его можно было увидеть без посторонней помощи). [ необходима цитата ]
В теории причинных множеств дискретные элементы пространства-времени следуют распределению Пуассона в объеме.
Распределение Пуассона ставит перед специализированными программными библиотеками две различные задачи: оценка распределения и построение случайных чисел в соответствии с этим распределением.
Оценка распределения Пуассона
Вычисление для заданных и является тривиальной задачей, которая может быть выполнена с использованием стандартного определения в терминах экспоненциальной, степенной и факториальной функций. Однако общепринятое определение распределения Пуассона содержит два термина, которые могут легко переполняться на компьютерах: λ k и k ! . Дробь λ k к k ! также может привести к ошибке округления, которая очень велика по сравнению с e − λ , и, следовательно, дать ошибочный результат. Для числовой устойчивости функция массы вероятности Пуассона должна поэтому оцениваться как
что математически эквивалентно, но численно стабильно. Натуральный логарифм гамма-функции можно получить с помощью lgammaфункции в стандартной библиотеке C (версия C99) или R , gammalnфункции в MATLAB или SciPy , или log_gammaфункции в Fortran 2008 и более поздних версиях.
Некоторые языки программирования предоставляют встроенные функции для оценки распределения Пуассона, а именно:
Р : функция dpois(x, lambda);
Excel : функция POISSON( x, mean, cumulative)с флагом для указания кумулятивного распределения;
Mathematica : одномерное распределение Пуассона как , [68] двумерное распределение Пуассона как ,. [69]PoissonDistribution[]MultivariatePoissonDistribution[{ }]
Генерация случайных величин
Менее тривиальная задача — извлечь целочисленную случайную величину из распределения Пуассона с заданными
Простой алгоритм генерации случайных чисел, распределенных по закону Пуассона ( выборка псевдослучайных чисел ), был предложен Кнутом : [70] : 137-138
алгоритм случайных чисел Пуассона (Кнут) : init : Пусть L ← e −λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерировать равномерное случайное число u в интервале [0,1] и пусть p ← p × u. пока p > L. вернуть k − 1.
Сложность линейна по возвращаемому значению k , которое в среднем равно λ . Существует много других алгоритмов для улучшения этого. Некоторые из них приведены в Ahrens & Dieter, см. § Ссылки ниже.
Для больших значений λ значение L = e − λ может быть настолько малым, что его трудно представить. Это можно решить, изменив алгоритм, который использует дополнительный параметр STEP, так что e − STEP не теряет значимость: [ необходима цитата ]
алгоритм случайных чисел Пуассона (Junhao, основанный на Кнуте) : init : Пусть λ слева ← λ , k ← 0 и p ← 1. do : к ← к + 1. Сгенерировать равномерное случайное число u в (0,1) и пусть p ← p × u. пока p < 1 и λ Left > 0: если λ Left > STEP: p ← p × e ШАГ λ Влево ← λ Влево − ШАГ иначе : p ← p × e λ Влево λ Влево ← 0 пока p > 1. вернуть k − 1.
Выбор STEP зависит от порога переполнения. Для формата с плавающей точкой двойной точности порог близок к e 700 , поэтому 500 должно быть безопасным STEP .
Другие решения для больших значений λ включают выборку с отклонением и использование гауссовой аппроксимации.
Выборка обратного преобразования проста и эффективна для малых значений λ и требует только одного равномерного случайного числа u на выборку. Кумулятивные вероятности проверяются по очереди, пока одна из них не превзойдет u .
Алгоритм Генератор Пуассона, основанный на инверсии последовательным поиском : [71] : 505 init : Пусть x ← 0, p ← e −λ , s ← p. Сгенерировать равномерное случайное число u в диапазоне [0,1]. пока вы делаете : х ← х + 1. р ← р × λ / х. с ← с + п. вернуть х.
^ ab Haight, Frank A. (1967). Справочник по распределению Пуассона . Нью-Йорк, США: John Wiley & Sons. ISBN978-0-471-33932-8.
^ ab Yates, Roy D.; Goodman, David J. (2014). Вероятность и стохастические процессы: Дружественное введение для инженеров-электриков и компьютерщиков (2-е изд.). Hoboken, NJ: Wiley. ISBN978-0-471-45259-1.
^ Росс, Шелдон М. (2014). Введение в вероятностные модели (11-е изд.). Academic Press.
^ Пуассон, Симеон Д. (1837). Probabilité des jugements en matière criminel et en matière Civile, precédées des regles générales du Calcul des probilités [ Исследование вероятности вынесения судебных решений по уголовным и гражданским делам ] (на французском языке). Париж, Франция: Башелье.
^ де Муавр, Авраам (1711). «De mensura sortis, seu, de probilitate eventuum in ludis a casu fortuito pendentibus» [Об измерении случайности, или о вероятности событий в играх, зависящих от случайного случая]. Философские труды Королевского общества (на латыни). 27 (329): 213–264. дои : 10.1098/rstl.1710.0018 .
^ Муавр, Абрахам (1718). Учение о шансах: или Метод расчета вероятности событий в игре. Лондон, Великобритания: W. Pearson. ISBN9780598843753.
^ де Муавр, Авраам (1721). «О законах случая». В Motte, Benjamin (ред.). Философские труды с года MDCC (где заканчивается Mr. Lowthorp) по год MDCCXX. Сокращено и размещено под общими заголовками (на латыни). Том I. Лондон, Великобритания: R. Wilkin, R. Robinson, S. Ballard, W. и J. Innys, и J. Osborn. стр. 190–219.
^ abcdefghi Джонсон, Норман Л.; Кемп, Адриенн В.; Коц, Сэмюэл (2005). «Распределение Пуассона». Одномерные дискретные распределения (3-е изд.). Нью-Йорк, штат Нью-Йорк, США: John Wiley & Sons, Inc. стр. 156–207. doi :10.1002/0471715816. ISBN978-0-471-27246-5.
^ Стиглер, Стивен М. (1982). «Пуассон на распределении Пуассона». Statistics & Probability Letters . 1 (1): 33–35. doi :10.1016/0167-7152(82)90010-4.
^ Хальд, Андерс; де Муавр, Авраам; МакКлинток, Брюс (1984). «А. де Муавр: «De Mensura Sortis», или «Об измерении случайности».". International Statistical Review / Revue Internationale de Statistique . 52 (3): 229–262. doi : 10.2307/1403045. JSTOR 1403045.
^ Ньюкомб, Саймон (1860). «Заметки о теории вероятностей». The Mathematical Monthly . 2 (4): 134–140.
^ abc фон Борткевич, Ладислав (1898). Das Gesetz der kleinen Zahlen [ Закон малых чисел ] (на немецком языке). Лейпциг, Германия: Б. Г. Тойбнер. стр. 1, 23–25.
На странице 1 Борткевич представляет распределение Пуассона.
На страницах 23–25 Борткевич представляет свой анализ книги «4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten». [4. Пример: убитые в прусской армии ударом лошади.]
^ Доказательство см. в: Доказательство вики: ожидание и Доказательство вики: дисперсия
^ Хельске, Йоуни (2017). "KFAS: Модели пространства состояний экспоненциального семейства в R". Журнал статистического программного обеспечения . 78 (10). arXiv : 1612.01907 . doi : 10.18637/jss.v078.i10. S2CID 14379617.
^ Чой, Квок П. (1994). «О медианах гамма-распределений и уравнении Рамануджана». Труды Американского математического общества . 121 (1): 245–251. doi : 10.2307/2160389 . JSTOR 2160389.
^ Риордан, Джон (1937). "Соотношения моментов для биномиального, пуассоновского и гипергеометрического распределений частот" (PDF) . Annals of Mathematical Statistics . 8 (2): 103–111. doi : 10.1214/aoms/1177732430 . JSTOR 2957598.
^ Д. Ахле, Томас (2022). «Точные и простые границы для необработанных моментов биномиального и пуассоновского распределений». Statistics & Probability Letters . 182 : 109306. arXiv : 2103.17027 . doi : 10.1016/j.spl.2021.109306.
^ Райков, Дмитрий (1937). «О разложении законов Пуассона». Comptes Rendus de l'Académie des Sciences de l'URSS . 14 : 9–11.
^ фон Мизес, Ричард (1964). Математическая теория вероятностей и статистика . Нью-Йорк, Нью-Джерси, США: Academic Press. doi :10.1016/C2013-0-12460-9. ISBN978-1-4832-3213-3.
^ Harremoes, P. (июль 2001 г.). «Биномиальное и пуассоновское распределения как распределения с максимальной энтропией». Труды IEEE по теории информации . 47 (5): 2039–2041. doi :10.1109/18.930936. S2CID 16171405.
^ Лаха, Радха Г.; Рохатги, Виджай К. (1979). Теория вероятностей . Нью-Йорк, Нью-Джерси, США: John Wiley & Sons. ISBN978-0-471-03262-5.
^ Митценмахер, Майкл (2017). Вероятность и вычисления: Рандомизация и вероятностные методы в алгоритмах и анализе данных . Эли Упфал (2-е изд.). Кембридж, Великобритания. Упражнение 5.14. ISBN978-1-107-15488-9. OCLC 960841613.{{cite book}}: CS1 maint: location missing publisher (link)
^ ab Mitzenmacher, Michael ; Upfal, Eli (2005). Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ . Кембридж, Великобритания: Cambridge University Press. ISBN978-0-521-83540-4.
^ Short, Michael (2013). «Улучшенные неравенства для распределения Пуассона и биномиального распределения и функций квантилей верхнего хвоста». ISRN Вероятность и статистика . 2013. Следствие 6. doi : 10.1155/2013/412958 .
^ Short, Michael (2013). «Улучшенные неравенства для распределения Пуассона и биномиального распределения и функций квантилей верхнего хвоста». ISRN Вероятность и статистика . 2013. Теорема 2. doi : 10.1155/2013/412958 .
^ Камат, Говинда М.; Шашоглу, Эрен; Це, Дэвид (14–19 июня 2015 г.). Оптимальная сборка гаплотипа из высокопроизводительных чтений пар-пар . Международный симпозиум IEEE по теории информации (ISIT) 2015 г. Гонконг, Китай. стр. 914–918. arXiv : 1502.01975 . doi :10.1109/ISIT.2015.7282588. S2CID 128634.
^ Prins, Jack (2012). "6.3.3.1. Контрольные карты подсчетов". Электронный справочник статистических методов . NIST/SEMATECH . Получено 20 сентября 2019 г.
^ Феллер, Уильям. Введение в теорию вероятностей и ее приложения .
^ Чжан, Хуэймин; Лю, Юньсяо; Ли, Бо (2014). «Заметки о дискретной составной модели Пуассона с приложениями к теории риска». Страхование: Математика и экономика . 59 : 325–336. doi :10.1016/j.insmatheco.2014.09.012.
^ Чжан, Хуэймин; Ли, Бо (2016). «Характеристики дискретных составных распределений Пуассона». Communications in Statistics - Theory and Methods . 45 (22): 6789–6802. doi :10.1080/03610926.2014.901375. S2CID 125475756.
^ МакКаллах, Питер ; Нелдер, Джон (1989). Обобщенные линейные модели . Монографии по статистике и прикладной вероятности. Том 37. Лондон, Великобритания: Chapman and Hall. ISBN978-0-412-31760-6.
^ Anscombe, Francis J. (1948). «Преобразование пуассоновских, биномиальных и отрицательных биномиальных данных». Biometrika . 35 (3–4): 246–254. doi :10.1093/biomet/35.3-4.246. JSTOR 2332343.
^ Росс, Шелдон М. (2010). Введение в вероятностные модели (10-е изд.). Бостон, Массачусетс: Academic Press. ISBN978-0-12-375686-2.
^ "1.7.7 – Связь между многочленом и Пуассоном | STAT 504". Архивировано из оригинала 6 августа 2019 г. Получено 6 августа 2019 г.
^ Лукас, Сотириос; Кемп, К. Дэвид (1986). «Тест индекса дисперсии для двумерного распределения Пуассона». Биометрия . 42 (4): 941–948. doi :10.2307/2530708. JSTOR 2530708.
^ Свободные случайные величины Д. Войкулеску, К. Дайкема, А. Ника, CRM Monograph Series, Американское математическое общество, Провиденс, Род-Айленд, 1992
^ Александру Ника, Роланд Шпайхер: Лекции по комбинаторике свободной вероятности. Серия заметок лекций Лондонского математического общества, том 335, Cambridge University Press, 2006.
↑ Лекции по комбинаторике свободной вероятности А. Ники и Р. Спейчера, стр. 203–204, Cambridge Univ. Press 2006
^ Ван Трис, Гарри Л. (2013). Оценка обнаружения и теория модуляции. Кристин Л. Белл, Чжи Тянь (Второе изд.). Хобокен, Нью-Джерси ISBN978-1-299-66515-6. OCLC 851161356.{{cite book}}: CS1 maint: location missing publisher (link)
^ Гарвуд, Фрэнк (1936). «Доверительные пределы для распределения Пуассона». Biometrika . 28 (3/4): 437–442. doi :10.1093/biomet/28.3-4.437. JSTOR 2333958.
^ Финк, Дэниел (1997). Сборник сопряженных априорных вероятностей .
^ Dytso, Alex; Poor, H. Vincent (2020). «Оценка в пуассоновском шуме: свойства условной средней оценки». IEEE Transactions on Information Theory . 66 (7): 4304–4323. arXiv : 1911.03744 . doi : 10.1109/TIT.2020.2979978 . S2CID 207853178.
^ Гельман; Карлин, Джон Б.; Стерн, Хэл С.; Рубин, Дональд Б. (2003). Байесовский анализ данных (2-е изд.). Бока-Ратон, Флорида, США: Chapman & Hall/CRC. ISBN1-58488-388-X.
^ Клевенсон, М. Лоуренс; Зайдек, Джеймс В. (1975). «Одновременная оценка средних значений независимых законов Пуассона». Журнал Американской статистической ассоциации . 70 (351): 698–705. doi :10.1080/01621459.1975.10482497. JSTOR 2285958.
^ Бергер, Джеймс О. (1985). Статистическая теория принятия решений и байесовский анализ . Springer Series in Statistics (2-е изд.). Нью-Йорк, Нью-Йорк: Springer-Verlag. Bibcode : 1985sdtb.book.....B. doi : 10.1007/978-1-4757-4286-2. ISBN978-0-387-96098-2.
^ Раш, Георг (1963). Пуассоновский процесс как модель для разнообразия поведенческих явлений (PDF) . 17-й Международный психологический конгресс. Том 2. Вашингтон, округ Колумбия: Американская психологическая ассоциация. doi :10.1037/e685262012-108.
^ Флори, Пол Дж. (1940). «Распределение размеров молекул в полимерах окиси этилена». Журнал Американского химического общества . 62 (6): 1561–1565. doi :10.1021/ja01863a066.
^ Ломниц, Цинна (1994). Основы прогнозирования землетрясений . Нью-Йорк, штат Нью-Йорк: Джон Уайли и сыновья. ISBN0-471-57419-8. OCLC 647404423.
^ студент (1907). «О погрешности подсчета с помощью гемоцитометра». Biometrika . 5 (3): 351–360. doi :10.2307/2331633. JSTOR 2331633.
^ Боланд, Филип Дж. (1984). «Биографический взгляд на Уильяма Сили Госсета». The American Statistician . 38 (3): 179–183. doi :10.1080/00031305.1984.10483195. JSTOR 2683648.
^ Эрланг, Агнер К. (1909). «Sandsynlighedsregning og Telefonsamtaler» [Вычисление вероятностей и телефонные разговоры]. Nyt Tidsskrift для Matematik (на датском языке). 20 (Б): 33–39. JSTOR 24528622.
^ Хорнби, Дэйв (2014). "Модель футбольного прогнозирования: распределение Пуассона". Ставки на спорт онлайн . Получено 19 сентября 2014 г.
^ Кояма, Кенто; Хокунан, Хидекадзу; Хасегава, Маюми; Кавамура, Шусо; Косеки, Сигенобу (2016). «Соответствуют ли числа бактериальных клеток теоретическому распределению Пуассона? Сравнение экспериментально полученных чисел отдельных клеток с генерацией случайных чисел посредством компьютерного моделирования». Пищевая микробиология . 60 : 49–53. doi :10.1016/j.fm.2016.05.019. PMID 27554145.
^ Кларк, RD (1946). "Применение распределения Пуассона" (PDF) . Журнал Института актуариев . 72 (3): 481. doi : 10.1017/S0020268100035435 .
^ Харди, Годфри Х .; Литтлвуд, Джон Э. (1923). «О некоторых проблемах «partitio numerorum» III: О выражении числа в виде суммы простых чисел». Acta Mathematica . 44 : 1–70. doi : 10.1007/BF02403921 .
^ Галлахер, Патрик X. (1976). «О распределении простых чисел на коротких интервалах». Mathematika . 23 (1): 4–9. doi :10.1112/s0025579300016442.
^ Кэмерон, А. Колин; Триведи, Правин К. (1998). Регрессионный анализ данных подсчета. Кембридж, Великобритания: Cambridge University Press. ISBN978-0-521-63567-7.
^ Katz, B.; Miledi, R. (август 1972 г.). «Статистическая природа потенциала ацетилхолина и его молекулярных компонентов». Журнал физиологии . 224 (3): 665–699. doi :10.1113/jphysiol.1972.sp009918. ISSN 0022-3751. PMC 1331515. PMID 5071933 .
^ ab Нельсон, Филип Чарльз; Бромберг, Сарина; Хермундстад, Энн; Прентис, Джейсон (2015). Физические модели живых систем. Нью-Йорк, штат Нью-Йорк: WH Freeman & Company, издательство Macmillan Education. ISBN978-1-4641-4029-7. OCLC 891121698.
^ Фостер, Патрисия Л. (1 января 2006 г.), «Методы определения частоты спонтанных мутаций», Репарация ДНК, часть B , Методы в энзимологии, т. 409, Academic Press, стр. 195–213, doi :10.1016/S0076-6879(05)09012-9, ISBN978-0-12-182814-1, PMC 2041832 , PMID 16793403
^ "Wolfram Language: PoissonDistribution справочная страница". wolfram.com . Получено 8 апреля 2016 г. .
^ "Wolfram Language: MultivariatePoissonDistribution справочная страница". wolfram.com . Получено 8 апреля 2016 г. .
Аренс, Иоахим Х.; Дитер, Ульрих (1974). «Компьютерные методы выборки из гамма-, бета-, пуассоновского и биномиального распределений». Computing . 12 (3): 223–246. doi :10.1007/BF02293108. S2CID 37484126.
Аренс, Иоахим Х.; Дитер, Ульрих (1982). «Компьютерная генерация отклонений Пуассона». Труды ACM по математическому программному обеспечению . 8 (2): 163–179. doi : 10.1145/355993.355997 . S2CID 12410131.
Эванс, Рональд Дж.; Боерсма, Дж.; Блахман, Н. М.; Ягерс, А. А. (1988). «Энтропия распределения Пуассона: задача 87-6». Обзор SIAM . 30 (2): 314–317. doi :10.1137/1030059.