stringtranslate.com

Отрицательное биномиальное распределение

В теории вероятностей и статистике отрицательное биномиальное распределение — это дискретное распределение вероятностей , которое моделирует количество неудач в последовательности независимых и одинаково распределенных испытаний Бернулли до того, как произойдет определенное (неслучайное) количество успехов (обозначенное ). [2] Например, мы можем определить выпадение 6 на игральной кости как успех, а любое другое число как неудачу и спросить, сколько неудачных бросков произойдет, прежде чем мы увидим третий успех ( ). В таком случае распределение вероятностей числа возникающих отказов будет отрицательным биномиальным распределением.

Альтернативная формулировка — моделировать общее количество испытаний (вместо количества неудач). Фактически, для заданного (неслучайного) числа успехов ( r ) количество неудач ( n  −  r ) является случайным, поскольку общее количество испытаний ( n ) является случайным. Например, мы могли бы использовать отрицательное биномиальное распределение для моделирования количества дней n (случайных), в течение которых определенная машина работает (заданная r ), прежде чем она выйдет из строя.

Распределение Паскаля ( по Блезу Паскалю ) и распределение Полиа (по Джорджу Полиа ) являются частными случаями отрицательного биномиального распределения. Среди инженеров, климатологов и других принято использовать «отрицательный бином» или «Паскаль» для случая целочисленного параметра времени остановки ( ) и использовать «Polya» для случая с действительным значением.

Для возникновения связанных дискретных событий, таких как вспышки торнадо, распределения Полиа можно использовать для создания более точных моделей, чем распределение Пуассона , поскольку в отличие от распределения Пуассона среднее значение и дисперсия могут быть разными. Отрицательное биномиальное распределение имеет дисперсию , причем распределение становится идентичным распределению Пуассона в пределе для данного среднего значения (т. е. когда сбои становятся все более редкими). Это может сделать распределение полезной сверхдисперсной альтернативой распределению Пуассона, например, для надежной модификации регрессии Пуассона . В эпидемиологии он использовался для моделирования передачи инфекционных заболеваний, где вероятное количество дальнейших инфекций может значительно варьироваться от человека к человеку и от ситуации к ситуации. [3] В более общем плане, это может быть уместно, когда события имеют положительно коррелированные события, вызывающие большую дисперсию , чем если бы события были независимыми, из-за положительного ковариационного члена.

Термин «отрицательный бином», вероятно, связан с тем, что определенный биномиальный коэффициент , который появляется в формуле функции массы вероятности распределения, можно проще записать отрицательными числами. [4]

Определения

Представьте себе последовательность независимых испытаний Бернулли : каждое испытание имеет два потенциальных результата, называемых «успехом» и «неудачей». В каждом испытании вероятность успеха равна , а вероятность неудачи равна . Мы наблюдаем эту последовательность до тех пор, пока не произойдет заранее определенное количество успехов. Тогда случайное число наблюдаемых отказов следует отрицательному биномиальному распределению (или распределению Паскаля ):

Функция массы вероятности

Функция массы вероятности отрицательного биномиального распределения равна

где r — количество успехов, k — количество неудач, а p — вероятность успеха в каждом испытании.

Здесь величина в скобках представляет собой биномиальный коэффициент и равна

Из k  +  r − 1 попыток выбрано k неудач  , а не k  +  r , поскольку последняя из k  +  r попыток по определению является успешной.

Альтернативно эту величину можно записать следующим образом, что объясняет название «отрицательный бином»:

Обратите внимание, что согласно последнему выражению и биномиальному ряду для каждого 0 ⩽ p < 1 и ,

следовательно, члены функции массы вероятности действительно составляют единицу, как показано ниже.

Чтобы понять приведенное выше определение функции массы вероятности, обратите внимание, что вероятность для каждой конкретной последовательности r  успехов и k  неудач равна p r (1 − p ) k , поскольку предполагается, что результаты k  +  r испытаний происходят независимо . Поскольку r -й успех всегда приходит последним,  из оставшихся k  +  r − 1 попыток осталось выбрать k попыток с неудачами  . Приведенный выше биномиальный коэффициент благодаря своей комбинаторной интерпретации дает в точности количество всех этих последовательностей длины k  +  r  - 1.

Кумулятивная функция распределения

Кумулятивную функцию распределения можно выразить через регуляризованную неполную бета-функцию : [2] [5]

(В этой формуле используется та же параметризация, что и в таблице статьи, где r — количество успехов и среднее значение.)

Это также можно выразить через кумулятивную функцию распределения биномиального распределения : [6]

Альтернативные составы

Некоторые источники могут определять отрицательное биномиальное распределение несколько иначе, чем первичное здесь. Наиболее распространены варианты, когда случайная величина X подсчитывает разные вещи. Эти варианты можно увидеть в таблице здесь:

Каждое из четырех определений отрицательного биномиального распределения можно выразить немного разными, но эквивалентными способами. Первая альтернативная формулировка представляет собой просто эквивалентную форму биномиального коэффициента, то есть: . Вторая альтернативная формулировка несколько упрощает это выражение, признавая, что общее количество испытаний — это просто количество успехов и неудач, то есть: . Эти вторые формулировки могут быть более интуитивными для понимания, однако они, возможно, менее практичны, поскольку содержат больше терминов.

Подставив это выражение в исходное определение, мы говорим, что X имеет отрицательное биномиальное (или полиа ) распределение, если оно имеет функцию массы вероятности :
Здесь r — действительное положительное число.

В отрицательной биномиальной регрессии [15] распределение определяется с точки зрения его среднего значения, которое затем связано с объясняющими переменными, как в линейной регрессии или других обобщенных линейных моделях . Из выражения для среднего m можно вывести и . Затем подстановка этих выражений в выражение для функции массы вероятности, когда r имеет действительное значение, дает следующую параметризацию функции массы вероятности в терминах  m :

Тогда дисперсию можно записать как . Некоторые авторы предпочитают устанавливать и выражать дисперсию как . В этом контексте и в зависимости от автора либо параметр r , либо обратный ему α называется «параметром дисперсии», «параметром формы» или «коэффициентом кластеризации» [16] , либо «неоднородностью» [15] или параметр «агрегация». [10] Термин «агрегация» особенно используется в экологии при описании подсчета отдельных организмов. Уменьшение параметра агрегации r до нуля соответствует увеличению агрегации организмов; Увеличение r до бесконечности соответствует отсутствию агрегации, что можно описать регрессией Пуассона .

Альтернативные параметризации

Иногда распределение параметризуется через его среднее значение µ и дисперсию σ 2 :

Другая популярная параметризация использует r и вероятность неудачи β :

При такой параметризации дисперсия отрицательной биномиальной случайной величины может оказаться квадратичной в среднем:

Примеры

Продолжительность пребывания в больнице

Продолжительность пребывания в больнице является примером реальных данных, которые можно хорошо смоделировать с помощью отрицательного биномиального распределения с помощью отрицательной биномиальной регрессии . [17] [18]

Продажа конфет

Пэт Коллис должен продавать шоколадные батончики, чтобы собрать деньги на экскурсию для 6-го класса. Пэт (несколько резко) не должен возвращаться домой, пока не будут проданы пять шоколадных батончиков. Итак, ребенок ходит от двери к двери, продавая шоколадные батончики. В каждом доме существует вероятность 0,6 продать один шоколадный батончик и вероятность 0,4 ничего не продать.

Какова вероятность продать последнюю шоколадку в n-м доме ?

Успешная продажа конфет достаточное количество раз — это то, что определяет наш критерий остановки (в отличие от неудачной продажи конфет), поэтому в данном случае k представляет собой количество неудач, а r — количество успехов. Напомним, что распределение NegBin( r , p ) описывает вероятность k неудач и r успехов в k  +  r испытаниях Бернулли( p ) с успехом в последнем испытании. Продать пять шоколадных батончиков – значит получить пять успехов. Следовательно, количество испытаний (т.е. домов) равно k  + 5 =  n . Интересующая нас случайная величина — это количество домов, поэтому мы подставляем k  =  n  − 5 в функцию масс NegBin(5, 0,4) и получаем следующую массовую функцию распределения домов (для n  ≥ 5):

Какова вероятность того, что Пэт закончит в десятом доме?

Какова вероятность того, что Пэт закончит в восьмом доме или раньше него?

Чтобы финишировать в восьмом доме или раньше, Пэт должен финишировать в пятом, шестом, седьмом или восьмом доме. Суммируем эти вероятности:

Какова вероятность того, что Пэт опустошит все 30 домов, стоящих по соседству?

Это можно выразить как вероятность того, что Пэт не закончит в домах с пятого по тридцатый:

Из-за довольно высокой вероятности того, что Пэт продаст недвижимость каждому дому (60 процентов), вероятность того, что она НЕ выполнит свое задание, исчезающе мала.

Характеристики

Ожидание

Ожидаемое общее количество испытаний, необходимое для достижения успеха , равно . Таким образом, ожидаемое количество неудач будет равно этому значению за вычетом успехов:

Ожидание успехов

Ожидаемое общее количество отказов в отрицательном биномиальном распределении с параметрами ( r , p ) равно r (1 −  p )/ p . Чтобы убедиться в этом, представьте, что эксперимент, моделирующий отрицательный бином, проводится много раз. То есть выполняется серия испытаний до тех пор , пока не будет получено r успехов, затем еще одна серия испытаний, затем еще одна и т. д. Запишите количество попыток, выполненных в каждом эксперименте: a , b , c ,... и поставьте a  +  б  +  с  + ... =  Н . Теперь мы ожидаем примерно успехов Np в целом. Допустим, эксперимент был проведен n раз. Тогда всего успехов nr . Итак, мы ожидаем, что nr = Np , поэтому N / nr / p . Обратите внимание, что N / n — это просто среднее количество попыток за эксперимент. Вот что мы подразумеваем под «ожиданием». Среднее количество неудач за эксперимент составляет N / n  -  rr / p  -  r = r (1 -  p )/ p . Это соответствует среднему значению, указанному в поле в правой части этой страницы.

Строгий вывод можно сделать, представляя отрицательное биномиальное распределение как сумму времен ожидания. Пусть с учетом соглашения представляет собой количество неудач, наблюдаемых перед успехами, с вероятностью успеха, равной . И пусть где представляет собой количество неудач до того, как мы увидим успех. Мы можем рассматривать это как время ожидания (количество неудач) между th и th успехом. Таким образом

Среднее значение

что следует из факта .

Дисперсия

При подсчете количества неудач до r -го успеха дисперсия равна  r (1 −  p )/ p 2 . При подсчете количества успехов до r -й неудачи, как в альтернативной формулировке (3) выше, дисперсия равна  rp /(1 −  p ) 2 .

Связь с биномиальной теоремой

Предположим, Y — случайная величина с биномиальным распределением с параметрами n и p . Предположим, что p  +  q  = 1, при этом pq  ≥ 0, тогда

Используя биномиальную теорему Ньютона , это также можно записать как:

в котором верхняя граница суммирования бесконечна. В этом случае биномиальный коэффициент

определяется, когда n является действительным числом, а не просто положительным целым числом. Но в нашем случае биномиального распределения оно равно нулю, когда k > n . Тогда мы можем сказать, например,

Теперь предположим, что r > 0, и мы используем отрицательный показатель степени:

Тогда все члены положительны, и член

— это просто вероятность того, что количество неудач до r -го успеха будет равно k , при условии, что r — целое число. (Если r — отрицательное нецелое число, так что показатель степени является положительным нецелым числом, то некоторые члены в сумме выше отрицательны, поэтому у нас нет распределения вероятностей на множестве всех неотрицательных целых чисел.)

Теперь мы также допускаем нецелые значения r . Тогда мы имеем правильное отрицательное биномиальное распределение, которое является обобщением распределения Паскаля, которое совпадает с распределением Паскаля, когда r оказывается положительным целым числом.

Напомним выше, что

Сумма независимых отрицательно-биномиально распределенных случайных величин r 1 и r 2 с одинаковым значением параметра p является отрицательно-биномиально распределенной с тем же самым p , но с r -значением  r 1  +  r 2 .

Это свойство сохраняется, когда определение таким образом обобщается, и позволяет быстро увидеть, что отрицательное биномиальное распределение бесконечно делится .

Рекуррентные отношения

Имеют место следующие рекуррентные соотношения :

Для функции вероятностной массы

Для моментов

Для кумулянтов

Связанные дистрибутивы

распределение Пуассона

Рассмотрим последовательность отрицательных биномиальных случайных величин, в которой параметр остановки r стремится к бесконечности, а вероятность p успеха в каждом испытании стремится к единице, таким образом, чтобы сохранить среднее значение распределения (т. е. ожидаемое количество неудач). постоянный. Обозначая это среднее значение как λ , параметр p будет равен p  =  r /( r  +  λ )

При этой параметризации функция массы вероятности будет равна

Теперь если рассматривать предел при r → ∞, то второй множитель будет сходиться к единице, а третий – к показательной функции:

которая является функцией масс случайной величины , распределенной по Пуассону, с ожидаемым значением  λ .

Другими словами, альтернативно параметризованное отрицательное биномиальное распределение сходится к распределению Пуассона, а r контролирует отклонение от Пуассона. Это делает отрицательное биномиальное распределение подходящим в качестве надежной альтернативы Пуассону, которое приближается к Пуассону для больших r , но имеет большую дисперсию, чем Пуассон для малых r .

Гамма-пуассоновская смесь

Отрицательное биномиальное распределение также возникает как непрерывная смесь распределений Пуассона (т.е. составное распределение вероятностей ), где смешанное распределение скорости Пуассона является гамма-распределением . То есть мы можем рассматривать отрицательный бином как распределение Пуассона ( λ ) , где λ сама по себе является случайной величиной, распределенной как гамма-распределение с формой r и масштабом θ = (1 − p )/ p или, соответственно, скоростью β = p /(1 - п ) .

Чтобы продемонстрировать интуицию этого утверждения, рассмотрим два независимых процесса Пуассона, «Успех» и «Неудача», с интенсивностями p и 1 −  p . Вместе процессы Успеха и Неудачи эквивалентны одному процессу Пуассона с интенсивностью 1, где возникновение процесса считается успешным, если при соответствующем независимом подбрасывании монеты выпадает орел с вероятностью p ; в противном случае это провал. Если r — счетное число, подбрасывание монеты показывает, что количество успехов до r- й неудачи подчиняется отрицательному биномиальному распределению с параметрами r и p . Однако этот счетчик также является счетчиком процесса Пуассона «Успех» в случайный момент времени T r- го события в процессе Пуассона «Неудача». Подсчет успехов соответствует распределению Пуассона со средним значением pT , где T — время ожидания r вхождений в пуассоновском процессе интенсивности 1 —  p , т. е. T является гамма-распределенным с параметром формы r и интенсивностью 1 —  p . Таким образом, отрицательное биномиальное распределение эквивалентно распределению Пуассона со средним значением pT , где случайная величина T гамма-распределена с параметром формы r и интенсивностью (1 - p ) . Предыдущий абзац следует, потому что λ  =  pT является гамма-распределенным с параметром формы r и интенсивностью (1 - p )/ p .

Следующий формальный вывод (который не зависит от того, является ли r счетным числом) подтверждает интуицию.

Из-за этого отрицательное биномиальное распределение также известно как распределение гамма-Пуассона (смеси) . Отрицательное биномиальное распределение изначально было получено как предельный случай гамма-распределения Пуассона. [19]

Распределение суммы геометрически распределенных случайных величин

Если Y r — случайная величина, следующая отрицательному биномиальному распределению с параметрами r и p и поддерживающая {0, 1, 2, ...}, то Y r — сумма r независимых переменных, следующих геометрическому распределению (на {0 , 1, 2, ...}) с параметром p . Таким образом , в результате центральной предельной теоремы Y r (правильно масштабированный и сдвинутый) является приблизительно нормальным для достаточно большого  r .

Более того, если B s + r — случайная величина, имеющая биномиальное распределение с параметрами s  +  r и p , то

В этом смысле отрицательное биномиальное распределение является «обратным» биномиальному распределению.

Сумма независимых отрицательно-биномиально распределенных случайных величин r 1 и r 2 с одинаковым значением параметра p является отрицательно-биномиально распределенной с тем же самым p , но с r -значением  r 1  +  r 2 .

Отрицательное биномиальное распределение бесконечно делится , т. е. если Y имеет отрицательное биномиальное распределение, то для любого положительного целого числа n существуют независимые одинаково распределенные случайные величины Y 1 , ...,  Y n , сумма которых имеет то же распределение, что и Y. .

Представление в виде составного распределения Пуассона

Отрицательное биномиальное распределение NB( r , p ) можно представить как составное распределение Пуассона : Обозначим последовательность независимых и одинаково распределенных случайных величин , каждая из которых имеет распределение логарифмического ряда Log( p ), с функцией массы вероятности

Пусть N — случайная величина, независимая от последовательности, и предположим, что N имеет распределение Пуассона со средним значением λ = - r ln(1 - p ) . Тогда случайная сумма

является NB( r , p )-распределенным. Чтобы доказать это, мы вычисляем производящую функцию G X для X , которая представляет собой композицию производящих функций G N и G Y 1 . С использованием

и

мы получаем

которая является производящей функцией вероятности распределения NB( r , p ).

В следующей таблице описаны четыре распределения, связанные с количеством успехов в последовательности розыгрышей:

( a , b ,0) класс распределений

Отрицательное биномиальное распределение, наряду с распределениями Пуассона и биномиальным, является членом класса распределений ( a , b ,0) . Все три этих распределения являются частными случаями распределения Панджера. Они также являются членами естественного экспоненциального семейства .

Статистические выводы

Оценка параметров

МВУЭ для п

Предположим, что p неизвестно и проводится эксперимент, в котором заранее решено, что выборка будет продолжаться до тех пор, пока не будет найдено r успехов. Достаточной статистикой для эксперимента является k — количество неудач.

При оценке p несмещенная оценка минимальной дисперсии равна

Оценка максимального правдоподобия

Когда r известен, оценка максимального правдоподобия p равна

но это предвзятая оценка . Однако его обратная ( r  +  k )/ r является несмещенной оценкой 1/ p . [20]

Когда r неизвестен, оценка максимального правдоподобия для p и r вместе существует только для выборок, для которых выборочная дисперсия больше выборочного среднего значения. [21] Функция правдоподобия для N iid наблюдений ( k 1 , ...,  k N ) равна

из которого мы вычисляем функцию логарифмического правдоподобия

Чтобы найти максимум, мы берем частные производные по r и p и приравниваем их к нулю:

и

где

это дигамма-функция .

Решение первого уравнения для p дает:

Подставив это во второе уравнение, получим:

Это уравнение не может быть решено относительно r в замкнутой форме . Если требуется численное решение, можно использовать итерационный метод, такой как метод Ньютона . Альтернативно можно использовать алгоритм ожидания-максимизации . [21]

Возникновение и применение

Время ожидания в процессе Бернулли

Для особого случая, когда r является целым числом, отрицательное биномиальное распределение известно как распределение Паскаля . Это распределение вероятностей определенного числа неудач и успехов в серии независимых и одинаково распределенных испытаний Бернулли. Для k  +  r испытаний Бернулли с вероятностью успеха p отрицательный бином дает вероятность k успехов и r неудач с неудачей в последнем испытании. Другими словами, отрицательное биномиальное распределение — это распределение вероятностей числа успехов перед r -й неудачей в процессе Бернулли с вероятностью p успехов в каждом испытании. Процесс Бернулли — это процесс с дискретным временем, поэтому количество попыток, неудач и успехов является целым числом.

Рассмотрим следующий пример. Предположим, мы неоднократно бросаем кубик и считаем 1 неудачей. Вероятность успеха в каждом испытании равна 5/6. Число успехов до третьей неудачи принадлежит бесконечному множеству { 0, 1, 2, 3, ... }. Это количество успехов является случайной величиной с отрицательным биномиальным распределением.

Когда r = 1, мы получаем вероятностное распределение количества успехов до первой неудачи (т. е. вероятность того, что первая неудача произойдет в ( k  + 1)-м испытании), которое представляет собой геометрическое распределение :

Передисперсный Пуассон

Отрицательное биномиальное распределение, особенно в его альтернативной параметризации, описанной выше, можно использовать в качестве альтернативы распределению Пуассона. Это особенно полезно для дискретных данных в неограниченном положительном диапазоне, дисперсия выборки которых превышает среднее значение выборки . В таких случаях наблюдения чрезмерно разбросаны по отношению к распределению Пуассона, для которого среднее значение равно дисперсии. Следовательно, распределение Пуассона не является подходящей моделью. Поскольку отрицательное биномиальное распределение имеет на один параметр больше, чем распределение Пуассона, второй параметр можно использовать для корректировки дисперсии независимо от среднего значения. См. Кумулянты некоторых дискретных распределений вероятностей .

Это можно применить к ежегодным подсчетам тропических циклонов в Северной Атлантике или к ежемесячным или шестимесячным подсчетам зимних внетропических циклонов над Европой, для которых дисперсия превышает среднее значение. [22] [23] [24] В случае умеренной сверхдисперсии это может дать результаты, по существу аналогичные сверхдисперсному распределению Пуассона. [25] [26]

Отрицательное биномиальное моделирование широко используется в исследованиях экологии и биоразнообразия для анализа данных подсчета, где очень распространено чрезмерное рассеивание. Это связано с тем, что чрезмерная дисперсия указывает на биологическую агрегацию, например, когда виды или сообщества образуют кластеры. Игнорирование чрезмерной дисперсии может привести к значительному завышению параметров модели, что приведет к ошибочным статистическим выводам. Отрицательное биномиальное распределение эффективно устраняет проблему чрезмерной дисперсии, позволяя дисперсии изменяться квадратично со средним значением. Дополнительный параметр дисперсии управляет наклоном квадратичного члена, определяя степень избыточной дисперсии. Квадратичная зависимость средней дисперсии модели оказывается реалистичным подходом к решению проблемы чрезмерной дисперсии, что подтверждается эмпирическими данными многих исследований. В целом, модель NB предлагает две привлекательные особенности: (1) удобную интерпретацию параметра дисперсии как индекса кластеризации или агрегации и (2) ее понятную форму, имеющую замкнутое выражение для функции массы вероятности. [27]

В генетике отрицательное биномиальное распределение обычно используется для моделирования данных в виде количества считываний дискретных последовательностей из экспериментов по высокопроизводительному секвенированию РНК и ДНК. [28] [29] [30] [31]

Наблюдения за множественностью (физика)

Отрицательное биномиальное распределение было наиболее эффективной статистической моделью для широкого диапазона наблюдений множественности в экспериментах по столкновению частиц , например, [32] [33] [34] [35] [36] (см. обзор в [37] ), и утверждается, что это масштабно-инвариантное свойство материи, [38] [39] обеспечивающее наилучшее соответствие астрономическим наблюдениям, где оно предсказывает количество галактик в определенной области космоса. [40] [41] [42] [43] Феноменологическое обоснование эффективности отрицательного биномиального распределения в этих контекстах оставалось неизвестным в течение пятидесяти лет, с момента их первого наблюдения в 1973 году. [44] В 2023 году было получено доказательство из первых принципов . в конечном итоге было продемонстрировано Скоттом В. Тезлафом, где было показано, что отрицательное биномиальное распределение возникает из симметрии в динамических уравнениях канонического ансамбля частиц в пространстве Минковского . [45] Грубо говоря, учитывая ожидаемое количество испытаний и ожидаемое количество успехов , где

изоморфную систему уравнений можно отождествить с параметрами релятивистской плотности тока канонического ансамбля массивных частиц через

где - плотность покоя , - релятивистская среднеквадратическая плотность, - релятивистская среднеквадратическая плотность тока, и - где - среднеквадратическая скорость ансамбля частиц и - скорость света - так, что можно установить следующее биективное отображение :

Строгое альтернативное доказательство вышеуказанного соответствия также было продемонстрировано с помощью квантовой механики с помощью интеграла по путям Фейнмана . [45]

История

Это распределение было впервые изучено в 1713 году Пьером Ремоном де Монмором в его «Эссе d'analyse sur les jeux de Risk » как распределение числа испытаний, необходимых в эксперименте для получения заданного числа успехов. [46] Ранее об этом упоминал Паскаль . [47]

Смотрите также

Рекомендации

  1. ^ ДеГрут, Моррис Х. (1986). Вероятность и статистика (второе изд.). Аддисон-Уэсли. стр. 258–259. ISBN 0-201-11366-Х. LCCN  84006269. OCLC  10605205.
  2. ^ abc Вайсштейн, Эрик. «Отрицательное биномиальное распределение». Вольфрам Математический мир . Вольфрам Исследования . Проверено 11 октября 2020 г.
  3. ^ например , Ллойд-Смит, Джо; Шрайбер, С.Дж.; Копп, ЧП; Гетц, WM (2005). «Суперраспространение и влияние индивидуальных вариаций на возникновение болезней». Природа . 438 (7066): 355–359. дои : 10.1038/nature04153 . ПМК 7094981 . 
    Параметр сверхдисперсии в эпидемиологии обычно обозначается буквой , а не как здесь.
  4. ^ Казелла, Джордж; Бергер, Роджер Л. (2002). Статистический вывод (2-е изд.). Томсон Обучение. п. 95. ИСБН 0-534-24312-6.
  5. ^ abc Кук, Джон Д. «Заметки об отрицательном биномиальном распределении» (PDF) .
  6. ^ Моррис К.В. (1963), Примечание о прямом и обратном отборе проб, Биометрика, 50, 544–545.
  7. ^ «Математика: отрицательное биномиальное распределение».
  8. ^ Саха, Абхишек. «Введение в вероятность / Основы вероятности: лекция 14» (PDF) .
  9. ^ Институт SAS , «Отрицательное биномиальное распределение», SAS (R) 9.4 Функции и процедуры CALL: Справочник, четвертое издание , Институт SAS, Кэри, Северная Каролина, 2016.
  10. ^ аб Кроули, Майкл Дж. (2012). Книга Р. Уайли. ISBN 978-1-118-44896-0.
  11. ^ ab «Теория множеств: Раздел 3.2.5 – Отрицательное биномиальное распределение» (PDF) .
  12. ^ «Randomservices.org, Глава 10: Испытания Бернулли, Раздел 4: Отрицательное биномиальное распределение» .
  13. ^ «Stat Trek: отрицательное биномиальное распределение» .
  14. ^ Роутон, Жаклин. «Различие между биномиальным, гипергеометрическим и отрицательным биномиальным распределениями» (PDF) .
  15. ^ аб Хильбе, Джозеф М. (2011). Отрицательная биномиальная регрессия (второе изд.). Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-0-521-19815-8.
  16. ^ Ллойд-Смит, Джо (2007). «Оценка максимального правдоподобия параметра отрицательной биномиальной дисперсии для сильно разбросанных данных с применением к инфекционным заболеваниям». ПЛОС ОДИН . 2 (2): е180. Бибкод : 2007PLoSO...2..180L. дои : 10.1371/journal.pone.0000180 . ПМК 1791715 . ПМИД  17299582.  Значок открытого доступа
  17. Картер, Э.М., Поттс, HWW (4 апреля 2014 г.). «Прогнозирование продолжительности пребывания на основе электронной системы записи пациентов: пример первичной полной замены коленного сустава». BMC Медицинская информатика и принятие решений . 14:26 . ​​дои : 10.1186/1472-6947-14-26 . ПМЦ 3992140 . ПМИД  24708853. {{cite journal}}: CS1 maint: multiple names: authors list (link) Значок открытого доступа
  18. ^ Ороджи, Арезу; Назар, Эйса; Садеги, Масуме; Моради, Али; Джафари, Захра; Исмаили, Хабиболла (30 апреля 2021 г.). «Факторы, связанные с продолжительностью пребывания в больнице пожилых пациентов с использованием моделей регрессии счета». Медицинский журнал Исламской Республики Иран . 35 :5. дои :10.47176/мджири.35.5. ПМК 8111647 . ПМИД  33996656. 
  19. ^ Гринвуд, М.; Юл, ГУ (1920). «Исследование природы частотных распределений, отражающих множество событий, с особым упором на множественные приступы болезней или повторяющиеся несчастные случаи». JR Stat Soc . 83 (2): 255–279. дои : 10.2307/2341080. JSTOR  2341080.
  20. ^ Холдейн, JBS (1945). «Об одном методе оценки частот». Биометрика . 33 (3): 222–225. дои : 10.1093/biomet/33.3.222. hdl : 10338.dmlcz/102575 . JSTOR  2332299. PMID  21006837.
  21. ^ Аб Арамидис, К. (1999). «ЭМ-алгоритм для оценки отрицательных биномиальных параметров». Статистический журнал Австралии и Новой Зеландии . 41 (2): 213–221. дои : 10.1111/1467-842X.00075 . S2CID  118758171.
  22. ^ Вилларини, Г.; Векки, Джорджия; Смит, Дж. А. (2010). «Моделирование зависимости количества тропических штормов в Североатлантическом бассейне от климатических показателей». Ежемесячный обзор погоды . 138 (7): 2681–2705. Бибкод : 2010MWRv..138.2681V. дои : 10.1175/2010MWR3315.1 .
  23. ^ Майлер, П.Дж.; Стивенсон, Д.Б.; Ферро, КОТ; Ходжес, К.И. (2006). «Серийное скопление внетропических циклонов». Ежемесячный обзор погоды . 134 (8): 2224–2240. Бибкод : 2006MWRv..134.2224M. дои : 10.1175/MWR3160.1 .
  24. ^ Витоло, Р.; Стивенсон, Д.Б.; Кук, Ян М.; Митчелл-Уоллес, К. (2009). «Серийное скопление сильных европейских штормов». Метеорологическая газета . 18 (4): 411–424. Бибкод : 2009МетЗе..18..411В. дои : 10.1127/0941-2948/2009/0393. S2CID  67845213.
  25. ^ МакКаллах, Питер ; Нелдер, Джон (1989). Обобщенные линейные модели (второе изд.). Бока-Ратон: Чепмен и Холл/CRC. ISBN 978-0-412-31760-6.
  26. ^ Кэмерон, Адриан С.; Триведи, Правин К. (1998). Регрессионный анализ данных подсчета . Издательство Кембриджского университета. ISBN 978-0-521-63567-7.
  27. ^ Стоклоса, Дж.; Блейки, Р.В.; Хуэй, FKC (2022). «Обзор современных применений отрицательного биномиального моделирования в экологии и биоразнообразии». Разнообразие . 14 (5): 320. дои : 10.3390/d14050320 .
  28. ^ Робинсон, доктор медицины; Смит, ГК (2007). «Модерируемые статистические тесты для оценки различий в численности меток». Биоинформатика . 23 (21): 2881–2887. doi : 10.1093/биоинформатика/btm453 . ПМИД  17881408.
  29. ^ «Дифференциальный анализ данных подсчета -» (PDF) .
  30. ^ Айрольди, EM; Коэн, WW; Финберг, SE (июнь 2005 г.). «Байесовские модели для часто встречающихся терминов в тексте». Труды Классификационного общества Северной Америки и ежегодных собраний INTERFACE . Том. 990. Сент-Луис, Миссури, США. п. 991.
  31. ^ Чен, Юньшунь; Дэвис, Маккарти (25 сентября 2014 г.). «edgeR: анализ дифференциальной экспрессии цифровых данных об экспрессии генов» (PDF) . Проверено 14 октября 2014 г.
  32. ^ Гросс-Этрингхаус, Ян Фите; Рейгерс, Клаус (01 августа 2010 г.). «Множественность заряженных частиц в протон-протонных столкновениях». Журнал физики G: Ядерная физика и физика элементарных частиц . 37 (8): 083001.arXiv : 0912.0023 . дои : 10.1088/0954-3899/37/8/083001. ISSN  0954-3899. S2CID  119233810.
  33. ^ Рыбчинский, Мацей; Вилк, Гжегож; Влодарчик, Збигнев (31 мая 2019 г.). «Интригующие свойства распределений множественности». Физический обзор D . 99 (9): 094045. arXiv : 1811.07197 . Бибкод : 2019PhRvD..99i4045R. doi : 10.1103/PhysRevD.99.094045 . ISSN  2470-0010.
  34. ^ Тарновски, Теренс Дж.; Вестфолл, Гэри Д. (9 июля 2013 г.). «Первое исследование отрицательного биномиального распределения применительно к более высоким моментам распределений чистого заряда и чистой множественности протонов». Буквы по физике Б. 724 (1): 51–55. arXiv : 1210.8102 . Бибкод : 2013PhLB..724...51T. дои : 10.1016/j.physletb.2013.05.064 . ISSN  0370-2693.
  35. ^ Деррик, М.; Ган, КК; Койджман, П.; Лоос, Дж.С.; Масгрейв, Б.; Цена, LE; Репонд, Дж.; Шлерет, Дж.; Сугано, К.; Вайс, Дж. М.; Вуд, Делавэр; Баранко, Г.; Блокус, Д.; Брабсон, Б.; Бром, Дж. М. (1 декабря 1986 г.). «Исследование фрагментации кварков при ${e}^{+}$${e}^{\mathrm{\ensuremath{-}}}$-аннигиляции при энергии 29 ГэВ: множественность заряженных частиц и одночастичные распределения по быстроте». Физический обзор D . 34 (11): 3304–3320. doi :10.1103/PhysRevD.34.3304. hdl : 1808/15222 .
  36. ^ Зборовский, И. (10 октября 2018 г.). «Трехкомпонентное распределение по множественности, колебание комбинантов и свойства кланов в pp-столкновениях на БАК». Европейский физический журнал C . 78 (10): 816. arXiv : 1811.11230 . Бибкод : 2018EPJC...78..816Z. doi : 10.1140/epjc/s10052-018-6287-x . ISSN  1434-6052.
  37. ^ Киттель, Вольфрам; Де Вольф, Эдди А. (2005). Мягкая мультихардонная динамика . Всемирная научная.
  38. ^ Шеффер, Р. (1984). «Определение N-точечной корреляционной функции галактики». Астрономия и астрофизика . 134 (2): Л15. Бибкод : 1984A&A...134L..15S.
  39. ^ Шеффер, Р. (1985). «Функция генерации вероятности кластеризации галактик». Астрономия и астрофизика . 144 (1): Л1–Л4. Бибкод : 1985A&A...144L...1S.
  40. ^ Перес, Люсия А.; Малхотра, Сангита; Роудс, Джеймс Э.; Тилви, Виталь (07 января 2021 г.). «Функция вероятности пустоты при моделировании исследований излучателей Ly α с высоким красным смещением». Астрофизический журнал . 906 (1): 58. arXiv : 2011.03556 . Бибкод : 2021ApJ...906...58P. дои : 10.3847/1538-4357/abc88b . ISSN  1538-4357.
  41. ^ Уртадо-Хил, Луис; Мартинес, Висент Дж.; Арналте-Мур, Пабло; Понс-Бордерия, Мария-Хесус; Пареха-Флорес, Кристобаль; Паредес, Сильвестр (01 мая 2017 г.). «Наилучшее соответствие наблюдаемой функции распределения количества галактик в ячейках». Астрономия и астрофизика . 601 : А40. arXiv : 1703.01087 . Бибкод : 2017A&A...601A..40H. дои : 10.1051/0004-6361/201629097 . ISSN  0004-6361.
  42. ^ Элизальде, Э.; Газтанага, Э. (январь 1992 г.). «Вероятность пустоты как функция формы пустоты и моделей, инвариантных к масштабу». Ежемесячные уведомления Королевского астрономического общества . 254 (2): 247–256. дои : 10.1093/mnras/254.2.247 . hdl : 2060/19910019799 . ISSN  0035-8711.
  43. ^ Хамида, М; Пластино, Анджело; Рокка, MC (01 марта 2021 г.). «Обобщенные распределения Пуассона для систем с двухчастичным взаимодействием». Научные заметки IOP . 2 (1): 015003. Бибкод : 2021IOPSN...2a5003H. дои : 10.1088/2633-1357/abec9f . hdl : 11336/181371 . ISSN  2633-1357.
  44. ^ Джованнини, А. (июнь 1973 г.). «Тепловой хаос» и «когерентность» в распределениях множественности при высоких энергиях». Иль Нуово Чименто А. 15 (3): 543–551. Бибкод : 1973NCimA..15..543G. дои : 10.1007/bf02734689. ISSN  0369-3546. S2CID  118805136.
  45. ^ Аб Тезлаф, Скотт В. (29 сентября 2023 г.). «Значение отрицательного биномиального распределения в явлениях множественности». Физика Скрипта . 98 (11). arXiv : 2310.03776 . Бибкод : 2023PhyS...98k5310T. doi : 10.1088/1402-4896/acfead. ISSN  0031-8949. S2CID  263300385.
  46. ^ Montmort PR de (1713) Essai d'analyse sur les jeux de hasard. 2-е изд. Кийо, Париж
  47. ^ Паскаль Б (1679) Varia Opera Mathematica. Д. Петри де Ферма. Толосы