stringtranslate.com

Сложное распределение вероятностей

В теории вероятностей и статистике сложное распределение вероятностей (также известное как смешанное распределение или заразительное распределение ) — это распределение вероятностей , возникающее в результате предположения, что случайная величина распределяется в соответствии с некоторым параметризованным распределением с (некоторыми) параметрами этого распределения. сами по себе являются случайными величинами. Если параметр является параметром масштаба , полученную смесь также называют смесью масштабов .

Составное распределение («безусловное распределение») является результатом маргинализации (интегрирования) скрытой случайной величины (-ов), представляющей параметр (-ы) параметризованного распределения («условное распределение»).

Определение

Составное распределение вероятностей — это распределение вероятностей, которое возникает в результате предположения, что случайная величина распределяется в соответствии с некоторым параметризованным распределением с неизвестным параметром , который снова распределяется в соответствии с некоторым другим распределением . Результирующее распределение называется распределением, полученным в результате сложения с . Распределение параметра также называется распределением смешивания или скрытым распределением . Технически, безусловное распределение является результатом маргинализации по , то есть интегрирования неизвестного параметра(ов) . Его функция плотности вероятности определяется следующим образом:

Та же самая формула применяется аналогично, если некоторые или все переменные являются векторами.

Из приведенной выше формулы можно видеть, что сложное распределение по сути является частным случаем маргинального распределения : Совместное распределение и определяется как , а сложное распределение является его маргинальным распределением: . Если область определения дискретна, то распределение снова является частным случаем смешанного распределения .

Характеристики

Общий

Составное распределение будет зависеть от конкретного выражения каждого распределения, а также от того, какой параметр распределяется в соответствии с распределением , и параметры будут включать в себя любые параметры, которые не изолированы или не интегрированы. Поддержка такая же, как и у , и если последнее представляет собой двухпараметрическое распределение, параметризованное средним значением и дисперсией, существуют некоторые общие свойства.

Среднее и дисперсия

Первые два момента сложного распределения определяются законом полного ожидания и законом полной дисперсии :

Если среднее значение распределено как , которое, в свою очередь, имеет среднее значение и дисперсию , приведенные выше выражения подразумевают и , где – дисперсия .

Доказательство

пусть и будут распределениями вероятностей, параметризованными средней дисперсией как


Дисперсия определяется выражением , и

Приложения

Тестирование

Распределения общей статистики теста представляют собой составные распределения при нулевой гипотезе, например, в t-критерии Стьюдента (где статистика теста представляет собой соотношение нормальной и случайной величины хи-квадрат ) или в F-тесте (где статистика теста представляет собой отношение двух случайных величин хи-квадрат ).

Моделирование сверхдисперсии

Сложные распределения полезны для моделирования результатов, демонстрирующих чрезмерную дисперсию , т. е. большую изменчивость, чем можно было бы ожидать в рамках определенной модели. Например, данные подсчета обычно моделируются с использованием распределения Пуассона , дисперсия которого равна его среднему значению. Распределение можно обобщить, допустив изменчивость его параметра скорости , реализованную через гамма-распределение , что приводит к предельному отрицательному биномиальному распределению . Это распределение по форме похоже на распределение Пуассона, но допускает большие дисперсии. Аналогичным образом, биномиальное распределение можно обобщить, чтобы обеспечить дополнительную вариативность, объединив его с бета-распределением для параметра вероятности успеха, что приводит к бета-биномиальному распределению .

Байесовский вывод

Помимо повсеместных маргинальных распределений, которые можно рассматривать как частные случаи составных распределений, в байесовском выводе сложные распределения возникают, когда в приведенных выше обозначениях F представляет распределение будущих наблюдений, а Gапостериорное распределение параметров F с учетом информацию в наборе наблюдаемых данных. Это дает апостериорное прогнозируемое распределение . Соответственно, для априорного прогнозируемого распределения F — это распределение новой точки данных, а G априорное распределение параметров.

Свертка

Свертку распределений вероятностей (для получения распределения вероятностей сумм случайных величин) также можно рассматривать как частный случай наложения процентов; здесь распределение суммы по существу является результатом рассмотрения одного слагаемого как параметра случайного местоположения для другого слагаемого. [1]

Вычисление

Сложные распределения, полученные из экспоненциальных семейных распределений, часто имеют замкнутую форму. Если аналитическое интегрирование невозможно, могут потребоваться численные методы.

Распределение соединений можно относительно легко исследовать с помощью методов Монте-Карло , т. е. путем создания случайных выборок. Зачастую легко сгенерировать случайные числа из распределений, а затем использовать их для выполнения свернутой выборки Гиббса для создания выборок из .

Сложное распределение обычно также может быть в достаточной степени аппроксимировано распределением смеси с использованием конечного числа компонентов смеси, что позволяет получить приблизительную плотность, функцию распределения и т. д. [1]

Оценка параметров ( оценка максимального правдоподобия или максимальная апостериорная оценка) в рамках составной модели распределения иногда может быть упрощена за счет использования EM-алгоритма . [2]

Примеры

Похожие термины

Понятие «сложного распределения», используемое, например, в определении сложного распределения Пуассона или сложного процесса Пуассона , отличается от определения, найденного в этой статье. Смысл в этой статье соответствует тому, что используется, например, в байесовском иерархическом моделировании .

Особый случай составных распределений вероятностей, где параметризованным распределением является распределение Пуассона , также называется смешанным распределением Пуассона .

Смотрите также

Рекомендации

  1. ^ аб Рёвер, К.; Фриде, Т. (2017). «Дискретная аппроксимация распределения смеси посредством ограниченной расходимости». Журнал вычислительной и графической статистики . 26 (1): 217–222. arXiv : 1602.04060 . дои : 10.1080/10618600.2016.1276840 .
  2. ^ Гельман, А.; Карлин, Дж. Б.; Стерн, Х.; Рубин, Д.Б. (1997). «9.5 Поиск маргинальных задних мод с использованием ЭМ и связанных с ней алгоритмов ». Байесовский анализ данных (1-е изд.). Бока-Ратон: Чепмен и Холл / CRC. п. 276.
  3. ^ Аб Ли, SX; Маклахлан, Дж.Дж. (2019). «Распределение масштабной смеси». Wiley StatsRef: Интернет-справочник по статистике . дои : 10.1002/9781118445112.stat08201.
  4. ^ Гнейтинг, Т. (1997). «Смеси нормального масштаба и двойные плотности вероятности». Журнал статистических вычислений и моделирования . 59 (4): 375–384. дои : 10.1080/00949659708811867.
  5. ^ Настроение, AM; Грейбилл, ФА; Боес, округ Колумбия (1974). Введение в теорию статистики (3-е изд.). Нью-Йорк: МакГроу-Хилл.
  6. ^ Эндрюс, DF; Маллоуз, CL (1974), «Шкаловые смеси нормальных распределений», Журнал Королевского статистического общества, серия B , 36 (1): 99–102, doi : 10.1111/j.2517-6161.1974.tb00989.x
  7. ^ Джонсон, Нидерланды; Кемп, AW; Коц, С. (2005). «6.2.2». Одномерные дискретные распределения (3-е изд.). Нью-Йорк: Уайли. п. 253.
  8. ^ Гельман, А.; Карлин, Дж. Б.; Стерн, Х.; Дансон, Д.Б.; Вехтари, А.; Рубин, Д.Б. (2014). Байесовский анализ данных (3-е изд.). Бока-Ратон: Чепмен и Холл / CRC.
  9. ^ Лоулесс, Дж. Ф. (1987). «Отрицательная биномиальная и смешанная регрессия Пуассона». Канадский статистический журнал . 15 (3): 209–225. дои : 10.2307/3314912. JSTOR  3314912.
  10. ^ Тейх, MC; Диамент, П. (1989). «Умножьте стохастические представления для K-распределений и их преобразований Пуассона». Журнал Оптического общества Америки А. 6 (1): 80–91. Бибкод : 1989JOSAA...6...80T. CiteSeerX 10.1.1.64.596 . дои : 10.1364/JOSAA.6.000080. 
  11. ^ Джонсон, Нидерланды; Коц, С.; Балакришнан, Н. (1994). «20 распределений Парето ». Непрерывные одномерные распределения . Том. 1 (2-е изд.). Нью-Йорк: Уайли. п. 573.
  12. ^ Дубей, SD (1970). «Соединенные гамма-, бета- и F-распределения». Метрика . 16 : 27–31. дои : 10.1007/BF02613934.

дальнейшее чтение