stringtranslate.com

Маргинальное распределение

В теории вероятностей и статистике маргинальное распределение подмножества набора случайных величин — это распределение вероятностей переменных, содержащихся в подмножестве . Он дает вероятности различных значений переменных в подмножестве без ссылки на значения других переменных. Это контрастирует с условным распределением , которое дает вероятности, зависящие от значений других переменных.

Маргинальные переменные — это те переменные в подмножестве переменных, которые сохраняются. Эти понятия являются «маргинальными», поскольку их можно найти, суммируя значения таблицы по строкам или столбцам и записывая сумму на полях таблицы. [1] Распределение маргинальных переменных (маргинальное распределение) получается путем маргинализации (то есть сосредоточения внимания на суммах в маргинальных пределах) над распределением отбрасываемых переменных, и говорят, что отброшенные переменные были маргинализированы. .

Контекст здесь таков, что проводимые теоретические исследования или анализ данных включают более широкий набор случайных величин, но внимание ограничивается уменьшенным числом этих переменных. Во многих приложениях анализ может начинаться с заданного набора случайных величин, затем сначала расширять этот набор путем определения новых (например, суммы исходных случайных величин) и, наконец, уменьшать число, обращая внимание на маргинальное распределение случайных величин. подмножество (например, сумма). Можно провести несколько различных анализов, каждый из которых рассматривает различное подмножество переменных как предельное распределение.

Определение

Маргинальная функция массы вероятности

При известном совместном распределении двух дискретных случайных величин , скажем, X и Y , предельное распределение любой переменной ( например, X ) представляет собой распределение вероятностей X , когда значения Y не принимаются во внимание. Это можно рассчитать путем суммирования совместного распределения вероятностей по всем значениям Y . Естественно, верно и обратное: предельное распределение может быть получено для Y путем суммирования отдельных значений X.

, и

Предельную вероятность всегда можно записать как ожидаемое значение :

Интуитивно понятно , что предельная вероятность X вычисляется путем изучения условной вероятности X при определенном значении Y и последующего усреднения этой условной вероятности по распределению всех значений Y.

Это следует из определения ожидаемой ценности (после применения закона бессознательного статистика )

Следовательно, маргинализация обеспечивает правило преобразования распределения вероятностей случайной величины Y и другой случайной величины X = g ( Y ) :

Функция предельной плотности вероятности

Учитывая две непрерывные случайные величины X и Y , совместное распределение которых известно, предельную функцию плотности вероятности можно получить путем интегрирования совместного распределения вероятностей f по Y, и наоборот. То есть

где и .

Маргинальная кумулятивная функция распределения

Найти предельную кумулятивную функцию распределения по совместной кумулятивной функции распределения легко. Напомним, что:

Если X и Y совместно принимают значения на [ a , b ] × [ c , d ], то

и

Если d равно ∞, то это становится пределом . Аналогично и для .

Маргинальное распределение против условного распределения

Определение

Предельная вероятность — это вероятность того, что одно событие произойдет независимо от других событий. Условная вероятность , с другой стороны, — это вероятность того, что событие произойдет при условии, что другое конкретное событие уже произошло. Это означает, что вычисление одной переменной зависит от другой переменной. [2]

Условное распределение переменной с учетом другой переменной представляет собой совместное распределение обеих переменных, разделенное на предельное распределение другой переменной. [3] То есть

Пример

Предположим, есть данные из класса из 200 учеников о количестве изученного времени ( X ) и проценте правильных ответов ( Y ). [4] Предполагая, что X и Y являются дискретными случайными величинами, совместное распределение X и Y можно описать путем перечисления всех возможных значений p ( x i , y j ), как показано в Таблице 3.

Маргинальное распределение можно использовать для определения количества учащихся, набравших 20 или ниже: , что означает 10 учащихся или 5%.

Условное распределение можно использовать для определения вероятности того, что учащийся, изучавший 60 минут или более, получит оценку 20 или ниже: , что означает, что вероятность набрать 20 баллов после обучения в течение как минимум 60 минут составляет около 11%.

Реальный пример

Предположим, что необходимо вычислить вероятность того, что пешехода, переходящего дорогу по пешеходному переходу, не обращая внимания на сигнал светофора, собьет машина. Пусть H — дискретная случайная величина , принимающая одно значение из {Hit, Not Hit}. Пусть L (для светофора) — дискретная случайная величина, принимающая одно значение из {Красный, Желтый, Зеленый}.

На самом деле H будет зависеть от L. То есть P(H = Hit) будет принимать разные значения в зависимости от того, является ли L красным, желтым или зеленым (и аналогично для P(H = Not Hit)). Например, человек с гораздо большей вероятностью будет сбит машиной при попытке перейти дорогу, когда свет перпендикулярного движения горит зеленым, чем если бы он был красным. Другими словами, для любой возможной пары значений H и L необходимо рассмотреть совместное распределение вероятностей H и L, чтобы найти вероятность того, что эта пара событий произойдет вместе, если пешеход проигнорирует состояние светофора.

Однако при попытке вычислить предельную вероятность P(H = Hit) мы ищем вероятность того, что H = Hit в ситуации, в которой конкретное значение L неизвестно и в которой пешеход игнорирует состояние светофора. . В общем, пешехода можно сбить, если свет горит красным, ИЛИ если свет желтый, ИЛИ если свет зеленый. Итак, ответ на предельную вероятность можно найти путем суммирования P(H | L) для всех возможных значений L, при этом каждое значение L взвешивается по вероятности его появления.

Вот таблица, показывающая условные вероятности попадания в зависимости от состояния огней. (Обратите внимание, что сумма столбцов в этой таблице должна составлять 1, поскольку вероятность попадания или не попадания равна 1 независимо от состояния источника света.)

Чтобы найти совместное распределение вероятностей, требуется больше данных. Например, предположим, что P(L = красный) = 0,2, P(L = желтый) = 0,1 и P(L = зеленый) = 0,7. Умножение каждого столбца в условном распределении на вероятность появления этого столбца приводит к совместному распределению вероятностей H и L, заданному в центральном блоке записей 2×3. (Обратите внимание, что сумма ячеек в этом блоке 2×3 равна 1).

Предельная вероятность P(H = попадание) представляет собой сумму 0,572 по строке H = попадание этой совместной таблицы распределения, поскольку это вероятность попадания в свет, когда свет горит красным ИЛИ желтым ИЛИ зеленым. Аналогично, предельная вероятность того, что P(H = Not Hit) представляет собой сумму по строке H = Not Hit.

Многомерные распределения

Многие выборки из двумерного нормального распределения. Предельные распределения показаны красным и синим цветом. Маргинальное распределение X также аппроксимируется путем создания гистограммы координат X без учета координат Y.

Для многомерных распределений применяются формулы, аналогичные приведенным выше, при этом символы X и/или Y интерпретируются как векторы. В частности, каждое суммирование или интегрирование будет осуществляться по всем переменным, кроме тех, которые содержатся в X. [5]

Это означает, что если X 1 , X 2 ,…, X n являются дискретными случайными величинами , то предельная функция массы вероятности должна быть равна

X 1X 2X nнепрерывными случайными величинамифункция плотности вероятности

Смотрите также

Рекомендации

  1. ^ Трамплер, Роберт Дж. и Гарольд Ф. Уивер (1962). Статистическая астрономия . Дуврские публикации. стр. 32–33.
  2. ^ «Предельные и условные распределения вероятностей: определение и примеры». Study.com . Проверено 16 ноября 2019 г.
  3. ^ «Экзамен P [Математика бывшего Советского Союза]» . www.math.fsu.edu . Проверено 16 ноября 2019 г.
  4. ^ Маргинальные и условные распределения , данные получены 16 ноября 2019 г.
  5. ^ Современное введение в вероятность и статистику: понимание почему и как . Деккинг, Мишель (1946 г.р.). Лондон: Спрингер. 2005. ISBN 9781852338961. ОСЛК  262680588.{{cite book}}: CS1 maint: others (link)

Библиография