В теории вероятностей и статистике распределение вероятностей — это математическая функция , которая определяет вероятности наступления возможных результатов эксперимента . [1] [2] Это математическое описание случайного явления с точки зрения его выборочного пространства и вероятностей событий ( подмножеств выборочного пространства). [3]
Например, если X используется для обозначения результата подбрасывания монеты («эксперимент»), то распределение вероятностей X будет иметь значение 0,5 (1 из 2 или 1/2) для X = орла и 0,5 для X = решки (предполагая, что монета честная ). Чаще всего распределения вероятностей используются для сравнения относительной встречаемости многих различных случайных значений.
Распределения вероятностей могут быть определены различными способами и для дискретных или для непрерывных величин. Распределениям со специальными свойствами или для особо важных приложений даются специальные названия.
Распределение вероятностей — это математическое описание вероятностей событий, подмножеств выборочного пространства . Выборочное пространство, часто представленное в нотации как , представляет собой множество всех возможных результатов случайного наблюдаемого явления. Выборочное пространство может быть любым множеством: множеством действительных чисел , множеством описательных меток, множеством векторов , множеством произвольных нечисловых значений и т. д. Например, выборочное пространство подбрасывания монеты может быть Ω = { "орел", "решка" } .
Чтобы определить распределения вероятностей для конкретного случая случайных величин (чтобы пространство выборки можно было рассматривать как числовой набор), обычно различают дискретные и абсолютно непрерывные случайные величины . В дискретном случае достаточно указать функцию массы вероятности, присваивающую вероятность каждому возможному результату (например, при бросании честной игральной кости каждая из шести цифр от «1» до «6» , соответствующих числу точек на игральной кости, имеет вероятность Вероятность события затем определяется как сумма вероятностей всех результатов, которые удовлетворяют событию; например, вероятность события «на игральной кости выпадает четное значение» равна
Напротив, когда случайная величина принимает значения из континуума, то по соглашению любому индивидуальному результату присваивается вероятность ноль. Для таких непрерывных случайных величин только события, которые включают бесконечно много результатов, таких как интервалы, имеют вероятность больше 0.
Например, рассмотрим измерение веса куска ветчины в супермаркете и предположим, что весы могут обеспечить произвольное количество цифр точности. Тогда вероятность того, что он весит ровно 500 г, должна быть равна нулю, поскольку независимо от выбранного уровня точности нельзя предположить, что в оставшихся пропущенных цифрах, игнорируемых уровнем точности, нет ненулевых десятичных цифр.
Однако для того же варианта использования можно выполнить требования контроля качества, например, чтобы упаковка ветчины весом "500 г" весила от 490 г до 510 г с вероятностью не менее 98%. Это возможно, поскольку это измерение не требует такой высокой точности от базового оборудования.
Абсолютно непрерывные распределения вероятностей можно описать несколькими способами. Функция плотности вероятности описывает бесконечно малую вероятность любого заданного значения, а вероятность того, что результат лежит в заданном интервале, можно вычислить путем интегрирования функции плотности вероятности по этому интервалу. [4] Альтернативное описание распределения — с помощью кумулятивной функции распределения , которая описывает вероятность того, что случайная величина не больше заданного значения (т. е. для некоторых ). Кумулятивная функция распределения — это область под функцией плотности вероятности от до , как показано на рисунке 1. [5]
Распределение вероятностей может быть описано в различных формах, например, с помощью функции массы вероятности или кумулятивной функции распределения. Одно из наиболее общих описаний, которое применяется для абсолютно непрерывных и дискретных переменных, осуществляется с помощью функции вероятности, входное пространство которой является σ-алгеброй , и дает в качестве выходного значения вероятность действительного числа , в частности, число в .
Функция вероятности может принимать в качестве аргумента подмножества самого пространства выборки, как в примере с подбрасыванием монеты, где функция была определена так, что P (орел) = 0,5 и P (решка) = 0,5 . Однако из-за широкого использования случайных величин , которые преобразуют пространство выборки в набор чисел (например, , ), более распространено изучать распределения вероятностей, аргументом которых являются подмножества этих конкретных видов множеств (множеств чисел), [6] и все распределения вероятностей, обсуждаемые в этой статье, относятся к этому типу. Обычно обозначается как вероятность того, что определенное значение переменной принадлежит определенному событию . [7] [8]
Вышеуказанная функция вероятности характеризует распределение вероятностей только в том случае, если она удовлетворяет всем аксиомам Колмогорова , то есть:
Понятие функции вероятности становится более строгим, если определить его как элемент вероятностного пространства , где — множество возможных результатов, — множество всех подмножеств , вероятность которых может быть измерена, а — функция вероятности или мера вероятности , которая присваивает вероятность каждому из этих измеримых подмножеств . [9]
Распределения вероятностей обычно принадлежат к одному из двух классов. Дискретное распределение вероятностей применимо к сценариям, где набор возможных результатов дискретен (например, подбрасывание монеты, бросок игральной кости), а вероятности кодируются дискретным списком вероятностей результатов; в этом случае дискретное распределение вероятностей известно как функция массы вероятности . С другой стороны, абсолютно непрерывные распределения вероятностей применимы к сценариям, где набор возможных результатов может принимать значения в непрерывном диапазоне (например, действительные числа), такие как температура в данный день. В абсолютно непрерывном случае вероятности описываются функцией плотности вероятности , а распределение вероятностей по определению является интегралом функции плотности вероятности. [7] [4] [8] Нормальное распределение является часто встречающимся абсолютно непрерывным распределением вероятностей. Более сложные эксперименты, такие как эксперименты со стохастическими процессами , определенными в непрерывном времени , могут потребовать использования более общих мер вероятности .
Распределение вероятностей, выборочное пространство которого является одномерным (например, действительные числа, список меток, упорядоченные метки или двоичное), называется одномерным , в то время как распределение, выборочное пространство которого является векторным пространством размерности 2 или более, называется многомерным . Одномерное распределение дает вероятности того, что одна случайная величина принимает различные значения; многомерное распределение ( совместное распределение вероятностей ) дает вероятности того, что случайный вектор — список из двух или более случайных величин — принимает различные комбинации значений. Важные и часто встречающиеся одномерные распределения вероятностей включают биномиальное распределение , гипергеометрическое распределение и нормальное распределение . Часто встречающееся многомерное распределение — это многомерное нормальное распределение .
Помимо функции вероятности, кумулятивная функция распределения, функция массы вероятности и функция плотности вероятности, функция генерации момента и характеристическая функция также служат для определения распределения вероятности, поскольку они однозначно определяют базовую кумулятивную функцию распределения. [10]
Ниже перечислены некоторые ключевые понятия и термины, широко используемые в литературе по теме распределений вероятностей. [1]
В частном случае действительной случайной величины распределение вероятностей может быть эквивалентно представлено кумулятивной функцией распределения вместо вероятностной меры. Кумулятивная функция распределения случайной величины относительно распределения вероятностей определяется как
Кумулятивная функция распределения любой действительной случайной величины обладает свойствами:
И наоборот, любая функция , которая удовлетворяет первым четырем из приведенных выше свойств, является кумулятивной функцией распределения некоторого распределения вероятностей действительных чисел. [13]
Любое распределение вероятностей можно разложить в виде смеси дискретного , абсолютно непрерывного и сингулярного непрерывного распределений [14], и , таким образом , любая кумулятивная функция распределения допускает разложение в виде выпуклой суммы трех соответствующих кумулятивных функций распределения.
Дискретное распределение вероятностей — это распределение вероятностей случайной величины, которая может принимать только счетное число значений [15] ( почти наверняка ) [16] , что означает, что вероятность любого события может быть выражена в виде (конечной или счетно бесконечной ) суммы: где — счетное множество с . Таким образом, дискретные случайные величины (т. е. случайные величины, распределение вероятностей которых дискретно) — это в точности те, у которых функция массы вероятности . В случае, когда диапазон значений счетно бесконечен, эти значения должны уменьшаться до нуля достаточно быстро, чтобы вероятности в сумме дали 1. Например, если для , сумма вероятностей будет .
Известные дискретные распределения вероятностей, используемые в статистическом моделировании, включают распределение Пуассона , распределение Бернулли , биномиальное распределение , геометрическое распределение , отрицательное биномиальное распределение и категориальное распределение . [3] Когда выборка (набор наблюдений) извлекается из более крупной популяции, точки выборки имеют эмпирическое распределение , которое является дискретным и которое предоставляет информацию о распределении популяции. Кроме того, дискретное равномерное распределение обычно используется в компьютерных программах, которые делают равновероятные случайные выборки между несколькими вариантами.
Действительная дискретная случайная величина может быть эквивалентно определена как случайная величина, кумулятивная функция распределения которой увеличивается только за счет скачков — то есть ее cdf увеличивается только там, где она «прыгает» к более высокому значению, и постоянна в интервалах без скачков. Точки, где происходят скачки, — это как раз те значения, которые может принимать случайная величина. Таким образом, кумулятивная функция распределения имеет вид
Точки, в которых функция cdf совершает скачки, всегда образуют счетное множество; это может быть любое счетное множество, и, таким образом, оно может быть даже плотным по действительным числам.
Дискретное распределение вероятностей часто представляется мерами Дирака , распределениями вероятностей детерминированных случайных величин . Для любого результата пусть будет мерой Дирака, сосредоточенной в . При наличии дискретного распределения вероятностей существует счетное множество с и функцией массы вероятности . Если - любое событие, то или, короче говоря,
Аналогично, дискретные распределения могут быть представлены с помощью дельта-функции Дирака как обобщенной функции плотности вероятности , где что означает для любого события [17]
Для дискретной случайной величины пусть будут значения, которые она может принимать с ненулевой вероятностью. Обозначим
Это непересекающиеся множества , и для таких множеств
Отсюда следует, что вероятность того, что принимает любое значение, кроме , равна нулю, и поэтому можно записать как
за исключением набора с нулевой вероятностью, где — индикаторная функция . Это может служить альтернативным определением дискретных случайных величин.
Особым случаем является дискретное распределение случайной величины, которая может принимать только одно фиксированное значение; другими словами, это детерминированное распределение . Выражаясь формально, случайная величина имеет одноточечное распределение, если она имеет возможный результат такой, что [18] Все другие возможные результаты тогда имеют вероятность 0. Ее кумулятивная функция распределения немедленно прыгает от 0 до 1.
Абсолютно непрерывное распределение вероятностей — это распределение вероятностей на действительных числах с несчетным количеством возможных значений, таких как целый интервал на действительной прямой, и где вероятность любого события может быть выражена в виде интеграла. [19] Точнее, действительная случайная величина имеет абсолютно непрерывное распределение вероятностей, если существует функция, такая что для каждого интервала вероятность принадлежности к задается интегралом от по : [ 20] [21] Это определение функции плотности вероятности , так что абсолютно непрерывные распределения вероятностей — это в точности те, у которых есть функция плотности вероятности. В частности, вероятность для принять любое единственное значение (то есть ) равна нулю, потому что интеграл с совпадающими верхним и нижним пределами всегда равен нулю. Если интервал заменить любым измеримым множеством , соответствующее равенство по-прежнему будет иметь место:
Абсолютно непрерывная случайная величина — это случайная величина, распределение вероятностей которой абсолютно непрерывно.
Существует множество примеров абсолютно непрерывных распределений вероятностей: нормальное , равномерное , хи-квадрат и другие .
Абсолютно непрерывные распределения вероятностей, как определено выше, — это именно те, у которых есть абсолютно непрерывная кумулятивная функция распределения. В этом случае кумулятивная функция распределения имеет вид где — плотность случайной величины относительно распределения .
Примечание по терминологии: Абсолютно непрерывные распределения следует отличать от непрерывных распределений , которые имеют непрерывную кумулятивную функцию распределения. Каждое абсолютно непрерывное распределение является непрерывным распределением, но обратное неверно, существуют сингулярные распределения , которые не являются ни абсолютно непрерывными, ни дискретными, ни смесью тех и других, и не имеют плотности. Примером может служить распределение Кантора . Однако некоторые авторы используют термин «непрерывное распределение» для обозначения всех распределений, кумулятивная функция распределения которых абсолютно непрерывна , т. е. называют абсолютно непрерывные распределения непрерывными распределениями. [7]
Более общее определение функций плотности и эквивалентных им абсолютно непрерывных мер см. в статье Абсолютно непрерывная мера .
В меро-теоретической формализации теории вероятностей случайная величина определяется как измеримая функция из вероятностного пространства в измеримое пространство . Учитывая, что вероятности событий вида удовлетворяют вероятностным аксиомам Колмогорова , распределение вероятностей является мерой изображения , которая является вероятностной мерой при удовлетворении . [22] [23] [24]
Абсолютно непрерывные и дискретные распределения с поддержкой на или чрезвычайно полезны для моделирования множества явлений, [7] [5], поскольку большинство практических распределений поддерживаются на относительно простых подмножествах, таких как гиперкубы или шары . Однако это не всегда так, и существуют явления с поддержкой, которые на самом деле являются сложными кривыми в некотором пространстве или подобном. В этих случаях распределение вероятностей поддерживается на изображении такой кривой и, скорее всего, будет определено эмпирически, а не найдена замкнутая формула для него. [25]
Один из примеров показан на рисунке справа, который отображает эволюцию системы дифференциальных уравнений (обычно известных как уравнения Рабиновича–Фабриканта ), которые можно использовать для моделирования поведения волн Ленгмюра в плазме . [26] При изучении этого явления наблюдаемые состояния из подмножества показаны красным. Поэтому можно спросить, какова вероятность наблюдения состояния в определенном положении красного подмножества; если такая вероятность существует, она называется вероятностной мерой системы. [27] [25]
Этот вид сложной поддержки довольно часто встречается в динамических системах . Непросто установить, что система имеет вероятностную меру, и основная проблема заключается в следующем. Пусть будут моментами времени и подмножеством поддержки; если вероятностная мера существует для системы, можно было бы ожидать, что частота наблюдения состояний внутри множества будет равна в интервале и , чего может и не произойти; например, она может колебаться подобно синусу, , предел которого при не сходится. Формально мера существует только в том случае, если предел относительной частоты сходится, когда система наблюдается в бесконечном будущем. [28] Раздел динамических систем, который изучает существование вероятностной меры, — это эргодическая теория .
Обратите внимание, что даже в этих случаях распределение вероятностей, если оно существует, все равно можно назвать «абсолютно непрерывным» или «дискретным» в зависимости от того, является ли носитель несчетным или счетным соответственно.
Большинство алгоритмов основаны на генераторе псевдослучайных чисел , который производит числа , равномерно распределенные в полуоткрытом интервале [0, 1) . Эти случайные переменные затем преобразуются с помощью некоторого алгоритма для создания новой случайной переменной, имеющей требуемое распределение вероятностей. С этим источником равномерной псевдослучайности можно сгенерировать реализации любой случайной величины. [29]
Например, предположим, что имеет равномерное распределение между 0 и 1. Чтобы построить случайную переменную Бернулли для некоторого , мы определяем так, что
Эта случайная величина X имеет распределение Бернулли с параметром . [29] Это преобразование дискретной случайной величины.
Для функции распределения абсолютно непрерывной случайной величины необходимо построить абсолютно непрерывную случайную величину. , обратная функция , относится к равномерной величине :
Например, предположим, что необходимо построить случайную величину, имеющую экспоненциальное распределение.
так и если имеет распределение, то случайная величина определяется как . Это имеет экспоненциальное распределение . [29]
Частой проблемой статистического моделирования ( метод Монте-Карло ) является генерация псевдослучайных чисел , распределенных заданным образом.
Концепция распределения вероятностей и случайных величин, которые они описывают, лежит в основе математической дисциплины теории вероятностей и науки статистики. Существует разброс или изменчивость почти любой величины, которая может быть измерена в популяции (например, рост людей, прочность металла, рост продаж, транспортный поток и т. д.); почти все измерения производятся с некоторой внутренней ошибкой; в физике многие процессы описываются вероятностно, от кинетических свойств газов до квантово-механического описания фундаментальных частиц . По этим и многим другим причинам простые числа часто неадекватны для описания величины, в то время как распределения вероятностей часто более уместны.
Ниже приведен список некоторых наиболее распространенных распределений вероятностей, сгруппированных по типу процесса, с которым они связаны. Для более полного списка см. список распределений вероятностей , который группируется по характеру рассматриваемого результата (дискретный, абсолютно непрерывный, многомерный и т. д.)
Все одномерные распределения ниже имеют один пик; то есть предполагается, что значения группируются вокруг одной точки. На практике фактически наблюдаемые величины могут группироваться вокруг нескольких значений. Такие величины можно моделировать с помощью смешанного распределения .
Подгонка распределения вероятностей или просто подгонка распределения — это подгонка распределения вероятностей к ряду данных, касающихся повторных измерений переменного явления. Цель подгонки распределения — предсказать вероятность или прогнозировать частоту появления величины явления в определенном интервале.
Существует множество распределений вероятностей (см. список распределений вероятностей ), некоторые из которых могут быть более точно подобраны к наблюдаемой частоте данных, чем другие, в зависимости от характеристик явления и распределения. Распределение, дающее близкое соответствие, должно приводить к хорошим прогнозам.
Поэтому при подгонке распределения необходимо выбрать распределение, которое хорошо соответствует данным.{{cite book}}
: CS1 maint: numeric names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: location missing publisher (link){{cite book}}
: CS1 maint: location missing publisher (link)