stringtranslate.com

Распределение Пирсона

Диаграмма системы Пирсона, показывающая распределения типов I, III, VI, V и IV с точки зрения β 1 (квадратичная асимметрия) и β 2 (традиционный эксцесс)

Распределение Пирсона — это семейство непрерывных распределений вероятностей . Впервые она была опубликована Карлом Пирсоном в 1895 году и впоследствии расширена им в 1901 и 1916 годах в серии статей по биостатистике .

История

Система Пирсона изначально была разработана для моделирования заметно искаженных наблюдений. В то время было хорошо известно, как настроить теоретическую модель так, чтобы она соответствовала первым двум кумулянтам или моментам наблюдаемых данных: любое распределение вероятностей можно напрямую расширить, чтобы сформировать семейство в масштабе местоположения . За исключением патологических случаев, семейство в масштабе местоположения может быть построено так, чтобы оно сколь угодно хорошо соответствовало наблюдаемому среднему значению (первый кумулянт) и дисперсии (второй кумулянт). Однако не было известно, как построить распределения вероятностей, в которых асимметрия (стандартизованный третий кумулянт) и эксцесс (стандартизованный четвертый кумулянт) могли бы регулироваться одинаково свободно. Эта необходимость стала очевидной при попытке подогнать известные теоретические модели к наблюдаемым данным, которые демонстрировали асимметрию. Примеры Пирсона включают данные о выживаемости, которые обычно асимметричны.

В своей оригинальной статье Пирсон (1895, стр. 360) выделил четыре типа распределений (с номерами от I до IV) в дополнение к нормальному распределению (которое первоначально было известно как тип V). Классификация зависела от того, поддерживались ли распределения на ограниченном интервале, на полупрямой или на всей действительной линии ; и были ли они потенциально перекошенными или обязательно симметричными. Вторая статья (Пирсон, 1901) исправила два упущения: она переопределила распределение типа V (первоначально просто нормальное распределение , но теперь распределение обратного гамма-распределения ) и ввела распределение типа VI. Вместе первые две статьи охватывают пять основных типов системы Пирсона (I, III, IV, V и VI). В третьей статье Пирсон (1916) представил дополнительные частные случаи и подтипы (с VII по XII).

Ринд (1909, стр. 430–432) разработал простой способ визуализации пространства параметров системы Пирсона, который впоследствии был принят Пирсоном (1916, табл. 1 и стр. 430 и след., 448 и далее). Типы Пирсона характеризуются двумя величинами, обычно называемыми β 1 и β 2 . Первый — это квадрат асимметрии : β 1 = γ 1 , где γ 1 — асимметрия, или третий стандартизированный момент . Второй — традиционный эксцесс , или четвертый стандартизированный момент: β 2 = γ 2 + 3. (Современные методы определяют эксцесс γ 2 в терминах кумулянтов, а не моментов, так что для нормального распределения мы имеем γ 2 = 0 и β 2 = 3. Здесь мы следуем историческому прецеденту и используем β 2 .) Диаграмма справа показывает, какому типу Пирсона принадлежит данное конкретное распределение (обозначаемое точкой (β 1 , β 2 )).

Многие из асимметричных и/или немезокуртических распределений , знакомых нам сегодня, были еще неизвестны в начале 1890-х годов. То, что сейчас известно как бета-распределение, использовалось Томасом Байесом в качестве апостериорного распределения параметра распределения Бернулли в его работе 1763 года по обратной вероятности . Бета-распределение получило известность благодаря своему членству в системе Пирсона и до 1940-х годов было известно как распределение Пирсона типа I. [1] (Распределение Пирсона типа II является частным случаем типа I, но обычно больше не выделяется.) Гамма- распределение возникло из работ Пирсона (Пирсон 1893, стр. 331; Пирсон 1895, стр. 357, 360, 373). –376) и был известен как распределение Пирсона типа III, прежде чем получил свое современное название в 1930-х и 1940-х годах. [2] В статье Пирсона 1895 года было представлено распределение типа IV, которое содержит t -распределение Стьюдента как особый случай, на несколько лет предшествовавшее последующему использованию Уильямом Сили Госсетом . В его статье 1901 года были представлены обратное гамма-распределение (тип V) и бета-распределение (тип VI).

Определение

Плотность Пирсона p определяется как любое допустимое решение дифференциального уравнения (ср. Pearson 1895, стр. 381).

с:

Согласно Орду, [3] Пирсон разработал основную форму уравнения (1) на основе, во-первых, формулы для производной логарифма функции плотности нормального распределения (которая дает линейную функцию) и, во-вторых, , из рекуррентного соотношения для значений функции массы вероятности гипергеометрического распределения (что дает структуру с линейным делением на квадратичную).

В уравнении (1) параметр a определяет стационарную точку и, следовательно, при некоторых условиях режим распределения, поскольку

следует непосредственно из дифференциального уравнения.

Поскольку мы имеем дело с линейным дифференциальным уравнением первого порядка с переменными коэффициентами , то его решение несложно:

Интеграл в этом решении значительно упрощается, если рассматривать некоторые частные случаи подынтегрального выражения. Пирсон (1895, с. 367) выделил два основных случая, определяемых знаком дискриминанта ( а значит, и числом вещественных корней ) квадратичной функции

Отдельные виды распределения

Случай 1, отрицательный дискриминант

Распределение Пирсона типа IV

Если дискриминант квадратичной функции (2) отрицателен ( ), то она не имеет действительных корней. Затем определите

Обратите внимание, что α — вполне определенное действительное число и α ≠ 0 , поскольку по предположению и, следовательно, b 2 ≠ 0 . Применяя эти замены, квадратичная функция (2) преобразуется в

Отсутствие действительных корней очевидно из этой формулировки, поскольку α 2 обязательно положителен.

Теперь выразим решение дифференциального уравнения (1) как функцию y :

Пирсон (1895, стр. 362) назвал это «тригонометрическим случаем», потому что интеграл

включает обратную тригонометрическую функцию Арктанса. Затем

Наконец, позвольте

Применяя эти замены, получаем параметрическую функцию:

Эта ненормированная плотность имеет поддержку на всей вещественной прямой . Это зависит от параметра масштаба α > 0 и параметров формы m > 1/2 и  ν . Один параметр был потерян, когда мы решили найти решение дифференциального уравнения (1) как функцию y , а не x . Поэтому мы вновь вводим четвертый параметр, а именно параметр местоположения λ . Таким образом, мы получили плотность распределения Пирсона типа IV :

Нормализующая константа включает в себя комплексную гамма-функцию (Γ) и бета-функцию  (B). Обратите внимание, что параметр местоположения λ здесь не совпадает с исходным параметром местоположения, введенным в общую формулировку, а связан через

Распределение Пирсона типа VII

График плотности Пирсона типа VII с λ = 0, σ = 1 и: γ 2 = ∞ (красный); γ 2 = 4 (синий); и γ 2 = 0 (черный)

Параметр формы ν распределения Пирсона типа IV контролирует его асимметрию . Если мы зафиксируем его значение равным нулю, мы получим симметричное трехпараметрическое семейство. Этот особый случай известен как распределение Пирсона типа VII (ср. Pearson 1916, стр. 450). Его плотность

где B — бета-функция .

Альтернативная параметризация (и небольшая специализация) распределения типа VII получается, если положить

для чего требуется m > 3/2. Это влечет за собой незначительную потерю общности, но гарантирует, что дисперсия распределения существует и равна σ 2 . Теперь параметр m контролирует только эксцесс распределения. Если m приближается к бесконечности, поскольку λ и σ остаются постоянными, нормальное распределение возникает как особый случай:

Это плотность нормального распределения со средним значением λ и стандартным отклонением σ .

Удобно потребовать, чтобы m > 5/2, и положить

Это еще одна специализация, и она гарантирует существование первых четырех моментов распределения. Более конкретно, распределение Пирсона типа VII, параметризованное в терминах (λ, σ, γ 2 ), имеет среднее значение λ , стандартное отклонение σ , асимметрию, равную нулю, и положительный избыточный эксцесс γ 2 .

t -распределение Стьюдента

Распределение Пирсона типа VII эквивалентно нестандартизованному t -распределению Стьюдента с параметрами ν > 0, µ, σ 2 путем применения следующих замен к его исходной параметризации:

Обратите внимание, что ограничение m > 1/2 выполнено.

Результирующая плотность

которую легко узнать как плотность t -распределения Стьюдента .

Это означает, что распределение Пирсона типа VII включает в себя стандартное t -распределение Стьюдента , а также стандартное распределение Коши . В частности, стандартное t -распределение Стьюдента возникает как подслучай, когда µ = 0 и σ 2 = 1, что эквивалентно следующим заменам:

Плотность этого ограниченного однопараметрического семейства представляет собой стандартный t Стьюдента :

Случай 2, неотрицательный дискриминант

Если квадратичная функция (2) имеет неотрицательный дискриминант ( ), она имеет действительные корни a 1 и a 2 (не обязательно различные):

При наличии действительных корней квадратичная функция (2) может быть записана в виде

и поэтому решение дифференциального уравнения есть

Пирсон (1895, стр. 362) назвал это «логарифмическим случаем», потому что интеграл

включает только функцию логарифма , а не функцию арктанса, как в предыдущем случае.

Используя замену

получим следующее решение дифференциального уравнения (1):

Поскольку эта плотность известна только с точностью до скрытой константы пропорциональности, эту константу можно изменить и записать плотность следующим образом:

Распределение Пирсона типа I

Распределение Пирсона типа I (обобщение бета-распределения ) возникает, когда корни квадратного уравнения (2) имеют противоположные знаки, т. е. . Тогда решение p поддерживается на интервале . Примените замену

где , что дает решение в терминах y , поддерживаемое на интервале (0, 1):

Можно определить:

Перегруппировав константы и параметры, это упрощается до:

Таким образом следует a с . Оказывается, что m 1 , m 2 > −1 необходимо и достаточно для того, чтобы p была правильной функцией плотности вероятности.

Распределение Пирсона типа II

Распределение Пирсона типа II является частным случаем семейства Пирсона типа I, ограниченным симметричными распределениями.

Для кривой Пирсона типа II [4]

где

Ордината y — это частота . Кривая Пирсона типа II используется при расчете таблицы значимых коэффициентов корреляции для коэффициента ранговой корреляции Спирмена, когда количество элементов в серии меньше 100 (или 30, в зависимости от некоторых источников). После этого распределение имитирует стандартное t-распределение Стьюдента . В таблице значений определенные значения используются в качестве констант в предыдущем уравнении:

Используемые моменты x равны

Распределение Пирсона типа III

Определение

является . Распределение Пирсона типа III представляет собой гамма-распределение или распределение хи-квадрат .

Распределение Пирсона типа V

Определение новых параметров:

следует за . Распределение Пирсона типа V является обратным гамма-распределением .

Распределение Пирсона типа VI

Определение

следует за . Распределение Пирсона типа VI представляет собой бета-распределение простых чисел или F -распределение .

Связь с другими дистрибутивами

Семейство Пирсонов включает, среди прочего, следующие распределения:

Альтернативой системе распределений Пирсона с целью подбора распределений к данным являются распределения с параметрами квантилей (QPD) и металогические распределения . QPD и металоги могут обеспечить большую гибкость формы и границ, чем система Пирсона. Вместо подбора моментов QPD обычно соответствуют эмпирическим CDF или другим данным с помощью линейного метода наименьших квадратов .

Приложения

Эти модели используются на финансовых рынках, поскольку их можно параметризовать таким образом, чтобы это имело интуитивное значение для рыночных трейдеров. В настоящее время используется ряд моделей, которые отражают стохастический характер волатильности ставок, акций и т. д. [ какие? ] [ нужна ссылка ] и это семейство дистрибутивов может оказаться одним из наиболее важных.

В Соединенных Штатах Log-Pearson III является распределением по умолчанию для анализа частоты наводнений. [5]

Недавно были разработаны альтернативы распределениям Пирсона, которые более гибкие и их легче адаптировать к данным. См. дистрибутивы металогов .

Примечания

  1. ^ Миллер, Джефф; и другие. (9 июля 2006 г.). «Бета-распределение». Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
  2. ^ Миллер, Джефф; и другие. (07.12.2006). «Гамма-распределение». Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
  3. ^ Орд Дж.К. (1972) с. 2
  4. ^ Рэмси, Филип Х. (1 сентября 1989 г.). «Критические значения для корреляции рангов Спирмена». Журнал образовательной статистики . 14 (3): 245–253. JSTOR  1165017.
  5. ^ «Руководство по определению частоты паводковых потоков» (PDF) . Геологическая служба США по воде . Март 1982 года . Проверено 14 июня 2019 г.

Источники

Основные источники

Вторичные источники

Рекомендации