Система Пирсона изначально была разработана для моделирования заметно искаженных наблюдений. В то время было хорошо известно, как настроить теоретическую модель так, чтобы она соответствовала первым двум кумулянтам или моментам наблюдаемых данных: любое распределение вероятностей можно напрямую расширить, чтобы сформировать семейство в масштабе местоположения . За исключением патологических случаев, семейство в масштабе местоположения может быть построено так, чтобы оно сколь угодно хорошо соответствовало наблюдаемому среднему значению (первый кумулянт) и дисперсии (второй кумулянт). Однако не было известно, как построить распределения вероятностей, в которых асимметрия (стандартизованный третий кумулянт) и эксцесс (стандартизованный четвертый кумулянт) могли бы регулироваться одинаково свободно. Эта необходимость стала очевидной при попытке подогнать известные теоретические модели к наблюдаемым данным, которые демонстрировали асимметрию. Примеры Пирсона включают данные о выживаемости, которые обычно асимметричны.
В своей оригинальной статье Пирсон (1895, стр. 360) выделил четыре типа распределений (с номерами от I до IV) в дополнение к нормальному распределению (которое первоначально было известно как тип V). Классификация зависела от того, поддерживались ли распределения на ограниченном интервале, на полупрямой или на всей действительной линии ; и были ли они потенциально перекошенными или обязательно симметричными. Вторая статья (Пирсон, 1901) исправила два упущения: она переопределила распределение типа V (первоначально просто нормальное распределение , но теперь распределение обратного гамма-распределения ) и ввела распределение типа VI. Вместе первые две статьи охватывают пять основных типов системы Пирсона (I, III, IV, V и VI). В третьей статье Пирсон (1916) представил дополнительные частные случаи и подтипы (с VII по XII).
Ринд (1909, стр. 430–432) разработал простой способ визуализации пространства параметров системы Пирсона, который впоследствии был принят Пирсоном (1916, табл. 1 и стр. 430 и след., 448 и далее). Типы Пирсона характеризуются двумя величинами, обычно называемыми β 1 и β 2 . Первый — это квадрат асимметрии : β 1 = γ 1 , где γ 1 — асимметрия, или третий стандартизированный момент . Второй — традиционный эксцесс , или четвертый стандартизированный момент: β 2 = γ 2 + 3. (Современные методы определяют эксцесс γ 2 в терминах кумулянтов, а не моментов, так что для нормального распределения мы имеем γ 2 = 0 и β 2 = 3. Здесь мы следуем историческому прецеденту и используем β 2 .) Диаграмма справа показывает, какому типу Пирсона принадлежит данное конкретное распределение (обозначаемое точкой (β 1 , β 2 )).
Многие из асимметричных и/или немезокуртических распределений , знакомых нам сегодня, были еще неизвестны в начале 1890-х годов. То, что сейчас известно как бета-распределение, использовалось Томасом Байесом в качестве апостериорного распределения параметра распределения Бернулли в его работе 1763 года по обратной вероятности . Бета-распределение получило известность благодаря своему членству в системе Пирсона и до 1940-х годов было известно как распределение Пирсона типа I. [1] (Распределение Пирсона типа II является частным случаем типа I, но обычно больше не выделяется.) Гамма- распределение возникло из работ Пирсона (Пирсон 1893, стр. 331; Пирсон 1895, стр. 357, 360, 373). –376) и был известен как распределение Пирсона типа III, прежде чем получил свое современное название в 1930-х и 1940-х годах. [2] В статье Пирсона 1895 года было представлено распределение типа IV, которое содержит t -распределение Стьюдента как особый случай, на несколько лет предшествовавшее последующему использованию Уильямом Сили Госсетом . В его статье 1901 года были представлены обратное гамма-распределение (тип V) и бета-распределение (тип VI).
Определение
Плотность Пирсона p определяется как любое допустимое решение дифференциального уравнения (ср. Pearson 1895, стр. 381).
с:
Согласно Орду, [3] Пирсон разработал основную форму уравнения (1) на основе, во-первых, формулы для производной логарифма функции плотности нормального распределения (которая дает линейную функцию) и, во-вторых, , из рекуррентного соотношения для значений функции массы вероятности гипергеометрического распределения (что дает структуру с линейным делением на квадратичную).
В уравнении (1) параметр a определяет стационарную точку и, следовательно, при некоторых условиях режим распределения, поскольку
следует непосредственно из дифференциального уравнения.
Интеграл в этом решении значительно упрощается, если рассматривать некоторые частные случаи подынтегрального выражения. Пирсон (1895, с. 367) выделил два основных случая, определяемых знаком дискриминанта ( а значит, и числом вещественных корней ) квадратичной функции
Отдельные виды распределения
Случай 1, отрицательный дискриминант
Распределение Пирсона типа IV
Если дискриминант квадратичной функции (2) отрицателен ( ), то она не имеет действительных корней. Затем определите
Обратите внимание, что α — вполне определенное действительное число и α ≠ 0 , поскольку по предположению и, следовательно, b 2 ≠ 0 . Применяя эти замены, квадратичная функция (2) преобразуется в
Отсутствие действительных корней очевидно из этой формулировки, поскольку α 2 обязательно положителен.
Теперь выразим решение дифференциального уравнения (1) как функцию y :
Пирсон (1895, стр. 362) назвал это «тригонометрическим случаем», потому что интеграл
Применяя эти замены, получаем параметрическую функцию:
Эта ненормированная плотность имеет поддержку на всей вещественной прямой . Это зависит от параметра масштаба α > 0 и параметров формы m > 1/2 и ν . Один параметр был потерян, когда мы решили найти решение дифференциального уравнения (1) как функцию y , а не x . Поэтому мы вновь вводим четвертый параметр, а именно параметр местоположения λ . Таким образом, мы получили плотность распределения Пирсона типа IV :
Параметр формы ν распределения Пирсона типа IV контролирует его асимметрию . Если мы зафиксируем его значение равным нулю, мы получим симметричное трехпараметрическое семейство. Этот особый случай известен как распределение Пирсона типа VII (ср. Pearson 1916, стр. 450). Его плотность
Альтернативная параметризация (и небольшая специализация) распределения типа VII получается, если положить
для чего требуется m > 3/2. Это влечет за собой незначительную потерю общности, но гарантирует, что дисперсия распределения существует и равна σ 2 . Теперь параметр m контролирует только эксцесс распределения. Если m приближается к бесконечности, поскольку λ и σ остаются постоянными, нормальное распределение возникает как особый случай:
Это плотность нормального распределения со средним значением λ и стандартным отклонением σ .
Удобно потребовать, чтобы m > 5/2, и положить
Это еще одна специализация, и она гарантирует существование первых четырех моментов распределения. Более конкретно, распределение Пирсона типа VII, параметризованное в терминах (λ, σ, γ 2 ), имеет среднее значение λ , стандартное отклонение σ , асимметрию, равную нулю, и положительный избыточный эксцесс γ 2 .
t -распределение Стьюдента
Распределение Пирсона типа VII эквивалентно нестандартизованному t -распределению Стьюдента с параметрами ν > 0, µ, σ 2 путем применения следующих замен к его исходной параметризации:
Обратите внимание, что ограничение m > 1/2 выполнено.
Результирующая плотность
которую легко узнать как плотность t -распределения Стьюдента .
Это означает, что распределение Пирсона типа VII включает в себя стандартное t -распределение Стьюдента , а также стандартное распределение Коши . В частности, стандартное t -распределение Стьюдента возникает как подслучай, когда µ = 0 и σ 2 = 1, что эквивалентно следующим заменам:
Плотность этого ограниченного однопараметрического семейства представляет собой стандартный t Стьюдента :
Случай 2, неотрицательный дискриминант
Если квадратичная функция (2) имеет неотрицательный дискриминант ( ), она имеет действительные корни a 1 и a 2 (не обязательно различные):
При наличии действительных корней квадратичная функция (2) может быть записана в виде
и поэтому решение дифференциального уравнения есть
Пирсон (1895, стр. 362) назвал это «логарифмическим случаем», потому что интеграл
включает только функцию логарифма , а не функцию арктанса, как в предыдущем случае.
Используя замену
получим следующее решение дифференциального уравнения (1):
Поскольку эта плотность известна только с точностью до скрытой константы пропорциональности, эту константу можно изменить и записать плотность следующим образом:
Распределение Пирсона типа I
Распределение Пирсона типа I (обобщение бета-распределения ) возникает, когда корни квадратного уравнения (2) имеют противоположные знаки, т. е. . Тогда решение p поддерживается на интервале . Примените замену
где , что дает решение в терминах y , поддерживаемое на интервале (0, 1):
Можно определить:
Перегруппировав константы и параметры, это упрощается до:
Таким образом следует a с . Оказывается, что m 1 , m 2 > −1 необходимо и достаточно для того, чтобы p была правильной функцией плотности вероятности.
Распределение Пирсона типа II
Распределение Пирсона типа II является частным случаем семейства Пирсона типа I, ограниченным симметричными распределениями.
Для кривой Пирсона типа II [4]
где
Ордината y — это частота . Кривая Пирсона типа II используется при расчете таблицы значимых коэффициентов корреляции для коэффициента ранговой корреляции Спирмена, когда количество элементов в серии меньше 100 (или 30, в зависимости от некоторых источников). После этого распределение имитирует стандартное t-распределение Стьюдента . В таблице значений определенные значения используются в качестве констант в предыдущем уравнении:
Эти модели используются на финансовых рынках, поскольку их можно параметризовать таким образом, чтобы это имело интуитивное значение для рыночных трейдеров. В настоящее время используется ряд моделей, которые отражают стохастический характер волатильности ставок, акций и т. д. [ какие? ] [ нужна ссылка ] и это семейство дистрибутивов может оказаться одним из наиболее важных.
В Соединенных Штатах Log-Pearson III является распределением по умолчанию для анализа частоты наводнений. [5]
Недавно были разработаны альтернативы распределениям Пирсона, которые более гибкие и их легче адаптировать к данным. См. дистрибутивы металогов .
Примечания
^ Миллер, Джефф; и другие. (9 июля 2006 г.). «Бета-распределение». Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
^ Миллер, Джефф; и другие. (07.12.2006). «Гамма-распределение». Самые ранние известные варианты использования некоторых математических слов . Проверено 9 декабря 2006 г.
^ Орд Дж.К. (1972) с. 2
^ Рэмси, Филип Х. (1 сентября 1989 г.). «Критические значения для корреляции рангов Спирмена». Журнал образовательной статистики . 14 (3): 245–253. JSTOR 1165017.
^ «Руководство по определению частоты паводковых потоков» (PDF) . Геологическая служба США по воде . Март 1982 года . Проверено 14 июня 2019 г.
Источники
Основные источники
Пирсон, Карл (1893). «Вклад в математическую теорию эволюции [аннотация]». Труды Королевского общества . 54 (326–330): 329–333. дои : 10.1098/rspl.1893.0079 . JSTOR 115538.
Пирсон, Карл (1895). «Вклад в математическую теорию эволюции, II: Асимметрия в однородном материале» (PDF) . Философские труды Королевского общества . 186 : 343–414. Бибкод : 1895RSPTA.186..343P. дои : 10.1098/rsta.1895.0010 . JSTOR 90649.
Пирсон, Карл (1901). «Математический вклад в теорию эволюции, X: Дополнение к мемуарам о асимметрии». Философские труды Королевского общества А. 197 (287–299): 443–459. Бибкод : 1901RSPTA.197..443P. дои : 10.1098/rsta.1901.0023 . JSTOR 90841.
Пирсон, Карл (1916). «Математический вклад в теорию эволюции, XIX: Второе приложение к мемуарам о асимметрии». Философские труды Королевского общества А. 216 (538–548): 429–457. Бибкод : 1916RSPTA.216..429P. дои : 10.1098/rsta.1916.0009 . JSTOR 91092.
Ринд, А. (июль – октябрь 1909 г.). «Таблицы для облегчения расчета вероятных ошибок главных констант асимметричных распределений частот». Биометрика . 7 (1/2): 127–147. дои : 10.1093/biomet/7.1-2.127. JSTOR 2345367.