Формализованное Джоном Тьюки , лямбда-распределение Тьюки представляет собой непрерывное, симметричное распределение вероятностей, определяемое в терминах его квантильной функции . Обычно оно используется для определения подходящего распределения (см. комментарии ниже) и не используется в статистических моделях напрямую.
Лямбда-распределение Тьюки имеет единственный параметр формы , λ , и, как и другие распределения вероятностей, его можно преобразовать с помощью параметра местоположения , μ , и параметра масштаба , σ . Поскольку общая форма распределения вероятностей может быть выражена в терминах стандартного распределения, последующие формулы приведены для стандартной формы функции.
Для стандартной формы лямбда-распределения Тьюки функция квантиля (т.е. обратная функция к кумулятивной функции распределения ) и функция плотности квантиля имеют вид
Для большинства значений параметра формы λ функция плотности вероятности (PDF) и кумулятивная функция распределения (CDF) должны быть вычислены численно. Лямбда-распределение Тьюки имеет простую, замкнутую форму для CDF и/или PDF только для нескольких исключительных значений параметра формы, например: λ ∈ { 2, 1, 1 /2 , 0 } (см. равномерное распределение [случаи λ = 1 и λ = 2 ] и логистическое распределение [случай λ = 0 ].
Однако для любого значения λ как CDF, так и PDF можно табулировать для любого числа кумулятивных вероятностей p , используя функцию квантиля Q для вычисления значения x для каждой кумулятивной вероятности p , с плотностью вероятности, заданной как 1/д , обратная величина функции плотности квантиля. Как это обычно бывает со статистическими распределениями, лямбда-распределение Тьюки можно легко использовать, найдя значения в подготовленной таблице.
Распределение лямбда Тьюки симметрично относительно нуля, поэтому ожидаемое значение этого распределения, если оно существует, равно нулю. Дисперсия существует для λ > − 1 /2 ,и за исключением случая, когда λ = 0,определяется формулой
В более общем случае момент n -го порядка конечен, когда λ > −1 /н и выражается (за исключением случая, когда λ = 0 )черезбета-функцию Β ( x , y ) :
В силу симметрии функции плотности все моменты нечетных порядков, если они существуют, равны нулю.
В отличие от центральных моментов, L-моменты могут быть выражены в замкнутой форме. Для L -го момента, определяется как [3]
Первые шесть L-моментов можно представить следующим образом: [3]
Лямбда-распределение Тьюки на самом деле является семейством распределений, которые могут аппроксимировать ряд общих распределений. Например,
Наиболее распространенное использование этого распределения — создание графика Tukey lambda PPCC набора данных . На основе значения λ с наилучшей корреляцией, как показано на графике PPCC , предлагается подходящая модель для данных. Например, если наилучшее соответствие кривой данным происходит для значения λ, равного или близкого к 0,14 , то эмпирически данные могут быть хорошо смоделированы с помощью нормального распределения. Значения λ менее 0,14 предполагают распределение с более тяжелым хвостом.
Миля при λ = 0 ( логистическая ) будет указывать на довольно толстые хвосты, с экстремальным пределом при λ = −1 , приближая версии Коши и малой выборки Стьюдента t . То есть, поскольку наилучшее значение λ меняется от тонких хвостов при 0,14 к толстым хвостам −1 , предлагается колоколообразная PDF с все более тяжелыми хвостами. Аналогично, оптимальное значение подгонки кривой λ больше 0,14 предполагает распределение с исключительно тонкими хвостами (исходя из точки зрения, что нормальное распределение само по себе имеет тонкий хвост с самого начала; экспоненциальное распределение часто выбирается в качестве примера хвостов, промежуточных между толстыми и тонкими).
За исключением значений λ, приближающихся к 0 и ниже, все обсуждаемые функции PDF имеют конечный носитель , между −1 /| λ | и +1 /| λ | .
Поскольку распределение лямбда Тьюки является симметричным распределением, использование графика лямбда Тьюки PPCC для определения разумного распределения для моделирования данных применимо только к симметричным распределениям. Гистограмма данных должна предоставить доказательства того, могут ли данные быть разумно смоделированы с симметричным распределением. [4]
В статье использованы материалы, являющиеся общественным достоянием Национального института стандартов и технологий.