Критерий К-квадрата Д'Агостино

В статистике тест Д'Агостино К ² , названный в честь Ральфа Д'Агостино , является мерой согласия с отклонением от нормальности , то есть тест направлен на оценку совместимости данных с нулевой гипотезой о том, что данные являются реализация независимых, одинаково распределенных гауссовских случайных величин. Тест основан на преобразованиях выборочного эксцесса и асимметрии и имеет силу только против альтернатив, согласно которым распределение является асимметричным и/или куртовым.

Асимметрия и эксцесс

Далее { x _i } обозначает выборку из n наблюдений, g ₁ и g _{2 —}асимметрия и эксцесс выборки , m _j — центральные моменты j -й выборки , а — выборочное среднее значение . Часто в литературе, посвященной проверке нормальности , асимметрия и эксцесс обозначаются как √ β ₁ и β ₂ соответственно. Такие обозначения могут быть неудобны, поскольку, например, √ β ₁ может быть отрицательной величиной. ${\bar {x}}$

Асимметрия выборки и эксцесс определяются как

{\begin{aligned}&g_{1}={\frac {m_{3}}{m_{2}^{3/2}}}={\frac {{\frac {1}{n} }\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{3}}{\left({\frac {1}{n}} \sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}\right)^{3/2}}}\ ,\\&g_ {2}={\frac {m_{4}}{m_{2}^{2}}}-3={\frac {{\frac {1}{n}}\sum _{i=1}^ {n}\left(x_{i}-{\bar {x}}\right)^{4}}{\left({\frac {1}{n}}\sum _{i=1}^{ n}\left(x_{i}-{\bar {x}}\right)^{2}\right)^{2}}}-3\ .\end{aligned}}

Эти величины последовательно оценивают теоретическую асимметрию и эксцесс распределения соответственно. Более того, если выборка действительно происходит из нормальной генеральной совокупности, то точные конечные выборочные распределения асимметрии и эксцесса сами по себе могут быть проанализированы с точки зрения их средних значений μ ₁ , дисперсий μ ₂ , асимметрии γ ₁ и эксцесса γ ₂ . Это было сделано Пирсоном (1931), который вывел следующие выражения: ^{[ нужен лучший источник ]}

{\begin{aligned}&\mu _{1}(g_{1})=0,\\&\mu _{2}(g_{1})={\frac {6(n-2) )}{(n+1)(n+3)}},\\&\gamma _{1}(g_{1})\equiv {\frac {\mu _{3}(g_{1})} {\mu _{2}(g_{1})^{3/2}}}=0,\\&\gamma _{2}(g_{1})\equiv {\frac {\mu _{4 }(g_{1})}{\mu _{2}(g_{1})^{2}}}-3={\frac {36(n-7)(n^{2}+2n-5 )}{(n-2)(n+5)(n+7)(n+9)}}.\end{aligned}}

{\begin{aligned}&\mu _{1}(g_{2})=- {\frac {6}{n+1}},\\&\mu _{2}(g_{2) })={\frac {24n(n-2)(n-3)}{(n+1)^{2}(n+3)(n+5)}},\\&\gamma _{1 }(g_{2})\equiv {\frac {\mu _{3}(g_{2})}{\mu _{2}(g_{2})^{3/2}}}={\ frac {6(n^{2}-5n+2)}{(n+7)(n+9)}}{\sqrt {\frac {6(n+3)(n+5)}{n( n-2)(n-3)}}},\\&\gamma _{2}(g_{2})\equiv {\frac {\mu _{4}(g_{2})}{\mu _{2}(g_{2})^{2}}}-3={\frac {36(15n^{6}-36n^{5}-628n^{4}+982n^{3}+5777n ^{2}-6402n+900)}{n(n-3)(n-2)(n+7)(n+9)(n+11)(n+13)}}.\end{aligned} }

Например, можно ожидать, что выборка размером n = 1000 , взятая из нормально распределенной совокупности, будет иметь асимметрию 0, SD 0,08 и эксцесс 0, SD 0,15 , где SD указывает на стандартное отклонение. ^{[ нужна цитата ]}

Преобразованная асимметрия выборки и эксцесс

Асимметрия выборки g ₁ и эксцесс g ₂ асимптотически нормальны. Однако скорость их сходимости к пределу распределения удручающе мала, особенно для g ₂ . Например, даже при n = 5000 наблюдений выборочный эксцесс g ₂ имеет как асимметрию, так и эксцесс примерно 0,3, что немаловажно. Чтобы исправить эту ситуацию, было предложено преобразовать величины g ₁ и g ₂ таким образом, чтобы их распределение было максимально близко к стандартному нормальному.

В частности, Д'Агостино и Пирсон (1973) предложили следующее преобразование асимметрии выборки:

Z_{1}(g_{1})=\delta \operatorname {asinh} \left({\frac {g_{1}}{\alpha {\sqrt {\mu _{2}}}}} \верно),

где константы α и δ вычисляются как

{\begin{aligned}&W^{2}={\sqrt {2\gamma _{2}+4}}-1,\\&\delta =1/{\sqrt {\ln W}},\\&\alpha ^{2}=2/(W^{2}-1),\end{aligned}}

и где μ ₂ = μ ₂ ( g ₁ ) — дисперсия g ₁ , а γ ₂ = γ ₂ ( g ₁ ) — эксцесс — выражения, приведенные в предыдущем разделе.

Аналогичным образом, Анскомб и Глинн (1983) предложили преобразование для g ₂ , которое достаточно хорошо работает для размеров выборки 20 и более:

Z_{2}(g_{2})={\sqrt {\frac {9A}{2}}}\left\{1-{\frac {2}{9A}}-\left({\frac {1-2/A}{1+{\frac {g_{2}-\mu _{1}}{\sqrt {\mu _{2}}}}{\sqrt {2/(A-4)}}}}\right)^{\!1/3}\right\},

где

A=6+{\frac {8}{\gamma _{1}}}\left({\frac {2}{\gamma _{1}}}+{\sqrt {1+4/\gamma _{1}^{2}}}\right),

и 1 = 1 ( г ₂ ), ₂= 2 ( г 2 ₎, 1 = 1 ₍ г 2 ₎_—_{величины}_,_{вычисленные} Пирсоном.

Статистика Омнибуса К 2

Статистики Z ₁ и Z ₂ можно объединить для получения комплексного теста, способного обнаружить отклонения от нормальности из-за асимметрии или эксцесса (Д'Агостино, Беланжер и Д'Агостино, 1990):

K^{2}=Z_{1}(g_{1})^{2}+Z_{2}(g_{2})^{2}\,

Если нулевая гипотеза нормальности верна, то К ² приблизительно х ² -распределен с 2 степенями свободы.

Обратите внимание, что статистики g ₁ , g ₂ не являются независимыми, а только некоррелированными. Следовательно, их преобразования Z ₁ , Z ₂ также будут зависимыми (Shenton & Bowman 1977), что ставит под сомнение достоверность аппроксимации χ ² . Моделирование показывает, что при нулевой гипотезе статистика теста K ² характеризуется

Критерий К-квадрата Д'Агостино

Асимметрия и эксцесс

Преобразованная асимметрия выборки и эксцесс

Статистика Омнибуса К 2

Смотрите также

Рекомендации