stringtranslate.com

Критерий К-квадрата Д'Агостино

В статистике тест Д'Агостино К 2 , названный в честь Ральфа Д'Агостино , является мерой согласия с отклонением от нормальности , то есть тест направлен на оценку совместимости данных с нулевой гипотезой о том, что данные являются реализация независимых, одинаково распределенных гауссовских случайных величин. Тест основан на преобразованиях выборочного эксцесса и асимметрии и имеет силу только против альтернатив, согласно которым распределение является асимметричным и/или куртовым.

Асимметрия и эксцесс

Далее {  x i  } обозначает выборку из n наблюдений, g 1 и g 2 — асимметрия и эксцесс выборки , m jцентральные моменты j -й выборки , а — выборочное среднее значение . Часто в литературе, посвященной проверке нормальности , асимметрия и эксцесс обозначаются как β 1 и β 2 соответственно. Такие обозначения могут быть неудобны, поскольку, например, β 1 может быть отрицательной величиной.

Асимметрия выборки и эксцесс определяются как

Эти величины последовательно оценивают теоретическую асимметрию и эксцесс распределения соответственно. Более того, если выборка действительно происходит из нормальной генеральной совокупности, то точные конечные выборочные распределения асимметрии и эксцесса сами по себе могут быть проанализированы с точки зрения их средних значений μ 1 , дисперсий μ 2 , асимметрии γ 1 и эксцесса γ 2 . Это было сделано Пирсоном (1931), который вывел следующие выражения: [ нужен лучший источник ]

и

Например, можно ожидать, что выборка размером n = 1000 , взятая из нормально распределенной совокупности, будет иметь асимметрию 0, SD 0,08 и эксцесс 0, SD 0,15 , где SD указывает на стандартное отклонение. [ нужна цитата ]

Преобразованная асимметрия выборки и эксцесс

Асимметрия выборки g 1 и эксцесс g 2 асимптотически нормальны. Однако скорость их сходимости к пределу распределения удручающе мала, особенно для g 2 . Например, даже при n = 5000 наблюдений выборочный эксцесс g 2 имеет как асимметрию, так и эксцесс примерно 0,3, что немаловажно. Чтобы исправить эту ситуацию, было предложено преобразовать величины g 1 и g 2 таким образом, чтобы их распределение было максимально близко к стандартному нормальному.

В частности, Д'Агостино и Пирсон (1973) предложили следующее преобразование асимметрии выборки:

где константы α и δ вычисляются как

и где μ 2 = μ 2 ( g 1 ) — дисперсия g 1 , а γ 2 = γ 2 ( g 1 ) — эксцесс — выражения, приведенные в предыдущем разделе.

Аналогичным образом, Анскомб и Глинн (1983) предложили преобразование для g 2 , которое достаточно хорошо работает для размеров выборки 20 и более:

где

и 1 = 1 ( г 2 ), 2 = 2 ( г 2 ) , 1 = 1 ( г 2 ) величины , вычисленные Пирсоном.

Статистика Омнибуса К 2

Статистики Z 1 и Z 2 можно объединить для получения комплексного теста, способного обнаружить отклонения от нормальности из-за асимметрии или эксцесса (Д'Агостино, Беланжер и Д'Агостино, 1990):

Если нулевая гипотеза нормальности верна, то К 2 приблизительно х 2 -распределен с 2 степенями свободы.

Обратите внимание, что статистики g 1 , g 2 не являются независимыми, а только некоррелированными. Следовательно, их преобразования Z 1 , Z 2 также будут зависимыми (Shenton & Bowman 1977), что ставит под сомнение достоверность аппроксимации χ 2 . Моделирование показывает, что при нулевой гипотезе статистика теста K 2 характеризуется

Смотрите также

Рекомендации