stringtranslate.com

Тест К-квадрат Д'Агостино

В статистике тест K2 Д'Агостино , названный в честь Ральфа Д'Агостино , является мерой соответствия отклонения от нормальности , то есть тест направлен на оценку совместимости заданных данных с нулевой гипотезой о том, что данные являются реализацией независимых, одинаково распределенных гауссовских случайных величин. Тест основан на преобразованиях выборочного эксцесса и асимметрии и имеет силу только против альтернатив, что распределение асимметрично и/или куртуазно.

Асимметрия и эксцесс

В дальнейшем {  x i  } обозначает выборку из n наблюдений, g 1 и g 2 — асимметрия и эксцесс выборки , m j 's — центральные моменты j -й выборки , а — среднее значение выборки . Часто в литературе, посвященной проверке на нормальность , асимметрия и эксцесс обозначаются как β 1 и β 2 соответственно. Такая запись может быть неудобной, поскольку, например, β 1 может быть отрицательной величиной.

Асимметрия и эксцесс выборки определяются как

Эти величины последовательно оценивают теоретическую асимметрию и эксцесс распределения соответственно. Более того, если выборка действительно происходит из нормальной популяции, то точные конечные выборочные распределения асимметрии и эксцесса сами могут быть проанализированы с точки зрения их средних значений μ 1 , дисперсий μ 2 , асимметрий γ 1 и эксцесса γ 2 . Это было сделано Пирсоном (1931), который вывел следующие выражения: [ требуется лучший источник ]

и

Например, можно ожидать, что выборка размером n = 1000, взятая из нормально распределенной популяции, будет иметь асимметрию 0, SD 0,08 и эксцесс 0, SD 0,15 , где SD указывает на стандартное отклонение. [ необходима ссылка ]

Трансформированная выборочная асимметрия и эксцесс

Асимметрия выборки g 1 и эксцесс g 2 являются асимптотически нормальными. Однако скорость их сходимости к пределу распределения удручающе медленная, особенно для g 2 . Например, даже при n = 5000 наблюдений эксцесс выборки g 2 имеет как асимметрию, так и эксцесс приблизительно 0,3, что не является пренебрежимо малым. Чтобы исправить эту ситуацию, было предложено преобразовать величины g 1 и g 2 таким образом, чтобы сделать их распределение максимально близким к стандартному нормальному.

В частности, Д'Агостино и Пирсон (1973) предложили следующее преобразование для асимметрии выборки:

где константы α и δ вычисляются как

и где μ 2 = μ 2 ( g 1 ) — дисперсия g 1 , а γ 2 = γ 2 ( g 1 ) — эксцесс — выражения, приведенные в предыдущем разделе.

Аналогично, Энскомб и Глинн (1983) предложили преобразование для g 2 , которое достаточно хорошо работает для выборок размером 20 и более:

где

и 1 = 1 ( г 2 ) , 2 = 2 ( г 2 ) , 1 = 1 ( г 2 ) — величины , вычисленные Пирсоном .

ОмнибусК2статистика

Статистики Z 1 и Z 2 можно объединить для создания всеобъемлющего теста, способного обнаружить отклонения от нормальности из-за асимметрии или эксцесса (D'Agostino, Belanger & D'Agostino 1990):

Если нулевая гипотеза нормальности верна, то K 2 приблизительно распределено по закону χ 2 с 2 степенями свободы.

Обратите внимание, что статистики g 1 , g 2 не являются независимыми, а только некоррелированными. Поэтому их преобразования Z 1 , Z 2 также будут зависимыми (Shenton & Bowman 1977), что делает обоснованность аппроксимации χ 2 сомнительной. Моделирование показывает, что при нулевой гипотезе статистика теста K 2 характеризуется

Смотрите также

Ссылки