Мера соответствия в статистике
В статистике тест K2 Д'Агостино , названный в честь Ральфа Д'Агостино , является мерой соответствия отклонения от нормальности , то есть тест направлен на оценку совместимости заданных данных с нулевой гипотезой о том, что данные являются реализацией независимых, одинаково распределенных гауссовских случайных величин. Тест основан на преобразованиях выборочного эксцесса и асимметрии и имеет силу только против альтернатив, что распределение асимметрично и/или куртуазно.
Асимметрия и эксцесс
В дальнейшем { x i } обозначает выборку из n наблюдений, g 1 и g 2 — асимметрия и эксцесс выборки , m j 's — центральные моменты j -й выборки , а — среднее значение выборки . Часто в литературе, посвященной проверке на нормальность , асимметрия и эксцесс обозначаются как √ β 1 и β 2 соответственно. Такая запись может быть неудобной, поскольку, например, √ β 1 может быть отрицательной величиной.
Асимметрия и эксцесс выборки определяются как
Эти величины последовательно оценивают теоретическую асимметрию и эксцесс распределения соответственно. Более того, если выборка действительно происходит из нормальной популяции, то точные конечные выборочные распределения асимметрии и эксцесса сами могут быть проанализированы с точки зрения их средних значений μ 1 , дисперсий μ 2 , асимметрий γ 1 и эксцесса γ 2 . Это было сделано Пирсоном (1931), который вывел следующие выражения: [ требуется лучший источник ]
и
Например, можно ожидать, что выборка размером n = 1000, взятая из нормально распределенной популяции, будет иметь асимметрию 0, SD 0,08 и эксцесс 0, SD 0,15 , где SD указывает на стандартное отклонение. [ необходима ссылка ]
Трансформированная выборочная асимметрия и эксцесс
Асимметрия выборки g 1 и эксцесс g 2 являются асимптотически нормальными. Однако скорость их сходимости к пределу распределения удручающе медленная, особенно для g 2 . Например, даже при n = 5000 наблюдений эксцесс выборки g 2 имеет как асимметрию, так и эксцесс приблизительно 0,3, что не является пренебрежимо малым. Чтобы исправить эту ситуацию, было предложено преобразовать величины g 1 и g 2 таким образом, чтобы сделать их распределение максимально близким к стандартному нормальному.
В частности, Д'Агостино и Пирсон (1973) предложили следующее преобразование для асимметрии выборки:
где константы α и δ вычисляются как
и где μ 2 = μ 2 ( g 1 ) — дисперсия g 1 , а γ 2 = γ 2 ( g 1 ) — эксцесс — выражения, приведенные в предыдущем разделе.
Аналогично, Энскомб и Глинн (1983) предложили преобразование для g 2 , которое достаточно хорошо работает для выборок размером 20 и более:
где
и 1 = 1 ( г 2 ) , 2 = 2 ( г 2 ) , 1 = 1 ( г 2 ) — величины , вычисленные Пирсоном .
ОмнибусК2статистика
Статистики Z 1 и Z 2 можно объединить для создания всеобъемлющего теста, способного обнаружить отклонения от нормальности из-за асимметрии или эксцесса (D'Agostino, Belanger & D'Agostino 1990):
Если нулевая гипотеза нормальности верна, то K 2 приблизительно распределено по закону χ 2 с 2 степенями свободы.
Обратите внимание, что статистики g 1 , g 2 не являются независимыми, а только некоррелированными. Поэтому их преобразования Z 1 , Z 2 также будут зависимыми (Shenton & Bowman 1977), что делает обоснованность аппроксимации χ 2 сомнительной. Моделирование показывает, что при нулевой гипотезе статистика теста K 2 характеризуется
Смотрите также
Ссылки
- Anscombe, FJ; Glynn, William J. (1983). «Распределение статистики эксцесса b 2 для нормальной статистики». Biometrika . 70 (1): 227–234. doi :10.1093/biomet/70.1.227. JSTOR 2335960.
- D'Agostino, Ralph B. (1970). «Преобразование к нормальности нулевого распределения g 1 ». Biometrika . 57 (3): 679–681. doi :10.1093/biomet/57.3.679. JSTOR 2334794.
- D'Agostino, Ralph B.; Pearson, ES (1973). "Тесты на отклонение от нормальности. Эмпирические результаты для распределений b 2 и √b 1 ". Biometrika . 60 (3): 613–622. JSTOR 2335012.
- D'Agostino, Ralph B.; Belanger, Albert; D'Agostino, Ralph B. Jr. (1990). "Предложение по использованию мощных и информативных тестов нормальности" (PDF) . The American Statistician . 44 (4): 316–321. doi :10.2307/2684359. JSTOR 2684359. Архивировано из оригинала (PDF) 2012-03-25.
- Пирсон, Эгон С. (1931). «Заметка о тестах на нормальность». Biometrika . 22 (3/4): 423–424. doi :10.1093/biomet/22.3-4.423. JSTOR 2332104.
- Шентон, Л.Р.; Боуман, Кимико О. (1977). «Двумерная модель распределения √b 1 и b 2 ». Журнал Американской статистической ассоциации . 72 (357): 206–211. doi :10.1080/01621459.1977.10479940. JSTOR 2286939.