В статистике тесты на нормальность используются для определения того, хорошо ли моделируется набор данных нормальным распределением , а также для вычисления вероятности того, что случайная величина, лежащая в основе набора данных, будет распределена нормально.
Точнее говоря, тесты являются формой выбора модели и могут интерпретироваться несколькими способами в зависимости от интерпретации вероятности :
Тест на нормальность используется для определения того, были ли данные выборки взяты из нормально распределенной совокупности (в пределах некоторого допуска). Ряд статистических тестов, таких как t-критерий Стьюдента и однофакторный и двухфакторный дисперсионный анализ (ANOVA), требуют нормально распределенной совокупности выборки.
Неформальный подход к проверке нормальности заключается в сравнении гистограммы выборочных данных с нормальной кривой вероятности. Эмпирическое распределение данных (гистограмма) должно иметь колоколообразную форму и напоминать нормальное распределение. Это может быть трудно увидеть, если выборка мала. В этом случае можно продолжить регрессию данных по квантилям нормального распределения с тем же средним значением и дисперсией, что и у выборки. Отсутствие соответствия линии регрессии предполагает отклонение от нормальности (см. коэффициент Андерсона-Дарлинга и мини-таблицу).
Графическим инструментом для оценки нормальности является график нормальной вероятности , график квантиль-квантиль (график QQ) стандартизированных данных против стандартного нормального распределения . Здесь корреляция между данными выборки и нормальными квантилями (мера качества соответствия) измеряет, насколько хорошо данные моделируются нормальным распределением. Для нормальных данных точки, нанесенные на график QQ, должны примерно попадать на прямую линию, что указывает на высокую положительную корреляцию. Эти графики легко интерпретировать, а также они имеют то преимущество, что выбросы легко идентифицируются.
Простой тест «назад конверта» берет максимум и минимум выборки и вычисляет их z-оценку , или, точнее, t-статистику (число стандартных отклонений выборки, на которое выборка выше или ниже среднего значения выборки), и сравнивает ее с правилом 68–95–99,7 : если есть событие 3 σ (точнее, событие 3 с ) и существенно меньше 300 выборок, или событие 4 с и существенно меньше 15 000 выборок, то нормальное распределение занижает максимальную величину отклонений в данных выборки.
Этот тест полезен в случаях, когда мы сталкиваемся с риском эксцесса (где имеют значение большие отклонения), и имеет то преимущество, что его очень легко вычислить и передать: неспециалисты по статистике могут легко понять, что «события 6 σ очень редки в нормальных распределениях».
Тесты одномерной нормальности включают в себя следующее:
Исследование 2011 года пришло к выводу, что тест Шапиро–Уилка имеет наибольшую мощность для заданной значимости, за ним следует тест Андерсона–Дарлинга при сравнении тестов Шапиро–Уилка, Колмогорова–Смирнова, Лиллиефорса и Андерсона–Дарлинга. [1]
Некоторые опубликованные работы рекомендуют тест Jarque–Bera, [2] [3], но у теста есть недостатки. В частности, тест имеет низкую мощность для распределений с короткими хвостами, особенно для бимодальных распределений. [4] Некоторые авторы отказались включать его результаты в свои исследования из-за его плохой общей производительности. [5]
Исторически, третий и четвертый стандартизированные моменты ( скошенность и эксцесс ) были одними из самых ранних тестов на нормальность. Тест Лин-Мудхолкара специально нацелен на асимметричные альтернативы. [6] Тест Харке-Бера сам по себе выведен из оценок скошенности и эксцесса . Многомерные тесты скошенности и эксцесса Мардиа обобщают тесты моментов на многомерный случай. [7] Другие ранние тестовые статистики включают отношение среднего абсолютного отклонения к стандартному отклонению и отношения диапазона к стандартному отклонению. [8]
Более поздние тесты нормальности включают энергетический тест [9] (Секей и Риццо) и тесты, основанные на эмпирической характеристической функции (ECF) (например, Эппс и Пулли, [10] Хенце–Цирклер, [11] тест BHEP [12] ). Энергетический и ECF тесты являются мощными тестами, которые применяются для проверки одномерной или многомерной нормальности и статистически согласованы с общими альтернативами.
Нормальное распределение имеет самую высокую энтропию среди всех распределений для данного стандартного отклонения. Существует ряд тестов на нормальность, основанных на этом свойстве, первый из которых приписывается Васичеку. [13]
Расхождения Кульбака-Лейблера между всеми апостериорными распределениями наклона и дисперсии не указывают на ненормальность. Однако отношение ожиданий этих апостериорных распределений и ожидание отношений дают результаты, схожие со статистикой Шапиро-Уилка, за исключением очень малых выборок, когда используются неинформативные априорные данные. [14]
Шпигельхальтер предлагает использовать фактор Байеса для сравнения нормальности с другим классом альтернатив распределения. [15] Этот подход был расширен Фарреллом и Роджерсом-Стюартом. [16]
Одно из применений тестов на нормальность — это остатки из линейной регрессионной модели. [17] Если они не распределены нормально, остатки не следует использовать в Z-тестах или в любых других тестах, полученных из нормального распределения, таких как t-тесты , F-тесты и хи-квадрат-тесты . Если остатки не распределены нормально, то зависимая переменная или по крайней мере одна объясняющая переменная может иметь неправильную функциональную форму, или могут отсутствовать важные переменные и т. д. Исправление одной или нескольких из этих систематических ошибок может привести к остаткам, которые распределены нормально; другими словами, ненормальность остатков часто является недостатком модели, а не проблемой данных. [18]
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка )