Тест на нормальность

В статистике тесты на нормальность используются для определения того, хорошо ли моделируется набор данных нормальным распределением , а также для вычисления вероятности того, что случайная величина, лежащая в основе набора данных, будет распределена нормально.

Точнее говоря, тесты являются формой выбора модели и могут интерпретироваться несколькими способами в зависимости от интерпретации вероятности :

В терминах описательной статистики измеряется степень соответствия нормальной модели данным. Если соответствие плохое, то данные в этом отношении не очень хорошо моделируются нормальным распределением, без вынесения суждения о какой-либо базовой переменной.
В частотной статистике проверка статистических гипотез заключается в проверке данных на соответствие нулевой гипотезе о том, что они распределены нормально.
В байесовской статистике не «проверяется нормальность» как таковая, а скорее вычисляется вероятность того, что данные получены из нормального распределения с заданными параметрами μ , σ (для всех μ , σ ), и сравнивается с вероятностью того, что данные получены из других рассматриваемых распределений, проще всего с помощью коэффициента Байеса (определяющего относительную вероятность получения данных при различных моделях) или, что более точно, с помощью априорного распределения для возможных моделей и параметров и вычисления апостериорного распределения с учетом вычисленных правдоподобий.

Тест на нормальность используется для определения того, были ли данные выборки взяты из нормально распределенной совокупности (в пределах некоторого допуска). Ряд статистических тестов, таких как t-критерий Стьюдента и однофакторный и двухфакторный дисперсионный анализ (ANOVA), требуют нормально распределенной совокупности выборки.

Графические методы

Неформальный подход к проверке нормальности заключается в сравнении гистограммы выборочных данных с нормальной кривой вероятности. Эмпирическое распределение данных (гистограмма) должно иметь колоколообразную форму и напоминать нормальное распределение. Это может быть трудно увидеть, если выборка мала. В этом случае можно продолжить регрессию данных по квантилям нормального распределения с тем же средним значением и дисперсией, что и у выборки. Отсутствие соответствия линии регрессии предполагает отклонение от нормальности (см. коэффициент Андерсона-Дарлинга и мини-таблицу).

Графическим инструментом для оценки нормальности является график нормальной вероятности , график квантиль-квантиль (график QQ) стандартизированных данных против стандартного нормального распределения . Здесь корреляция между данными выборки и нормальными квантилями (мера качества соответствия) измеряет, насколько хорошо данные моделируются нормальным распределением. Для нормальных данных точки, нанесенные на график QQ, должны примерно попадать на прямую линию, что указывает на высокую положительную корреляцию. Эти графики легко интерпретировать, а также они имеют то преимущество, что выбросы легко идентифицируются.

Тест на обратную сторону конверта

Простой тест «назад конверта» берет максимум и минимум выборки и вычисляет их z-оценку , или, точнее, t-статистику (число стандартных отклонений выборки, на которое выборка выше или ниже среднего значения выборки), и сравнивает ее с правилом 68–95–99,7 : если есть событие 3 σ (точнее, событие 3 с ) и существенно меньше 300 выборок, или событие 4 с и существенно меньше 15 000 выборок, то нормальное распределение занижает максимальную величину отклонений в данных выборки.

Этот тест полезен в случаях, когда мы сталкиваемся с риском эксцесса (где имеют значение большие отклонения), и имеет то преимущество, что его очень легко вычислить и передать: неспециалисты по статистике могут легко понять, что «события 6 σ очень редки в нормальных распределениях».

Частотные тесты

Тесты одномерной нормальности включают в себя следующее:

Тест К-квадрат Д'Агостино ,
Тест Харке-Бера ,
Тест Андерсона-Дарлинга ,
критерий Крамера–фон Мизеса ,
Тест Колмогорова–Смирнова : этот тест работает только в том случае, если предполагается, что среднее значение и дисперсия нормального распределения известны при нулевой гипотезе,
Тест Лиллиефорса : основан на тесте Колмогорова–Смирнова, скорректированном с учетом оценки среднего значения и дисперсии данных,
Тест Шапиро-Уилка и
Тест хи-квадрат Пирсона .

Исследование 2011 года пришло к выводу, что тест Шапиро–Уилка имеет наибольшую мощность для заданной значимости, за ним следует тест Андерсона–Дарлинга при сравнении тестов Шапиро–Уилка, Колмогорова–Смирнова, Лиллиефорса и Андерсона–Дарлинга. ^[1]

Некоторые опубликованные работы рекомендуют тест Jarque–Bera, ^[2]^[3], но у теста есть недостатки. В частности, тест имеет низкую мощность для распределений с короткими хвостами, особенно для бимодальных распределений. ^[4] Некоторые авторы отказались включать его результаты в свои исследования из-за его плохой общей производительности. ^[5]

Исторически, третий и четвертый стандартизированные моменты ( скошенность и эксцесс ) были одними из самых ранних тестов на нормальность. Тест Лин-Мудхолкара специально нацелен на асимметричные альтернативы. ^[6] Тест Харке-Бера сам по себе выведен из оценок скошенности и эксцесса . Многомерные тесты скошенности и эксцесса Мардиа обобщают тесты моментов на многомерный случай. ^[7] Другие ранние тестовые статистики включают отношение среднего абсолютного отклонения к стандартному отклонению и отношения диапазона к стандартному отклонению. ^[8]

Более поздние тесты нормальности включают энергетический тест ^[9] (Секей и Риццо) и тесты, основанные на эмпирической характеристической функции (ECF) (например, Эппс и Пулли, ^[10] Хенце–Цирклер, ^[11] тест BHEP ^[12] ). Энергетический и ECF тесты являются мощными тестами, которые применяются для проверки одномерной или многомерной нормальности и статистически согласованы с общими альтернативами.

Нормальное распределение имеет самую высокую энтропию среди всех распределений для данного стандартного отклонения. Существует ряд тестов на нормальность, основанных на этом свойстве, первый из которых приписывается Васичеку. ^[13]

Байесовские тесты

Расхождения Кульбака-Лейблера между всеми апостериорными распределениями наклона и дисперсии не указывают на ненормальность. Однако отношение ожиданий этих апостериорных распределений и ожидание отношений дают результаты, схожие со статистикой Шапиро-Уилка, за исключением очень малых выборок, когда используются неинформативные априорные данные. ^[14]

Шпигельхальтер предлагает использовать фактор Байеса для сравнения нормальности с другим классом альтернатив распределения. ^[15] Этот подход был расширен Фарреллом и Роджерсом-Стюартом. ^[16]

Приложения

Одно из применений тестов на нормальность — это остатки из линейной регрессионной модели. ^[17] Если они не распределены нормально, остатки не следует использовать в Z-тестах или в любых других тестах, полученных из нормального распределения, таких как t-тесты , F-тесты и хи-квадрат-тесты . Если остатки не распределены нормально, то зависимая переменная или по крайней мере одна объясняющая переменная может иметь неправильную функциональную форму, или могут отсутствовать важные переменные и т. д. Исправление одной или нескольких из этих систематических ошибок может привести к остаткам, которые распределены нормально; другими словами, ненормальность остатков часто является недостатком модели, а не проблемой данных. ^[18]

Смотрите также

Примечания

^ Разали, Норнадиа; Вах, Яп Би (2011). "Сравнение мощностей тестов Шапиро–Уилка, Колмогорова–Смирнова, Лиллиефорса и Андерсона–Дарлинга" (PDF) . Журнал статистического моделирования и аналитики . 2 (1): 21–33. Архивировано из оригинала (PDF) 2015-06-30.
^ Джадж, Джордж Г.; Гриффитс, У. Э.; Хилл, Р. Картер; Люткеполь, Хельмут ; Ли, Т. (1988). Введение в теорию и практику эконометрики (второе изд.). Wiley. стр. 890–892. ISBN 978-0-471-08277-4.
^ Гуджарати, Дамодар Н. (2002). Основы эконометрики (четвертое издание). McGraw Hill. стр. 147–148. ISBN 978-0-07-123017-9.
^ Thadewald, Thorsten; Büning, Herbert (1 января 2007 г.). «Тест Jarque–Bera и его конкуренты для проверки нормальности – сравнение мощностей». Journal of Applied Statistics . 34 (1): 87–105. CiteSeerX 10.1.1.507.1186 . doi :10.1080/02664760600994539. S2CID 13866566.
^ Sürücü, Barış (1 сентября 2008 г.). «Исследование сравнения мощностей и моделирования тестов согласия». Компьютеры и математика с приложениями . 56 (6): 1617–1625. doi : 10.1016/j.camwa.2008.03.010 .
^ Лин, CC; Мудхолкар, GS (1980). «Простой тест на нормальность против асимметричных альтернатив». Biometrika . 67 (2): 455–461. doi :10.1093/biomet/67.2.455.
^ Мардиа, К. В. (1970). Меры многомерной асимметрии и эксцесса с приложениями. Biometrika 57, 519–530.
^ Филлибен, Дж. Дж. (февраль 1975 г.). «Тест коэффициента корреляции вероятностного графика на нормальность». Технометрика . 17 (1): 111–117. doi :10.2307/1268008. JSTOR 1268008.
^ Секей, Г. Дж. и Риццо, М. Л. (2005) Новый тест на многомерную нормальность, Журнал многомерного анализа 93, 58–80.
^ Эппс, TW, и Пулли, LB (1983). Тест на нормальность, основанный на эмпирической характеристической функции. Biometrika 70, 723–726.
^ Хенце, Н. и Цирклер, Б. (1990). Класс инвариантных и последовательных тестов для многомерной нормальности. Communications in Statistics – Theory and Methods 19, 3595–3617.
^ Хенце, Н. и Вагнер, Т. (1997). Новый подход к тестам BHEP для многомерной нормальности. Журнал многомерного анализа 62, 1–23.
^ Васичек, Олдрич (1976). «Тест на нормальность на основе выборочной энтропии». Журнал Королевского статистического общества . Серия B (Методологическая). 38 (1): 54–59. JSTOR 2984828.
^ Young KDS (1993), «Байесовская диагностика для проверки предположений о нормальности». Журнал статистических вычислений и моделирования , 47 (3–4), 167–180
^ Spiegelhalter, DJ (1980). Всеобъемлющий тест на нормальность для малых выборок. Biometrika, 67, 493–496. doi :10.1093/biomet/67.2.493
^ Фаррелл, П. Дж., Роджерс-Стюарт, К. (2006) «Комплексное исследование тестов на нормальность и симметрию: расширение теста Шпигельхальтера». Журнал статистических вычислений и моделирования , 76(9), 803 – 816. doi :10.1080/10629360500109023
^ Портни, LG и Уоткинс, MP (2000). Основы клинических исследований: применение на практике . Нью-Джерси: Prentice Hall Health. стр. 516–517. ISBN 0838526950.{{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Пек, Джолинн; Вонг, Октавия; Вонг, Августин CM (2018-11-06). «Как решать проблему ненормальности: таксономия подходов, рассмотренная и проиллюстрированная». Frontiers in Psychology . 9 : 2104. doi : 10.3389/fpsyg.2018.02104 . ISSN 1664-1078. PMC 6232275. PMID 30459683 .

Дальнейшее чтение

Ральф Б. Д'Агостино (1986). "Тесты для нормального распределения". В Д'Агостино, Р.Б.; Стивенс, М.А. (ред.). Методы проверки соответствия . Нью-Йорк: Марсель Деккер. ISBN 978-0-8247-7487-5.

Генри К. Тоде, младший (2002). Тестирование на нормальность . Нью-Йорк: Marcel Dekker, Inc. стр. 479. ISBN 978-0-8247-9613-6.