stringtranslate.com

Тест Андерсона-Дарлинга

Тест Андерсона–Дарлинга — это статистический тест , проверяющий, взята ли заданная выборка данных из заданного распределения вероятностей . В своей базовой форме тест предполагает, что в проверяемом распределении нет параметров для оценки, в этом случае тест и его набор критических значений являются свободными от распределения. Однако тест чаще всего используется в контекстах, где проверяется семейство распределений, в этом случае параметры этого семейства необходимо оценить, и это необходимо учитывать при корректировке либо статистики теста, либо его критических значений. При применении к проверке того, адекватно ли нормальное распределение описывает набор данных, он является одним из самых мощных статистических инструментов для обнаружения большинства отклонений от нормальности . [1] [2] Тесты Андерсона–Дарлинга для k -выборок доступны для проверки того, можно ли смоделировать несколько наборов наблюдений как поступающих из одной популяции, где функция распределения не обязательно должна быть указана.

Помимо использования в качестве теста соответствия распределений, его можно использовать при оценке параметров в качестве основы для процедуры оценки минимального расстояния .

Тест назван в честь Теодора Уилбура Андерсона (1918–2016) и Дональда А. Дарлинга (1915–2014), которые изобрели его в 1952 году. [3]

Тест с одним образцом

Статистики Андерсона–Дарлинга и Крамера–фон Мизеса относятся к классу квадратичных статистик EDF (тесты, основанные на эмпирической функции распределения ). [2] Если предполагаемое распределение равно , а эмпирическая (выборочная) кумулятивная функция распределения равна , то квадратичные статистики EDF измеряют расстояние между и по

где — число элементов в выборке, а — весовая функция. Когда весовая функция равна , статистика — это статистика Крамера–фон Мизеса . Тест Андерсона–Дарлинга (1954) [4] основан на расстоянии

что получается, когда весовая функция равна . Таким образом, по сравнению с расстоянием Крамера–фон Мизеса расстояние Андерсона–Дарлинга придает больший вес наблюдениям в хвостах распределения.

Базовая статистика теста

Тест Андерсона-Дарлинга оценивает, происходит ли выборка из определенного распределения. Он использует тот факт, что при задании гипотетического базового распределения и предположении, что данные действительно возникают из этого распределения, можно предположить, что кумулятивная функция распределения (CDF) данных следует равномерному распределению . Затем данные можно проверить на однородность с помощью теста расстояния (Шапиро, 1980). Формула для тестовой статистики для оценки того, происходят ли данные (обратите внимание, что данные должны быть упорядочены) из CDF, следующая :

где

Затем тестовую статистику можно сравнить с критическими значениями теоретического распределения. В этом случае никакие параметры не оцениваются относительно кумулятивной функции распределения .

Тесты для семейств распределений

По сути, та же самая тестовая статистика может быть использована при проверке соответствия семейства распределений, но затем ее необходимо сравнивать с критическими значениями, соответствующими этому семейству теоретических распределений, а также в зависимости от метода, используемого для оценки параметров.

Тест на нормальность

Эмпирическое тестирование показало [5] , что тест Андерсона–Дарлинга не так хорош, как тест Шапиро–Уилка , но лучше других тестов. Стивенс [1] обнаружил , что это одна из лучших статистик эмпирической функции распределения для обнаружения большинства отклонений от нормальности.

Расчеты различаются в зависимости от того, что известно о распределении: [6]

Наблюдения n , , для , переменной должны быть отсортированы таким образом, что и обозначения в следующем предположении предполагают, что X i представляет упорядоченные наблюдения. Пусть

Значения стандартизируются для создания новых значений , заданных

При использовании стандартного нормального CDF рассчитывается с использованием

Альтернативное выражение, в котором на каждом этапе суммирования рассматривается только одно наблюдение, имеет вид:

Модифицированную статистику можно рассчитать с помощью

Если или превышает заданное критическое значение, то гипотеза о нормальности отвергается с некоторым уровнем значимости. Критические значения приведены в таблице ниже для значений . [1] [7]

Примечание 1: Если = 0 или любое (0 или 1), то не может быть вычислено и не определено.

Примечание 2: Приведенная выше формула корректировки взята из Shorack & Wellner (1986, стр. 239). Необходимо соблюдать осторожность при сравнении различных источников, поскольку часто конкретная формула корректировки не указывается.

Примечание 3: Стивенс [1] отмечает, что тест становится лучше, когда параметры вычисляются на основе данных, даже если они известны.

Примечание 4: Марсалья и Марсалья [7] дают более точный результат для случая 0 — 85% и 99%.

В качестве альтернативы для случая 3 выше (и среднее, и дисперсия неизвестны), Д'Агостино (1986) [6] в Таблице 4.7 на стр. 123 и на страницах 372–373 приводит скорректированную статистику:

и нормальность отклоняется, если превышает 0,631, 0,754, 0,884, 1,047 или 1,159 при уровнях значимости 10%, 5%, 2,5%, 1% и 0,5% соответственно; процедура действительна для размера выборки не менее n=8. Формулы для вычисления p -значений для других значений приведены в таблице 4.9 на стр. 127 той же книги.

Тесты для других дистрибутивов

Выше предполагалось, что переменная проверяется на нормальное распределение. Любое другое семейство распределений может быть проверено, но тест для каждого семейства реализуется с использованием другой модификации базовой тестовой статистики, и это относится к критическим значениям, специфичным для этого семейства распределений. Модификации статистики и таблицы критических значений приведены Стивенсом (1986) [2] для экспоненциального, экстремального значений, Вейбулла, гамма, логистического, Коши и фон Мизеса. Тесты для (двухпараметрического) логнормального распределения могут быть реализованы путем преобразования данных с использованием логарифма и использования вышеуказанного теста на нормальность. Подробная информация о требуемых модификациях тестовой статистики и критических значениях для нормального распределения и экспоненциального распределения была опубликована Пирсоном и Хартли (1972, таблица 54). Подробности для этих распределений, с добавлением распределения Гумбеля , также приведены Shorack & Wellner (1986, стр. 239). Подробности для логистического распределения приведены Stephens (1979). Тест для (двухпараметрического) распределения Вейбулла может быть получен с использованием того факта, что логарифм переменной Вейбулла имеет распределение Гумбеля .

Непараметрическийк-примерные тесты

Фриц Шольц и Майкл А. Стивенс (1987) обсуждают тест, основанный на мере согласия между распределениями Андерсона–Дарлинга, для того, могли ли несколько случайных выборок с возможно разными размерами выборки возникнуть из одного и того же распределения, где это распределение не указано. [8] Пакет R kSamples и пакет Python Scipy реализуют этот ранговый тест для сравнения k выборок среди нескольких других подобных ранговых тестов. [9] [10]

Для выборок статистику можно вычислить следующим образом, предполагая, что функция распределения -й выборки непрерывна

где

Смотрите также

Ссылки

  1. ^ abcd Stephens, MA (1974). "Статистика EDF для качества соответствия и некоторых сравнений". Журнал Американской статистической ассоциации . 69 (347): 730–737. doi :10.2307/2286009. JSTOR  2286009.
  2. ^ abc MA Stephens (1986). "Тесты, основанные на статистике EDF". В D'Agostino, RB; Stephens, MA (ред.). Методы проверки соответствия . Нью-Йорк: Marcel Dekker. ISBN 0-8247-7487-6.
  3. ^ Андерсон, TW ; Дарлинг, DA (1952). «Асимптотическая теория некоторых критериев «доброты соответствия», основанных на стохастических процессах». Annals of Mathematical Statistics . 23 (2): 193–212. doi : 10.1214/aoms/1177729437 .
  4. ^ Андерсон, TW; Дарлинг, DA (1954). «Тест на соответствие». Журнал Американской статистической ассоциации . 49 (268): 765–769. doi :10.2307/2281537. JSTOR  2281537.
  5. ^ Разали, Норнадиа; Вах, Яп Би (2011). «Сравнение мощностей тестов Шапиро–Уилка, Колмогорова–Смирнова, Лиллиефорса и Андерсона–Дарлинга». Журнал статистического моделирования и аналитики . 2 (1): 21–33.
  6. ^ ab Ralph B. D'Agostino (1986). "Тесты для нормального распределения". В D'Agostino, RB; Stephens, MA (ред.). Методы проверки соответствия . Нью-Йорк: Marcel Dekker. ISBN 0-8247-7487-6.
  7. ^ ab Marsaglia, G. (2004). «Оценка распределения Андерсона-Дарлинга». Журнал статистического программного обеспечения . 9 (2): 730–737. CiteSeerX 10.1.1.686.1363 . doi : 10.18637/jss.v009.i02 . 
  8. ^ ab Scholz, FW; Stephens, MA (1987). "K-sample Anderson–Darling Tests". Журнал Американской статистической ассоциации . 82 (399): 918–924. doi :10.1080/01621459.1987.10478517.
  9. ^ "kSamples: Тесты рангов K-выборки и их комбинации". Проект R.
  10. ^ "Тест Андерсона-Дарлинга для k-выборок. Пакет Scipy".

Дальнейшее чтение

Внешние ссылки