stringtranslate.com

Тест Андерсона-Дарлинга

Тест Андерсона -Дарлинга — это статистический тест того, получена ли данная выборка данных из заданного распределения вероятностей . В своей базовой форме тест предполагает, что в тестируемом распределении нет параметров, подлежащих оценке, и в этом случае тест и его набор критических значений не зависят от распределения. Однако тест чаще всего используется в контексте, когда тестируется семейство распределений, и в этом случае необходимо оценить параметры этого семейства и принять это во внимание при корректировке либо тестовой статистики, либо ее критических значений. Применительно к проверке того, адекватно ли нормальное распределение описывает набор данных, оно является одним из самых мощных статистических инструментов для обнаружения большинства отклонений от нормальности . [1] [2] Критерии Андерсона–Дарлинга с K- выборкой доступны для проверки того, можно ли смоделировать несколько наборов наблюдений как исходящие из одной совокупности, где не требуется указывать функцию распределения .

Помимо использования в качестве теста соответствия распределений, его можно использовать при оценке параметров в качестве основы для процедуры оценки минимального расстояния .

Тест назван в честь Теодора Уилбура Андерсона (1918–2016) и Дональда А. Дарлинга (1915–2014), которые изобрели его в 1952 году. [3]

Одновыборочный тест

Статистика Андерсона-Дарлинга и Крамера-фон Мизеса относится к классу квадратичных статистик EDF (тесты, основанные на эмпирической функции распределения ). [2] Если гипотетическое распределение равно , а эмпирическая (выборочная) кумулятивная функция распределения равна , то квадратичная статистика EDF измеряет расстояние между и

где – количество элементов в выборке, – весовая функция. Когда весовая функция равна , статистика является статистикой Крамера-фон Мизеса . Тест Андерсона–Дарлинга (1954) [4] основан на расстоянии

что получается, когда весовая функция равна . Таким образом, по сравнению с расстоянием Крамера – фон Мизеса , расстояние Андерсона – Дарлинга придает больший вес наблюдениям в хвостах распределения.

Базовая статистика теста

Тест Андерсона-Дарлинга оценивает, происходит ли выборка из указанного распределения. Он использует тот факт, что при наличии гипотетического основного распределения и предположении, что данные действительно возникают из этого распределения, можно предположить, что кумулятивная функция распределения (CDF) данных следует равномерному распределению . Затем данные можно проверить на единообразие с помощью дистанционного теста (Шапиро, 1980). Формула тестовой статистики для оценки того, поступают ли данные (обратите внимание, что данные должны быть упорядочены) из CDF :

где

Затем статистику теста можно сравнить с критическими значениями теоретического распределения. В этом случае никакие параметры не оцениваются по отношению к кумулятивной функции распределения .

Тесты для семейств дистрибутивов

По сути, одна и та же тестовая статистика может использоваться при проверке соответствия семейства распределений, но затем ее необходимо сравнить с критическими значениями, соответствующими этому семейству теоретических распределений и зависящими также от метода, используемого для оценки параметров.

Тест на нормальность

Эмпирическое тестирование показало [5] , что тест Андерсона-Дарлинга не так хорош, как тест Шапиро-Уилка , но лучше, чем другие тесты. Стивенс [1] обнаружил , что это одна из лучших эмпирических статистических функций распределения для обнаружения большинства отклонений от нормальности.

Вычисления различаются в зависимости от того, что известно о распределении: [6]

n наблюдений , for , переменной должны быть отсортированы таким образом, чтобы и последующие обозначения предполагают, что X i представляет упорядоченные наблюдения. Позволять

Значения стандартизируются для создания новых значений , заданных формулой

При использовании стандартного нормального CDF рассчитывается с использованием

Альтернативное выражение, в котором на каждом этапе суммирования учитывается только одно наблюдение:

Модифицированную статистику можно рассчитать с помощью

Если или превышает заданное критическое значение, то гипотеза нормальности отвергается с некоторым уровнем значимости. Критические значения приведены в таблице ниже для значений . [1] [7]

Примечание 1: Если = 0 или любое (0 или 1), то вычисление невозможно и оно не определено.

Примечание 2: Приведенная выше формула корректировки взята из Shorack & Wellner (1986, стр. 239). При сравнении различных источников требуется осторожность, поскольку часто не указывается конкретная формула корректировки.

Примечание 3: Стивенс [1] отмечает, что тест становится лучше, когда параметры вычисляются на основе данных, даже если они известны.

Примечание 4: Марсалья и Марсалья [7] дают более точные результаты для случая 0 — 85% и 99%.

Альтернативно, для случая 3, приведенного выше (как среднее значение, так и дисперсия неизвестны), Д'Агостино (1986) [6] в таблице 4.7 на стр. 123 и на страницах 372–373 приводится скорректированная статистика:

нормальность отвергается, если превышает 0,631, 0,754, 0,884, 1,047 или 1,159 на уровнях значимости 10%, 5%, 2,5%, 1% и 0,5% соответственно; процедура действительна для размера выборки не менее n=8. Формулы расчета р -значений для других значений приведены в таблице 4.9 на с. 127 в той же книге.

Тесты для других дистрибутивов

Выше предполагалось, что переменная проверяется на нормальное распределение. Любое другое семейство распределений можно протестировать, но тест для каждого семейства реализуется с использованием различных модификаций базовой тестовой статистики, и это относится к критическим значениям, специфичным для этого семейства распределений. Модификации статистики и таблицы критических значений приведены Стивенсом (1986) [2] для экспоненциального распределения, распределения экстремальных значений, распределения Вейбулла, гамма-распределения, логистического распределения, распределения Коши и фон Мизеса. Тесты на (двухпараметрическое) логарифмически нормальное распределение можно реализовать путем преобразования данных с помощью логарифма и использования приведенного выше теста на нормальность. Подробности необходимых модификаций тестовой статистики и критических значений для нормального и экспоненциального распределения были опубликованы Пирсоном и Хартли (1972, таблица 54). Подробности об этих распределениях, с добавлением распределения Гамбеля , также даны Шораком и Веллнером (1986, стр. 239). Подробности логистического распределения даны Стивенсом (1979). Тест для распределения Вейбулла (с двумя параметрами) можно получить, воспользовавшись тем фактом, что логарифм переменной Вейбулла имеет распределение Гамбеля .

Непараметрические тесты k -выборки

Фриц Шольц и Майкл А. Стивенс (1987) обсуждают тест, основанный на мере согласия Андерсона-Дарлинга между распределениями, для определения того, могло ли несколько случайных выборок с возможно разными размерами выборки возникнуть из одного и того же распределения, где это распределение неопределенные. [8] Пакет R kSamples и пакет Python Scipy реализуют этот ранговый тест для сравнения k выборок среди нескольких других подобных ранговых тестов. [9] [10]

Для выборок статистику можно вычислить следующим образом в предположении, что функция распределения -й выборки непрерывна.

где

Реализации

Смотрите также

Рекомендации

  1. ^ abcd Стивенс, Массачусетс (1974). «Статистика EDF по точности соответствия и некоторые сравнения». Журнал Американской статистической ассоциации . 69 (347): 730–737. дои : 10.2307/2286009. JSTOR  2286009.
  2. ^ abc MA Стивенс (1986). «Тесты на основе статистики EDF». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN 0-8247-7487-6.
  3. ^ Андерсон, ТВ ; Дарлинг, Д.А. (1952). «Асимптотическая теория некоторых критериев согласия», основанная на случайных процессах». Анналы математической статистики . 23 (2): 193–212. дои : 10.1214/aoms/1177729437 .
  4. ^ Андерсон, ТВ; Дарлинг, Д.А. (1954). «Проверка пригодности». Журнал Американской статистической ассоциации . 49 (268): 765–769. дои : 10.2307/2281537. JSTOR  2281537.
  5. ^ Разали, Норнадия; Вау, Яп Би (2011). «Сравнение мощности тестов Шапиро-Уилка, Колмогорова-Смирнова, Лиллифорса и Андерсона-Дарлинга». Журнал статистического моделирования и аналитики . 2 (1): 21–33.
  6. ^ аб Ральф Б. Д'Агостино (1986). «Тесты нормального распределения». В Д'Агостино, РБ; Стивенс, Массачусетс (ред.). Методы согласия . Нью-Йорк: Марсель Деккер. ISBN 0-8247-7487-6.
  7. ^ аб Марсалья, Г. (2004). «Оценка распределения Андерсона-Дарлинга». Журнал статистического программного обеспечения . 9 (2): 730–737. CiteSeerX 10.1.1.686.1363 . дои : 10.18637/jss.v009.i02 . 
  8. ^ аб Шольц, ФРВ; Стивенс, Массачусетс (1987). «К-образец Тесты Андерсона – Дарлинга». Журнал Американской статистической ассоциации . 82 (399): 918–924. дои : 10.1080/01621459.1987.10478517.
  9. ^ «kSamples: тесты ранга K-выборки и их комбинации» . Р-проект .
  10. ^ "Тест Андерсона-Дарлинга для k-образцов. Пакет Scipy" .
  11. ^ "Фиттер". 03.10.2023.

дальнейшее чтение

Внешние ссылки