Тест Андерсона-Дарлинга

Тест Андерсона -Дарлинга — это статистический тест того, получена ли данная выборка данных из заданного распределения вероятностей . В своей базовой форме тест предполагает, что в тестируемом распределении нет параметров, подлежащих оценке, и в этом случае тест и его набор критических значений не зависят от распределения. Однако тест чаще всего используется в контексте, когда тестируется семейство распределений, и в этом случае необходимо оценить параметры этого семейства и принять это во внимание при корректировке либо тестовой статистики, либо ее критических значений. Применительно к проверке того, адекватно ли нормальное распределение описывает набор данных, оно является одним из самых мощных статистических инструментов для обнаружения большинства отклонений от нормальности . ^[1]^[2]Критерии Андерсона–Дарлинга с K- выборкой доступны для проверки того, можно ли смоделировать несколько наборов наблюдений как исходящие из одной совокупности, где не требуется указывать функцию распределения .

Помимо использования в качестве теста соответствия распределений, его можно использовать при оценке параметров в качестве основы для процедуры оценки минимального расстояния .

Тест назван в честь Теодора Уилбура Андерсона (1918–2016) и Дональда А. Дарлинга (1915–2014), которые изобрели его в 1952 году. ^[3]

Одновыборочный тест

Статистика Андерсона-Дарлинга и Крамера-фон Мизеса относится к классу квадратичных статистик EDF (тесты, основанные на эмпирической функции распределения ). ^[2] Если гипотетическое распределение равно , а эмпирическая (выборочная) кумулятивная функция распределения равна , то квадратичная статистика EDF измеряет расстояние между и $F$ $F_{n}$ $F$ $F_{n}$

{\ displaystyle n \ int _ {- \ infty } ^ {\ infty } (F _ {n} (x) - F (x)) ^ {2} \, w (x) \, dF (x),}

где – количество элементов в выборке, – весовая функция. Когда весовая функция равна , статистика является статистикой Крамера-фон Мизеса . Тест Андерсона–Дарлинга (1954) ^[4] основан на расстоянии $п$ ${\ displaystyle w (x)}$ ${\ displaystyle w (x) = 1}$

A^{2}=n\int _{-\infty }^{\infty }{\frac {(F_{n}(x)-F(x))^{2}}{F(x )\;(1-F(x))}}\,dF(x),

что получается, когда весовая функция равна . Таким образом, по сравнению с расстоянием Крамера – фон Мизеса , расстояние Андерсона – Дарлинга придает больший вес наблюдениям в хвостах распределения. $w(x)=[F(x)\;(1-F(x))]^{- 1}$

Базовая статистика теста

Тест Андерсона-Дарлинга оценивает, происходит ли выборка из указанного распределения. Он использует тот факт, что при наличии гипотетического основного распределения и предположении, что данные действительно возникают из этого распределения, можно предположить, что кумулятивная функция распределения (CDF) данных следует равномерному распределению . Затем данные можно проверить на единообразие с помощью дистанционного теста (Шапиро, 1980). Формула тестовой статистики для оценки того, поступают ли данные (обратите внимание, что данные должны быть упорядочены) из CDF : $А$ $\{Y_{1}<\cdots <Y_{n}\}$ $F$

A^{2}=-nS\,,

где

S=\sum _{i=1}^{n}{\frac {2i-1}{n}}\left[\ln(F(Y_{i}))+\ln \left(1 -F(Y_{n+1-i})\вправо)\вправо].

Затем статистику теста можно сравнить с критическими значениями теоретического распределения. В этом случае никакие параметры не оцениваются по отношению к кумулятивной функции распределения . $F$

Тесты для семейств дистрибутивов

По сути, одна и та же тестовая статистика может использоваться при проверке соответствия семейства распределений, но затем ее необходимо сравнить с критическими значениями, соответствующими этому семейству теоретических распределений и зависящими также от метода, используемого для оценки параметров.

Тест на нормальность

Эмпирическое тестирование показало ^[5] , что тест Андерсона-Дарлинга не так хорош, как тест Шапиро-Уилка , но лучше, чем другие тесты. Стивенс ^[1] обнаружил , что это одна из лучших эмпирических статистических функций распределения для обнаружения большинства отклонений от нормальности. $A^{2}$

Вычисления различаются в зависимости от того, что известно о распределении: ^[6]

Случай 0: известны среднее значение и дисперсия . $\mu$ $\sigma ^{2}$
Случай 1: Дисперсия известна, но среднее значение неизвестно. $\sigma ^{2}$ $\mu$
Случай 2: Среднее значение известно, но дисперсия неизвестна. $\mu$ $\sigma ^{2}$
Случай 3: Среднее значение и дисперсия неизвестны. $\mu$ $\sigma ^{2}$

n наблюдений , for , переменной должны быть отсортированы таким образом, чтобы и последующие обозначения предполагают, что X _i представляет упорядоченные наблюдения. Позволять $X_{i}$ $я = 1,\ldots n$ $X$ $X_{1}\leq X_{2}\leq ...\leq X_{n}$

{\hat {\mu }}={\begin{cases}\mu ,&{\text{если известно среднее значение.}} \\{\bar {X}}={\frac {1} {n}}\sum _{i=1}^{n}X_{i},&{\text{иначе.}}\end{cases}}

{\hat {\sigma }}^{2}={\begin{cases}\sigma ^{2},&{\text{если дисперсия известна.}}\\{\frac {1} {n}}\sum _{i=1}^{n}(X_{i}-\mu )^{2},&{\text{если дисперсия неизвестна, но известно среднее значение.}}\ \{\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2},&{\text{иначе .}}\end{случаи}}

Значения стандартизируются для создания новых значений , заданных формулой $X_{i}$ $Y_{i}$

Y_{i}={\frac {X_{i}-{\hat {\mu }}}{\hat {\sigma }}}.

При использовании стандартного нормального CDF рассчитывается с использованием $\Phi$ $A^{2}$

A^{2}=-n-{\frac {1}{n}}\sum _{i=1}^{n}(2i-1)(\ln \Phi (Y_{i})+\ln(1-\Phi (Y_{n+1-i}))).

Альтернативное выражение, в котором на каждом этапе суммирования учитывается только одно наблюдение:

A^{2}=-n-{\frac {1}{n}}\sum _{i=1}^{n}\left[(2i-1)\ln \Phi (Y_{i})+(2(n-i)+1)\ln(1-\Phi (Y_{i}))\right].

Модифицированную статистику можно рассчитать с помощью

A^{*2}={\begin{cases}A^{2}\left(1+{\frac {4}{n}}-{\frac {25}{n^{2}}}\right),&{\text{if the variance and the mean are both unknown.}}\\A^{2},&{\text{otherwise.}}\end{cases}}

Если или превышает заданное критическое значение, то гипотеза нормальности отвергается с некоторым уровнем значимости. Критические значения приведены в таблице ниже для значений . ^[1]^[7] $A^{2}$ $A^{*2}$ $A^{*2}$

Примечание 1: Если = 0 или любое (0 или 1), то вычисление невозможно и оно не определено. ${\hat {\sigma }}$ $\Phi (Y_{i})=$ $A^{2}$

Примечание 2: Приведенная выше формула корректировки взята из Shorack & Wellner (1986, стр. 239). При сравнении различных источников требуется осторожность, поскольку часто не указывается конкретная формула корректировки.

Примечание 3: Стивенс ^[1] отмечает, что тест становится лучше, когда параметры вычисляются на основе данных, даже если они известны.

Примечание 4: Марсалья и Марсалья ^[7] дают более точные результаты для случая 0 — 85% и 99%.

Альтернативно, для случая 3, приведенного выше (как среднее значение, так и дисперсия неизвестны), Д'Агостино (1986) ^[6] в таблице 4.7 на стр. 123 и на страницах 372–373 приводится скорректированная статистика:

A^{*2}=A^{2}\left(1+{\frac {0.75}{n}}+{\frac {2.25}{n^{2}}}\right).

нормальность отвергается, если превышает 0,631, 0,754, 0,884, 1,047 или 1,159 на уровнях значимости 10%, 5%, 2,5%, 1% и 0,5% соответственно; процедура действительна для размера выборки не менее n=8. Формулы расчета р -значений для других значений приведены в таблице 4.9 на с. 127 в той же книге. $A^{*2}$ $A^{*2}$

Тесты для других дистрибутивов

Выше предполагалось, что переменная проверяется на нормальное распределение. Любое другое семейство распределений можно протестировать, но тест для каждого семейства реализуется с использованием различных модификаций базовой тестовой статистики, и это относится к критическим значениям, специфичным для этого семейства распределений. Модификации статистики и таблицы критических значений приведены Стивенсом (1986) ^[2] для экспоненциального распределения, распределения экстремальных значений, распределения Вейбулла, гамма-распределения, логистического распределения, распределения Коши и фон Мизеса. Тесты на (двухпараметрическое) логарифмически нормальное распределение можно реализовать путем преобразования данных с помощью логарифма и использования приведенного выше теста на нормальность. Подробности необходимых модификаций тестовой статистики и критических значений для нормального и экспоненциального распределения были опубликованы Пирсоном и Хартли (1972, таблица 54). Подробности об этих распределениях, с добавлением распределения Гамбеля , также даны Шораком и Веллнером (1986, стр. 239). Подробности логистического распределения даны Стивенсом (1979). Тест для распределения Вейбулла (с двумя параметрами) можно получить, воспользовавшись тем фактом, что логарифм переменной Вейбулла имеет распределение Гамбеля . $X_{i}$

Непараметрические тесты k -выборки

Фриц Шольц и Майкл А. Стивенс (1987) обсуждают тест, основанный на мере согласия Андерсона-Дарлинга между распределениями, для определения того, могло ли несколько случайных выборок с возможно разными размерами выборки возникнуть из одного и того же распределения, где это распределение неопределенные. ^[8] Пакет R kSamples и пакет Python Scipy реализуют этот ранговый тест для сравнения k выборок среди нескольких других подобных ранговых тестов. ^[9]^[10]

Для выборок статистику можно вычислить следующим образом в предположении, что функция распределения -й выборки непрерывна. $k$ $F_{i}$ $i$

A_{kN}^{2}={\frac {1}{N}}\sum _{i=1}^{k}{\frac {1}{n_{i}}}\sum _{j=1}^{N-1}{\frac {(NM_{ij}-jn_{i})^{2}}{j(N-j)}}

где

$n_{i}$ количество наблюдений в -й выборке $i$
$N$ общее количество наблюдений во всех выборках
$Z_{1}<\cdots <Z_{N}$ это объединенная упорядоченная выборка
$M_{ij}$ – количество наблюдений в -й выборке, не превышающих . ^[8] $i$ $Z_{j}$

Реализации

Phitter ^[11] : онлайн-программное обеспечение, подходящее для распространения.

Смотрите также

дальнейшее чтение

Кордер, Г.В., Форман, Д.И. (2009). Непараметрическая статистика для нестатистов: пошаговый подход Wiley, ISBN 978-0-470-45461-9
Мехта, С. (2014) ISBN статистических тем 978-1499273533
Пирсон Э.С., Хартли, Х.О. (редакторы) (1972) Таблицы биометрики для статистиков , Том II. ЧАШКА. ISBN 0-521-06937-8 .
Шапиро, СС (1980) Как проверить нормальность и другие предположения о распределении. В: Основные ссылки ASQC по контролю качества: статистические методы 3, стр. 1–78.
Шорак, Г. Р. , Веллнер, Дж. А. (1986) Эмпирические процессы с применением к статистике , Уайли. ISBN 0-471-86725-X .
Стивенс, Массачусетс (1979) Критерий соответствия логистическому распределению на основе эмпирической функции распределения , Биометрика, 66(3), 591–5.

Внешние ссылки

Справочник по статистике NIST США