тест Койпера

Тест Койпера используется в статистике для проверки того, противоречит ли данное распределение или семейство распределений данным из выборки данных. Он назван в честь голландского математика Николааса Койпера . ^[1]

Тест Койпера тесно связан с более известным тестом Колмогорова-Смирнова (или тестом КС, как его часто называют). Как и в случае с тестом KS, статистика несоответствий D ⁺ и D ^- представляет собой абсолютные размеры наиболее положительных и наиболее отрицательных различий между двумя сравниваемыми кумулятивными функциями распределения . Хитрость теста Койпера заключается в использовании величины D ⁺ + D ⁻ в качестве статистики теста. Это небольшое изменение делает критерий Койпера столь же чувствительным как в хвостах, так и в медиане, а также делает его инвариантным относительно циклических преобразований независимой переменной. Тест Андерсона -Дарлинга - это еще один тест, который обеспечивает чувствительность на хвостах, равную медиане, но не обеспечивает циклическую инвариантность.

Эта инвариантность относительно циклических преобразований делает тест Койпера неоценимым при проверке циклических изменений в зависимости от времени года, дня недели или времени суток, а также в более общем плане для проверки соответствия круговых распределений вероятностей и различий между ними .

Определение

Тестовая статистика V для теста Койпера определяется следующим образом. Пусть F — непрерывная кумулятивная функция распределения , которая должна быть нулевой гипотезой . Обозначим выборку данных, которые являются независимыми реализациями случайных величин с F в качестве функции распределения, через x _i ( i =1,..., n ). Затем определим ^[2]

z_{i}=F(x_{i}),

D^{+}=\mathrm {max} \left[i/n-z_{i}\right],

D^{-}=\mathrm {max} \left[z_{i}-(i-1)/n\right],

и наконец,

V=D^{+}+D^{-}.

Доступны таблицы критических точек статистики испытаний ^{[3] , и они включают определенные случаи, когда тестируемое распределение не полностью известно, поэтому}оцениваются параметры семейства распределений .

Пример

Мы могли бы проверить гипотезу о том, что в некоторые времена года компьютеры выходят из строя чаще, чем в другие. Чтобы проверить это, мы собирали даты, когда тестовый набор компьютеров вышел из строя, и строили эмпирическую функцию распределения . Нулевая гипотеза заключается в том, что отказы распределены равномерно . Статистика Койпера не изменится, если мы изменим начало года, и не требует, чтобы мы разбивали неудачи на месяцы или что-то в этом роде. ^[1]^[4] Другой тестовой статистикой, обладающей этим свойством, является статистика Ватсона, ^[2]^[4] которая связана с критерием Крамера – фон Мизеса .

Однако, если сбои происходят в основном по выходным, многие тесты равномерного распределения, такие как KS и Kuiper, пропустят это, поскольку выходные дни распределены в течение года. Эта неспособность отличить распределения гребенчатой формы от непрерывных равномерных распределений является ключевой проблемой всей статистики, основанной на варианте теста КС. Тест Койпера, примененный к времени событий по модулю одна неделя, способен обнаружить такую закономерность. Использование времени событий, модулированного с помощью теста KS, может привести к разным результатам в зависимости от того, как поэтапно распределены данные. В этом примере тест KS может обнаружить неравномерность, если данные настроены на начало недели в субботу, но не сможет обнаружить неравномерность, если неделя начинается в среду.

Смотрите также

Тест Колмогорова – Смирнова

тест Койпера

Определение

Пример

Смотрите также

Рекомендации