Тест Койпера используется в статистике для проверки того, противоречит ли данное распределение или семейство распределений данным из выборки данных. Он назван в честь голландского математика Николааса Койпера . [1]
Тест Койпера тесно связан с более известным тестом Колмогорова-Смирнова (или тестом КС, как его часто называют). Как и в случае с тестом KS, статистика несоответствий D + и D - представляет собой абсолютные размеры наиболее положительных и наиболее отрицательных различий между двумя сравниваемыми кумулятивными функциями распределения . Хитрость теста Койпера заключается в использовании величины D + + D − в качестве статистики теста. Это небольшое изменение делает критерий Койпера столь же чувствительным как в хвостах, так и в медиане, а также делает его инвариантным относительно циклических преобразований независимой переменной. Тест Андерсона -Дарлинга - это еще один тест, который обеспечивает чувствительность на хвостах, равную медиане, но не обеспечивает циклическую инвариантность.
Эта инвариантность относительно циклических преобразований делает тест Койпера неоценимым при проверке циклических изменений в зависимости от времени года, дня недели или времени суток, а также в более общем плане для проверки соответствия круговых распределений вероятностей и различий между ними .
Тестовая статистика V для теста Койпера определяется следующим образом. Пусть F — непрерывная кумулятивная функция распределения , которая должна быть нулевой гипотезой . Обозначим выборку данных, которые являются независимыми реализациями случайных величин с F в качестве функции распределения, через x i ( i =1,..., n ). Затем определим [2]
и наконец,
Доступны таблицы критических точек статистики испытаний [3] , и они включают определенные случаи, когда тестируемое распределение не полностью известно, поэтому оцениваются параметры семейства распределений .
Мы могли бы проверить гипотезу о том, что в некоторые времена года компьютеры выходят из строя чаще, чем в другие. Чтобы проверить это, мы собирали даты, когда тестовый набор компьютеров вышел из строя, и строили эмпирическую функцию распределения . Нулевая гипотеза заключается в том, что отказы распределены равномерно . Статистика Койпера не изменится, если мы изменим начало года, и не требует, чтобы мы разбивали неудачи на месяцы или что-то в этом роде. [1] [4] Другой тестовой статистикой, обладающей этим свойством, является статистика Ватсона, [2] [4] которая связана с критерием Крамера – фон Мизеса .
Однако, если сбои происходят в основном по выходным, многие тесты равномерного распределения, такие как KS и Kuiper, пропустят это, поскольку выходные дни распределены в течение года. Эта неспособность отличить распределения гребенчатой формы от непрерывных равномерных распределений является ключевой проблемой всей статистики, основанной на варианте теста КС. Тест Койпера, примененный к времени событий по модулю одна неделя, способен обнаружить такую закономерность. Использование времени событий, модулированного с помощью теста KS, может привести к разным результатам в зависимости от того, как поэтапно распределены данные. В этом примере тест KS может обнаружить неравномерность, если данные настроены на начало недели в субботу, но не сможет обнаружить неравномерность, если неделя начинается в среду.