Статистический тест
Тест Кохрана — это непараметрический статистический тест для проверки того, имеют ли k методов лечения идентичные эффекты при анализе двухфакторных рандомизированных блочных дизайнов , где переменная ответа является бинарной . [1] [2] [3] Он назван в честь Уильяма Джеммелла Кохрана . Тест Q Кохрана не следует путать с тестом C Кохрана , который является тестом на выбросы дисперсии. Проще говоря, тест Q Кохрана требует, чтобы был только бинарный ответ (например, успех/неудача или 1/0) и чтобы было более 2 групп одинакового размера. Тест оценивает, является ли доля успехов одинаковой между группами. Часто он используется для оценки того, имеют ли разные наблюдатели одного и того же явления согласованные результаты (межнаблюдательная изменчивость). [4]
Фон
Q-тест Кохрана предполагает, что имеется k > 2 экспериментальных методов лечения и что наблюдения организованы в b блоков ; то есть,
«Блоками» здесь могут быть отдельные люди или другие организмы. [5] Например, если бы b респондентам в опросе было задано k вопросов «Да/Нет», Q-тест можно было бы использовать для проверки нулевой гипотезы о том, что все вопросы с равной вероятностью вызовут ответ «Да».
Описание
Q-тест Кохрана — это
- Нулевая гипотеза (H 0 ): методы лечения одинаково эффективны.
- Альтернативная гипотеза (H a ): существует разница в эффективности между методами лечения.
Статистика Q-теста Кохрана:
где
- k — количество обработок
- X • j — итог столбца для j -го лечения
- b — количество блоков
- X i • — это общая сумма по строке для i -го блока
- N — это общая сумма
Критическая область
Для уровня значимости α асимптотическая критическая область равна
где Χ 2 1 − α,k − 1 — (1 − α)-квантиль распределения хи -квадрат с k − 1 степенями свободы. Нулевая гипотеза отклоняется, если статистика теста находится в критической области. Если тест Кохрана отклоняет нулевую гипотезу о равной эффективности методов лечения, можно провести парные множественные сравнения , применив тест Q Кохрана к двум интересующим методам лечения.
Точное распределение статистики T может быть вычислено для небольших выборок. Это позволяет получить точную критическую область. Первый алгоритм был предложен в 1975 году Патилом [6] , а второй был предоставлен Фахми и Беллетуалем [7] в 2017 году.
Предположения
Q-тест Кохрана основан на следующих предположениях:
- Если используется приближение большой выборки (а не точное распределение), b должно быть «большим».
- Блоки были выбраны случайным образом из совокупности всех возможных блоков.
- Результаты лечения можно закодировать в виде бинарных ответов (т. е. «0» или «1») способом, общим для всех видов лечения в каждом блоке.
Связанные тесты
- Тест Фридмана или тест Дарбина можно использовать, когда ответ не двоичный, а порядковый или непрерывный.
- При наличии ровно двух методов лечения тест Кохрана Q эквивалентен тесту Макнемара , который, в свою очередь, эквивалентен двустороннему тесту знаков .
Ссылки
- ↑ Уильям Г. Кохран (декабрь 1950 г.). «Сравнение процентов в сопоставленных образцах». Biometrika . 37 (3/4): 256–266. doi :10.1093/biomet/37.3-4.256. JSTOR 2332378.
- ^ Коновер, Уильям Джей (1999). Практическая непараметрическая статистика (третье изд.). Wiley, Нью-Йорк, штат Нью-Йорк, США. С. 388–395. ISBN 9780471160687.
- ^ Национальный институт стандартов и технологий. Тест Кохрана
- ^ Мохамед М. Шукри (2004). Меры межнаблюдательного согласия . Бока-Ратон: Chapman & Hall/CRC. ISBN 9780203502594. OCLC 61365784.
- ^ Роберт Р. Сокал и Ф. Джеймс Рольф (1969). Биометрия (3-е изд.). Нью-Йорк: WH Freeman. С. 786–787. ISBN 9780716724117.
- ^ Кашинат Д. Патил (март 1975 г.). «Q-тест Кохрана: точное распределение». Журнал Американской статистической ассоциации . 70 (349): 186–189. doi :10.1080/01621459.1975.10480285. JSTOR 2285400.
- ^ Fahmy T.; Bellétoile A. (октябрь 2017 г.). «Алгоритм 983: Быстрое вычисление неасимптотической статистики Кохрана Q для обнаружения неоднородности». ACM Transactions on Mathematical Software . 44 (2): 1–20. doi :10.1145/3095076.
В статье использованы материалы, являющиеся общественным достоянием Национального института стандартов и технологий.