Тест Сигела-Тьюки, названный в честь Сиднея Сигела и Джона Тьюки , является непараметрическим тестом , который может быть применен к данным, измеренным по крайней мере по порядковой шкале . Он проверяет различия в масштабе между двумя группами.
Тест используется для определения того, имеет ли одна из двух групп данных тенденцию к более широкому разбросу значений, чем другая. Другими словами, тест определяет, имеет ли одна из двух групп тенденцию к движению, иногда вправо, иногда влево, но от центра (порядковой шкалы).
Тест был опубликован в 1960 году Сиднеем Сигелом и Джоном Уайлдером Тьюки в журнале Американской статистической ассоциации в статье «Непараметрическая процедура суммы рангов для относительного разброса в непарных выборках».
Принцип основан на следующей идее:
Предположим, что есть две группы A и B с n наблюдениями для первой группы и m наблюдениями для второй (то есть всего N = n + m наблюдений). Если все N наблюдений расположены в порядке возрастания, можно ожидать, что значения двух групп будут смешаны или отсортированы случайным образом, если между двумя группами нет различий (следуя нулевой гипотезе H 0 ). Это означало бы, что среди рангов крайних (высоких и низких) оценок будут находиться похожие значения из группы A и группы B.
Если, скажем, группа А более склонна к экстремальным значениям ( альтернативная гипотеза H 1 ), то будет более высокая доля наблюдений из группы А с низкими или высокими значениями и уменьшенная доля значений в центре.
Две группы, A и B, выдают следующие значения (уже отсортированные в порядке возрастания):
Объединив группы, получаем группу из 13 записей. Ранжирование осуществляется по чередующимся крайностям (ранг 1 — самый низкий, 2 и 3 — два самых высоких, 4 и 5 — два следующих за ним и т. д.).
Сумма рангов внутри каждой группы W:
Если нулевая гипотеза верна, ожидается, что средние ранги двух групп будут схожими.
Если одна из двух групп более рассеяна, ее ранги будут ниже, так как крайние значения получат более низкие ранги, в то время как другая группа получит больше высоких баллов, назначенных центру. Для проверки разницы между группами на значимость используется тест суммы рангов Уилкоксона , который также оправдывает обозначения W A и W B при расчете сумм рангов.
Из ранговых сумм рассчитывается статистика U путем вычитания минимально возможного балла n ( n + 1)/2 для каждой группы: [1]
Минимальное из этих двух значений распределяется согласно распределению суммы рангов Вилкоксона с параметрами, заданными размерами двух групп:
Что позволяет рассчитать p-значение для этого теста по следующей формуле:
Для определения статистической значимости результатов можно использовать таблицу распределения суммы рангов Уилкоксона ( более подробные пояснения по этим таблицам см. в Mann–Whitney_U_test ).
Для данных примера с группами размеров m=6 и n=7 p-значение равно:
что указывает на отсутствие или отсутствие существенных оснований для отклонения нулевой гипотезы о том, что дисперсия двух групп одинакова.