В статистике F -тест равенства дисперсий является тестом для нулевой гипотезы о том, что две нормальные совокупности имеют одинаковую дисперсию . Теоретически любой F -тест можно рассматривать как сравнение двух дисперсий, но конкретный случай, обсуждаемый в этой статье, — это случай двух совокупностей, где используемая статистика теста — это отношение двух выборочных дисперсий . [1] Эта конкретная ситуация важна в математической статистике , поскольку она обеспечивает базовый примерный случай, в котором может быть выведено F -распределение . [2] Для применения в прикладной статистике существует опасение [3] , что тест настолько чувствителен к предположению о нормальности, что было бы нецелесообразно использовать его в качестве рутинного теста на равенство дисперсий. Другими словами, это случай, когда «приблизительная нормальность» (которая в подобных контекстах часто была бы оправдана с использованием центральной предельной теоремы ) недостаточно хороша, чтобы сделать процедуру теста приблизительно допустимой в приемлемой степени.
Пусть X 1 , ..., X n и Y 1 , ..., Y m — независимые и одинаково распределенные выборки из двух совокупностей, каждая из которых имеет нормальное распределение . Ожидаемые значения для двух совокупностей могут быть разными, и проверяемая гипотеза заключается в том, что дисперсии равны. Пусть
быть образцом означает . Пусть
быть выборочными дисперсиями . Тогда тестовая статистика
имеет F-распределение с n − 1 и m − 1 степенями свободы, если нулевая гипотеза о равенстве дисперсий верна. В противном случае она следует F-распределению, масштабированному отношением истинных дисперсий. Нулевая гипотеза отклоняется, если F слишком велико или слишком мало на основе желаемого уровня альфа (т. е. статистической значимости ).
Известно, что этот F-тест чрезвычайно чувствителен к ненормальности [ 4] [5], поэтому тест Левена , тест Бартлетта или тест Брауна–Форсайта являются лучшими тестами для проверки равенства двух дисперсий. (Однако все эти тесты создают экспериментальную инфляцию ошибок типа I , когда проводятся в качестве проверки предположения о гомоскедастичности до проверки эффектов. [6] ) F-тесты на равенство дисперсий можно использовать на практике, с осторожностью, особенно когда требуется быстрая проверка, и при условии сопутствующей диагностической проверки: практические учебники [7] предлагают как графические, так и формальные проверки предположения.
F-тесты используются для других статистических проверок гипотез , таких как проверка различий в средних значениях в трех или более группах или в факторных макетах. Эти F-тесты, как правило, не являются надежными , когда есть нарушения предположения, что каждая популяция следует нормальному распределению , особенно для малых уровней альфа и несбалансированных макетов. [8] Однако для больших уровней альфа (например, не менее 0,05) и сбалансированных макетов F-тест относительно надежен, хотя (если предположение о нормальности не выполняется) он страдает от потери сравнительной статистической мощности по сравнению с непараметрическими аналогами.
Непосредственное обобщение проблемы, описанной выше, касается ситуаций, когда имеется более двух групп или популяций, и гипотеза заключается в том, что все дисперсии равны. Это проблема, рассматриваемая тестом Хартли и тестом Бартлетта .