stringtranslate.com

F-тест равенства дисперсий

В статистике F -тест равенства дисперсий является тестом для нулевой гипотезы о том, что две нормальные совокупности имеют одинаковую дисперсию . Теоретически любой F -тест можно рассматривать как сравнение двух дисперсий, но конкретный случай, обсуждаемый в этой статье, — это случай двух совокупностей, где используемая статистика теста — это отношение двух выборочных дисперсий . [1] Эта конкретная ситуация важна в математической статистике , поскольку она обеспечивает базовый примерный случай, в котором может быть выведено F -распределение . [2] Для применения в прикладной статистике существует опасение [3] , что тест настолько чувствителен к предположению о нормальности, что было бы нецелесообразно использовать его в качестве рутинного теста на равенство дисперсий. Другими словами, это случай, когда «приблизительная нормальность» (которая в подобных контекстах часто была бы оправдана с использованием центральной предельной теоремы ) недостаточно хороша, чтобы сделать процедуру теста приблизительно допустимой в приемлемой степени.

Тест

Пусть X 1 , ...,  X n и Y 1 , ...,  Y mнезависимые и одинаково распределенные выборки из двух совокупностей, каждая из которых имеет нормальное распределение . Ожидаемые значения для двух совокупностей могут быть разными, и проверяемая гипотеза заключается в том, что дисперсии равны. Пусть

быть образцом означает . Пусть

быть выборочными дисперсиями . Тогда тестовая статистика

имеет F-распределение с n  − 1 и m  − 1 степенями свободы, если нулевая гипотеза о равенстве дисперсий верна. В противном случае она следует F-распределению, масштабированному отношением истинных дисперсий. Нулевая гипотеза отклоняется, если F слишком велико или слишком мало на основе желаемого уровня альфа (т. е. статистической значимости ).

Характеристики

Известно, что этот F-тест чрезвычайно чувствителен к ненормальности [ 4] [5], поэтому тест Левена , тест Бартлетта или тест Брауна–Форсайта являются лучшими тестами для проверки равенства двух дисперсий. (Однако все эти тесты создают экспериментальную инфляцию ошибок типа I , когда проводятся в качестве проверки предположения о гомоскедастичности до проверки эффектов. [6] ) F-тесты на равенство дисперсий можно использовать на практике, с осторожностью, особенно когда требуется быстрая проверка, и при условии сопутствующей диагностической проверки: практические учебники [7] предлагают как графические, так и формальные проверки предположения.

F-тесты используются для других статистических проверок гипотез , таких как проверка различий в средних значениях в трех или более группах или в факторных макетах. Эти F-тесты, как правило, не являются надежными , когда есть нарушения предположения, что каждая популяция следует нормальному распределению , особенно для малых уровней альфа и несбалансированных макетов. [8] Однако для больших уровней альфа (например, не менее 0,05) и сбалансированных макетов F-тест относительно надежен, хотя (если предположение о нормальности не выполняется) он страдает от потери сравнительной статистической мощности по сравнению с непараметрическими аналогами.

Обобщение

Непосредственное обобщение проблемы, описанной выше, касается ситуаций, когда имеется более двух групп или популяций, и гипотеза заключается в том, что все дисперсии равны. Это проблема, рассматриваемая тестом Хартли и тестом Бартлетта .

Смотрите также

Ссылки

  1. ^ Снедекор, Джордж У. и Кохран, Уильям Г. (1989), Статистические методы, восьмое издание, Издательство Университета штата Айова.
  2. ^ Джонсон, Н. Л., Коц, С., Балакришнан, Н. (1995) Непрерывные одномерные распределения, том 2 , Wiley. ISBN  0-471-58494-0 (раздел 27.1)
  3. ^ Агрести, А. и Катери, М. (2021), Основы статистики для специалистов по данным: с R и Python, CRC Press. ISBN 978-0-367-74845-6 (Раздел 5.3.2) 
  4. ^ Бокс, GEP (1953). «Ненормальность и тесты на дисперсии». Biometrika . 40 (3/4): 318–335. doi :10.1093/biomet/40.3-4.318. JSTOR  2333350.
  5. ^ Марковски, Кэрол А.; Марковски, Эдвард П. (1990). «Условия эффективности предварительного дисперсионного теста». Американский статистик . 44 (4): 322–326. doi :10.2307/2684360. JSTOR  2684360.
  6. ^ Савиловски, С. (2002). «Ферма, Шуберт, Эйнштейн и Беренс–Фишер: Вероятная разница между двумя средними, когда σ12 ≠ σ22», Журнал современных прикладных статистических методов , 1 (2), 461–472.
  7. ^ Риз, Д.Г. (2001) Essential Statistics (4-е издание) , Chapman & Hall/CRC, ISBN 1-58488-007-4 . Раздел 10.15 
  8. ^ Блэр, RC (1981). «Реакция на «Последствия невыполнения предположений, лежащих в основе дисперсионного и ковариационного анализа с фиксированными эффектами»". Обзор исследований в области образования . 51 (4): 499–507. doi :10.3102/00346543051004499. S2CID  121873115.