В статистике тест Левена — это выводная статистика, используемая для оценки равенства дисперсий для переменной, рассчитанной для двух или более групп. [1] Этот тест используется , поскольку некоторые общие статистические процедуры предполагают, что дисперсии популяций, из которых взяты разные выборки, равны. Тест Левена оценивает это предположение. Он проверяет нулевую гипотезу о том, что дисперсии популяций равны (называется однородностью дисперсии или гомоскедастичностью ). Если результирующее p -значение теста Левена меньше некоторого уровня значимости (обычно 0,05), полученные различия в дисперсиях выборок вряд ли возникли на основе случайной выборки из популяции с равными дисперсиями. Таким образом, нулевая гипотеза о равенстве дисперсий отвергается, и делается вывод о наличии разницы между дисперсиями в популяции.
Тест Левена использовался в прошлом перед сравнением средних значений для информирования о решении использовать ли объединенный t-тест или t-тест Уэлча для двухвыборочных тестов или дисперсионный анализ или модифицированный однофакторный дисперсионный анализ Уэлча для многоуровневых тестов. Однако было показано, что такая двухэтапная процедура может значительно увеличить ошибку типа 1, полученную с помощью t-тестов, и поэтому не рекомендуется. [2] Вместо этого предпочтительный подход заключается в том, чтобы просто использовать тест Уэлча во всех случаях. [2]
Тест Левена также может использоваться в качестве основного теста для ответа на отдельный вопрос о том, имеют ли две подвыборки в данной популяции равные или разные дисперсии. [3]
Тест Левена был разработан и назван в честь американского статистика и генетика Говарда Левена .
Тест Левена эквивалентен однофакторному дисперсионному анализу между группами (ANOVA), где зависимая переменная представляет собой абсолютное значение разницы между баллом и средним значением группы, к которой принадлежит балл (показано ниже как ). Статистика теста, , эквивалентна статистике , которая была бы получена с помощью такого ANOVA, и определяется следующим образом:
где
(Оба определения используются, хотя второе, строго говоря, является тестом Брауна–Форсайта — см. ниже для сравнения.)
Тестовая статистика приблизительно распределена по закону F с и степенями свободы, и, следовательно, представляет собой значимость результата, протестированного против , где — квантиль F-распределения с и степенями свободы, а — выбранный уровень значимости (обычно 0,05 или 0,01).
Тест Брауна-Форсайта использует медиану вместо среднего значения при вычислении разброса внутри каждой группы ( против , выше). Хотя оптимальный выбор зависит от базового распределения, определение, основанное на медиане, рекомендуется как выбор, который обеспечивает хорошую устойчивость против многих типов ненормальных данных, сохраняя при этом хорошую статистическую мощность . [3] Если у кого-то есть знания о базовом распределении данных, это может указывать на использование одного из других вариантов. Браун и Форсайт провели исследования Монте-Карло , которые показали, что использование усеченного среднего значения дает наилучшие результаты, когда базовые данные следуют распределению Коши ( распределение с тяжелым хвостом ), а медиана дает наилучшие результаты, когда базовые данные следуют распределению хи-квадрат с четырьмя степенями свободы (сильно перекошенное распределение ). Использование среднего значения обеспечивает наилучшую мощность для симметричных распределений с умеренным хвостом.
Многие программы для работы с электронными таблицами и статистические пакеты, такие как R , Python , Julia и MATLAB, включают в себя реализации теста Левена.