тест Левена

В статистике тест Левена — это выводная статистика, используемая для оценки равенства дисперсий для переменной, рассчитанной для двух или более групп. ^[1] Этот тест используется , поскольку некоторые общие статистические процедуры предполагают, что дисперсии популяций, из которых взяты разные выборки, равны. Тест Левена оценивает это предположение. Он проверяет нулевую гипотезу о том, что дисперсии популяций равны (называется однородностью дисперсии или гомоскедастичностью ). Если результирующее p -значение теста Левена меньше некоторого уровня значимости (обычно 0,05), полученные различия в дисперсиях выборок вряд ли возникли на основе случайной выборки из популяции с равными дисперсиями. Таким образом, нулевая гипотеза о равенстве дисперсий отвергается, и делается вывод о наличии разницы между дисперсиями в популяции.

Тест Левена использовался в прошлом перед сравнением средних значений для информирования о решении использовать ли объединенный t-тест или t-тест Уэлча для двухвыборочных тестов или дисперсионный анализ или модифицированный однофакторный дисперсионный анализ Уэлча для многоуровневых тестов. Однако было показано, что такая двухэтапная процедура может значительно увеличить ошибку типа 1, полученную с помощью t-тестов, и поэтому не рекомендуется. ^[2] Вместо этого предпочтительный подход заключается в том, чтобы просто использовать тест Уэлча во всех случаях. ^[2]

Тест Левена также может использоваться в качестве основного теста для ответа на отдельный вопрос о том, имеют ли две подвыборки в данной популяции равные или разные дисперсии. ^[3]

Тест Левена был разработан и назван в честь американского статистика и генетика Говарда Левена .

Определение

Тест Левена эквивалентен однофакторному дисперсионному анализу между группами (ANOVA), где зависимая переменная представляет собой абсолютное значение разницы между баллом и средним значением группы, к которой принадлежит балл (показано ниже как ). Статистика теста, , эквивалентна статистике , которая была бы получена с помощью такого ANOVA, и определяется следующим образом: $Z_{ij}=|Y_{ij}-{\bar {Y}}_{i\cdot }|$ $W$ $F$

W={\frac {(Nk)}{(k-1)}}\cdot {\frac {\sum _{i=1}^{k}N_{i}(Z_{i\cdot } -Z_{\cdot \cdot })^{2}}{\sum _{i=1}^{k}\sum _{j=1}^{N_{i}}(Z_{ij}-Z_{ я\cdot })^{2}}},

где

$к$ это число различных групп, к которым принадлежат отобранные случаи,
$N_{i}$ - число случаев в й группе, $я$
$N$ общее число случаев во всех группах,
$Y_{ij}$ - значение измеряемой переменной для -го случая из -й группы, $j$ $я$
$Z_{ij}={\begin{cases}|Y_{ij}-{\bar {Y}}_{i\cdot }|,&{\bar {Y}}_{i\cdot }{\text{ является средним значением }}i{\text{-й группы}},\\|Y_{ij}-{\tilde {Y}}_{i\cdot }|,&{\tilde {Y}}_{i\cdot }{\text{ является медианой }}i{\text{-й группы}}.\end{cases}}$

(Оба определения используются, хотя второе, строго говоря, является тестом Брауна–Форсайта — см. ниже для сравнения.)

$Z_{i\cdot }={\frac {1}{N_{i}}}\sum _{j=1}^{N_{i}}Z_{ij}$ это среднее значение для группы , $Z_{ij}$ $я$
$Z_{\cdot \cdot }={\frac {1}{N}}\sum _{i=1}^{k}\sum _{j=1}^{N_{i}}Z_{ ij}$ является средним из всех . $Z_{ij}$

Тестовая статистика приблизительно распределена по закону F с и степенями свободы, и, следовательно, представляет собой значимость результата, протестированного против , где — квантиль F-распределения с и степенями свободы, а — выбранный уровень значимости (обычно 0,05 или 0,01). $W$ $к-1$ $Нк$ $w$ $W$ $F(1-\alpha;k-1,Nk)$ $F$ $к-1$ $Нк$ $\альфа$

Сравнение с тестом Брауна–Форсайта

Тест Брауна-Форсайта использует медиану вместо среднего значения при вычислении разброса внутри каждой группы ( против , выше). Хотя оптимальный выбор зависит от базового распределения, определение, основанное на медиане, рекомендуется как выбор, который обеспечивает хорошую устойчивость против многих типов ненормальных данных, сохраняя при этом хорошую статистическую мощность . ^[3] Если у кого-то есть знания о базовом распределении данных, это может указывать на использование одного из других вариантов. Браун и Форсайт провели исследования Монте-Карло , которые показали, что использование усеченного среднего значения дает наилучшие результаты, когда базовые данные следуют распределению Коши ( распределение с тяжелым хвостом ), а медиана дает наилучшие результаты, когда базовые данные следуют распределению хи-квадрат с четырьмя степенями свободы (сильно перекошенное распределение ). Использование среднего значения обеспечивает наилучшую мощность для симметричных распределений с умеренным хвостом. ${\bar {Y}}$ ${\тильда {Y}}$

Реализации программного обеспечения

Многие программы для работы с электронными таблицами и статистические пакеты, такие как R , Python , Julia и MATLAB, включают в себя реализации теста Левена.

Смотрите также

Ссылки

^ Левин, Ховард (1960). «Надежные тесты на равенство дисперсий». В Ингрэм Олкин ; Гарольд Хотеллинг ; и др. (ред.). Вклад в теорию вероятности и статистику: эссе в честь Гарольда Хотеллинга . Stanford University Press. стр. 278–292.
^ ab Циммерманн, Дональд В. (2004). «Заметка о предварительных тестах равенства дисперсий». British Journal of Mathematical and Statistical Psychology . 57 (1): 173–81. doi :10.1348/000711004849222.
^ ab Деррик, Б.; Рак, А.; Тохер, Д.; Уайт, П. (2018). «Тесты на равенство дисперсий между двумя выборками, которые содержат как парные наблюдения, так и независимые наблюдения» (PDF) . Журнал прикладных количественных методов . 13 (2): 36–47.

Внешние ссылки

Параметрический и непараметрический тест Левена в SPSS
http://www.itl.nist.gov/div898/handbook/eda/section3/eda35a.htm