Z-тест

Z - тест — это любой статистический тест , для которого распределение тестовой статистики при нулевой гипотезе может быть аппроксимировано нормальным распределением . Z -тест проверяет среднее значение распределения. Для каждого уровня значимости в доверительном интервале Z -тест имеет одно критическое значение (например, 1,96 для 5% двухстороннего), что делает его более удобным, чем t -тест Стьюдента , критические значения которого определяются размером выборки (через соответствующие степени свободы ). И Z-тест, и t-тест Стьюдента имеют сходство в том, что они оба помогают определить значимость набора данных. Однако z-тест редко используется на практике, поскольку отклонение генеральной совокупности трудно определить.

Применимость

Из-за центральной предельной теоремы многие тестовые статистики распределены приблизительно нормально для больших выборок. Поэтому многие статистические тесты можно удобно выполнять как приближенные Z -тесты, если размер выборки большой или дисперсия популяции известна. Если дисперсия популяции неизвестна (и, следовательно, должна быть оценена по самой выборке), а размер выборки невелик ( n < 30), t -тест Стьюдента может быть более подходящим (в некоторых случаях n < 50, как описано ниже).

Процедура

Как выполнить Z-тест, когда T — статистика, которая приблизительно нормально распределена при нулевой гипотезе, выглядит следующим образом:

Сначала оценим ожидаемое значение μ величины T при нулевой гипотезе и получим оценку s стандартного отклонения величины T.

Во-вторых, определите свойства T : однохвостый или двухвостый.

Для нулевой гипотезы H ₀ : μ≥μ ₀ против альтернативной гипотезы H ₁ : μ<μ ₀ она является нижней/левосторонней (односторонней).

Для нулевой гипотезы H ₀ : μ≤μ ₀ против альтернативной гипотезы H ₁ : μ>μ ₀ распределение является верхним/правым (односторонним).

Для нулевой гипотезы H ₀ : μ=μ ₀ против альтернативной гипотезы H ₁ : μ≠μ ₀ он является двусторонним.

В-третьих, вычислите стандартную оценку : какие односторонние и двусторонние p -значения можно рассчитать как Φ( Z )(для нижних/левых тестов), Φ(− Z ) (для верхних/правых тестов) и 2Φ(−| Z |) (для двусторонних тестов), где Φ — стандартная нормальная кумулятивная функция распределения . $Z={\frac {({\bar {X}}-\mu _{0})}{s}},$

Использование при тестировании местоположения

Термин « Z -тест» часто используется для обозначения именно одновыборочного локационного теста, сравнивающего среднее значение набора измерений с заданной константой, когда известна дисперсия выборки. Например, если наблюдаемые данные X ₁ , ..., X _n (i) независимы, (ii) имеют общее среднее значение μ и (iii) имеют общую дисперсию σ ² , то выборочное среднее значение X имеет среднее значение μ и дисперсию . ${\frac {\sigma ^{2}}{n}}$
Нулевая гипотеза заключается в том, что среднее значение X равно заданному числу μ _0. Мы можем использовать X в качестве тестовой статистики, отвергая нулевую гипотезу, если X − μ ₀ велико.
Для вычисления стандартизированной статистики нам нужно знать или иметь приблизительное значение для σ ² , из которого мы можем вычислить . В некоторых приложениях σ ² известен, но это необычно. $Z={\frac {({\bar {X}}-\mu _{0})}{s}}$ $s^{2}={\frac {\sigma ^{2}}{n}}$
Если размер выборки средний или большой, мы можем заменить дисперсию выборки на σ ² , получив подключаемый тест. Полученный тест не будет точным Z -тестом, поскольку неопределенность в дисперсии выборки не учитывается, однако он будет хорошим приближением, если размер выборки не мал.
Для учета неопределенности в дисперсии выборки, когда данные полностью нормальны, можно использовать t - тест .
Разница между Z-тестом и t-тестом: Z-тест используется, когда размер выборки большой (n>50) или дисперсия генеральной совокупности известна. t-тест используется, когда размер выборки небольшой (n<50) и дисперсия генеральной совокупности неизвестна.
Не существует универсальной константы, при которой размер выборки обычно считается достаточно большим, чтобы оправдать использование теста плагина. Типичные правила: размер выборки должен составлять 50 наблюдений или более.
Для больших размеров выборки процедура t -теста дает практически идентичные p -значения, что и процедура Z -теста.
Другими тестами местоположения, которые можно выполнять как Z -тесты, являются двухвыборочный тест местоположения и парный разностный тест .

Условия

Для применения Z -теста необходимо соблюдение определенных условий.

Мешающие параметры должны быть известны или оценены с высокой точностью (примером мешающего параметра может служить стандартное отклонение в тесте местоположения с одной выборкой). Z -тесты фокусируются на одном параметре и рассматривают все остальные неизвестные параметры как фиксированные на их истинных значениях. На практике, благодаря теореме Слуцкого , «подключение» последовательных оценок мешающих параметров может быть оправдано. Однако, если размер выборки недостаточно велик для того, чтобы эти оценки были достаточно точными, Z -тест может работать не очень хорошо.
Статистика теста должна следовать нормальному распределению . Обычно апеллируют к центральной предельной теореме, чтобы оправдать предположение, что статистика теста изменяется нормально. Существует много статистических исследований по вопросу о том, когда статистика теста изменяется приблизительно нормально. Если вариация статистики теста сильно ненормальна, Z -тест не следует использовать.

Если оценки мешающих параметров включены, как обсуждалось выше, важно использовать оценки, соответствующие способу выборки данных . В особом случае Z -тестов для проблемы расположения одной или двух выборок обычное стандартное отклонение выборки подходит только в том случае, если данные были собраны как независимая выборка.

В некоторых ситуациях можно разработать тест, который должным образом учитывает вариацию в оценках плагинов мешающих параметров. В случае проблем с одним и двумя образцами это делает t -тест .

Пример

Предположим, что в определенном географическом регионе среднее значение и стандартное отклонение баллов за тест по чтению составляют 100 баллов и 12 баллов соответственно. Нас интересуют баллы 55 учеников в определенной школе, которые получили средний балл 96. Мы можем спросить, является ли этот средний балл значительно ниже среднего регионального — то есть, сопоставимы ли ученики в этой школе с простой случайной выборкой из 55 учеников из региона в целом или их баллы удивительно низкие?

Сначала вычислим стандартную ошибку среднего значения:

\mathrm {SE} ={\frac {\sigma }{\sqrt {n}}}={\frac {12}{\sqrt {55}}}={\frac {12}{7,42}}=1,62

где — стандартное отклонение популяции. ${\сигма}$

Затем вычислите z -оценку , которая представляет собой расстояние от среднего значения выборки до среднего значения совокупности в единицах стандартной ошибки:

z={\frac {M-\mu }{\mathrm {SE} }}={\frac {96-100}{1,62}}=-2,47

В этом примере мы рассматриваем среднее значение и дисперсию популяции как известные, что было бы уместно, если бы все студенты в регионе были протестированы. Когда параметры популяции неизвестны, вместо этого следует провести t-тест Стьюдента .

Средний балл класса составляет 96, что составляет −2,47 единиц стандартной ошибки от среднего значения популяции 100. Просматривая z -оценку в таблице кумулятивной вероятности стандартного нормального распределения , мы обнаруживаем, что вероятность наблюдения стандартного нормального значения ниже −2,47 составляет приблизительно 0,5 − 0,4932 = 0,0068. Это одностороннее p - значение для нулевой гипотезы о том, что 55 студентов сопоставимы с простой случайной выборкой из популяции всех сдающих тест. Двустороннее p -значение составляет приблизительно 0,014 (в два раза больше одностороннего p -значения).

Другой способ утверждения заключается в том, что с вероятностью 1 − 0,014 = 0,986 простая случайная выборка из 55 студентов будет иметь средний тестовый балл в пределах 4 единиц от среднего значения популяции. Мы также могли бы сказать, что с уверенностью 98,6% мы отвергаем нулевую гипотезу о том, что 55 испытуемых сопоставимы с простой случайной выборкой из популяции испытуемых.

Z -тест говорит нам , что 55 интересующих нас студентов имеют необычно низкий средний тестовый балл по сравнению с большинством простых случайных выборок аналогичного размера из популяции тестируемых. Недостатком этого анализа является то, что он не учитывает, имеет ли значение размер эффекта в 4 балла. Если бы вместо класса мы рассматривали субрегион, содержащий 900 студентов, средний балл которых был 99, наблюдались бы почти те же z -оценка и p -значение. Это показывает, что если размер выборки достаточно велик, очень небольшие различия от нулевого значения могут быть статистически высокозначимыми. См. статистическое тестирование гипотез для дальнейшего обсуждения этого вопроса.

З-тесты, отличные от локационных тестов

Тесты местоположения являются наиболее известными Z -тестами. Другой класс Z -тестов возникает при оценке максимального правдоподобия параметров в параметрической статистической модели . Оценки максимального правдоподобия приблизительно нормальны при определенных условиях, и их асимптотическая дисперсия может быть рассчитана в терминах информации Фишера. Оценка максимального правдоподобия, деленная на ее стандартную ошибку, может использоваться в качестве испытательной статистики для нулевой гипотезы о том, что значение популяции параметра равно нулю. В более общем смысле, если — оценка максимального правдоподобия параметра θ, а θ ₀ — значение θ при нулевой гипотезе, ${\hat {\theta }}$

{\frac {{\hat {\theta }}-\theta _{0}}{{\rm {SE}}({\hat {\theta }})}}

может использоваться как статистика Z -теста.

При использовании Z -теста для оценок максимального правдоподобия важно знать, что нормальное приближение может быть плохим, если размер выборки недостаточно велик. Хотя не существует простого универсального правила, определяющего, насколько большим должен быть размер выборки для использования Z -теста, моделирование может дать хорошее представление о том, подходит ли Z -тест в данной ситуации.

Z -тесты применяются всякий раз, когда можно утверждать, что тестовая статистика следует нормальному распределению при интересующей нулевой гипотезе. Многие непараметрические тестовые статистики, такие как U-статистика , приблизительно нормальны для достаточно больших размеров выборки и, следовательно, часто выполняются как Z -тесты.

Смотрите также

Ссылки

Спринтхолл, RC (2011). Базовый статистический анализ (9-е изд.). Pearson Education. ISBN 978-0-205-05217-2.
Казелла, Г. , Бергер, Р. Л. (2002). Статистический вывод . Duxbury Press. ISBN 0-534-24312-6 .
Дуглас К. Монтгомери, Джордж К. Рангер.(2014). Прикладная статистика и вероятность для инженеров .(6-е изд.). John Wiley & Sons, inc. ISBN 9781118539712 , 9781118645062 .