Стандартная ошибка ( SE ) [1] статистики ( обычно оценка параметра ) — это стандартное отклонение ее выборочного распределения [2] или оценка этого стандартного отклонения. Если статистика — это выборочное среднее, она называется стандартной ошибкой среднего ( SEM ). [1] Стандартная ошибка — это ключевой ингредиент в создании доверительных интервалов . [3]
Выборочное распределение среднего значения генерируется путем повторной выборки из той же совокупности и записи полученных выборочных средних значений. Это формирует распределение различных средних значений, и это распределение имеет свое собственное среднее значение и дисперсию . Математически дисперсия полученного выборочного распределения среднего значения равна дисперсии совокупности, деленной на размер выборки. Это происходит потому, что по мере увеличения размера выборки выборочные средние значения группируются более тесно вокруг среднего значения совокупности.
Таким образом, соотношение между стандартной ошибкой среднего значения и стандартным отклонением таково, что для заданного размера выборки стандартная ошибка среднего значения равна стандартному отклонению, деленному на квадратный корень размера выборки. [1] Другими словами, стандартная ошибка среднего значения является мерой дисперсии выборочных средних значений вокруг среднего значения совокупности.
В регрессионном анализе термин «стандартная ошибка» относится либо к квадратному корню из приведенной статистики хи-квадрат , либо к стандартной ошибке для конкретного коэффициента регрессии (используемого, например, в доверительных интервалах ).
Предположим, что статистически независимая выборка наблюдений взята из статистической совокупности со стандартным отклонением . Среднее значение, вычисленное по выборке, , будет иметь связанную стандартную ошибку среднего , , заданную как: [1]
На практике это означает, что при попытке оценить значение среднего значения совокупности, с учетом фактора , уменьшение ошибки оценки в два раза требует получения в четыре раза большего числа наблюдений в выборке; уменьшение в десять раз требует получения в сто раз большего числа наблюдений.
Стандартное отклонение выборочной совокупности редко известно. Поэтому стандартная ошибка среднего значения обычно оценивается путем замены ее на стандартное отклонение выборки :
Поскольку это всего лишь оценка истинной «стандартной ошибки», здесь часто можно увидеть другие обозначения, например:
Распространенной причиной путаницы является неспособность четко различать:
Если размер выборки мал, использование стандартного отклонения выборки вместо истинного стандартного отклонения генеральной совокупности будет иметь тенденцию к систематической недооценке стандартного отклонения генеральной совокупности, а следовательно, и стандартной ошибки. При n = 2 недооценка составляет около 25%, но при n = 6 недооценка составляет всего 5%. Гурланд и Трипати (1971) приводят поправку и уравнение для этого эффекта. [4] Сокал и Рольф (1981) приводят уравнение поправочного коэффициента для малых выборок n < 20. [5] См. непредвзятую оценку стандартного отклонения для дальнейшего обсуждения.
Стандартная ошибка среднего может быть получена из дисперсии суммы независимых случайных величин, [6] учитывая определение дисперсии и некоторые ее свойства . Если это выборка независимых наблюдений из совокупности со средним и стандартным отклонением , то мы можем определить общую сумму , которая, благодаря формуле Бьенеме , будет иметь дисперсию , где мы аппроксимировали стандартные отклонения, т. е. неопределенности, самих измерений с наилучшим значением для стандартного отклонения совокупности. Среднее значение этих измерений задается как
Тогда дисперсия среднего равна
Стандартная ошибка, по определению, представляет собой стандартное отклонение, равное квадратному корню из дисперсии:
Для коррелированных случайных величин выборочную дисперсию необходимо вычислять в соответствии с центральной предельной теоремой цепи Маркова .
Бывают случаи, когда выборка берется без знания заранее, сколько наблюдений будет приемлемо по какому-либо критерию. В таких случаях размер выборки является случайной величиной, вариация которой добавляется к вариации таким образом, что, [7] что следует из закона полной дисперсии .
Если имеет распределение Пуассона , то с оценщиком . Следовательно, оценщик становится , что приводит к следующей формуле для стандартной ошибки: (поскольку стандартное отклонение является квадратным корнем дисперсии).
Во многих практических приложениях истинное значение σ неизвестно. В результате нам нужно использовать распределение, которое учитывает этот разброс возможных σ' s. Когда известно, что истинное базовое распределение является гауссовым, хотя и с неизвестным σ, то полученное оценочное распределение следует распределению Стьюдента. Стандартная ошибка — это стандартное отклонение распределения Стьюдента. Распределения T немного отличаются от гауссовского и различаются в зависимости от размера выборки. Малые выборки несколько более склонны недооценивать стандартное отклонение совокупности и иметь среднее значение, которое отличается от истинного среднего значения совокупности, а распределение Стьюдента учитывает вероятность этих событий с несколько более тяжелыми хвостами по сравнению с гауссовым. Чтобы оценить стандартную ошибку распределения Стьюдента, достаточно использовать стандартное отклонение выборки «s» вместо σ , и мы могли бы использовать это значение для расчета доверительных интервалов.
Примечание: распределение вероятности Стьюдента хорошо аппроксимируется распределением Гаусса, когда размер выборки превышает 100. Для таких выборок можно использовать последнее распределение, которое намного проще. Кроме того, даже если «истинное» распределение совокупности неизвестно, предположение о нормальности распределения выборки имеет смысл для разумного размера выборки и при определенных условиях выборки, см. CLT . Если эти условия не выполняются, то использование распределения Bootstrap для оценки стандартной ошибки часто является хорошим обходным путем, но это может быть вычислительно интенсивным.
Примером того, как используется, является создание доверительных интервалов неизвестного среднего значения совокупности. Если распределение выборки распределено нормально , то среднее значение выборки, стандартная ошибка и квантили нормального распределения могут быть использованы для вычисления доверительных интервалов для истинного среднего значения совокупности. Следующие выражения могут быть использованы для вычисления верхнего и нижнего 95% доверительных пределов, где равно среднему значению выборки, равно стандартной ошибке для среднего значения выборки, а 1,96 является приблизительным значением 97,5 процентильной точки нормального распределения :
В частности, стандартная ошибка выборочной статистики (например, выборочное среднее ) — это фактическое или оценочное стандартное отклонение выборочного среднего в процессе, с помощью которого оно было получено. Другими словами, это фактическое или оценочное стандартное отклонение выборочного распределения выборочной статистики. Обозначение для стандартной ошибки может быть любым из SE, SEM (для стандартной ошибки измерения или среднего ) или S E .
Стандартные ошибки представляют собой простые меры неопределенности значения и часто используются по следующим причинам:
В научной и технической литературе экспериментальные данные часто суммируются либо с использованием среднего значения и стандартного отклонения выборочных данных, либо среднего значения со стандартной ошибкой. Это часто приводит к путанице относительно их взаимозаменяемости. Однако среднее значение и стандартное отклонение являются описательной статистикой , тогда как стандартная ошибка среднего значения описывает процесс случайной выборки. Стандартное отклонение выборочных данных является описанием вариации измерений, тогда как стандартная ошибка среднего значения является вероятностным утверждением о том, как размер выборки обеспечит лучшую границу для оценок среднего значения совокупности в свете центральной предельной теоремы. [8]
Проще говоря, стандартная ошибка выборочного среднего — это оценка того, насколько далеко выборочное среднее, вероятно, будет от среднего значения популяции, тогда как стандартное отклонение выборки — это степень, в которой индивидуумы в выборке отличаются от среднего значения выборки. [9] Если стандартное отклонение популяции конечно, стандартная ошибка среднего значения выборки будет стремиться к нулю с увеличением размера выборки, поскольку оценка среднего значения популяции улучшится, в то время как стандартное отклонение выборки будет стремиться к стандартному отклонению популяции по мере увеличения размера выборки.
Формула, приведенная выше для стандартной ошибки, предполагает, что популяция бесконечна. Тем не менее, она часто используется для конечных популяций, когда люди заинтересованы в измерении процесса, который создал существующую конечную популяцию (это называется аналитическим исследованием ). Хотя приведенная выше формула не совсем верна, когда популяция конечна, разница между версиями для конечной и бесконечной популяции будет небольшой, когда доля выборки мала (например, изучается небольшая доля конечной популяции). В этом случае люди часто не вносят поправку на конечную популяцию, по сути рассматривая ее как «приблизительно бесконечную» популяцию.
Если кто-то заинтересован в измерении существующей конечной популяции, которая не будет меняться с течением времени, то необходимо сделать поправку на размер популяции (так называемое перечислительное исследование ). Когда доля выборки (часто называемая f ) велика (приблизительно 5% или более) в перечислительном исследовании , оценку стандартной ошибки необходимо скорректировать путем умножения на «поправку на конечную популяцию» (также известную как: FPC ): [10] [11] которая для больших N : учитывает дополнительную точность, полученную за счет выборки близкой к большему проценту популяции. Эффект FPC заключается в том, что ошибка становится нулевой, когда размер выборки n равен размеру популяции N .
Это происходит в методологии обследования при выборке без замены . Если выборка с заменой, то FPC не вступает в игру.
Если значения измеренной величины A не являются статистически независимыми, но были получены из известных местоположений в пространстве параметров x , несмещенная оценка истинной стандартной ошибки среднего (фактически поправка на часть стандартного отклонения) может быть получена путем умножения вычисленной стандартной ошибки выборки на фактор f : где коэффициент смещения выборки ρ является широко используемой оценкой Прайса–Винстена коэффициента автокорреляции (величина между −1 и +1) для всех пар точек выборки. Эта приближенная формула подходит для выборок среднего и большого размера; в справочнике приведены точные формулы для любого размера выборки, и ее можно применять к сильно автокоррелированным временным рядам, таким как котировки акций Уолл-стрит. Более того, эта формула работает как для положительных, так и для отрицательных ρ. [12] См. также несмещенную оценку стандартного отклонения для более подробного обсуждения.