В статистике стандартная оценка — это число стандартных отклонений , на которое значение сырой оценки (т. е. наблюдаемое значение или точка данных) выше или ниже среднего значения того, что наблюдается или измеряется. Сырые оценки выше среднего имеют положительные стандартные оценки, тогда как те, что ниже среднего, имеют отрицательные стандартные оценки.
Он рассчитывается путем вычитания среднего значения популяции из индивидуального сырого балла и последующего деления разницы на стандартное отклонение популяции . Этот процесс преобразования сырого балла в стандартный балл называется стандартизацией или нормализацией (однако «нормализация» может относиться ко многим типам соотношений; см. Нормализация для получения дополнительной информации).
Стандартные оценки чаще всего называются z -оценками ; эти два термина могут использоваться взаимозаменяемо, как в этой статье. Другие эквивалентные термины в использовании включают z-значение , z-статистику , нормальную оценку , стандартизированную переменную и тянуть в физике высоких энергий . [1] [2]
Для вычисления z-оценки необходимо знать среднее значение и стандартное отклонение всей совокупности, к которой принадлежит точка данных; если имеется только выборка наблюдений из совокупности, то аналогичное вычисление с использованием выборочного среднего значения и стандартного отклонения выборки дает t -статистику .
Если известны среднее значение популяции и стандартное отклонение популяции, то исходный балл x преобразуется в стандартный балл по формуле [3]
где:
Абсолютное значение z представляет собой расстояние между исходным баллом x и средним значением генеральной совокупности в единицах стандартного отклонения. z имеет отрицательное значение, если исходный балл ниже среднего значения, и положительное значение, если выше.
Расчет z с использованием этой формулы требует использования среднего значения популяции и стандартного отклонения популяции, а не среднего значения выборки или отклонения выборки. Однако знание истинного среднего значения и стандартного отклонения популяции часто является нереалистичным ожиданием, за исключением таких случаев, как стандартизированное тестирование , когда измеряется вся популяция.
Если среднее значение совокупности и стандартное отклонение совокупности неизвестны, стандартную оценку можно оценить, используя среднее значение выборки и стандартное отклонение выборки в качестве оценок значений совокупности. [4] [5] [6] [7]
В этих случаях z -оценка определяется как
где:
Хотя это всегда следует указывать, различие между использованием статистики населения и выборки часто не проводится. В любом случае числитель и знаменатель уравнений имеют одинаковые единицы измерения, так что единицы сокращаются посредством деления, и z остается как безразмерная величина .
Z-оценка часто используется в z-тесте в стандартизированном тестировании – аналоге t-теста Стьюдента для совокупности, параметры которой известны, а не оценены. Поскольку очень необычно знать всю совокупность, t-тест используется гораздо шире.
Стандартная оценка может быть использована при расчете интервалов прогнозирования . Интервал прогнозирования [ L , U ], состоящий из нижней конечной точки, обозначенной L , и верхней конечной точки, обозначенной U , представляет собой интервал, такой, что будущее наблюдение X будет лежать в интервале с высокой вероятностью , т.е.
Для стандартной оценки Z из X это дает: [8]
Определив квантиль z таким образом, что
следует:
В приложениях управления технологическими процессами значение Z позволяет оценить степень отклонения процесса от целевого значения.
Когда баллы измеряются по разным шкалам, их можно преобразовать в z-баллы для облегчения сравнения. Диц и др. [9] приводят следующий пример, сравнивая баллы учащихся по (старым) тестам SAT и ACT для старших классов. В таблице показано среднее значение и стандартное отклонение для общих баллов по SAT и ACT. Предположим, что ученик A набрал 1800 баллов по SAT, а ученик B набрал 24 балла по ACT. Какой ученик показал лучшие результаты по сравнению с другими сдающими тест?
Z-оценка для студента А составляет
Z-оценка для студента B составляет
Поскольку у студента А z-оценка выше, чем у студента Б, студент А показал лучшие результаты по сравнению с другими сдающими тест, чем студент Б.
Продолжая пример с результатами ACT и SAT, если можно предположить, что результаты ACT и SAT распределены нормально (что приблизительно верно), то z-оценки можно использовать для расчета процента сдающих тест, получивших более низкие баллы, чем студенты A и B.
«Для некоторых многомерных методов, таких как многомерное шкалирование и кластерный анализ, концепция расстояния между единицами данных часто представляет значительный интерес и важность… Когда переменные в многомерном наборе данных находятся в разных масштабах, имеет больше смысла вычислять расстояния после некоторой формы стандартизации». [10]
В анализе главных компонентов «переменные, измеряемые в разных шкалах или в общей шкале с сильно различающимися диапазонами, часто стандартизируются» [11] .
Стандартизация переменных перед множественным регрессионным анализом иногда используется в качестве вспомогательного средства для интерпретации. [12] (стр. 95) утверждает следующее.
«Стандартизированный наклон регрессии — это наклон в уравнении регрессии, если X и Y стандартизированы… Стандартизация X и Y выполняется путем вычитания соответствующих средних значений из каждого набора наблюдений и деления на соответствующие стандартные отклонения… В множественной регрессии, где используются несколько переменных X, стандартизированные коэффициенты регрессии количественно определяют относительный вклад каждой переменной X».
Однако Катнер и др. [13] (стр. 278) делают следующее предостережение: «… следует проявлять осторожность при интерпретации любых коэффициентов регрессии, независимо от того, стандартизированы они или нет. Причина в том, что когда предикторные переменные коррелируют между собой, … на коэффициенты регрессии влияют другие предикторные переменные в модели… Величины стандартизированных коэффициентов регрессии зависят не только от наличия корреляций между предикторными переменными, но и от интервалов между наблюдениями по каждой из этих переменных. Иногда эти интервалы могут быть совершенно произвольными. Следовательно, обычно неразумно интерпретировать величины стандартизированных коэффициентов регрессии как отражающие сравнительную важность предикторных переменных».
В математической статистике случайная величина X стандартизируется путем вычитания ее ожидаемого значения и деления разницы на ее стандартное отклонение.
Если рассматриваемая случайная величина является выборочным средним случайной выборки X :
то стандартизированная версия
В образовательной оценке T-балл представляет собой стандартный балл, смещенный на Z и масштабированный таким образом, чтобы среднее значение составляло 50, а стандартное отклонение — 10. [14] [15] [16]
При измерении плотности костей Т-показатель является стандартным показателем измерения по сравнению с популяцией здоровых 30-летних взрослых и имеет обычное среднее значение 0 и стандартное отклонение 1. [17]