В статистике дисперсия (также называемая изменчивостью , разбросом или спредом ) — это степень, в которой распределение растянуто или сжато. [1] Распространенными примерами мер статистической дисперсии являются дисперсия , стандартное отклонение и межквартильный размах . Например, когда дисперсия данных в наборе велика, данные широко разбросаны. С другой стороны, когда дисперсия мала, данные в наборе кластеризованы.
Дисперсия противопоставляется местоположению или центральной тенденции , и вместе они являются наиболее используемыми свойствами распределений.
Мера статистической дисперсии — это неотрицательное действительное число , которое равно нулю, если все данные одинаковы, и увеличивается по мере того, как данные становятся более разнообразными.
Большинство мер дисперсии имеют те же единицы , что и измеряемая величина . Другими словами, если измерения в метрах или секундах, то и мера дисперсии тоже. Примеры мер дисперсии включают:
Они часто используются (вместе с масштабными факторами ) в качестве оценщиков масштабных параметров , в этом качестве они называются оценками масштаба. Надежные меры масштаба — это те, которые не подвержены влиянию небольшого числа выбросов , и включают в себя IQR и MAD.
Все вышеперечисленные меры статистической дисперсии обладают полезным свойством, заключающимся в том, что они инвариантны к местоположению и линейны по шкале . Это означает, что если случайная величина имеет дисперсию , то линейное преобразование для вещественной и должно иметь дисперсию , где — абсолютное значение , то есть игнорирует предшествующий отрицательный знак .
Другие меры дисперсии безразмерны . Другими словами, они не имеют единиц, даже если сама переменная имеет единицы. К ним относятся:
Существуют и другие меры дисперсии:
Некоторые меры дисперсии имеют специализированные цели. Дисперсия Аллана может использоваться для приложений, где шум нарушает сходимость. [2] Дисперсия Адамара может использоваться для противодействия линейной чувствительности к дрейфу частоты. [3]
Для категориальных переменных дисперсию измеряют одним числом реже; см. качественная вариация . Одной из мер, которая это делает, является дискретная энтропия .
В физических науках такая изменчивость может быть результатом случайных ошибок измерения: измерения с помощью приборов часто не являются идеально точными, т. е. воспроизводимыми , и существует дополнительная изменчивость между экспертами в интерпретации и сообщении результатов измерений. Можно предположить, что измеряемая величина стабильна, и что вариация между измерениями вызвана ошибкой наблюдения . Система из большого числа частиц характеризуется средними значениями относительно небольшого числа макроскопических величин, таких как температура, энергия и плотность. Стандартное отклонение является важной мерой в теории флуктуаций, которая объясняет многие физические явления, включая то, почему небо голубое. [4]
В биологических науках измеряемая величина редко бывает неизменной и стабильной, и наблюдаемая вариация может быть также присуща явлению: она может быть вызвана межиндивидуальной изменчивостью , то есть отдельными членами популяции, отличающимися друг от друга. Кроме того, она может быть вызвана внутрииндивидуальной изменчивостью , то есть одним и тем же субъектом, различающимся в тестах, взятых в разное время или в других различных условиях. Такие типы изменчивости также наблюдаются в сфере промышленных продуктов; даже там дотошный ученый обнаруживает вариацию.
Сохраняющий среднее значение спред ( MPS) — это изменение одного распределения вероятностей A на другое распределение вероятностей B, где B формируется путем распространения одной или нескольких частей функции плотности вероятности A, при этом среднее значение (ожидаемое значение) остается неизменным. [5] Концепция сохраняющего среднее значение спреда обеспечивает частичное упорядочение распределений вероятностей в соответствии с их дисперсиями: из двух распределений вероятностей одно может быть ранжировано как имеющее большую дисперсию, чем другое, или, в качестве альтернативы, ни одно из них не может быть ранжировано как имеющее большую дисперсию.