stringtranslate.com

Статистическая дисперсия

Пример выборок из двух популяций с одинаковым средним значением, но разной дисперсией. Синяя популяция гораздо более дисперсна, чем красная популяция.

В статистике дисперсия (также называемая изменчивостью , разбросом или спредом ) — это степень, в которой распределение растянуто или сжато. [1] Распространенными примерами мер статистической дисперсии являются дисперсия , стандартное отклонение и межквартильный размах . Например, когда дисперсия данных в наборе велика, данные широко разбросаны. С другой стороны, когда дисперсия мала, данные в наборе кластеризованы.

Дисперсия противопоставляется местоположению или центральной тенденции , и вместе они являются наиболее используемыми свойствами распределений.

Меры статистической дисперсии

Мера статистической дисперсии — это неотрицательное действительное число , которое равно нулю, если все данные одинаковы, и увеличивается по мере того, как данные становятся более разнообразными.

Большинство мер дисперсии имеют те же единицы , что и измеряемая величина . Другими словами, если измерения в метрах или секундах, то и мера дисперсии тоже. Примеры мер дисперсии включают:

Они часто используются (вместе с масштабными факторами ) в качестве оценщиков масштабных параметров , в этом качестве они называются оценками масштаба. Надежные меры масштаба — это те, которые не подвержены влиянию небольшого числа выбросов , и включают в себя IQR и MAD.

Все вышеперечисленные меры статистической дисперсии обладают полезным свойством, заключающимся в том, что они инвариантны к местоположению и линейны по шкале . Это означает, что если случайная величина имеет дисперсию , то линейное преобразование для вещественной и должно иметь дисперсию , где — абсолютное значение , то есть игнорирует предшествующий отрицательный знак .

Другие меры дисперсии безразмерны . Другими словами, они не имеют единиц, даже если сама переменная имеет единицы. К ним относятся:

Существуют и другие меры дисперсии:

Некоторые меры дисперсии имеют специализированные цели. Дисперсия Аллана может использоваться для приложений, где шум нарушает сходимость. [2] Дисперсия Адамара может использоваться для противодействия линейной чувствительности к дрейфу частоты. [3]

Для категориальных переменных дисперсию измеряют одним числом реже; см. качественная вариация . Одной из мер, которая это делает, является дискретная энтропия .

Источники

В физических науках такая изменчивость может быть результатом случайных ошибок измерения: измерения с помощью приборов часто не являются идеально точными, т. е. воспроизводимыми , и существует дополнительная изменчивость между экспертами в интерпретации и сообщении результатов измерений. Можно предположить, что измеряемая величина стабильна, и что вариация между измерениями вызвана ошибкой наблюдения . Система из большого числа частиц характеризуется средними значениями относительно небольшого числа макроскопических величин, таких как температура, энергия и плотность. Стандартное отклонение является важной мерой в теории флуктуаций, которая объясняет многие физические явления, включая то, почему небо голубое. [4]

В биологических науках измеряемая величина редко бывает неизменной и стабильной, и наблюдаемая вариация может быть также присуща явлению: она может быть вызвана межиндивидуальной изменчивостью , то есть отдельными членами популяции, отличающимися друг от друга. Кроме того, она может быть вызвана внутрииндивидуальной изменчивостью , то есть одним и тем же субъектом, различающимся в тестах, взятых в разное время или в других различных условиях. Такие типы изменчивости также наблюдаются в сфере промышленных продуктов; даже там дотошный ученый обнаруживает вариацию.

Частичное упорядочение дисперсии

Сохраняющий среднее значение спред ( MPS) — это изменение одного распределения вероятностей A на другое распределение вероятностей B, где B формируется путем распространения одной или нескольких частей функции плотности вероятности A, при этом среднее значение (ожидаемое значение) остается неизменным. [5] Концепция сохраняющего среднее значение спреда обеспечивает частичное упорядочение распределений вероятностей в соответствии с их дисперсиями: из двух распределений вероятностей одно может быть ранжировано как имеющее большую дисперсию, чем другое, или, в качестве альтернативы, ни одно из них не может быть ранжировано как имеющее большую дисперсию.

Смотрите также

Ссылки

  1. ^ Электронный справочник статистических методов NIST/SEMATECH. "1.3.6.4. Параметры местоположения и масштаба". www.itl.nist.gov . Министерство торговли США.
  2. ^ "Allan Variance — Обзор Дэвида У. Аллана". www.allanstime.com . Получено 16.09.2021 .
  3. ^ "Вариация Адамара". www.wriley.com . Получено 16.09.2021 .
  4. ^ Маккуорри, Дональд А. (1976). Статистическая механика . Нью-Йорк: Harper & Row. ISBN 0-06-044366-9.
  5. ^ Ротшильд, Майкл; Стиглиц, Джозеф (1970). «Увеличение риска I: определение». Журнал экономической теории . 2 (3): 225–243. doi :10.1016/0022-0531(70)90038-4.