Среднее абсолютное отклонение ( AAD ) набора данных — это среднее абсолютных отклонений от центральной точки . Это сводная статистика статистической дисперсии или изменчивости. В общей форме центральной точкой может быть среднее значение , медиана , мода или результат любой другой меры центральной тенденции или любого эталонного значения, связанного с данным набором данных. AAD включает среднее абсолютное отклонение и медианное абсолютное отклонение (оба обозначаются сокращенно MAD ).
Некоторые меры статистической дисперсии определяются с точки зрения абсолютного отклонения. Термин «среднее абсолютное отклонение» не определяет однозначно меру статистической дисперсии , поскольку существует несколько показателей, которые можно использовать для измерения абсолютных отклонений, а также есть несколько показателей центральной тенденции , которые также можно использовать. Таким образом, чтобы однозначно определить абсолютное отклонение, необходимо указать как меру отклонения, так и меру центральной тенденции. В статистической литературе еще не приняты стандартные обозначения, поскольку как среднее абсолютное отклонение от среднего, так и медианное абсолютное отклонение от медианы обозначаются в литературе инициалами «MAD», что может привести к путанице, поскольку в целом , они могут иметь значения, значительно отличающиеся друг от друга.
Среднее абсолютное отклонение набора { x 1 , x 2 , ..., x n } равно
Выбор меры центральной тенденции оказывает заметное влияние на величину среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}:
Среднее абсолютное отклонение (MAD), также называемое «средним отклонением» или иногда «средним абсолютным отклонением», представляет собой среднее значение абсолютных отклонений данных от среднего значения данных: среднее (абсолютное) расстояние от среднего значения. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме относительно указанной центральной точки (см. Выше).
Было предложено использовать MAD вместо стандартного отклонения , поскольку оно лучше соответствует реальной жизни. [1] Поскольку MAD является более простой мерой изменчивости, чем стандартное отклонение , он может быть полезен в школьном обучении. [2] [3]
Точность прогноза этого метода очень тесно связана с методом среднеквадратичной ошибки (MSE), который представляет собой всего лишь среднеквадратическую ошибку прогнозов. Хотя эти методы очень тесно связаны, MAD используется чаще, поскольку его легче вычислить (избегая необходимости возведения в квадрат) [4] и легче понять. [5]
Для нормального распределения отношение среднего абсолютного отклонения от среднего значения к стандартному отклонению равно . Таким образом, если X является нормально распределенной случайной величиной с ожидаемым значением 0, то см. Geary (1935): [6]
Среднее абсолютное отклонение от среднего меньше или равно стандартному отклонению ; один из способов доказать это основан на неравенстве Йенсена .
Неравенство Йенсена равно , где φ — выпуклая функция, отсюда следует :
Поскольку обе части положительны, а квадратный корень является монотонно возрастающей функцией в положительной области:
Общий случай этого утверждения см. в неравенстве Гёльдера .
Медиана — это точка, относительно которой среднее отклонение минимально . Медиана MAD предлагает прямую меру масштаба случайной величины вокруг ее медианы.
Это оценка максимального правдоподобия масштабного параметра распределения Лапласа .
Поскольку медиана минимизирует среднее абсолютное расстояние, мы имеем . Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего значения. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа.
Используя общую функцию дисперсии, Хабиб (2011) определил MAD относительно медианы как
Это представление позволяет получить медианные коэффициенты корреляции MAD. [ нужна цитата ]
Хотя в принципе в качестве центральной точки медианного абсолютного отклонения можно принять среднее значение или любую другую центральную точку, чаще всего вместо этого берется медианное значение.
Медианное абсолютное отклонение (также MAD) — это медиана абсолютного отклонения от медианы . Это надежная оценка дисперсии .
Для примера {2, 2, 3, 4, 14}: 3 — это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (переупорядочены как {0, 1, 1, 1). , 11}) с медианой 1, в данном случае на нее не влияет значение выброса 14, поэтому медианное абсолютное отклонение равно 1.
При симметричном распределении медианное абсолютное отклонение равно половине межквартильного размаха .
Максимальное абсолютное отклонение вокруг произвольной точки — это максимальное из абсолютных отклонений выборки от этой точки. Хотя максимальное абсолютное отклонение не является строго мерой центральной тенденции, его можно найти с помощью формулы для среднего абсолютного отклонения, как указано выше, с , где – выборочный максимум .
Меры статистической дисперсии, полученные на основе абсолютного отклонения, характеризуют различные меры центральной тенденции как минимизирующие дисперсию: Медиана — это мера центральной тенденции, наиболее связанная с абсолютным отклонением. Некоторые параметры местоположения можно сравнить следующим образом:
Среднее абсолютное отклонение выборки представляет собой смещенную оценку среднего абсолютного отклонения генеральной совокупности. Чтобы абсолютное отклонение было несмещенной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно равняться абсолютному отклонению генеральной совокупности. Однако это не так. Для популяции 1,2,3 как абсолютное отклонение популяции от медианы, так и абсолютное отклонение популяции от среднего значения составляют 2/3. Среднее значение всех абсолютных отклонений выборки от среднего размера 3, которое можно получить из генеральной совокупности, составляет 44/81, тогда как среднее значение всех абсолютных отклонений выборки от медианы составляет 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.
Однако этот аргумент основан на понятии несмещенности к среднему. Каждая мера местоположения имеет свою собственную форму несмещенности (см. статью о смещенной оценке ). Соответствующей формой беспристрастности здесь является медианная несмещенность.
{{cite web}}
: CS1 maint: bot: original URL status unknown (link){{cite book}}
: CS1 maint: multiple names: authors list (link)часто является предпочтительным методом измерения ошибки прогноза, поскольку он не требует возведения в квадрат.
смысл MAD легче интерпретировать.