stringtranslate.com

Среднее абсолютное отклонение

Среднее абсолютное отклонение ( AAD ) набора данных — это среднее абсолютных отклонений от центральной точки . Это сводная статистика статистической дисперсии или изменчивости. В общей форме центральной точкой может быть среднее значение , медиана , мода или результат любой другой меры центральной тенденции или любого эталонного значения, связанного с данным набором данных. AAD включает среднее абсолютное отклонение и медианное абсолютное отклонение (оба обозначаются сокращенно MAD ).

Меры дисперсии

Некоторые меры статистической дисперсии определяются с точки зрения абсолютного отклонения. Термин «среднее абсолютное отклонение» не определяет однозначно меру статистической дисперсии , поскольку существует несколько показателей, которые можно использовать для измерения абсолютных отклонений, а также есть несколько показателей центральной тенденции , которые также можно использовать. Таким образом, чтобы однозначно определить абсолютное отклонение, необходимо указать как меру отклонения, так и меру центральной тенденции. В статистической литературе еще не приняты стандартные обозначения, поскольку как среднее абсолютное отклонение от среднего, так и медианное абсолютное отклонение от медианы обозначаются в литературе инициалами «MAD», что может привести к путанице, поскольку в целом , они могут иметь значения, значительно отличающиеся друг от друга.

Среднее абсолютное отклонение вокруг центральной точки

Среднее абсолютное отклонение набора { x 1 , x 2 , ..., x n } равно

Выбор меры центральной тенденции оказывает заметное влияние на величину среднего отклонения. Например, для набора данных {2, 2, 3, 4, 14}:

Среднее абсолютное отклонение от среднего значения

Среднее абсолютное отклонение (MAD), также называемое «средним отклонением» или иногда «средним абсолютным отклонением», представляет собой среднее значение абсолютных отклонений данных от среднего значения данных: среднее (абсолютное) расстояние от среднего значения. «Среднее абсолютное отклонение» может относиться либо к этому использованию, либо к общей форме относительно указанной центральной точки (см. Выше).

Было предложено использовать MAD вместо стандартного отклонения , поскольку оно лучше соответствует реальной жизни. [1] Поскольку MAD является более простой мерой изменчивости, чем стандартное отклонение , он может быть полезен в школьном обучении. [2] [3]

Точность прогноза этого метода очень тесно связана с методом среднеквадратичной ошибки (MSE), который представляет собой всего лишь среднеквадратическую ошибку прогнозов. Хотя эти методы очень тесно связаны, MAD используется чаще, поскольку его легче вычислить (избегая необходимости возведения в квадрат) [4] и легче понять. [5]

Для нормального распределения отношение среднего абсолютного отклонения от среднего значения к стандартному отклонению равно . Таким образом, если X является нормально распределенной случайной величиной с ожидаемым значением 0, то см. Geary (1935): [6]

nn[7]

Среднее абсолютное отклонение от среднего меньше или равно стандартному отклонению ; один из способов доказать это основан на неравенстве Йенсена .

Доказательство

Неравенство Йенсена равно , где φ — выпуклая функция, отсюда следует :

Поскольку обе части положительны, а квадратный корень является монотонно возрастающей функцией в положительной области:

Общий случай этого утверждения см. в неравенстве Гёльдера .

Среднее абсолютное отклонение от медианы

Медиана — это точка, относительно которой среднее отклонение минимально . Медиана MAD предлагает прямую меру масштаба случайной величины вокруг ее медианы.

Это оценка максимального правдоподобия масштабного параметра распределения Лапласа .

Поскольку медиана минимизирует среднее абсолютное расстояние, мы имеем . Среднее абсолютное отклонение от медианы меньше или равно среднему абсолютному отклонению от среднего значения. Фактически, среднее абсолютное отклонение от медианы всегда меньше или равно среднему абсолютному отклонению от любого другого фиксированного числа.

Используя общую функцию дисперсии, Хабиб (2011) определил MAD относительно медианы как

Это представление позволяет получить медианные коэффициенты корреляции MAD. [ нужна цитата ]

Медианное абсолютное отклонение вокруг центральной точки

Хотя в принципе в качестве центральной точки медианного абсолютного отклонения можно принять среднее значение или любую другую центральную точку, чаще всего вместо этого берется медианное значение.

Медианное абсолютное отклонение вокруг медианы

Медианное абсолютное отклонение (также MAD) — это медиана абсолютного отклонения от медианы . Это надежная оценка дисперсии .

Для примера {2, 2, 3, 4, 14}: 3 — это медиана, поэтому абсолютные отклонения от медианы равны {1, 1, 0, 1, 11} (переупорядочены как {0, 1, 1, 1). , 11}) с медианой 1, в данном случае на нее не влияет значение выброса 14, поэтому медианное абсолютное отклонение равно 1.

При симметричном распределении медианное абсолютное отклонение равно половине межквартильного размаха .

Максимальное абсолютное отклонение

Максимальное абсолютное отклонение вокруг произвольной точки — это максимальное из абсолютных отклонений выборки от этой точки. Хотя максимальное абсолютное отклонение не является строго мерой центральной тенденции, его можно найти с помощью формулы для среднего абсолютного отклонения, как указано выше, с , где – выборочный максимум .

Минимизация

Меры статистической дисперсии, полученные на основе абсолютного отклонения, характеризуют различные меры центральной тенденции как минимизирующие дисперсию: Медиана — это мера центральной тенденции, наиболее связанная с абсолютным отклонением. Некоторые параметры местоположения можно сравнить следующим образом:

Оценка

Среднее абсолютное отклонение выборки представляет собой смещенную оценку среднего абсолютного отклонения генеральной совокупности. Чтобы абсолютное отклонение было несмещенной оценкой, ожидаемое значение (среднее) всех абсолютных отклонений выборки должно равняться абсолютному отклонению генеральной совокупности. Однако это не так. Для популяции 1,2,3 как абсолютное отклонение популяции от медианы, так и абсолютное отклонение популяции от среднего значения составляют 2/3. Среднее значение всех абсолютных отклонений выборки от среднего размера 3, которое можно получить из генеральной совокупности, составляет 44/81, тогда как среднее значение всех абсолютных отклонений выборки от медианы составляет 4/9. Следовательно, абсолютное отклонение является смещенной оценкой.

Однако этот аргумент основан на понятии несмещенности к среднему. Каждая мера местоположения имеет свою собственную форму несмещенности (см. статью о смещенной оценке ). Соответствующей формой беспристрастности здесь является медианная несмещенность.

Смотрите также

Рекомендации

  1. ^ Талеб, Нассим Николас (2014). «Какая научная идея готова уйти на пенсию?». Край . Архивировано из оригинала 16 января 2014 г. Проверено 16 января 2014 г.{{cite web}}: CS1 maint: bot: original URL status unknown (link)
  2. ^ Кадер, Гэри (март 1999 г.). «Средства и MADS». Преподавание математики в средней школе . 4 (6): 398–403. Архивировано из оригинала 18 мая 2013 г. Проверено 20 февраля 2013 г.
  3. ^ Франклин, Кристина, Гэри Кейдер, Дениз Мьюборн, Джерри Морено, Рокси Пек , Майк Перри и Ричард Шеффер (2007). Руководство по оценке и обучению в области статистического образования (PDF) . Американская статистическая ассоциация. ISBN 978-0-9791747-1-1. Архивировано (PDF) из оригинала 7 марта 2013 г. Проверено 20 февраля 2013 г.{{cite book}}: CS1 maint: multiple names: authors list (link)
  4. ^ Намиас, Стивен; Олсен, Тава Леннон (2015), Анализ производства и операций (7-е изд.), Waveland Press, стр. 62, ISBN 9781478628248MAD часто является предпочтительным методом измерения ошибки прогноза, поскольку он не требует возведения в квадрат.
  5. ^ Штадтлер, Хартмут; Килджер, Кристоф; Мейр, Герберт, ред. (2014), Управление цепочками поставок и перспективное планирование: концепции, модели, программное обеспечение и тематические исследования, Тексты Springer по бизнесу и экономике (5-е изд.), Springer, стр. 143, ISBN 9783642553097, смысл MAD легче интерпретировать.
  6. ^ Гири, RC (1935). Отношение среднего отклонения к стандартному отклонению как критерий нормальности. Биометрика, 27(3/4), 310–332.
  7. ^ См. также статьи Гири за 1936 и 1946 годы: Geary, RC (1936). Моменты отношения среднего отклонения к стандартному отклонению для нормальных образцов. Биометрика, 28 (3/4), 295–307 и Гири, RC (1947). Проверка на нормальность. Биометрика, 34(3/4), 209–242.

Внешние ссылки