Средняя абсолютная разность (одномерная) — это мера статистической дисперсии, равная средней абсолютной разности двух независимых значений, взятых из распределения вероятностей . Связанная статистика — это относительная средняя абсолютная разность , которая представляет собой среднюю абсолютную разность, деленную на среднее арифметическое и равную удвоенному коэффициенту Джини . Средняя абсолютная разность также известна как абсолютная средняя разность (не путать с абсолютным значением средней знаковой разности ) и средняя разность Джини (GMD). [1] Средняя абсолютная разность иногда обозначается как Δ или как MD.
Средняя абсолютная разность определяется как «среднее» или «среднее», формально ожидаемое значение абсолютной разности двух случайных величин X и Y, независимо и одинаково распределенных с одним и тем же (неизвестным) распределением, далее называемым Q.
В частности, в дискретном случае,
В непрерывном случае,
Альтернативная форма уравнения имеет вид:
Когда распределение вероятностей имеет конечное и ненулевое арифметическое среднее значение AM, относительная средняя абсолютная разность, иногда обозначаемая как Δ или RMD, определяется как
Относительная средняя абсолютная разность количественно определяет среднюю абсолютную разность по сравнению с размером среднего и является безразмерной величиной. Относительная средняя абсолютная разность равна удвоенному коэффициенту Джини , который определяется в терминах кривой Лоренца . Это соотношение дает дополнительные перспективы как относительной средней абсолютной разности, так и коэффициенту Джини, включая альтернативные способы расчета их значений.
Средняя абсолютная разность инвариантна к переносам и отрицаниям и изменяется пропорционально положительному масштабированию. То есть, если X — случайная величина, а c — константа:
Относительная средняя абсолютная разность инвариантна к положительному масштабированию, коммутирует с отрицанием и изменяется при переносе пропорционально отношению исходного и перенесенного среднего арифметического. То есть, если X — случайная величина, а c — константа:
Если случайная величина имеет положительное среднее значение, то ее относительная средняя абсолютная разность всегда будет больше или равна нулю. Если, кроме того, случайная величина может принимать только значения, большие или равные нулю, то ее относительная средняя абсолютная разность будет меньше 2.
Средняя абсолютная разность равна удвоенной шкале L (второй L-момент ), тогда как стандартное отклонение равно квадратному корню дисперсии относительно среднего (второй условный центральный момент). Различия между L-моментами и условными моментами впервые видны при сравнении средней абсолютной разности и стандартного отклонения (первый L-момент и первый условный момент оба являются средним).
Как стандартное отклонение , так и средняя абсолютная разность измеряют дисперсию — насколько разбросаны значения совокупности или вероятности распределения. Средняя абсолютная разность не определяется в терминах конкретной меры центральной тенденции, тогда как стандартное отклонение определяется в терминах отклонения от среднего арифметического. Поскольку стандартное отклонение возводит свои разности в квадрат, оно имеет тенденцию придавать больший вес большим разностям и меньший вес меньшим разностям по сравнению со средней абсолютной разностью. Когда среднее арифметическое конечно, средняя абсолютная разность также будет конечной, даже когда стандартное отклонение бесконечно. Смотрите примеры для некоторых конкретных сравнений.
Недавно введенное стандартное отклонение расстояния играет аналогичную роль средней абсолютной разнице, но стандартное отклонение расстояния работает с центрированными расстояниями. См. также E-статистику .
Для случайной выборки S из случайной величины X , состоящей из n значений y i , статистика
является последовательной и несмещенной оценкой MD( X ). Статистика:
является последовательной оценкой RMD( X ), но в общем случае не является несмещенной .
Доверительные интервалы для RMD( X ) можно рассчитать с использованием методов бутстреп-выборки.
В общем случае не существует несмещенной оценки для RMD( X ), отчасти из-за сложности нахождения несмещенной оценки для умножения на обратную величину среднего. Например, даже если известно, что выборка взята из случайной величины X ( p ) для неизвестного p , и X ( p ) − 1 имеет распределение Бернулли , так что Pr( X ( p ) = 1) = 1 − p и Pr( X ( p ) = 2) = p , то
Но ожидаемое значение любой оценки R ( S ) RMD ( X ( p )) будет иметь вид: [ необходима цитата ]
где r i — константы. Таким образом, E( R ( S )) никогда не может быть равно RMD( X ( p )) для всех p от 0 до 1.
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь )