В статистике усеченная оценка — это оценка, полученная из другой оценки путем исключения некоторых экстремальных значений , процесс называется усечением . Обычно это делается для получения более надежной статистики , а экстремальные значения считаются выбросами . [1] Усеченные оценки также часто имеют более высокую эффективность для смешанных распределений и распределений с тяжелыми хвостами , чем соответствующая неусеченная оценка, за счет более низкой эффективности для других распределений, таких как нормальное распределение .
При наличии оценщика усеченная версия x% получается путем отбрасывания x% самых низких или самых высоких наблюдений или на обоих концах: это статистика по середине данных. Например, усеченное среднее значение 5% получается путем взятия среднего значения диапазона от 5% до 95%. В некоторых случаях усеченный оценщик отбрасывает фиксированное количество точек (например, максимум и минимум) вместо процента.
Медиана — это наиболее урезанная статистика (номинально 50%), поскольку она отбрасывает все данные, кроме самых центральных, и равна полностью урезанному среднему значению — или действительно полностью урезанному среднему значению, или (для наборов данных нечетного размера) полностью урезанному максимуму или минимуму. Аналогично, никакая степень усечения не влияет на медиану — усеченная медиана и есть медиана — поскольку усечение всегда исключает равное количество самых низких и самых высоких значений.
Квантили можно рассматривать как усеченные максимумы или минимумы: например, 5-й процентиль — это усеченный минимум в 5%.
Усеченные оценщики, используемые для оценки параметра местоположения, включают:
Усеченные оценщики, используемые для оценки параметра шкалы, включают:
Примерами L-оценок являются усеченные оценки, включающие только линейные комбинации точек .
Чаще всего урезанные оценщики используются для оценки параметров того же параметра, что и неурезанный оценщик. В некоторых случаях оценщик может использоваться напрямую, в то время как в других случаях его необходимо настроить, чтобы получить несмещенный согласованный оценщик .
Например, при оценке параметра местоположения для симметричного распределения усеченная оценка будет несмещенной (при условии, что исходная оценка была несмещенной), поскольку она удаляет одинаковое количество сверху и снизу. Однако, если распределение имеет перекос , усеченные оценки, как правило, будут смещенными и потребуют корректировки. Например, в перекошенном распределении непараметрический перекос (и коэффициенты перекоса Пирсона ) измеряют смещение медианы как оценку среднего.
При оценке параметра масштаба с использованием усеченной оценки в качестве надежной меры масштаба , например, для оценки дисперсии совокупности или стандартного отклонения совокупности , обычно необходимо умножить ее на масштабный коэффициент , чтобы сделать ее несмещенной и последовательной оценкой; см. параметр масштаба: оценка .
Например, деление IQR на (с использованием функции ошибок ) делает его несмещенной, последовательной оценкой стандартного отклонения популяции, если данные следуют нормальному распределению .
Усеченные оценки также могут использоваться как статистика сама по себе — например, медиана является мерой местоположения, а межквартильный размах (IQR) является мерой дисперсии. В этих случаях выборочные статистики могут выступать в качестве оценок собственного ожидаемого значения . Например, среднее абсолютное отклонение выборки из стандартного распределения Коши является оценкой среднего абсолютного отклонение популяции, которое в этом случае равно 1, тогда как дисперсия популяции не существует.