stringtranslate.com

Урезанный оценщик

В статистике усеченная оценка — это оценка, полученная из другой оценки путем исключения некоторых экстремальных значений , процесс называется усечением . Обычно это делается для получения более надежной статистики , а экстремальные значения считаются выбросами . [1] Усеченные оценки также часто имеют более высокую эффективность для смешанных распределений и распределений с тяжелыми хвостами , чем соответствующая неусеченная оценка, за счет более низкой эффективности для других распределений, таких как нормальное распределение .

При наличии оценщика усеченная версия x% получается путем отбрасывания x% самых низких или самых высоких наблюдений или на обоих концах: это статистика по середине данных. Например, усеченное среднее значение 5% получается путем взятия среднего значения диапазона от 5% до 95%. В некоторых случаях усеченный оценщик отбрасывает фиксированное количество точек (например, максимум и минимум) вместо процента.

Примеры

Медиана — это наиболее урезанная статистика (номинально 50%), поскольку она отбрасывает все данные, кроме самых центральных, и равна полностью урезанному среднему значению — или действительно полностью урезанному среднему значению, или (для наборов данных нечетного размера) полностью урезанному максимуму или минимуму. Аналогично, никакая степень усечения не влияет на медиану — усеченная медиана и есть медиана — поскольку усечение всегда исключает равное количество самых низких и самых высоких значений.

Квантили можно рассматривать как усеченные максимумы или минимумы: например, 5-й процентиль — это усеченный минимум в 5%.

Усеченные оценщики, используемые для оценки параметра местоположения, включают:

Усеченные оценщики, используемые для оценки параметра шкалы, включают:

Примерами L-оценок являются усеченные оценки, включающие только линейные комбинации точек .

Приложения

Оценка

Чаще всего урезанные оценщики используются для оценки параметров того же параметра, что и неурезанный оценщик. В некоторых случаях оценщик может использоваться напрямую, в то время как в других случаях его необходимо настроить, чтобы получить несмещенный согласованный оценщик .

Например, при оценке параметра местоположения для симметричного распределения усеченная оценка будет несмещенной (при условии, что исходная оценка была несмещенной), поскольку она удаляет одинаковое количество сверху и снизу. Однако, если распределение имеет перекос , усеченные оценки, как правило, будут смещенными и потребуют корректировки. Например, в перекошенном распределении непараметрический перекоскоэффициенты перекоса Пирсона ) измеряют смещение медианы как оценку среднего.

При оценке параметра масштаба с использованием усеченной оценки в качестве надежной меры масштаба , например, для оценки дисперсии совокупности или стандартного отклонения совокупности , обычно необходимо умножить ее на масштабный коэффициент , чтобы сделать ее несмещенной и последовательной оценкой; см. параметр масштаба: оценка .

Например, деление IQR на (с использованием функции ошибок ) делает его несмещенной, последовательной оценкой стандартного отклонения популяции, если данные следуют нормальному распределению .

Другие применения

Усеченные оценки также могут использоваться как статистика сама по себе — например, медиана является мерой местоположения, а межквартильный размах (IQR) является мерой дисперсии. В этих случаях выборочные статистики могут выступать в качестве оценок собственного ожидаемого значения . Например, среднее абсолютное отклонение выборки из стандартного распределения Коши является оценкой среднего абсолютного отклонение популяции, которое в этом случае равно 1, тогда как дисперсия популяции не существует.

Смотрите также

Ссылки

  1. ^ Кальтенбах, Ханс-Майкл (2012). Краткое руководство по статистике. Гейдельберг: Спрингер. ISBN 978-3-642-23502-3. OCLC  763157853.