В статистике состоятельный оценщик или асимптотически состоятельный оценщик — это оценщик — правило для вычисления оценок параметра θ 0 — обладающий тем свойством, что при неограниченном увеличении числа используемых точек данных результирующая последовательность оценок сходится по вероятности к θ 0 . Это означает, что распределения оценок становятся все более и более сконцентрированными вблизи истинного значения оцениваемого параметра, так что вероятность того, что оценщик будет произвольно близок к θ 0 , сходится к единице.
На практике оценщик строится как функция доступной выборки размера n , а затем представляется возможность продолжать собирать данные и расширять выборку до бесконечности . Таким образом, можно получить последовательность оценок, индексированных по n , а согласованность является свойством того, что происходит, когда размер выборки «растет до бесконечности». Если можно математически показать, что последовательность оценок сходится по вероятности к истинному значению θ 0 , она называется согласованной оценкой; в противном случае оценщик называется несогласованной .
Согласованность, как она определена здесь, иногда называют слабой согласованностью . Когда мы заменяем сходимость по вероятности на почти верную сходимость , то говорят, что оценка сильно согласована . Согласованность связана со смещением ; см. смещение против согласованности.
Формально говоря, оценка T n параметра θ называется слабо состоятельной , если она сходится по вероятности к истинному значению параметра: [1]
т.е. если для всех ε > 0
Говорят, что оценка T n параметра θ строго согласована , если она почти наверняка сходится к истинному значению параметра:
Более строгое определение учитывает тот факт, что θ на самом деле неизвестно, и, таким образом, сходимость по вероятности должна иметь место для каждого возможного значения этого параметра. Предположим, что { p θ : θ ∈ Θ } — семейство распределений ( параметрическая модель ), а X θ = { X 1 , X 2 , … : X i ~ p θ } — бесконечная выборка из распределения p θ . Пусть { T n ( X θ ) } — последовательность оценок для некоторого параметра g ( θ ). Обычно T n будет основываться на первых n наблюдениях выборки. Тогда эта последовательность { T n } называется (слабо) согласованной , если [2]
Это определение использует g ( θ ) вместо просто θ , поскольку часто интересуются оценкой определенной функции или подвектора базового параметра. В следующем примере мы оцениваем параметр местоположения модели, но не масштаб:
Предположим, что имеется последовательность статистически независимых наблюдений { X 1 , X 2 , ...} из нормального распределения N ( μ , σ 2 ) . Чтобы оценить μ на основе первых n наблюдений, можно использовать выборочное среднее : T n = ( X 1 + ... + X n )/ n . Это определяет последовательность оценок, индексированных по размеру выборки n .
Из свойств нормального распределения мы знаем выборочное распределение этой статистики: T n сама по себе нормально распределена со средним значением μ и дисперсией σ 2 / n . Эквивалентно, имеет стандартное нормальное распределение:
при n, стремящемся к бесконечности, для любого фиксированного ε > 0. Следовательно, последовательность T n выборочных средних значений согласуется со средним значением совокупности μ (напоминая, что это кумулятивное распределение нормального распределения).
Понятие асимптотической согласованности очень близко, почти синонимично понятию сходимости по вероятности. Таким образом, любая теорема, лемма или свойство, устанавливающее сходимость по вероятности, может быть использовано для доказательства согласованности. Существует много таких инструментов:
Наиболее распространенным выбором для функции h является либо абсолютное значение (в этом случае оно известно как неравенство Маркова ), либо квадратичная функция (соответственно неравенство Чебышева ).
Оценка может быть несмещенной , но не последовательной. Например, для выборки iid { x
1,..., х
н} можно использовать T
н( Х ) = х
нкак оценка среднего значения E[ X ]. Обратите внимание, что здесь выборочное распределение T
нто же самое, что и базовое распределение (для любого n, поскольку оно игнорирует все точки, кроме последней), поэтому E[ T
н( X )] = E[ X ] и оно несмещено, но не сходится ни к какому значению.
Однако если последовательность оценок является несмещенной и сходится к некоторому значению, то она является последовательной, поскольку она должна сходиться к правильному значению.
В качестве альтернативы, оценщик может быть смещенным, но последовательным. Например, если среднее значение оценивается по , оно смещено, но по мере оно приближается к правильному значению, и поэтому оно последовательно.
Важные примеры включают дисперсию выборки и стандартное отклонение выборки . Без поправки Бесселя (то есть при использовании размера выборки вместо степеней свободы ) обе оценки являются отрицательно смещенными, но последовательными. С поправкой скорректированная дисперсия выборки является несмещенной, в то время как скорректированное стандартное отклонение выборки все еще смещено, но в меньшей степени, и обе по-прежнему последовательны: поправочный коэффициент сходится к 1 по мере роста размера выборки.
Вот еще один пример. Пусть будет последовательностью оценок для .
Мы видим , что , , и смещение не сходится к нулю.