stringtranslate.com

Повторная выборка складного ножа

Схема повторной выборки складного ножа

В статистике складной нож ( перекрестная проверка складным ножом) — это метод перекрестной проверки и, следовательно, форма повторной выборки . Это особенно полезно для оценки смещения и дисперсии . Складной нож появился раньше других распространенных методов повторной выборки, таких как бутстрап . Учитывая выборку размером , можно построить оценщик складного ножа путем агрегирования оценок параметров из каждой подвыборки размера, полученных путем исключения одного наблюдения. [1]

Техника складного ножа была разработана Морисом Кенуем (1924–1973) в 1949 году и усовершенствована в 1956 году. Джон Тьюки расширил эту технику в 1958 году и предложил название «складной нож», потому что, как и обычный складной нож (компактный складной нож), это готовый инструмент, который может импровизировать решение множества проблем, хотя конкретные проблемы можно более эффективно решить с помощью специально разработанного инструмента. [2]

Складной нож — это линейная аппроксимация бутстрапа . [2]

Простой пример: средняя оценка

Оценщик параметра «складной нож» находится путем систематического исключения каждого наблюдения из набора данных и расчета оценки параметра по оставшимся наблюдениям, а затем агрегирования этих вычислений.

Например, если оцениваемый параметр — это генеральное среднее случайной величины , то для данного набора наблюдений iid естественной оценкой является выборочное среднее:

где последняя сумма использовала другой способ указать, что индекс пробегает набор .

Затем мы действуем следующим образом: для каждого из них мы вычисляем среднее значение подвыборки складного ножа, состоящей из всех точек данных, кроме -й, и это называется -й репликой складного ножа:

Было бы полезно подумать, что эти повторы складного ножа дают нам приблизительное распределение выборочного среднего значения , и чем больше, тем лучше будет это приближение. Затем, наконец, чтобы получить оценку складного ножа, мы берем среднее значение этих повторений складного ножа:

Можно задаться вопросом о смещении и дисперсии . Из определения среднего значения повторов складного ножа можно попытаться рассчитать явно, и смещение - это тривиальный расчет, но дисперсия более сложна, поскольку повторы складного ножа не являются независимыми.

Для частного случая среднего можно явно показать, что оценка складного ножа равна обычной оценке:

Это устанавливает личность . Тогда, взяв ожидания, мы получим , что означает объективность, а приняв дисперсию, мы получим . Однако эти свойства обычно не справедливы для других параметров, кроме среднего.

Этот простой пример для случая оценки среднего предназначен только для иллюстрации конструкции оценщика складного ножа, в то время как реальные тонкости (и полезность) проявляются в случае оценки других параметров, таких как моменты, более высокие, чем среднее значение, или другие функционалы от распределение.

может быть использовано для построения эмпирической оценки смещения , а именно с некоторым подходящим коэффициентом , хотя в этом случае мы знаем, что эта конструкция не добавляет никаких значимых знаний, но дает правильную оценку смещения (которая равна нулю) .

Оценку дисперсии складного ножа можно рассчитать на основе дисперсии повторов складного ножа : [3] [4]

Левое равенство определяет оценщик , а правое равенство представляет собой тождество, которое можно проверить напрямую. Затем, взяв ожидания, мы получаем , так что это несмещенная оценка дисперсии .

Оценка смещения оценщика

Метод «складного ножа» можно использовать для оценки (и корректировки) смещения оценщика, рассчитанного по всей выборке.

Предположим , это целевой параметр, который, как предполагается, является некоторым функционалом распределения . На основе конечного набора наблюдений , который, как предполагается, состоит из iid копий , строится оценщик :

Значение зависит от выборки, поэтому это значение будет меняться от одной случайной выборки к другой.

По определению, смещение выглядит следующим образом:

Можно вычислить несколько значений из нескольких выборок и усреднить их, чтобы вычислить эмпирическую аппроксимацию , но это невозможно, когда нет «других выборок», когда для расчета использовался весь набор доступных наблюдений . В такой ситуации может помочь метод повторной выборки «складной нож».

Конструируем повторы складного ножа:

где каждый экземпляр представляет собой оценку с «исключением одного» на основе подвыборки складного ножа, состоящей из всех точек данных, кроме одной:

Затем мы определяем их среднее значение:

Складная оценка смещения определяется следующим образом:

и результирующая оценка складного ножа с поправкой на смещение определяется по формуле:

Это устраняет смещение в частном случае, которым оно является, и уменьшает его в других случаях. [2]

Оценка дисперсии оценщика

Метод «складного ножа» также можно использовать для оценки дисперсии оценщика, рассчитанного по всей выборке.

Смотрите также

Литература

Примечания

  1. ^ Эфрон 1982, с. 2.
  2. ^ abc Cameron & Trivedi 2005, с. 375.
  3. ^ Эфрон 1982, с. 14.
  4. ^ Макинтош, Эйвери И. «Метод оценки складного ножа» (PDF) . Бостонский университет . Эйвери И. Макинтош. Архивировано из оригинала (PDF) 14 мая 2016 г. Проверено 30 апреля 2016 г.: п. 3.

Рекомендации