stringtranslate.com

Теорема Рао – Блэквелла

В статистике теорема Рао -Блэквелла , иногда называемая теоремой Рао-Блэквелла-Колмогорова , представляет собой результат, характеризующий преобразование сколь угодно грубой оценки в оценку, оптимальную по критерию среднеквадратической ошибки или любому из множество схожих критериев.

Теорема Рао–Блэквелла утверждает, что если g ( X ) является какой-либо оценкой параметра θ, то условное ожидание g ( X ) при условии T ( X ) , где Tдостаточная статистика , обычно является лучшей оценкой параметра θ. θ, и никогда не бывает хуже. Иногда можно очень легко построить очень грубую оценку g ( X ), а затем вычислить это условное ожидаемое значение, чтобы получить оценку, которая является в различных смыслах оптимальной.

Теорема названа в честь Ч.Р. Рао и Дэвида Блэквелла . Процесс преобразования средства оценки с использованием теоремы Рао–Блэквелла можно назвать « рао–Блэквеллизацией» . Преобразованная оценка называется оценкой Рао – Блэквелла . [1] [2] [3]

Определения

Другими словами, достаточная статистика T(X) для параметра θ — это статистика , такая, что условная вероятность данных X при заданном T ( X ) не зависит от параметра θ.

Теорема

Версия со среднеквадратической ошибкой

Один из случаев теоремы Рао – Блэквелла гласит:

Среднеквадратическая ошибка оценки Рао–Блэквелла не превышает ошибку исходной оценки.

Другими словами,

Важными инструментами доказательства, помимо приведенного выше определения, являются закон полного ожидания и тот факт, что для любой случайной величины Y E( Y 2 ) не может быть меньше [E( Y )] 2 . Это неравенство представляет собой случай неравенства Йенсена , хотя можно также показать, что оно немедленно следует из часто упоминаемого факта, что

Точнее, среднеквадратическая ошибка оценки Рао-Блэквелла имеет следующее разложение [4]

Поскольку , немедленно следует теорема Рао-Блэквелла.

Выпуклое обобщение потерь

Более общая версия теоремы Рао-Блэквелла говорит об «ожидаемых потерях» или функции риска :

где «функция потерь» L может быть любой выпуклой функцией . Если функция потерь дважды дифференцируема, как в случае среднеквадратической ошибки, то мы имеем более точное неравенство [4]

Характеристики

Улучшенная оценка является несмещенной тогда и только тогда, когда исходная оценка несмещена, в чем можно сразу убедиться, используя закон полного ожидания . Теорема справедлива независимо от того, используются ли смещенные или несмещенные оценки.

Теорема кажется очень слабой: она говорит лишь о том, что оценка Рао–Блэквелла не хуже исходной. Однако на практике улучшение часто бывает огромным. [5]

Пример

Телефонные звонки поступают на коммутатор в соответствии с процессом Пуассона со средней скоростью λ в минуту. Эта скорость не наблюдаема, но наблюдаются числа X 1 , ..., X n телефонных звонков, поступивших в течение n последовательных одноминутных периодов. Требуется оценить вероятность e −λ того, что следующий минутный период пройдет без телефонных звонков.

Чрезвычайно грубая оценка желаемой вероятности :

т. е. он оценивает эту вероятность как 1, если в первую минуту не поступило ни одного телефонного звонка, и как нулевую в противном случае. Несмотря на очевидные ограничения этой оценки, результат, полученный с помощью ее Рао-Блэквеллизации, является очень хорошей оценкой.

Сумма

можно легко показать, что это достаточная статистика для λ, т. е. условное распределение данных X 1 , ..., X n зависит от λ только через эту сумму. Таким образом, мы находим оценку Рао–Блэквелла

После некоторых алгебраических действий мы имеем

Поскольку среднее количество вызовов, поступающих в течение первых n минут, равно n λ, можно не удивляться, если эта оценка имеет довольно высокую вероятность (если n велико) быть близкой к

Таким образом, δ1 , очевидно, является значительно улучшенной оценкой этой последней величины. Фактически, поскольку Sn является полным и δ 0 является несмещенным, δ 1 является единственной несмещенной оценкой минимальной дисперсии по теореме Лемана – Шеффе .

Идемпотентность

Рао-Блэквеллизация — идемпотентная операция. Использование его для улучшения уже улучшенной оценки не приводит к дальнейшему улучшению, а просто возвращает на выходе ту же улучшенную оценку.

Полнота и минимальная дисперсия Лемана – Шеффе

Если обуславливающая статистика является одновременно полной и достаточной , а начальная оценка несмещена, то оценка Рао-Блэквелла является уникальной « лучшей несмещенной оценкой »: см. теорему Лемана-Шеффе .

Пример улучшаемого улучшения Рао-Блэквелла при использовании минимальной достаточной статистики, которая не является полной , был предоставлен Галили и Мейлиджсоном в 2016 году. [6] Пусть это случайная выборка из равномерного по масштабу распределения с неизвестным средним значением и известным дизайном. параметр . При поиске «наилучших» возможных несмещенных оценок для естественно рассматривать в качестве исходной (грубой) несмещенную оценку для и затем пытаться ее улучшить. Поскольку не является функцией , минимальной достаточной статистики для (где и ), ее можно улучшить с помощью теоремы Рао – Блэквелла следующим образом:

Однако можно показать, что следующая несмещенная оценка имеет меньшую дисперсию:

Фактически, его можно было бы еще улучшить, если бы использовать следующую оценку:

Модель представляет собой масштабную модель . Затем можно получить оптимальные эквивариантные оценки для инвариантных функций потерь . [7]

Смотрите также

Рекомендации

  1. ^ Блэквелл, Д. (1947). «Условное ожидание и несмещенная последовательная оценка». Анналы математической статистики . 18 (1): 105–110. дои : 10.1214/aoms/1177730497 . МР  0019903. Збл  0033.07603.
  2. ^ Колмогоров, А.Н. (1950). «Непредвзятые оценки». Известия Акад. Наук СССР. Сер. Мат . 14 : 303–326. МР  0036479.
  3. ^ Рао, К. Радхакришна (1945). «Информация и точность, достижимые при оценке статистических параметров». Бюллетень Калькуттского математического общества . 37 (3): 81–91.
  4. ^ аб Дж. Г. Ляо; А. Берг (22 июня 2018 г.). «Уточнение неравенства Дженсена». Американский статистик . 73 (3): 278–281. arXiv : 1707.08644 . дои : 10.1080/00031305.2017.1419145. S2CID  88515366.
  5. Карпентер, Боб (20 января 2020 г.). «Рао-блэквеллизация и дискретные параметры в Стэне». Статистическое моделирование, причинный вывод и социальные науки . Проверено 13 сентября 2021 г. Теорема Рао-Блэквелла утверждает, что маржинальный подход имеет дисперсию, меньшую или равную прямому подходу. На практике эта разница может быть огромной.
  6. ^ Таль Галили; Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной оценки Байеса». Американский статистик . 70 (1): 108–113. дои : 10.1080/00031305.2015.1100683. ПМК 4960505 . ПМИД  27499547. 
  7. ^ Таральдсен, Гуннар (2020). «Миха Мандель (2020), «Возвращение к масштабной однородной модели», Американский статистик, 74: 1, 98–100: Комментарий». Американский статистик . 74 (3): 315. дои : 10.1080/00031305.2020.1769727. ISSN  0003-1305. S2CID  219493070.

Внешние ссылки