stringtranslate.com

Теорема Рао–Блэквелла

В статистике теорема Рао–Блэквелла , иногда называемая теоремой Рао–Блэквелла–Колмогорова , представляет собой результат, характеризующий преобразование произвольно грубой оценки в оценку, оптимальную по критерию среднеквадратической ошибки или любому из множества подобных критериев.

Теорема Рао–Блэквелла утверждает, что если g ( X ) является любым видом оценки параметра θ, то условное ожидание g ( X ) при заданном T ( X ), где Tдостаточная статистика , обычно является лучшей оценкой θ и никогда не бывает хуже. Иногда можно очень легко построить очень грубую оценку g ( X ), а затем оценить это условное ожидаемое значение, чтобы получить оценку, которая является оптимальной в различных смыслах.

Теорема названа в честь CR Rao и David Blackwell . Процесс преобразования оценщика с использованием теоремы Rao–Blackwell можно назвать Rao–Blackwellization . Преобразованный оценщик называется оценщиком Rao–Blackwell . [1] [2] [3]

Определения

Другими словами, достаточная статистика T(X) для параметра θ — это статистика , такая, что условная вероятность данных X при заданном T ( X ) не зависит от параметра θ.

Теорема

Версия со среднеквадратической ошибкой

Один из случаев теоремы Рао–Блэквелла гласит:

Среднеквадратическая ошибка оценки Рао–Блэквелла не превышает ошибку исходной оценки.

Другими словами,

Основными инструментами доказательства, помимо определения выше, являются закон полного ожидания и тот факт, что для любой случайной величины Y , E( Y 2 ) не может быть меньше, чем [E( Y )] 2 . Это неравенство является случаем неравенства Йенсена , хотя можно также показать, что оно немедленно следует из часто упоминаемого факта, что

Точнее, среднеквадратическая ошибка оценки Рао-Блэквелла имеет следующее разложение [4]

Так как , то теорема Рао-Блэквелла следует немедленно.

Выпуклое обобщение потерь

Более общая версия теоремы Рао–Блэквелла говорит об «ожидаемых потерях» или функции риска :

где "функция потерь" L может быть любой выпуклой функцией . Если функция потерь дважды дифференцируема, как в случае со среднеквадратической ошибкой, то мы имеем более точное неравенство [4]

Характеристики

Улучшенная оценка является несмещенной тогда и только тогда, когда исходная оценка является несмещенной, что можно сразу увидеть, используя закон полного ожидания . Теорема верна независимо от того, используются ли смещенные или несмещенные оценки.

Теорема кажется очень слабой: она говорит только, что оценка Рао–Блэквелла не хуже исходной оценки. На практике, однако, улучшение часто оказывается огромным. [5]

Пример

Телефонные звонки поступают на коммутатор в соответствии с пуассоновским процессом со средней скоростью λ в минуту. Эта скорость не наблюдаема, но наблюдаются числа X 1 , ..., X n телефонных звонков, поступивших в течение n последовательных одноминутных периодов. Требуется оценить вероятность e −λ того, что следующий одноминутный период пройдет без телефонных звонков.

Крайне грубая оценка желаемой вероятности:

т. е. он оценивает эту вероятность как 1, если в первую минуту не поступило ни одного звонка, и как ноль в противном случае. Несмотря на очевидные ограничения этой оценки, результат, полученный с помощью ее Рао-Блэквеллизации, является очень хорошей оценкой.

Сумма

можно легко показать, что это достаточная статистика для λ, т. е. условное распределение данных X 1 , ..., X n , зависит от λ только через эту сумму. Поэтому мы находим оценку Рао–Блэквелла

После некоторых алгебраических действий мы имеем

Поскольку среднее число звонков, поступающих в течение первых n минут, равно n λ, неудивительно, если эта оценка имеет довольно высокую вероятность (если n велико) оказаться близкой к

Так что δ 1 явно является значительно улучшенной оценкой этой последней величины. Фактически, поскольку S n является полной , а δ 0 является несмещенной, δ 1 является единственной несмещенной оценкой с минимальной дисперсией по теореме Лемана–Шеффе .

Идемпотентность

Операция Рао–Блэквеллизации является идемпотентной . Использование ее для улучшения уже улучшенной оценки не приводит к дальнейшему улучшению, а просто возвращает в качестве выхода ту же улучшенную оценку.

Полнота и минимальная дисперсия Лемана-Шеффе

Если обусловливающая статистика является и полной , и достаточной , а начальная оценка является несмещенной, то оценка Рао–Блэквелла является единственной « наилучшей несмещенной оценкой »: см. теорему Лемана–Шеффе .

Пример улучшаемого улучшения Рао–Блэквелла при использовании минимальной достаточной статистики, которая не является полной , был предоставлен Галили и Мейлийсоном в 2016 году. [6] Пусть будет случайной выборкой из равномерного по масштабу распределения с неизвестным средним значением и известным параметром дизайна . В поисках «наилучших» возможных несмещенных оценок для естественно рассматривать в качестве начальной (грубой) несмещенной оценки для , а затем попытаться улучшить ее. Поскольку не является функцией , минимальной достаточной статистики для (где и ), ее можно улучшить с помощью теоремы Рао–Блэквелла следующим образом:

Однако можно показать, что следующая несмещенная оценка имеет меньшую дисперсию:

И на самом деле, его можно было бы еще улучшить, если бы использовалась следующая оценка:

Модель является масштабной моделью . Оптимальные эквивариантные оценки затем могут быть получены для функций потерь , которые являются инвариантными . [7]

Смотрите также

Ссылки

  1. ^ Блэквелл, Д. (1947). «Условное ожидание и несмещенная последовательная оценка». Annals of Mathematical Statistics . 18 (1): 105–110. doi : 10.1214/aoms/1177730497 . MR  0019903. Zbl  0033.07603.
  2. ^ Колмогоров, А.Н. (1950). «Непредвзятые оценки». Известия Акад. Наук СССР. Сер. Мат . 14 : 303–326. МР  0036479.
  3. ^ Рао, К. Радхакришна (1945). «Информация и точность, достижимая при оценке статистических параметров». Бюллетень Калькуттского математического общества . 37 (3): 81–91.
  4. ^ ab JG Liao; A. Berg (22 июня 2018 г.). «Усиление неравенства Дженсена». The American Statistician . 73 (3): 278–281. arXiv : 1707.08644 . doi : 10.1080/00031305.2017.1419145. S2CID  88515366.
  5. ^ Карпентер, Боб (20 января 2020 г.). «Rao-Blackwellization and discretary options in Stan». Статистическое моделирование, причинно-следственные связи и социальные науки . Получено 13 сентября 2021 г. Теорема Рао-Блэквелла утверждает, что подход маргинализации имеет дисперсию, меньшую или равную прямому подходу. На практике эта разница может быть огромной.
  6. ^ Tal Galili; Isaac Meilijson (31 марта 2016 г.). «Пример улучшаемого улучшения Рао–Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной байесовской оценки». The American Statistician . 70 (1): 108–113. doi :10.1080/00031305.2015.1100683. PMC 4960505 . PMID  27499547. 
  7. ^ Таралдсен, Гуннар (2020). «Миха Мандель (2020), «Пересмотр масштабированной однородной модели», The American Statistician, 74:1, 98–100: Комментарий». The American Statistician . 74 (3): 315. doi :10.1080/00031305.2020.1769727. ISSN  0003-1305. S2CID  219493070.

Внешние ссылки