Теорема в статистике
В статистике теорема Лемана -Шеффе является выдающимся утверждением, связывающим воедино идеи полноты, достаточности, единственности и наилучшей несмещенной оценки. [1] Теорема утверждает, что любая оценка , которая является несмещенной для данной неизвестной величины и зависит от данных только через полную , достаточную статистику , является единственной лучшей несмещенной оценкой этой величины. Теорема Лемана-Шеффе названа в честь Эриха Лео Лемана и Генри Шеффе , учитывая их две ранние статьи. [2] [3]
Если T является полной достаточной статистикой для θ и E( g ( T )) = τ ( θ ), то g ( T ) является равномерной несмещённой оценкой минимальной дисперсии (UMVUE) τ ( θ ).
Заявление
Пусть это случайная выборка из распределения, которое имеет pdf (или pmf в дискретном случае), где – параметр в пространстве параметров. Предположим , что это достаточная статистика для θ , и пусть это полное семейство. If then – уникальный MVUE θ .![{\displaystyle {\vec {X}}=X_{1},X_{2},\dots,X_{n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ displaystyle f (x: \ theta)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \тета \в \Омега}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle Y=u({\vec {X}})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \{f_{Y}(y:\theta):\theta \in \Omega \}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varphi:\operatorname {E} [\varphi (Y)]=\theta }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varphi (Y)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Доказательство
По теореме Рао-Блэквелла , если является несмещенной оценкой θ , то определяется несмещенная оценка θ со свойством, согласно которому ее дисперсия не больше, чем у .![{\displaystyle Z}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varphi (Y):=\operatorname {E} [Z\mid Y]}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle Z}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Теперь покажем, что эта функция единственна. Предположим , это еще один кандидат на оценку MVUE θ . Затем снова определяет несмещенную оценку θ со свойством, что ее дисперсия не превышает дисперсию . Затем![{\displaystyle W}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \psi (Y):=\operatorname {E} [W\mid Y]}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle W}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {E} [\varphi (Y)-\psi (Y)]=0,\theta \in \Omega.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Так как это полная семья![{\displaystyle \{f_{Y}(y:\theta):\theta \in \Omega \}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {E} [\varphi (Y)-\psi (Y)]=0\подразумевает \varphi (y)-\psi (y)=0,\theta \in \Omega }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
и, следовательно, эта функция является уникальной функцией Y с дисперсией, не превышающей дисперсию любой другой несмещенной оценки. Делаем вывод, что это МВУЭ.![{\displaystyle \varphi }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varphi (Y)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Пример использования неполной минимально достаточной статистики
Пример улучшаемого улучшения Рао-Блэквелла при использовании минимальной достаточной статистики, которая не является полной , был предоставлен Галили и Мейлиджсоном в 2016 году. [4] Пусть это случайная выборка из равномерного по масштабу распределения с неизвестным средним значением и известным дизайном. параметр . В поисках «наилучших» возможных несмещенных оценок для , естественно рассматривать в качестве исходной (грубой) несмещенную оценку для и затем пытаться ее улучшить. Поскольку не является функцией , минимальной достаточной статистики для (где и ), ее можно улучшить с помощью теоремы Рао – Блэквелла следующим образом: ![{\displaystyle X_{1},\ldots,X_{n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ displaystyle X \ sim U ((1-k) \ theta, (1 + k) \ theta),}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {E} [X]=\theta }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle k\in (0,1)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ displaystyle \ theta }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle X_{1}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ displaystyle \ theta }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle X_{1}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ displaystyle T = \ left (X_ {(1)}, X_ {(n)} \ right)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ displaystyle \ theta }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle X_{(1)}=\min _{i}X_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle X_{(n)}=\max _{i}X_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle {\hat {\theta }}_{RB}=\operatorname {E} _{\theta }[X_{1}\mid X_{(1)},X_{(n)}]={\ frac {X_{(1)}+X_{(n)}}{2}}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Однако можно показать, что следующая несмещенная оценка имеет меньшую дисперсию:
![{\displaystyle {\hat {\theta }}_{LV}={\frac {1}{k^{2}{\frac {n-1}{n+1}}+1}}\cdot {\ frac {(1-k)X_{(1)}+(1+k)X_{(n)}}{2}}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Фактически, его можно было бы еще улучшить, если бы использовать следующую оценку:
![{\displaystyle {\hat {\theta }}_{\text{BAYES}}={\frac {n+1}{n}}\left[1-{\frac {{\frac {X_{(1) }(1+k)}{X_{(n)}(1-k)}}-1}{\left({\frac {X_{(1)}(1+k)}{X_{(n) }(1-k)}}\right)^{n+1}-1}}\right]{\frac {X_{(n)}}{1+k}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Модель представляет собой масштабную модель . Затем можно получить оптимальные эквивариантные оценки для инвариантных функций потерь . [5]
Смотрите также
Рекомендации
- ^ Казелла, Джордж (2001). Статистические выводы . Даксбери Пресс. п. 369. ИСБН 978-0-534-24312-8.
- ^ Леманн, Эль ; Шеффе, Х. (1950). «Полнота, схожие регионы и объективная оценка. I». Санкхья . 10 (4): 305–340. дои : 10.1007/978-1-4614-1412-4_23 . JSTOR 25048038. МР 0039201.
- ^ Леманн, Эль ; Шеффе, Х. (1955). «Полнота, схожие регионы и объективная оценка. II». Санкхья . 15 (3): 219–236. дои : 10.1007/978-1-4614-1412-4_24 . JSTOR 25048243. MR 0072410.
- ^ Таль Галили; Исаак Мейлиджсон (31 марта 2016 г.). «Пример улучшаемого улучшения Рао – Блэквелла, неэффективной оценки максимального правдоподобия и несмещенной обобщенной оценки Байеса». Американский статистик . 70 (1): 108–113. дои : 10.1080/00031305.2015.1100683. ПМК 4960505 . ПМИД 27499547.
- ^ Таральдсен, Гуннар (2020). «Миха Мандель (2020), «Возвращение к масштабной однородной модели», Американский статистик, 74: 1, 98–100: Комментарий». Американский статистик . 74 (3): 315. дои : 10.1080/00031305.2020.1769727. S2CID 219493070.