Оценка Джеймса–Стейна представляет собой смещенную оценку среднего значения (возможно) коррелированных гауссовых распределенных случайных величин с неизвестными средними значениями .
Он возник последовательно в двух основных опубликованных работах. Ранняя версия оценщика была разработана в 1956 году, [1] , когда Чарльз Стайн пришел к относительно шокирующему выводу, что, хотя тогдашняя обычная оценка среднего, выборочное среднее , допустима, когда , она недопустима , когда . Стайн предложил возможное улучшение оценщика, которое сжимает выборочные средние в сторону более центрального вектора среднего (который может быть выбран априори или обычно как «среднее из средних» выборочных средних, учитывая, что все выборки имеют одинаковый размер). Это наблюдение обычно называют примером или парадоксом Стайна . В 1961 году Уиллард Джеймс и Чарльз Стайн упростили исходный процесс. [2]
Можно показать, что оценка Джеймса–Стейна доминирует над «обычным» методом наименьших квадратов , то есть оценка Джеймса–Стейна имеет меньшую или такую же среднеквадратичную ошибку, чем «обычный» метод наименьших квадратов.
Подобно оценке Ходжеса , оценка Джеймса-Стейна является сверхэффективной и нерегулярной при . [3]
Пусть вектор — неизвестное среднее значение , которое распределено по нормальному закону и имеет известную ковариационную матрицу .
Мы заинтересованы в получении оценки, , для , основанной на одном наблюдении, , для .
В реальном применении это обычная ситуация, когда набор параметров выбирается, и выборки искажаются независимым гауссовым шумом . Поскольку этот шум имеет нулевое среднее значение, может быть разумно использовать сами выборки в качестве оценки параметров. Этот подход представляет собой оценку наименьших квадратов , которая равна .
Стайн продемонстрировал, что с точки зрения среднеквадратической ошибки оценка наименьших квадратов, , не является оптимальной по сравнению с оценками, основанными на сжатии, такими как оценка Джеймса–Стайна , . [1] Парадоксальный результат, заключающийся в том, что существует (возможно) лучшая и никогда не худшая оценка среднеквадратической ошибки по сравнению со средним значением выборки, стал известен как пример Стайна .
Если известно, то оценка Джеймса–Стейна определяется выражением
Джеймс и Стайн показали, что указанная выше оценка доминирует для любого , что означает, что оценка Джеймса–Стайна всегда достигает более низкой средней квадратической ошибки (MSE), чем оценка максимального правдоподобия . [2] [4] По определению, это делает оценку наименьших квадратов неприемлемой , когда .
Обратите внимание, что если то эта оценка просто берет естественную оценку и сжимает ее к началу координат 0 . На самом деле это не единственное направление сжатия , которое работает. Пусть ν будет произвольным фиксированным вектором размерности . Тогда существует оценка типа Джеймса–Стейна, которая сжимается к ν , а именно
Оценка Джеймса–Стейна доминирует над обычной оценкой для любого ν . Естественный вопрос, который следует задать, заключается в том, является ли улучшение по сравнению с обычной оценкой независимым от выбора ν . Ответ — нет. Улучшение невелико, если велико. Таким образом, чтобы получить очень большое улучшение, необходимы некоторые знания о местоположении θ . Конечно, это величина, которую мы пытаемся оценить, поэтому у нас нет этих знаний априори . Но у нас может быть некоторая догадка относительно того, каков средний вектор. Это можно считать недостатком оценки: выбор не является объективным, поскольку он может зависеть от убеждений исследователя. Тем не менее, результат Джеймса и Стейна заключается в том, что любая конечная догадка ν улучшает ожидаемую MSE по сравнению с оценкой максимального правдоподобия, что равносильно использованию бесконечного ν , безусловно, плохой догадке.
Рассмотрение оценки Джеймса–Стейна как эмпирического байесовского метода дает некоторую интуицию относительно этого результата: предполагается, что θ сама по себе является случайной величиной с априорным распределением , где A оценивается из самих данных. Оценка A дает преимущество по сравнению с оценкой максимального правдоподобия только тогда, когда размерность достаточно велика; следовательно, она не работает для . Оценка Джеймса–Стейна является членом класса байесовских оценок, которые доминируют над оценкой максимального правдоподобия. [5]
Следствием вышеизложенного обсуждения является следующий контринтуитивный результат: когда измеряются три или более несвязанных параметра, их общую MSE можно уменьшить, используя комбинированную оценку, такую как оценка Джеймса-Стейна; тогда как когда каждый параметр оценивается отдельно, оценка наименьших квадратов (LS) является допустимой . Причудливым примером будет оценка скорости света, потребления чая на Тайване и веса свиней в Монтане, всех вместе. Оценка Джеймса-Стейна всегда улучшает общую MSE, т. е. сумму ожидаемых квадратов ошибок каждого компонента. Следовательно, общая MSE при измерении скорости света, потребления чая и веса свиней улучшится при использовании оценки Джеймса-Стейна. Однако любой конкретный компонент (например, скорость света) улучшится для некоторых значений параметров и ухудшится для других. Таким образом, хотя оценка Джеймса–Стейна доминирует над оценкой МНК при оценке трех или более параметров, ни один отдельный компонент не доминирует над соответствующим компонентом оценки МНК.
Вывод из этого гипотетического примера заключается в том, что измерения следует объединять, если кто-то заинтересован в минимизации их общей MSE. Например, в телекоммуникационной среде разумно объединять измерения ответвлений каналов в сценарии оценки канала , поскольку цель состоит в минимизации общей ошибки оценки канала.
Оценка Джеймса–Стейна также нашла применение в фундаментальной квантовой теории, где она была использована для улучшения теоретических границ энтропийного принципа неопределенности для более чем трех измерений. [6]
Интуитивный вывод и интерпретация даются гальтоновской перспективой. [7] В рамках этой интерпретации мы стремимся предсказать средние значения популяции, используя несовершенно измеренные средние значения выборки . Уравнение оценщика OLS в гипотетической регрессии средних значений популяции на средние значения выборки дает оценщик в форме оценщика Джеймса-Стейна (когда мы заставляем свободный член OLS равным 0) или оценщика Эфрона-Морриса (когда мы позволяем свободному члену изменяться).
Несмотря на интуитивное представление о том, что оценщик Джеймса–Стейна сжимает оценку максимального правдоподобия до , оценка на самом деле отдаляется от для малых значений , поскольку множитель на тогда отрицателен. Это можно легко исправить, заменив этот множитель нулем, когда он отрицателен. Полученная оценка называется оценщиком Джеймса–Стейна с положительной частью и задается как
Эта оценка имеет меньший риск, чем базовая оценка Джеймса–Стейна. Из этого следует, что базовая оценка Джеймса–Стейна сама по себе недопустима . [8]
Однако оказывается, что оценка с положительной частью также недопустима. [4] Это следует из общего результата, который требует, чтобы допустимые оценки были гладкими.
Оценка Джеймса–Стейна может показаться на первый взгляд результатом некоторой особенности постановки проблемы. Фактически, оценка является примером очень широкомасштабного эффекта; а именно, того факта, что «обычная» или оценка наименьших квадратов часто неприемлема для одновременной оценки нескольких параметров. [ необходима цитата ] Этот эффект был назван феноменом Стейна и был продемонстрирован для нескольких различных постановок проблемы, некоторые из которых кратко описаны ниже.