В статистике понятие инвариантного оценщика является критерием, который можно использовать для сравнения свойств различных оценщиков для одной и той же величины. Это способ формализации идеи о том, что оценщик должен обладать определенными интуитивно привлекательными качествами. Строго говоря, «инвариантный» будет означать, что сами оценки остаются неизменными, когда и измерения, и параметры преобразуются совместимым образом, но значение было расширено, чтобы позволить оценкам изменяться соответствующим образом при таких преобразованиях. [1] Термин эквивариантный оценщик используется в формальных математических контекстах, которые включают точное описание отношения того, как оценщик изменяется в ответ на изменения в наборе данных и параметризации: это соответствует использованию « эквивариантности » в более общей математике.
Общая настройка
Фон
В статистическом выводе существует несколько подходов к теории оценки , которые можно использовать для немедленного решения, какие оценщики следует использовать в соответствии с этими подходами. Например, идеи из байесовского вывода напрямую приведут к байесовским оценщикам . Аналогично, теория классического статистического вывода иногда может приводить к сильным выводам о том, какой оценщик следует использовать. Однако полезность этих теорий зависит от наличия полностью предписанной статистической модели и может также зависеть от наличия соответствующей функции потерь для определения оценщика. Таким образом, может быть проведен байесовский анализ , приводящий к апостериорному распределению для соответствующих параметров, но использование конкретной функции полезности или потерь может быть неясным. Идеи инвариантности затем могут быть применены к задаче суммирования апостериорного распределения. В других случаях статистический анализ проводится без полностью определенной статистической модели или классическая теория статистического вывода не может быть легко применена, поскольку рассматриваемое семейство моделей не поддается такой обработке. В дополнение к этим случаям, когда общая теория не предписывает оценщика, концепция инвариантности оценщика может применяться при поиске оценщиков альтернативных форм, либо ради простоты применения оценщика, либо для того, чтобы оценщик был надежным .
Понятие инвариантности иногда используется само по себе как способ выбора между оценщиками, но это не обязательно является окончательным. Например, требование инвариантности может быть несовместимо с требованием, чтобы оценщик был несмещенным по среднему ; с другой стороны, критерий несмещенности по медиане определяется в терминах выборочного распределения оценщика и поэтому инвариантен относительно многих преобразований.
Одно из применений концепции инвариантности — когда предлагается класс или семейство оценщиков, и среди них должна быть выбрана конкретная формулировка. Одна процедура заключается в том, чтобы наложить соответствующие свойства инвариантности, а затем найти формулировку в этом классе, которая имеет наилучшие свойства, что приводит к тому, что называется оптимальной инвариантной оценкой.
Некоторые классы инвариантных оценщиков
Существует несколько типов преобразований, которые полезно учитывать при работе с инвариантными оценщиками. Каждый из них порождает класс оценщиков, которые инвариантны к этим конкретным типам преобразований.
- Инвариантность сдвига: Теоретически оценки параметра местоположения должны быть инвариантны к простым сдвигам значений данных. Если все значения данных увеличиваются на заданную величину, оценка должна измениться на ту же величину. При рассмотрении оценки с использованием взвешенного среднего это требование инвариантности немедленно подразумевает, что веса должны в сумме давать единицу. Хотя тот же результат часто выводится из требования несмещенности, использование «инвариантности» не требует, чтобы существовало среднее значение, и вообще не использует какое-либо распределение вероятностей.
- Масштабная инвариантность: Обратите внимание, что эту тему об инвариантности параметра масштаба оценки не следует путать с более общей масштабной инвариантностью поведения систем в совокупности свойств (в физике).
- Инвариантность преобразования параметров: здесь преобразование применяется только к параметрам. Идея здесь заключается в том, что по сути тот же вывод должен быть сделан из данных и модели, включающей параметр θ, как это было бы сделано из тех же данных, если бы модель использовала параметр φ, где φ является однозначным преобразованием θ, φ = h (θ). Согласно этому типу инвариантности, результаты от преобразованно-инвариантных оценщиков также должны быть связаны соотношением φ = h (θ). Оценщики максимального правдоподобия обладают этим свойством, когда преобразование является монотонным . Хотя асимптотические свойства оценщика могут быть инвариантными, свойства малой выборки могут быть разными, и необходимо вывести конкретное распределение. [2]
- Инвариантность к перестановкам: если набор значений данных может быть представлен статистической моделью, которая является результатом независимых и одинаково распределенных случайных величин , разумно наложить требование, чтобы любая оценка любого свойства общего распределения была инвариантной к перестановкам: в частности, оценка, рассматриваемая как функция набора значений данных, не должна меняться, если элементы данных меняются местами в наборе данных.
Сочетание инвариантности перестановки и инвариантности местоположения для оценки параметра местоположения из независимого и одинаково распределенного набора данных с использованием взвешенного среднего подразумевает, что веса должны быть идентичны и в сумме давать единицу. Конечно, оценки, отличные от взвешенного среднего, могут быть предпочтительными.
Оптимальные инвариантные оценки
В этой настройке нам дан набор измерений , который содержит информацию о неизвестном параметре . Измерения моделируются как векторная случайная величина , имеющая функцию плотности вероятности , которая зависит от вектора параметров .
Задача состоит в оценке заданного . Оценка, обозначенная , является функцией измерений и принадлежит набору . Качество результата определяется функцией потерь , которая определяет функцию риска . Наборы возможных значений , , и обозначаются , , и , соответственно.
В классификации
В статистической классификации правило, которое присваивает класс новому элементу данных, можно считать особым типом оценщика. Ряд соображений типа инвариантности можно использовать при формулировании априорных знаний для распознавания образов .
Математическая установка
Определение
Инвариантная оценка — это оценка, которая подчиняется следующим двум правилам: [ необходима цитата ]
- Принцип рациональной инвариантности: действие, предпринимаемое в задаче принятия решения, не должно зависеть от преобразования используемого измерения.
- Принцип инвариантности: если две задачи принятия решений имеют одинаковую формальную структуру (с точки зрения , и ), то в каждой задаче следует использовать одно и то же правило принятия решений .
Чтобы формально определить инвариантную или эквивариантную оценку, сначала необходимо дать некоторые определения, связанные с группами преобразований. Пусть обозначает множество возможных выборок данных. Группа преобразований , обозначаемая как , представляет собой множество (измеримых) преобразований 1:1 и на в себя, которое удовлетворяет следующим условиям:
- Если и тогда
- Если , то , где (То есть каждое преобразование имеет обратное внутри группы.)
- (т.е. происходит трансформация идентичности )
Наборы данных и в эквивалентны, если для некоторого . Все эквивалентные точки образуют класс эквивалентности . Такой класс эквивалентности называется орбитой (в ). Орбита, , является множеством . Если состоит из одной орбиты, то называется транзитивным.
Семейство плотностей называется инвариантным относительно группы , если для любого и существует единственное такое, что имеет плотность . будем обозначать .
Если инвариантна относительно группы , то говорят, что функция потерь инвариантна относительно , если для каждого и существует такое , что для всех . Преобразованное значение будет обозначаться как .
В приведенном выше примере — это группа преобразований из в себя, а — это группа преобразований из в себя.
Задача оценки инвариантна (эквивариантна) относительно , если существуют три группы , определенные выше.
Для задачи оценки, которая инвариантна относительно , оценщик является инвариантным оценщиком относительно , если для всех и ,
Характеристики
- Функция риска инвариантной оценки, , постоянна на орбитах . Эквивалентно для всех и .
- Функция риска инвариантной оценки с транзитивностью постоянна.
Для данной задачи инвариантная оценка с наименьшим риском называется «лучшей инвариантной оценкой». Лучшая инвариантная оценка не всегда может быть достигнута. Частным случаем, для которого она может быть достигнута, является случай, когда является транзитивным.
Пример: параметр местоположения
Предположим, что является параметром местоположения, если плотность имеет вид . Для и задача инвариантна относительно . Инвариантная оценка в этом случае должна удовлетворять
таким образом, он имеет вид ( ). является транзитивным по , поэтому риск не меняется с : то есть, . Наилучшей инвариантной оценкой является та, которая сводит риск к минимуму.
В случае, если L — квадрат ошибки
Оценщик Питмана
Задача оценки состоит в том, что имеет плотность , где θ — параметр, который необходимо оценить, и где функция потерь . Эта задача инвариантна со следующими (аддитивными) группами преобразований:
Лучшая инвариантная оценка — это та, которая минимизирует
и это оценка Питмана (1939).
Для случая квадратичной ошибки потери результат будет следующим:
Если (т.е. многомерное нормальное распределение с независимыми компонентами с единичной дисперсией), то
Если (независимые компоненты, имеющие распределение Коши с параметром масштаба σ ), то ,. Однако результат будет
с
Ссылки
- ^ см. раздел 5.2.1 в Gourieroux, C. и Monfort, A. (1995). Статистика и эконометрические модели, том 1. Cambridge University Press.
- ^ Гурьеру и Монфор (1995)
- Бергер, Джеймс О. (1985). Статистическая теория принятия решений и байесовский анализ (2-е изд.). Нью-Йорк: Springer-Verlag. ISBN 0-387-96098-8. МР 0804611.[ нужна страница ]
- Freue, Gabriela V. Cohen (2007). «Оценка Питмана параметра местоположения Коши». Журнал статистического планирования и вывода . 137 (6): 1900–1913. doi :10.1016/j.jspi.2006.05.002.
- Питман, Э. Дж. Г. (1939). «Оценка параметров местоположения и масштаба непрерывной популяции любой заданной формы». Biometrika . 30 (3/4): 391–421. doi :10.1093/biomet/30.3-4.391. JSTOR 2332656.
- Питман, Э. Дж. Г. (1939). «Проверка гипотез относительно параметров местоположения и масштаба». Biometrika . 31 (1/2): 200–215. doi :10.1093/biomet/31.1-2.200. JSTOR 2334983.