stringtranslate.com

Идентифицируемость

В статистике идентифицируемость — это свойство, которому должна удовлетворять модель , чтобы был возможен точный вывод . Модель является идентифицируемой , если теоретически возможно узнать истинные значения основных параметров этой модели после получения от нее бесконечного числа наблюдений. Математически это эквивалентно утверждению, что разные значения параметров должны порождать разные распределения вероятностей наблюдаемых переменных. Обычно модель идентифицируема только при определенных технических ограничениях, и в этом случае совокупность этих требований называется условиями идентификации .

Модель, которую невозможно идентифицировать, называется неидентифицируемой или неидентифицируемой : две или более параметризации эквивалентны с точки зрения наблюдения . В некоторых случаях, даже если модель не поддается идентификации, все же можно узнать истинные значения определенного подмножества параметров модели. В этом случае мы говорим, что модель частично идентифицируема . В других случаях можно узнать местоположение истинного параметра до определенной конечной области пространства параметров, и в этом случае модель становится идентифицируемой .

Помимо строго теоретического исследования свойств модели, идентифицируемость можно рассматривать в более широком смысле, когда модель проверяется на экспериментальных наборах данных с использованием анализа идентифицируемости . [1]

Определение

Позвольте быть статистической моделью с пространством параметров . Мы говорим, что это идентифицируемо , если отображение взаимно однозначно : [2]

Это определение означает, что различные значения θ должны соответствовать различным распределениям вероятностей: если θ 1θ 2 , то также P θ 1P θ 2 . [3] Если распределения определяются в терминах функций плотности вероятности (PDF), то две PDF-файлы следует считать различными, только если они различаются по множеству ненулевой меры (например, две функции ƒ 1 ( x ) =  1 0 ≤  x  < 1 и ƒ 2 ( x ) =  1 0 ≤  x  ≤ 1 различаются только в одной точке x  = 1 — наборе нулевой меры — и, следовательно, не могут рассматриваться как отдельные PDF-файлы).

Идентифицируемость модели в смысле обратимости карты эквивалентна возможности узнать истинный параметр модели, если за моделью можно наблюдать неопределенно долго. Действительно, если { X t } ⊆  S — последовательность наблюдений модели, то по усиленному закону больших чисел

для любого измеримого множества A  ⊆  S (здесь 1 {...}индикаторная функция ). Таким образом, при бесконечном числе наблюдений мы сможем найти истинное распределение вероятностей P 0 в модели, а поскольку приведенное выше условие идентифицируемости требует, чтобы отображение было обратимым, мы также сможем найти истинное значение параметра которое породило данное распределение  P 0 .

Примеры

Пример 1

Пусть это обычное семейство в масштабе местоположения :

Затем

Это выражение равно нулю почти для всех x только тогда, когда все его коэффициенты равны нулю, что возможно только при | σ 1 | = | σ 2 | и μ 1 = μ 2 . Поскольку в масштабе параметр σ ограничен значением больше нуля, мы заключаем, что модель идентифицируема: ƒ θ 1  = ƒ θ 2θ 1  =  θ 2 .

Пример 2

Пусть это стандартная модель линейной регрессии :

(где ′ обозначает транспонирование матрицы ). Тогда параметр β идентифицируем тогда и только тогда, когда матрица обратима. Таким образом, это условие идентификации в модели.

Пример 3

Предположим , что это классическая линейная модель ошибок в переменных :

где ( ε , η , x* ) — совместно нормальные независимые случайные величины с нулевым ожидаемым значением и неизвестными дисперсиями, и наблюдаются только переменные ( x , y ). Тогда эта модель неидентифицируема, [4] идентифицируемо только произведение βσ² (где σ² — дисперсия скрытого регрессора x* ). Это также пример модели, идентифицируемой множеством : хотя точное значение β невозможно узнать, мы можем гарантировать, что оно должно лежать где-то в интервале ( β yx , 1 ÷ β xy ), где β yx — коэффициент в МНК . регрессия y по x , а β xy — коэффициент регрессии OLS x по y . [5]

Если отказаться от предположения о нормальности и потребовать, чтобы x* не были нормально распределены, сохранив лишь условие независимости ε  ⊥  η  ⊥  x* , то модель станет идентифицируемой. [4]

Смотрите также

Рекомендации

Цитаты

  1. ^ Рауэ, А.; Кройц, К.; Майвальд, Т.; Бахманн, Дж.; Шиллинг, М.; Клингмюллер, У.; Тиммер, Дж. (1 августа 2009 г.). «Структурный и практический анализ идентифицируемости частично наблюдаемых динамических моделей с использованием вероятности профиля». Биоинформатика . 25 (15): 1923–1929. doi : 10.1093/биоинформатика/btp358 . ПМИД  19505944.
  2. ^ Леманн и Казелла 1998, гл. 1, Определение 5.2
  3. ^ ван дер Ваарт 1998, с. 62
  4. ^ аб Рейерсол, 1950 г.
  5. ^ Казелла и Бергер 2002, с. 583

Источники

дальнейшее чтение

Эконометрика