stringtranslate.com

Идентифицируемость

В статистике идентифицируемость — это свойство, которому должна удовлетворять модель для того, чтобы был возможен точный вывод . Модель идентифицируема, если теоретически возможно узнать истинные значения базовых параметров этой модели после получения бесконечного числа наблюдений из нее. Математически это эквивалентно утверждению, что различные значения параметров должны генерировать различные распределения вероятностей наблюдаемых переменных. Обычно модель идентифицируема только при определенных технических ограничениях, и в этом случае набор этих требований называется условиями идентификации .

Модель, которая не может быть идентифицирована, называется неидентифицируемой или неидентифицируемой : две или более параметризации эквивалентны с точки зрения наблюдения . В некоторых случаях, даже если модель неидентифицируема, все равно можно узнать истинные значения определенного подмножества параметров модели. В этом случае мы говорим, что модель частично идентифицируема . В других случаях может быть возможно узнать местоположение истинного параметра вплоть до определенной конечной области пространства параметров, и в этом случае модель устанавливается идентифицируемой .

Помимо строго теоретического исследования свойств модели, идентифицируемость может рассматриваться в более широком смысле, когда модель тестируется с помощью экспериментальных наборов данных, используя анализ идентифицируемости . [1]

Определение

Пусть будет статистической моделью с пространством параметров . Мы говорим, что она идентифицируема , если отображение является однозначным : [2]

Это определение означает, что различные значения θ должны соответствовать различным распределениям вероятностей: если θ 1θ 2 , то также P θ 1P θ 2 . [3] Если распределения определены в терминах функций плотности вероятности (PDF), то две PDF следует считать различными, только если они различаются на множестве ненулевой меры (например, две функции ƒ 1 ( x ) =  1 0 ≤  x  < 1 и ƒ 2 ( x ) =  1 0 ≤  x  ≤ 1 различаются только в одной точке x  = 1 — множестве меры нуль — и, таким образом, не могут рассматриваться как различные PDF).

Идентифицируемость модели в смысле обратимости отображения эквивалентна возможности узнать истинный параметр модели, если модель может наблюдаться бесконечно долго. Действительно, если { X t } ⊆  S — последовательность наблюдений из модели, то по усиленному закону больших чисел ,

для каждого измеримого множества A  ⊆  S (здесь 1 {...}индикаторная функция ). Таким образом, при бесконечном числе наблюдений мы сможем найти истинное распределение вероятностей P 0 в модели, и поскольку условие идентифицируемости выше требует, чтобы отображение было обратимым, мы также сможем найти истинное значение параметра, который сгенерировал данное распределение  P 0 .

Примеры

Пример 1

Пусть будет нормальным семейством масштабов местоположения :

Затем

Это выражение равно нулю для почти всех x только тогда, когда все его коэффициенты равны нулю, что возможно только при | σ 1 | = | σ 2 | и μ 1 = μ 2 . Поскольку в параметре масштаба σ ограничено значением больше нуля, мы заключаем, что модель идентифицируема: ƒ θ 1  = ƒ θ 2θ 1  =  θ 2 .

Пример 2

Пусть будет стандартной линейной регрессионной моделью :

(где ′ обозначает транспонирование матрицы ). Тогда параметр β идентифицируем тогда и только тогда, когда матрица обратима. Таким образом, это условие идентификации в модели.

Пример 3

Предположим, что это классическая линейная модель с ошибками в переменных :

где ( ε , η , x* ) являются совместно нормальными независимыми случайными величинами с нулевым ожидаемым значением и неизвестными дисперсиями, и только переменные ( x , y ) наблюдаются. Тогда эта модель не идентифицируема, [4] только произведение βσ² является (где σ² является дисперсией скрытого регрессора x* ). Это также пример модели, идентифицируемой по множеству : хотя точное значение β не может быть изучено, мы можем гарантировать, что оно должно лежать где-то в интервале ( β yx , 1÷ β xy ), где β yx является коэффициентом в регрессии OLS y на x , а β xy является коэффициентом в регрессии OLS x на y . [5]

Если отказаться от предположения о нормальности и потребовать, чтобы x* не были распределены нормально, сохранив только условие независимости ε  ⊥  η  ⊥  x* , то модель станет идентифицируемой. [4]

Смотрите также

Ссылки

Цитаты

  1. ^ Рауэ, А.; Крейц, К.; Майвальд, Т.; Бахманн, Дж.; Шиллинг, М.; Клингмюллер, У.; Тиммер, Дж. (2009-08-01). «Анализ структурной и практической идентифицируемости частично наблюдаемых динамических моделей путем использования правдоподобия профиля». Биоинформатика . 25 (15): 1923–1929. doi : 10.1093/bioinformatics/btp358 . PMID  19505944.
  2. ^ Леманн и Каселла 1998, Гл. 1, Определение 5.2
  3. ^ ван дер Ваарт 1998, стр. 62
  4. ^ ab Reiersøl 1950
  5. ^ Казелла и Бергер 2002, стр. 583

Источники

Дальнейшее чтение

Эконометрика