Идентифицируемость

В статистике идентифицируемость — это свойство, которому должна удовлетворять модель , чтобы был возможен точный вывод . Модель является идентифицируемой , если теоретически возможно узнать истинные значения основных параметров этой модели после получения от нее бесконечного числа наблюдений. Математически это эквивалентно утверждению, что разные значения параметров должны порождать разные распределения вероятностей наблюдаемых переменных. Обычно модель идентифицируема только при определенных технических ограничениях, и в этом случае совокупность этих требований называется условиями идентификации .

Модель, которую невозможно идентифицировать, называется неидентифицируемой или неидентифицируемой : две или более параметризации эквивалентны с точки зрения наблюдения . В некоторых случаях, даже если модель не поддается идентификации, все же можно узнать истинные значения определенного подмножества параметров модели. В этом случае мы говорим, что модель частично идентифицируема . В других случаях можно узнать местоположение истинного параметра до определенной конечной области пространства параметров, и в этом случае модель становится идентифицируемой .

Помимо строго теоретического исследования свойств модели, идентифицируемость можно рассматривать в более широком смысле, когда модель проверяется на экспериментальных наборах данных с использованием анализа идентифицируемости . ^[1]

Определение

Позвольте быть статистической моделью с пространством параметров . Мы говорим, что это идентифицируемо , если отображение взаимно однозначно : ^[2] ${\mathcal {P}}=\{P_{\theta }:\theta \in \Theta \}$ $\Тета$ ${\mathcal {P}}$ $\theta \mapsto P_ {\theta }$

P_{\theta _{1}}=P_{\theta _{2}}\quad \Rightarrow \quad \theta _{1} =\theta _{2}\quad \ {\text{для всех }}\theta _{1},\theta _{2}\in \Theta .

Это определение означает, что различные значения θ должны соответствовать различным распределениям вероятностей: если θ ₁ ≠ θ ₂ , то также P _{θ ₁} ≠ P _{θ ₂} . ^[3] Если распределения определяются в терминах функций плотности вероятности (PDF), то две PDF-файлы следует считать различными, только если они различаются по множеству ненулевой меры (например, две функции ƒ ₁ ( x ) = 1 _{0 ≤ x < 1} и ƒ ₂ ( x ) = 1 _{0 ≤ x ≤ 1} различаются только в одной точке x = 1 — наборе нулевой меры — и, следовательно, не могут рассматриваться как отдельные PDF-файлы).

Идентифицируемость модели в смысле обратимости карты эквивалентна возможности узнать истинный параметр модели, если за моделью можно наблюдать неопределенно долго. Действительно, если { X _t } ⊆ S — последовательность наблюдений модели, то по усиленному закону больших чисел $\theta \mapsto P_ {\theta }$

{\frac {1}{T}}\sum _{t=1}^{T}\mathbf {1} _{\{X_{t}\in A\}} \ {\xrightarrow {\ text{as}}}\ \Pr[X_{t}\in A],

для любого измеримого множества A ⊆ S (здесь 1 _{...} — индикаторная функция ). Таким образом, при бесконечном числе наблюдений мы сможем найти истинное распределение вероятностей P ₀ в модели, а поскольку приведенное выше условие идентифицируемости требует, чтобы отображение было обратимым, мы также сможем найти истинное значение параметра которое породило данное распределение P ₀ . $\theta \mapsto P_ {\theta }$

Примеры

Пример 1

Пусть это обычное семейство в масштабе местоположения : ${\mathcal {P}}$

{\mathcal {P}}={\Big \{}\ f_{\theta }(x)={\tfrac {1}{{\sqrt {2\pi }}\sigma }}e^{ -{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}}\ {\Big |}\ \theta =(\mu ,\sigma ):\mu \in \mathbb {R} ,\,\sigma \!>0\ {\Big \}}.

Затем

{\begin{aligned}&f_{\theta _{1}}(x)=f_{\theta _{2}}(x)\\[6pt]\Longleftrightarrow {}&{\frac {1} {{\sqrt {2\pi }}\sigma _{1}}}\exp \left(-{\frac {1}{2\sigma _{1}^{2}}}(x-\mu _ {1})^{2}\right)={\frac {1}{{\sqrt {2\pi }}\sigma _{2}}}\exp \left(-{\frac {1}{2 \sigma _{2}^{2}}}(x-\mu _{2})^{2}\right)\\[6pt]\Longleftrightarrow {}&{\frac {1}{\sigma _{ 1}^{2}}}(x-\mu _{1})^{2}+\ln \sigma _{1}={\frac {1}{\sigma _{2}^{2}} }(x-\mu _{2})^{2}+\ln \sigma _{2}\\[6pt]\Longleftrightarrow {}&x^{2}\left({\frac {1}{\sigma _{1}^{2}}}-{\frac {1}{\sigma _{2}^{2}}}\right)-2x\left({\frac {\mu _{1}}{ \sigma _{1}^{2}}}-{\frac {\mu _{2}}{\sigma _{2}^{2}}}\right)+\left({\frac {\mu _{1}^{2}}{\sigma _{1}^{2}}}-{\frac {\mu _{2}^{2}}{\sigma _{2}^{2}} }+\ln \sigma _{1}-\ln \sigma _{2}\right)=0\end{aligned}}

Это выражение равно нулю почти для всех x только тогда, когда все его коэффициенты равны нулю, что возможно только при | σ ₁ | = | σ ₂ | и μ ₁ = μ ₂ . Поскольку в масштабе параметр σ ограничен значением больше нуля, мы заключаем, что модель идентифицируема: ƒ _{θ ₁} = ƒ _{θ ₂} ⇔ θ ₁ = θ ₂ .

Пример 2

Пусть это стандартная модель линейной регрессии : ${\mathcal {P}}$

y=\beta 'x+\varepsilon,\quad \mathrm {E} [\,\varepsilon \mid x\,]=0

(где ′ обозначает транспонирование матрицы ). Тогда параметр β идентифицируем тогда и только тогда, когда матрица обратима. Таким образом, это условие идентификации в модели. $\mathrm {E} [xx']$

Пример 3

Предположим , что это классическая линейная модель ошибок в переменных : ${\mathcal {P}}$

{\begin{cases}y=\beta x^{*}+\varepsilon,\\x=x^{*}+\eta,\end{cases}}

где ( ε , η , x* ) — совместно нормальные независимые случайные величины с нулевым ожидаемым значением и неизвестными дисперсиями, и наблюдаются только переменные ( x , y ). Тогда эта модель неидентифицируема, ^[4] идентифицируемо только произведение βσ² _∗ (где σ² _∗ — дисперсия скрытого регрессора x* ). Это также пример модели, идентифицируемой множеством : хотя точное значение β невозможно узнать, мы можем гарантировать, что оно должно лежать где-то в интервале ( β _yx , 1 ÷ β _xy ), где β _yx — коэффициент в МНК . регрессия y по x , а β _xy — коэффициент регрессии OLS x по y . ^[5]

Если отказаться от предположения о нормальности и потребовать, чтобы x* не были нормально распределены, сохранив лишь условие независимости ε ⊥ η ⊥ x* , то модель станет идентифицируемой. ^[4]

Смотрите также

дальнейшее чтение

Уолтер, Э. ; Пронцато, Л. (1997), Идентификация параметрических моделей на основе экспериментальных данных , Springer

Эконометрика

Льюбель, Артур (01 декабря 2019 г.). «Зоопарк идентификации: значения идентификации в эконометрике». Журнал экономической литературы . Американская экономическая ассоциация. 57 (4): 835–903. дои : 10.1257/jel.20181361. ISSN 0022-0515. S2CID 125792293.
Мацкин, Роза Л. (2013). «Непараметрическая идентификация в структурных экономических моделях». Ежегодный обзор экономики . 5 (1): 457–486. doi : 10.1146/annurev- Economics-082912-110231.
Ротенберг, Томас Дж. (1971). «Идентификация в параметрических моделях». Эконометрика . 39 (3): 577–591. дои : 10.2307/1913267. ISSN 0012-9682. JSTOR 1913267.