В статистике и эконометрике идентификация множеств ( или частичная идентификация ) расширяет концепцию идентифицируемости (или «точечной идентификации») в статистических моделях на среды, где модель и распределение наблюдаемых переменных недостаточны для определения уникального значения параметров модели , но вместо этого ограничивают параметры строгим подмножеством пространства параметров. Статистические модели, которые идентифицированы множеством (или частично), возникают в различных условиях в экономике , включая теорию игр и причинную модель Рубина . В отличие от подходов, которые обеспечивают точечную идентификацию параметров модели, методы из литературы по частичной идентификации используются для получения оценок множеств, которые действительны при более слабых предположениях моделирования.
История
Ранние работы, содержащие основные идеи идентификации множеств, включали работы Фриша (1934) и Маршака и Эндрюса (1944). Однако методы были значительно развиты и продвинуты Чарльзом Мански , начиная с Мански (1989) и Мански (1990).
Частичная идентификация продолжает оставаться основной темой в исследованиях эконометрики. Пауэлл (2017) назвал частичную идентификацию примером теоретического прогресса в литературе по эконометрике, а Бономм и Шейх (2017) перечисляют частичную идентификацию как «одну из самых выдающихся недавних тем в эконометрике».
Определение
Пусть обозначает вектор скрытых переменных, пусть обозначает вектор наблюдаемых (возможно, эндогенных) объясняющих переменных, и пусть обозначает вектор наблюдаемых эндогенных переменных результата. Структура — это пара , где представляет собой набор условных распределений, а — структурная функция, такая что для всех реализаций случайных векторов . Модель — это набор допустимых (т.е. возможных) структур . [2] [3]
Пусть обозначает набор условных распределений , соответствующих структуре . Допустимые структуры и называются эквивалентными с точки зрения наблюдения, если . [2] [3] Пусть обозначает истинную (т.е. генерирующую данные) структуру. Модель называется идентифицированной по точкам, если для каждого имеем . В более общем смысле модель называется заданно (или частично ) идентифицированной, если существует хотя бы одно допустимое такое, что . Идентифицированный набор структур — это набор допустимых структур, которые эквивалентны с точки зрения наблюдения .
В большинстве случаев определение можно существенно упростить. В частности, когда не зависит от и имеет известное (с точностью до некоторого конечномерного параметра) распределение, и когда известно с точностью до некоторого конечномерного вектора параметров, каждая структура может быть охарактеризована конечномерным вектором параметров . Если обозначает истинный (т.е. генерирующий данные) вектор параметров, то идентифицированный набор , часто обозначаемый как , является набором значений параметров, которые с точки зрения наблюдения эквивалентны .
Пример: отсутствующие данные
Этот пример принадлежит Тамеру (2010). Предположим, что есть две бинарные случайные величины , Y и Z . Эконометрист интересуется . Однако существует проблема с отсутствующими данными : Y можно наблюдать только в том случае, если .
По закону полной вероятности ,
Единственным неизвестным объектом является , который ограничен диапазоном от 0 до 1. Следовательно, идентифицированный набор — это
Учитывая ограничение в виде отсутствующих данных, эконометрист может сказать только то, что . Это позволяет использовать всю доступную информацию.
Статистический вывод
Оценка множества не может полагаться на обычные инструменты статистического вывода, разработанные для точечной оценки . Литература по статистике и эконометрике изучает методы статистического вывода в контексте моделей, идентифицированных множеством, уделяя особое внимание построению доверительных интервалов или доверительных областей с соответствующими свойствами. Например, метод, разработанный Черножуковым, Хонгом и Тамером (2007), строит доверительные области, которые покрывают идентифицированный набор с заданной вероятностью.
Примечания
- ^ ab "Обобщенные модели инструментальных переменных - Эконометрическое общество". www.econometricsociety.org . doi :10.3982/ecta12223 . Получено 05.01.2024 .
- ^ ab Matzkin, Rosa L. (2013-08-02). «Непараметрическая идентификация в структурных экономических моделях». Annual Review of Economics . 5 (1): 457–486. doi :10.1146/annurev-economics-082912-110231. ISSN 1941-1383.
Ссылки
- Бономм, Стефан; Шейх, Азим (2017). «Сохранение экономики в эконометрике: (микро-) эконометрика в журнале политической экономии». Журнал политической экономии . 125 (6): 1846–1853. doi :10.1086/694620.
- Черножуков, Виктор ; Хонг, Хан; Тамер, Эли (2007). «Оценка и доверительные области для наборов параметров в эконометрических моделях». Econometrica . 75 (5). Эконометрическое общество: 1243–1284. doi : 10.1111/j.1468-0262.2007.00794.x. hdl : 1721.1/63545 . ISSN 0012-9682.
- Фриш, Рагнар (1934). Статистический анализ слияния с помощью полных регрессионных систем . Университетский институт экономики, Осло.
- Мански, Чарльз (1989). «Анатомия проблемы отбора». Журнал человеческих ресурсов . 24 (3): 343–360. doi :10.2307/145818.
- Мански, Чарльз (1990). «Непараметрические границы эффектов лечения». The American Economic Review . 80 (2): 319–323. JSTOR 2006592.
- Маршак, Якоб; Эндрюс, Уильямс (1944). «Случайные одновременные уравнения и теория производства». Econometrica . 12 (3/4). Эконометрическое общество: 143–205. doi :10.2307/1905432.
- Пауэлл, Джеймс (2017). «Идентификация и асимптотические аппроксимации: три примера прогресса в эконометрической теории». Журнал экономических перспектив . 31 (2): 107–124. doi :10.1257/jep.31.2.107.
- Льюбел, Артур (01.12.2019). «Зоопарк идентификации: значения идентификации в эконометрике». Журнал экономической литературы . 57 (4). Американская экономическая ассоциация: 835–903. doi : 10.1257/jel.20181361. ISSN 0022-0515. S2CID 125792293.
- Тамер, Эли (2010). «Частичная идентификация в эконометрике». Annual Review of Economics . 2 (1): 167–195. doi :10.1146/annurev.economics.050708.143401.
Дальнейшее чтение