stringtranslate.com

Оценка инструментальных переменных

В статистике , эконометрике , эпидемиологии и смежных дисциплинах метод инструментальных переменных ( IV ) используется для оценки причинно-следственных связей , когда контролируемые эксперименты невозможны или когда лечение не удается успешно применить к каждой единице в рандомизированном эксперименте. [1] Интуитивно понятно, что IV используются, когда интересующая объясняющая переменная коррелирует с ошибкой (эндогенной), и в этом случае обычные методы наименьших квадратов и ANOVA дают смещенные результаты. Действительный инструмент вызывает изменения в объясняющей переменной (коррелирует с эндогенной переменной), но не оказывает независимого влияния на зависимую переменную и не коррелирует с ошибкой, что позволяет исследователю выявить причинное влияние объясняющей переменной на зависимую. переменная.

Методы инструментальных переменных позволяют проводить последовательную оценку, когда объясняющие переменные (ковариаты) коррелируют с ошибками в регрессионной модели. Такая корреляция может возникнуть, когда:

  1. изменения зависимой переменной меняют значение хотя бы одной из ковариат («обратная» причинно-следственная связь),
  2. имеются пропущенные переменные , которые влияют как на зависимые, так и на независимые переменные, или
  3. ковариаты подвержены неслучайной ошибке измерения .

Объясняющие переменные, которые страдают от одной или нескольких из этих проблем в контексте регрессии, иногда называют эндогенными . В этой ситуации обычный метод наименьших квадратов дает смещенные и противоречивые оценки. [2] Однако, если инструмент доступен, последовательные оценки все равно могут быть получены. Инструмент — это переменная, которая сама по себе не принадлежит объясняющему уравнению, но коррелирует с эндогенными объясняющими переменными при условии, что они зависят от значения других ковариат.

В линейных моделях есть два основных требования для использования IV:

Пример

Неформально, пытаясь оценить причинное влияние некоторой переменной X («ковариата» или «объясняющая переменная») на другую Y («зависимую переменную»), инструментом является третья переменная Z , которая влияет на Y только через свое влияние на  X.

Например, предположим, что исследователь желает оценить причинное влияние курения ( X ) на общее состояние здоровья ( Y ). [5] Корреляция между курением и здоровьем не означает, что курение приводит к ухудшению здоровья, поскольку другие переменные, такие как депрессия, могут влиять как на здоровье, так и на курение, или потому, что здоровье может влиять на курение. Невозможно проводить контролируемые эксперименты по изучению статуса курения среди населения в целом. Исследователь может попытаться оценить причинное влияние курения на здоровье на основе данных наблюдений, используя ставку налога на табачные изделия ( Z ) в качестве инструмента оценки курения. Ставка налога на табачные изделия является разумным выбором в качестве инструмента, поскольку исследователь предполагает, что ее можно коррелировать со здоровьем только через ее влияние на курение. Если затем исследователь обнаружит, что налоги на табачные изделия и состояние здоровья коррелируют, это можно рассматривать как свидетельство того, что курение вызывает изменения в здоровье.

История

Впервые инструментальная переменная использовалась в книге Филипа Райта , вышедшей в 1928 году , наиболее известного своим превосходным описанием производства, транспортировки и продажи растительных и животных масел в начале 1900-х годов в США, [6] [7] а в 1945 году Олав Рейерсоль применил тот же подход в контексте моделей ошибок в переменных в своей диссертации, дав этому методу название. [8]

Райт попытался определить спрос и предложение на сливочное масло, используя панельные данные о ценах и количествах, продаваемых в Соединенных Штатах. Идея заключалась в том, что регрессионный анализ мог бы создать кривую спроса или предложения, поскольку они формируются путем изменения цен и объемов спроса или предложения. Проблема заключалась в том, что данные наблюдений образовывали не кривую спроса или предложения как таковую, а скорее облако точечных наблюдений, которые принимали разные формы в различных рыночных условиях. Казалось, что сделать выводы из данных оставалось невозможным.

Проблема заключалась в том, что цена влияла как на спрос, так и на предложение, поэтому функцию, описывающую только один из двух факторов, нельзя было построить непосредственно на основе данных наблюдений. Райт правильно пришел к выводу, что ему нужна переменная, которая коррелировала бы либо со спросом, либо с предложением, но не с обоими сразу, то есть инструментальная переменная.

После долгих размышлений Райт решил использовать региональные осадки в качестве инструментальной переменной: он пришел к выводу, что осадки влияют на производство травы и, следовательно, на производство молока и, в конечном итоге, на предложение масла, но не на спрос на масло. Таким образом, он смог построить уравнение регрессии, используя только инструментальные переменные цены и предложения. [9]

Формальные определения инструментальных переменных с использованием контрфактических данных и графических критериев были даны Джудеей Перл в 2000 году. [10] Ангрист и Крюгер (2001) представляют обзор истории и использования методов инструментальных переменных. [11] Понятия причинности в эконометрике и их связь с инструментальными переменными и другими методами обсуждаются Хекманом ( 2008). [12]

Теория

Хотя идеи, лежащие в основе IV, распространяются на широкий класс моделей, очень распространенным контекстом для IV является линейная регрессия. Традиционно [13] инструментальная переменная определяется как переменная Z , которая коррелирует с независимой переменной X и не коррелирует с «членом ошибки» U в линейном уравнении.

является вектором. представляет собой матрицу, обычно со столбцом единиц и, возможно, с дополнительными столбцами для других ковариат. Рассмотрим, как инструмент позволяет восстанавливаться. Напомним, что МНК находит такое условие (когда мы минимизируем сумму квадратов ошибок , условие первого порядка равно ). пропущенная переменная , которая влияет как на обе , так и по отдельности — тогда эта процедура МНК не окажет причинного воздействия на . OLS просто выберет параметр, при котором результирующие ошибки будут выглядеть некоррелированными с .

Рассмотрим для простоты случай с одной переменной. Предположим, мы рассматриваем регрессию с одной переменной и константой (возможно, никакие другие ковариаты не нужны или, возможно, мы частично исключили любые другие соответствующие ковариаты):

В этом случае коэффициент регрессора, представляющий интерес, определяется как . Замена даров

где - то, каким был бы предполагаемый вектор коэффициентов, если бы x не коррелировал с u . В этом случае можно показать, что это несмещенная оценка If в базовой модели, в которую мы верим, тогда OLS дает коэффициент, который не отражает основной причинный эффект, представляющий интерес. IV помогает решить эту проблему, определяя параметры не на основе того, не коррелирует ли она с , а на основе того, не коррелирует ли другая переменная с . Если теория предполагает, что это связано с (первой стадией), но не коррелирует с (ограничением исключения), то IV может определить интересующий причинный параметр, при котором МНК не работает. Поскольку существует несколько конкретных способов использования и получения оценок IV даже только в линейном случае (IV, 2SLS, GMM), мы оставим дальнейшее обсуждение для раздела «Оценка» ниже.

Графическое определение

Методы IV были разработаны для гораздо более широкого класса нелинейных моделей. Общие определения инструментальных переменных с использованием контрфактического и графического формализма были даны Перлом (2000; стр. 248). [10] Графическое определение требует, чтобы Z удовлетворял следующим условиям:

где обозначает d -разделение и обозначает граф , в котором все стрелки, входящие в X , обрезаны.

Контрфактическое определение требует, чтобы Z удовлетворяло

где Y x означает значение, которого Y достиг бы, если бы X было x , и означает независимость.

Если существуют дополнительные ковариаты W, то приведенные выше определения изменяются так, что Z квалифицируется как инструмент , если данные критерии являются условными для W.

Суть определения Перла такова:

  1. Интересующие уравнения являются «структурными», а не «регрессионными».
  2. Термин ошибки U обозначает все экзогенные факторы, влияющие на Y , когда X остается постоянным.
  3. Прибор Z должен быть независим от U.
  4. Инструмент Z не должен влиять на Y , если X остается постоянным (ограничение исключения).
  5. Инструмент Z не должен быть независимым от X.

Эти условия не зависят от конкретной функциональной формы уравнений и поэтому применимы к нелинейным уравнениям, где U может быть неаддитивным (см. Непараметрический анализ). Они также применимы к системе множества уравнений, в которой X (и другие факторы) влияют на Y через несколько промежуточных переменных. Инструментальная переменная не обязательно должна быть причиной X ; Также можно использовать прокси такой причины, если он удовлетворяет условиям 1–5. [10] Ограничение исключения (условие 4) является излишним; это следует из условий 2 и 3.

Выбор подходящих инструментов

Поскольку U не наблюдается, требование того, чтобы Z было независимым от U , не может быть выведено из данных и вместо этого должно быть определено из структуры модели, т. е. процесса генерации данных. Причинные графы являются представлением этой структуры, и графическое определение, данное выше, можно использовать для быстрого определения того, может ли переменная Z квалифицироваться как инструментальная переменная с учетом набора ковариат W . Чтобы увидеть, как это сделать, рассмотрим следующий пример.

Предположим, мы хотим оценить влияние университетской программы репетиторства на средний балл ( GPA ). Взаимосвязь между посещением программы репетиторства и средним баллом может быть нарушена рядом факторов. Учащиеся, посещающие программу репетиторства, могут больше заботиться о своих оценках или испытывать трудности с работой. Это смешение показано на рисунках 1–3 справа через двунаправленную дугу между программой репетиторства и средним баллом успеваемости. Если студентов распределяют по общежитиям случайным образом, близость студенческого общежития к программе обучения является естественным кандидатом на роль инструментальной переменной.

Однако что, если программа обучения находится в библиотеке колледжа? В этом случае близость также может привести к тому, что учащиеся будут проводить больше времени в библиотеке, что, в свою очередь, повысит их средний балл (см. Рисунок 1). Используя причинно-следственный график, изображенный на рисунке 2, мы видим, что близость не квалифицируется как инструментальная переменная, поскольку она связана с GPA через путь «Proximity Library Hours GPA» в . Однако, если мы контролируем часы работы библиотеки, добавляя ее в качестве ковариаты, тогда близость становится инструментальной переменной, поскольку близость отделена от среднего балла за время работы библиотеки, указанное в [ необходима цитата ] .

Теперь предположим, что мы заметили, что «естественные способности» учащегося влияют на количество часов, проведенных им в библиотеке, а также на его средний балл, как показано на рисунке 3. Используя причинно-следственный график, мы видим, что часы работы в библиотеке — это коллайдер и условие на нем открывает путь к часам библиотеки близости GPA. В результате близость не может использоваться в качестве инструментальной переменной.

Наконец, предположим, что часы работы в библиотеке на самом деле не влияют на средний балл, потому что студенты, которые не учатся в библиотеке, просто учатся в другом месте, как показано на рисунке 4. В этом случае контроль за часами в библиотеке по-прежнему открывает ложный путь от близости к среднему баллу. Однако если мы не будем контролировать часы работы библиотеки и удалим их как ковариату, то близость снова можно будет использовать в качестве инструментальной переменной.

Оценка

Теперь мы вернемся к механике IV и расширим ее более подробно. Предположим, что данные генерируются процессом вида

где

Вектор параметров представляет собой причинный эффект изменения на одну единицу каждого элемента , сохраняя все остальные причины постоянными. Эконометрическая цель состоит в том, чтобы оценить . Для простоты предположим, что результаты e некоррелированы и взяты из распределений с одинаковой дисперсией (то есть, что ошибки серийно некоррелированы и гомоскедастичны ).

Предположим также, что предложена регрессионная модель номинально той же формы. Учитывая случайную выборку T наблюдений этого процесса, обычная оценка методом наименьших квадратов равна

где X , y и e обозначают векторы - столбцы длины T. Это уравнение аналогично уравнению, приведенному во введении (это матричная версия этого уравнения). Когда X и e некоррелированы , при определенных условиях регулярности второй член имеет ожидаемое значение, обусловленное X , равное нулю и сходящееся к нулю в пределе, поэтому оценка является несмещенной и последовательной. Когда X и другие неизмеренные, причинные переменные, свернутые в член e , коррелируют, однако оценка OLS обычно является смещенной и непоследовательной для  β . В этом случае допустимо использовать оценки для прогнозирования значений y при заданных значениях X , но оценка не восстанавливает причинное влияние X на  y .

Чтобы восстановить базовый параметр , мы вводим набор переменных Z , который сильно коррелирует с каждым эндогенным компонентом X , но (в нашей базовой модели) не коррелирует с  e . Для простоты можно считать X матрицей T × 2, состоящей из столбца констант и одной эндогенной переменной, а Z — матрицей T × 2, состоящей из столбца констант и одной инструментальной переменной. Однако этот метод обобщается: X представляет собой матрицу константы и, скажем, пяти эндогенных переменных, а Z представляет собой матрицу, состоящую из константы и пяти инструментов. В последующем обсуждении мы будем предполагать, что X представляет собой матрицу T × K , и оставим это значение K неуказанным. Оценка, в которой X и Z являются матрицами T × K , называется только что идентифицированной .

Предположим, что связь между каждым эндогенным компонентом x i и инструментами определяется выражением

Наиболее распространенная спецификация IV использует следующую оценку:

Эта спецификация приближается к истинному параметру по мере увеличения выборки, при условии, что она соответствует истинной модели:

Пока в базовом процессе, генерирующем данные, соответствующее использование оценщика IV будет определять этот параметр. Это работает, потому что IV находит уникальный параметр, который удовлетворяет , и, следовательно, уточняет истинный базовый параметр по мере роста размера выборки.

Теперь расширение: предположим, что инструментов больше, чем ковариат в интересующем уравнении, так что Z представляет собой матрицу T × M с M > K . Это часто называют случаем чрезмерной идентификации . В этом случае можно использовать обобщенный метод моментов (ОММ). Оценщик GMM IV

где относится к матрице проекции .

Это выражение превращается в первое, когда количество инструментов равно количеству ковариат в интересующем уравнении. Следовательно, сверхидентифицированный IV является обобщением только что идентифицированного IV.

Доказательство того, что β GMM коллапсирует до β IV в только что выявленном случае.

Развиваем выражение:

В только что выявленном случае у нас есть столько инструментов , сколько ковариат, так что размерность X такая же, как и размерность  Z. Следовательно, и все квадраты матриц одной размерности. Мы можем расширить обратное, используя тот факт, что для любых обратимых n -x n матриц A и B ( AB ) −1 = B −1 A −1 (см. Обратимая матрица#Свойства ):

Ссылка: см. Дэвидсон и Маккиннон (1993) [14] : 218. 

Существует эквивалентная недостаточно идентифицированная оценка для случая, когда m < k . Поскольку параметры являются решениями набора линейных уравнений, недостаточно идентифицированная модель, использующая этот набор уравнений, не имеет единственного решения.

Интерпретация как двухэтапный метод наименьших квадратов

Одним из вычислительных методов, который можно использовать для расчета оценок IV, является двухэтапный метод наименьших квадратов (2SLS или TSLS). На первом этапе каждая объясняющая переменная, которая является эндогенной ковариатой в уравнении интереса, подвергается регрессии по всем экзогенным переменным в модели, включая как экзогенные ковариаты в уравнении интереса, так и исключенные инструменты. Прогнозируемые значения этих регрессий получаются:

Этап 1: Регрессия каждого столбца X по Z , ( ):

и сохраните прогнозируемые значения:

На втором этапе интересующая регрессия оценивается как обычно, за исключением того, что на этом этапе каждая эндогенная ковариата заменяется прогнозируемыми значениями из первого этапа:

Этап 2: Регресс Y по прогнозируемым значениям первого этапа:

который дает

Этот метод применим только в линейных моделях. Для категориальных эндогенных ковариат может возникнуть соблазн использовать первый этап, отличный от обычного метода наименьших квадратов, например, пробит-модель для первого этапа, за которым следует МНК для второго. В эконометрической литературе это широко известно как запрещенная регрессия [15] , поскольку оценки параметров IV второго этапа согласованы только в особых случаях. [16]

Доказательство: вычисление оценки 2SLS.

Обычный оценщик МНК: . Заменив и отметив, что это симметричная и идемпотентная матрица, так что

Полученная оценка численно идентична выражению, показанному выше. Необходимо внести небольшую поправку в сумму квадратов остатков в подобранной модели на втором этапе, чтобы ковариационная матрица рассчитывалась правильно.

Непараметрический анализ

Когда форма структурных уравнений неизвестна, инструментальную переменную все же можно определить через уравнения:

где и — две произвольные функции и не зависят от . Однако в отличие от линейных моделей измерения и не позволяют выявить среднее причинное влияние на , обозначаемое ACE.

Балке и Перл [1997] получили точные границы ACE и показали, что они могут предоставить ценную информацию о знаке и размере ACE. [17]

В линейном анализе не существует теста, опровергающего предположение, что параметр является инструментальным по отношению к паре . Это не тот случай, когда дискретно. Перл (2000) показал, что для всех и следующее ограничение, называемое «Инструментальное неравенство», должно выполняться всякий раз, когда удовлетворяются два приведенных выше уравнения: [10]

Интерпретация при неоднородности эффекта лечения

В приведенном выше изложении предполагается, что интересующий причинный эффект не меняется в зависимости от наблюдения, то есть является константой. Как правило, разные субъекты по-разному реагируют на изменения в «лечении» x . Когда эта возможность признается, средний эффект изменения x на y в популяции может отличаться от эффекта в данной субпопуляции. Например, средний эффект от программы профессионального обучения может существенно различаться в зависимости от группы людей, которые фактически проходят обучение, и группы, которая предпочитает не проходить обучение. По этим причинам методы IV используют неявные предположения о поведенческой реакции или, в более общем смысле, предположения о корреляции между реакцией на лечение и склонностью к лечению. [18]

Стандартный оценщик IV может восстанавливать локальные средние эффекты лечения (LATE), а не средние эффекты лечения (ATE). [1] Имбенс и Ангрист (1994) демонстрируют, что линейную оценку IV можно интерпретировать в слабых условиях как средневзвешенное значение локальных средних эффектов лечения, где веса зависят от эластичности эндогенного регрессора к изменениям инструментальных переменных. Грубо говоря, это означает, что влияние переменной обнаруживается только для субпопуляций, на которые влияют наблюдаемые изменения в инструментах, и что субпопуляции, которые больше всего реагируют на изменения в инструментах, будут иметь наибольшее влияние на величину оценки IV.

Например, если исследователь использует наличие колледжа, предоставляющего землю, в качестве инструмента высшего образования в регрессии доходов, он определяет влияние колледжа на доходы в подгруппе населения, которая получила бы высшее образование, если бы колледж существовал, но которая не получить ученую степень, если нет колледжа. Без дополнительных предположений этот эмпирический подход ничего не говорит исследователю о влиянии колледжа на людей, которые либо всегда, либо никогда не получат высшее образование, независимо от того, существует ли местный колледж.

Проблема слабых инструментов

Как отмечают Баунд, Джегер и Бейкер (1995), проблема возникает из-за выбора «слабых» инструментов, инструментов, которые плохо предсказывают эндогенный предиктор вопроса в уравнении первой стадии. [19] В этом случае прогнозирование предсказателя вопроса инструментом будет плохим, а прогнозируемые значения будут иметь очень небольшие вариации. Следовательно, они вряд ли добьются большого успеха в предсказании конечного результата, если их использовать вместо предсказателя вопроса в уравнении второго этапа.

В контексте рассмотренного выше примера курения и здоровья табачные налоги являются слабым инструментом борьбы с курением, если статус курения в значительной степени не реагирует на изменения налогов. Если более высокие налоги не побуждают людей бросить курить (или не начать курить), то изменение налоговых ставок ничего не говорит нам о влиянии курения на здоровье. Если налоги влияют на здоровье не через курение, а через другие каналы, тогда инструменты недействительны, и подход инструментальных переменных может привести к вводящим в заблуждение результатам. Например, места и времена с относительно заботящимся о своем здоровье населением могут как вводить высокие налоги на табачные изделия, так и демонстрировать лучшее здоровье, даже если уровень курения остается постоянным, поэтому мы бы наблюдали корреляцию между налогами на здоровье и табачными изделиями, даже если бы курение не имело никакого эффекта. на здоровье. В этом случае было бы ошибкой делать вывод о причинном влиянии курения на здоровье на основе наблюдаемой корреляции между налогами на табачные изделия и здоровьем.

Тестирование слабых инструментов

Силу инструментов можно оценить напрямую, поскольку наблюдаемы как эндогенные ковариаты, так и сами инструменты. [20] Общее эмпирическое правило для моделей с одним эндогенным регрессором таково: F-статистика относительно нуля , при которой исключенные инструменты не имеют значения в регрессии первого этапа, должна быть больше 10.

Статистические выводы и проверка гипотез

Когда ковариаты являются экзогенными, свойства малой выборки оценщика МНК могут быть получены простым способом путем вычисления моментов оценщика, обусловленного X . Когда некоторые из ковариат являются эндогенными, так что осуществляется оценка инструментальных переменных, простые выражения для моментов оценки не могут быть получены таким образом. Как правило, средства оценки инструментальных переменных имеют только желаемые асимптотические свойства, а не конечную выборку, и вывод основан на асимптотических аппроксимациях выборочного распределения средства оценки. Даже когда инструменты не коррелируют с ошибкой в ​​интересующем уравнении и когда инструменты не являются слабыми, свойства конечной выборки средства оценки инструментальных переменных могут быть плохими. Например, точно идентифицированные модели создают оценки конечной выборки без моментов, поэтому можно сказать, что оценка не является ни смещенной, ни несмещенной, номинальный размер тестовой статистики может быть существенно искажен, а оценки обычно могут быть далеки от истинного значения. параметра. [21]

Тестирование ограничения исключения

Предположение о том, что инструменты не коррелируют с ошибкой в ​​уравнении интереса, не поддается проверке в точно идентифицированных моделях. Если модель переидентифицирована, имеется доступная информация, которую можно использовать для проверки этого предположения. Самый распространенный тест этих чрезмерно идентифицирующих ограничений , называемый тестом Саргана-Хансена , основан на наблюдении, что остатки не должны быть коррелированы с набором экзогенных переменных, если инструменты действительно экзогенны. [22] Статистика теста Саргана-Хансена может быть рассчитана как (количество наблюдений, умноженное на коэффициент детерминации ) на основе регрессии остатков по МНК на набор экзогенных переменных. Эта статистика будет асимптотически хи-квадрат с m  -  k степенями свободы при условии, что член ошибки не коррелирует с инструментами.

Смотрите также

Рекомендации

  1. ^ аб Имбенс, Г.; Ангрист, Дж. (1994). «Идентификация и оценка местных средних эффектов лечения». Эконометрика . 62 (2): 467–476. дои : 10.2307/2951620. JSTOR  2951620. S2CID  153123153.
  2. ^ Баллок, Дж.Г.; Грин, ДП; Ха, ЮВ (2010). «Да, но каков механизм? (Не ждите простого ответа)». Журнал личности и социальной психологии . 98 (4): 550–558. CiteSeerX 10.1.1.169.5465 . дои : 10.1037/a0018933. PMID  20307128. S2CID  7913867. 
  3. ^ https://www.stata.com/meeting/5nasug/wiv.pdf [ нужна полная ссылка ]
  4. ^ Николс, Остин (23 июля 2006 г.). «Слабые инструменты: обзор и новые методы». {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  5. ^ Ли, JP; Шембри, М. (2004). «Методика инструментальных переменных: цена на сигареты позволила лучше оценить влияние курения на SF-12». Журнал клинической эпидемиологии . 57 (3): 284–293. doi : 10.1016/j.jclinepi.2003.08.006. ПМИД  15066689.
  6. ^ Эпштейн, Рой Дж. (1989). «Падение OLS в структурных оценках». Оксфордские экономические документы . 41 (1): 94–107. doi : 10.1093/oxfordjournals.oep.a041930. JSTOR  2663184.
  7. ^ Сток, Джеймс Х.; Требби, Франческо (2003). «Ретроспективы: кто изобрел инструментальную регрессию переменных?». Журнал экономических перспектив . 17 (3): 177–194. дои : 10.1257/089533003769204416 .
  8. ^ Рейерсёл, Олав (1945). Анализ конфлюенса с помощью инструментальных наборов переменных . Архив по математике, астрономии и физике. Том. 32А. Уппсала: Алмквист и Викселлс. ОСЛК  793451601.
  9. ^ Вулдридж, Дж.: Вводная эконометрика . Юго-Западный, Скарборо, Канада, 2009 г.
  10. ^ abcd Перл, Дж. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Издательство Кембриджского университета . ISBN 978-0-521-89560-6.
  11. ^ Ангрист, Дж.; Крюгер, А. (2001). «Инструментальные переменные и поиск идентификации: от спроса и предложения к естественным экспериментам». Журнал экономических перспектив . 15 (4): 69–85. дои : 10.1257/jep.15.4.69 . hdl : 1721.1/63775 .
  12. ^ Хекман, Дж. (2008). «Эконометрическая причинность». Международный статистический обзор . 76 (1): 1–27. дои : 10.1111/j.1751-5823.2007.00024.x.
  13. ^ Боуден, Р.Дж.; Теркингтон, Д.А. (1984). Инструментальные переменные . Кембридж, Англия: Издательство Кембриджского университета.
  14. ^ Дэвидсон, Рассел; Маккиннон, Джеймс (1993). Оценка и вывод в эконометрике . Нью-Йорк: Издательство Оксфордского университета. ISBN 978-0-19-506011-9.
  15. ^ Вулдридж, Дж. (2010). Эконометрический анализ перекрестных и панельных данных. Эконометрический анализ перекрестных и панельных данных. МТИ Пресс. [ нужна страница ]
  16. ^ Лергенмюллер, Саймон (2017). Двухэтапная замена предикторов для данных времени до события (Диссертация). hdl : 10852/57801.
  17. ^ Балке, А.; Перл, Дж. (1997). «Границы эффекта лечения, полученные в исследованиях с несовершенным соблюдением режима». Журнал Американской статистической ассоциации . 92 (439): 1172–1176. CiteSeerX 10.1.1.26.3952 . дои : 10.1080/01621459.1997.10474074. S2CID  18365761. 
  18. ^ Хекман, Дж. (1997). «Инструментальные переменные: исследование неявных поведенческих предположений, используемых при оценке программ». Журнал человеческих ресурсов . 32 (3): 441–462. дои : 10.2307/146178. JSTOR  146178.
  19. ^ Баунд, Дж.; Джагер, Д.А.; Бейкер, Р.М. (1995). «Проблемы с оценкой инструментальных переменных, когда корреляция между инструментами и эндогенной объясняющей переменной слаба». Журнал Американской статистической ассоциации . 90 (430): 443. дои : 10.1080/01621459.1995.10476536.
  20. ^ Сток, Дж.; Райт, Дж.; Його, М. (2002). «Обзор слабых инструментов и их идентификация в обобщенном методе моментов». Журнал Американской статистической ассоциации . 20 (4): 518–529. CiteSeerX 10.1.1.319.2477 . дои : 10.1198/073500102288618658. S2CID  14793271. 
  21. ^ Нельсон, ЧР; Старц, Р. (1990). «Некоторые дополнительные результаты по точным свойствам малой выборки инструментального средства оценки переменных». Эконометрика . 58 (4): 967–976. дои : 10.2307/2938359. JSTOR  2938359. S2CID  119872226.
  22. ^ Хаяси, Фумио (2000). «Тестирование сверхидентифицирующих ограничений». Эконометрика . Принстон: Издательство Принстонского университета. стр. 217–221. ISBN 978-0-691-01018-2.

дальнейшее чтение

Библиография

Внешние ссылки