В статистике , эконометрике , эпидемиологии и смежных дисциплинах метод инструментальных переменных ( ИВ ) используется для оценки причинно-следственных связей , когда контролируемые эксперименты невозможны или когда лечение не было успешно доставлено каждой единице в рандомизированном эксперименте. [1] Интуитивно ИВ используются, когда объясняющая переменная, представляющая интерес, коррелирует с ошибкой (эндогенной), в этом случае обычные наименьшие квадраты и ANOVA дают смещенные результаты. Действительный инструмент вызывает изменения в объясняющей переменной (коррелирует с эндогенной переменной), но не оказывает независимого влияния на зависимую переменную и не коррелирует с ошибкой, что позволяет исследователю раскрыть причинно-следственное влияние объясняющей переменной на зависимую переменную.
Методы инструментальных переменных позволяют проводить последовательную оценку, когда объясняющие переменные (ковариаты) коррелируют с ошибками в регрессионной модели. Такая корреляция может возникнуть, когда:
Объяснительные переменные, которые страдают от одной или нескольких из этих проблем в контексте регрессии, иногда называются эндогенными . В этой ситуации обычный метод наименьших квадратов дает смещенные и непоследовательные оценки. [2] Однако, если инструмент доступен, последовательные оценки все равно могут быть получены. Инструмент — это переменная, которая сама по себе не принадлежит объясняющему уравнению, но коррелирует с эндогенными объясняющими переменными, условно на значении других ковариатов.
В линейных моделях существуют два основных требования к использованию IV:
Неформально, при попытке оценить причинно-следственное влияние некоторой переменной X («ковариата» или «объясняющей переменной») на другую переменную Y («зависимую переменную»), инструментом является третья переменная Z , которая влияет на Y только посредством своего влияния на X.
Например, предположим, что исследователь хочет оценить причинно-следственное влияние курения ( X ) на общее состояние здоровья ( Y ). [5] Корреляция между курением и здоровьем не означает, что курение вызывает плохое здоровье, потому что другие переменные, такие как депрессия, могут влиять как на здоровье, так и на курение, или потому что здоровье может влиять на курение. Невозможно провести контролируемые эксперименты по курению среди населения в целом. Исследователь может попытаться оценить причинно-следственное влияние курения на здоровье на основе данных наблюдений, используя ставку налога на табачные изделия ( Z ) в качестве инструмента для курения. Ставка налога на табачные изделия является разумным выбором для инструмента, потому что исследователь предполагает, что она может коррелировать со здоровьем только через ее влияние на курение. Если затем исследователь обнаружит, что налоги на табак и состояние здоровья коррелируют, это можно рассматривать как доказательство того, что курение вызывает изменения в здоровье.
Первое использование инструментальной переменной произошло в 1928 году в книге Филипа Г. Райта , наиболее известного своим превосходным описанием производства, транспортировки и продажи растительных и животных масел в начале 1900-х годов в Соединенных Штатах. [6] [7] В 1945 году Олав Рейерсёль применил тот же подход в контексте моделей ошибок в переменных в своей диссертации, дав методу его название. [8]
Райт попытался определить спрос и предложение на масло, используя панельные данные о ценах и объемах продаж в Соединенных Штатах. Идея заключалась в том, что регрессионный анализ может создать кривую спроса или предложения, поскольку они формируются путем между ценами и объемами спроса или предложения. Проблема заключалась в том, что данные наблюдений не формировали кривую спроса или предложения как таковую, а скорее облако точечных наблюдений, которые принимали разные формы в различных рыночных условиях. Казалось, что делать выводы из данных оставалось неуловимым.
Проблема заключалась в том, что цена влияла как на спрос, так и на предложение, так что функция, описывающая только одно из двух, не могла быть построена напрямую из данных наблюдений. Райт правильно заключил, что ему нужна переменная, которая коррелировала бы либо со спросом, либо с предложением, но не с обоими, то есть инструментальная переменная.
После долгих раздумий Райт решил использовать региональные осадки в качестве инструментальной переменной: он пришел к выводу, что осадки влияют на производство травы и, следовательно, на производство молока и, в конечном счете, на предложение масла, но не на спрос на масло. Таким образом, он смог построить уравнение регрессии только с инструментальной переменной цены и предложения. [9]
Формальные определения инструментальных переменных, использующие контрфактуальные и графические критерии, были даны Джудеей Перл в 2000 году. [10] Энгрист и Крюгер (2001) представляют обзор истории и использования методов инструментальных переменных. [11] Понятия причинности в эконометрике и их связь с инструментальными переменными и другими методами обсуждаются Хекманом (2008). [12]
Хотя идеи, лежащие в основе IV, распространяются на широкий класс моделей, очень распространенным контекстом для IV является линейная регрессия . Традиционно [13] инструментальная переменная определяется как переменная , которая коррелирует с независимой переменной и не коррелирует с «ошибочным членом» U в линейном уравнении.
— вектор. — матрица, обычно со столбцом единиц и, возможно, с дополнительными столбцами для других ковариатов. Рассмотрим, как инструмент позволяет восстановиться. Вспомним, что МНК решает для так, что (когда мы минимизируем сумму квадратов ошибок, , условие первого порядка в точности равно .) Если предполагается, что истинная модель имеет по любой из перечисленных выше причин — например, если есть пропущенная переменная , которая влияет как на , так и на по отдельности — то эта процедура МНК не даст причинно-следственного влияния на . МНК просто выберет параметр, который делает результирующие ошибки некоррелированными с .
Рассмотрим для простоты случай с одной переменной. Предположим, что мы рассматриваем регрессию с одной переменной и константой (возможно, другие ковариаты не нужны, или, возможно, мы исключили какие-либо другие релевантные ковариаты):
В этом случае коэффициент интересующего нас регрессора определяется как . Подстановка дает
где — то, каким будет вектор предполагаемых коэффициентов, если . В этом случае можно показать, что — несмещенная оценка . Если в базовой модели, которую мы считаем, то МНК дает противоречивую оценку, которая не отражает лежащий в основе причинный эффект интереса. IV помогает решить эту проблему, идентифицируя параметры не на основе того, не коррелирует ли с , а на основе того, не коррелирует ли другая переменная с . Если теория предполагает, что связано с (первый этап), но не коррелирует с (ограничение исключения), то IV может идентифицировать причинный параметр интереса, когда МНК терпит неудачу. Поскольку существует несколько конкретных способов использования и вывода оценок IV даже в линейном случае (IV, 2SLS, GMM), мы отложим дальнейшее обсуждение для раздела «Оценка» ниже.
Методы IV были разработаны среди гораздо более широкого класса нелинейных моделей. Общие определения инструментальных переменных, использующих контрфактуальный и графический формализм, были даны Перлом (2000; стр. 248). [10] Графическое определение требует, чтобы Z удовлетворяло следующим условиям:
где обозначает d -разделение , а обозначает граф , в котором все стрелки, входящие в X, отсекаются.
Контрфактическое определение требует, чтобы Z удовлетворяло
где Y x обозначает значение, которого достигло бы Y , если бы X был x , а обозначает независимость.
Если имеются дополнительные ковариаты W, то приведенные выше определения изменяются таким образом, что Z может считаться инструментом, если заданные критерии выполняются при условии W.
Суть определения Перла такова:
Эти условия не зависят от конкретной функциональной формы уравнений и поэтому применимы к нелинейным уравнениям, где U может быть неаддитивным (см. Непараметрический анализ). Они также применимы к системе множественных уравнений, в которых X (и другие факторы) влияют на Y через несколько промежуточных переменных. Инструментальная переменная не обязательно должна быть причиной X ; заместитель такой причины также может быть использован, если он удовлетворяет условиям 1–5. [10] Ограничение исключения (условие 4) избыточно; оно следует из условий 2 и 3.
Поскольку U ненаблюдаемо, требование, чтобы Z был независим от U , не может быть выведено из данных, а должно быть определено из структуры модели, т. е. процесса генерации данных. Причинно-следственные графики являются представлением этой структуры, и графическое определение, данное выше, может быть использовано для быстрого определения того, квалифицируется ли переменная Z как инструментальная переменная, учитывая набор ковариатов W. Чтобы увидеть, как это сделать, рассмотрим следующий пример.
Предположим, что мы хотим оценить влияние программы репетиторства в университете на средний балл ( GPA ). Связь между посещением программы репетиторства и средним баллом может быть осложнена рядом факторов. Студенты, которые посещают программу репетиторства, могут больше заботиться о своих оценках или могут испытывать трудности с учебой. Это затруднение изображено на рисунках 1–3 справа через двунаправленную дугу между программой репетиторства и средним баллом. Если студенты распределяются по общежитиям случайным образом, близость общежития студента к программе репетиторства является естественным кандидатом на роль инструментальной переменной.
Однако что, если программа обучения находится в библиотеке колледжа? В этом случае близость также может заставить студентов проводить больше времени в библиотеке, что, в свою очередь, улучшает их средний балл (см. Рисунок 1). Используя причинно-следственный график, изображенный на рисунке 2, мы видим, что близость не может считаться инструментальной переменной, поскольку она связана с средним баллом через путь Близость Библиотечные часы Средний балл в . Однако, если мы контролируем Библиотечные часы, добавляя их как ковариат, то близость становится инструментальной переменной, поскольку близость отделена от среднего балла с учетом Библиотечных часов в [ необходима ссылка ] .
Теперь предположим, что мы замечаем, что «природные способности» студента влияют на его или ее количество часов в библиотеке, а также на его или ее средний балл, как на рисунке 3. Используя причинно-следственный граф, мы видим, что Библиотечные часы являются коллайдером, и обусловливание на нем открывает путь Близость Библиотечные часы Средний балл. В результате Близость не может использоваться как инструментальная переменная.
Наконец, предположим, что Библиотечные часы на самом деле не влияют на средний балл, потому что студенты, которые не учатся в библиотеке, просто учатся в другом месте, как на рисунке 4. В этом случае контроль Библиотечных часов все еще открывает ложный путь от Близости к среднему баллу. Однако, если мы не будем контролировать Библиотечные часы и удалим их как ковариату, то Близость снова можно будет использовать как инструментальную переменную.
Теперь мы пересматриваем и расширяем механику IV более подробно. Предположим, что данные генерируются процессом вида
где
Вектор параметров — это причинно-следственный эффект изменения на единицу в каждом элементе , при этом все остальные причины остаются постоянными. Эконометрическая цель — оценить . Для простоты предположим, что выборки e некоррелированы и взяты из распределений с одинаковой дисперсией (то есть ошибки последовательно некоррелированы и гомоскедастичны ).
Предположим также, что предлагается регрессионная модель номинально той же формы. При наличии случайной выборки наблюдений T из этого процесса обычная оценка наименьших квадратов имеет вид
где X , y и e обозначают векторы-столбцы длины T. Это уравнение похоже на уравнение, включающее в себя во введении (это матричная версия этого уравнения). Когда X и e некоррелированы , при определенных условиях регулярности второй член имеет ожидаемое значение, обусловленное X, равным нулю, и сходится к нулю в пределе, поэтому оценка является несмещенной и последовательной. Однако, когда X и другие неизмеренные причинные переменные, свернутые в член e , коррелированы, оценка OLS, как правило, смещена и непоследовательна для β . В этом случае допустимо использовать оценки для прогнозирования значений y при заданных значениях X , но оценка не восстанавливает причинно-следственное влияние X на y .
Чтобы восстановить базовый параметр , мы вводим набор переменных Z , который сильно коррелирует с каждым эндогенным компонентом X, но (в нашей базовой модели) не коррелирует с e . Для простоты можно считать X матрицей T × 2, состоящей из столбца констант и одной эндогенной переменной, а Z — матрицей T × 2, состоящей из столбца констант и одной инструментальной переменной. Однако этот метод обобщается до X , являющейся матрицей константы и, скажем, 5 эндогенных переменных, причем Z является матрицей, состоящей из константы и 5 инструментов. В последующем обсуждении мы будем предполагать, что X является матрицей T × K , и оставим это значение K неопределенным. Оценщик, в котором X и Z являются матрицами T × K, называется просто идентифицированным .
Предположим, что связь между каждым эндогенным компонентом x i и инструментами определяется выражением
Наиболее распространенная спецификация IV использует следующую оценку:
Эта спецификация приближается к истинному параметру по мере увеличения выборки, при условии, что в истинной модели:
Пока в базовом процессе, который генерирует данные, соответствующее использование оценщика IV определит этот параметр. Это работает, потому что IV решает для уникального параметра, который удовлетворяет , и, следовательно, фокусируется на истинном базовом параметре по мере роста размера выборки.
Теперь расширение: предположим, что в интересующем нас уравнении инструментов больше, чем ковариатов, так что Z представляет собой матрицу T × M с M > K. Это часто называют случаем переопределения . В этом случае можно использовать обобщенный метод моментов (GMM). Оценщик GMM IV имеет вид
где относится к матрице проекции .
Это выражение схлопывается до первого, когда число инструментов равно числу ковариатов в интересующем уравнении. Таким образом, сверхопределенный IV является обобщением только что определенного IV.
Развивая выражение:
В только что выявленном случае у нас столько же инструментов, сколько и ковариатов, так что размерность X такая же, как и у Z. Следовательно, и являются квадратными матрицами одинаковой размерности. Мы можем разложить обратную матрицу, используя тот факт, что для любых обратимых матриц A и B размером n на n , ( AB ) −1 = B −1 A −1 (см. Обратимая матрица#Свойства ):
Ссылка: см. Дэвидсон и Маккиннон (1993) [14] : 218
Существует эквивалентная недоопределенная оценка для случая, когда m < k . Поскольку параметры являются решениями набора линейных уравнений, недоопределенная модель, использующая набор уравнений, не имеет единственного решения.
Один из вычислительных методов, который можно использовать для расчета оценок IV, — это двухэтапный метод наименьших квадратов (2SLS или TSLS). На первом этапе каждая объясняющая переменная, которая является эндогенным ковариатом в интересующем уравнении, регрессируется на все экзогенные переменные в модели, включая как экзогенные ковариаты в интересующем уравнении, так и исключенные инструменты. Прогнозируемые значения из этих регрессий получаются:
Этап 1: Регрессия каждого столбца X на Z , ( ):
и сохраните прогнозируемые значения:
На втором этапе интересующая нас регрессия оценивается как обычно, за исключением того, что на этом этапе каждый эндогенный ковариат заменяется прогнозируемыми значениями с первого этапа:
Этап 2: Регрессия Y по прогнозируемым значениям с первого этапа:
что дает
Этот метод действителен только в линейных моделях. Для категориальных эндогенных ковариатов может возникнуть соблазн использовать другой первый этап, нежели обычные наименьшие квадраты, например, пробит-модель для первого этапа, за которой следует МНК для второго. Это обычно известно в эконометрической литературе как запрещенная регрессия [15] , потому что оценки параметров IV второго этапа согласованы только в особых случаях. [16]
Обычная оценка МНК выглядит так: Заменяем и отмечаем, что является симметричной и идемпотентной матрицей, так что
Полученная оценка численно идентична выражению, показанному выше. Небольшая коррекция должна быть сделана в сумме квадратов остатков в подобранной модели второго этапа, чтобы ковариационная матрица была рассчитана правильно.
Когда форма структурных уравнений неизвестна, инструментальную переменную все равно можно определить с помощью уравнений:
где и являются двумя произвольными функциями и не зависит от . Однако, в отличие от линейных моделей, измерения и не позволяют идентифицировать средний причинный эффект на , обозначаемый ACE
Балке и Перл [1997] вывели строгие границы для ACE и показали, что они могут предоставить ценную информацию о знаке и размере ACE. [17]
В линейном анализе нет теста, который опровергал бы предположение, что является инструментальным относительно пары . Это не так, когда является дискретным. Перл (2000) показал, что для всех и должно выполняться следующее ограничение, называемое «Инструментальным неравенством», если удовлетворяет двум уравнениям выше: [10]
Изложение выше предполагает, что причинный эффект интереса не меняется в зависимости от наблюдений, то есть является константой. Как правило, разные субъекты будут по-разному реагировать на изменения в «лечении» x . Когда эта возможность признается, средний эффект в популяции изменения x на y может отличаться от эффекта в данной субпопуляции. Например, средний эффект программы профессиональной подготовки может существенно различаться в группе людей, которые фактически получают обучение, и в группе, которая предпочитает не получать обучение. По этим причинам методы IV вызывают неявные предположения о поведенческой реакции или, в более общем плане, предположения о корреляции между реакцией на лечение и склонностью к получению лечения. [18]
Стандартная оценка IV может восстановить локальные средние эффекты лечения (LATE), а не средние эффекты лечения (ATE). [1] Имбенс и Энгрист (1994) демонстрируют, что линейная оценка IV может быть интерпретирована при слабых условиях как взвешенное среднее локальных средних эффектов лечения, где веса зависят от эластичности эндогенного регрессора к изменениям в инструментальных переменных. Грубо говоря, это означает, что эффект переменной проявляется только для субпопуляций, затронутых наблюдаемыми изменениями в инструментах, и что субпопуляции, которые больше всего реагируют на изменения в инструментах, будут иметь наибольшее влияние на величину оценки IV.
Например, если исследователь использует наличие колледжа, предоставляющего землю, в качестве инструмента для высшего образования в регрессии доходов, он определяет влияние колледжа на доходы в подгруппе населения, которая получила бы высшее образование, если бы колледж присутствовал, но которая не получила бы высшее образование, если бы колледжа не было. Этот эмпирический подход, без дополнительных предположений, ничего не говорит исследователю о влиянии колледжа среди людей, которые либо всегда, либо никогда не получат высшее образование, независимо от того, существует ли местный колледж.
Как отмечают Баунд, Джегер и Бейкер (1995), проблема возникает из-за выбора «слабых» инструментов, инструментов, которые являются плохими предикторами эндогенного предиктора вопроса в уравнении первой стадии. [19] В этом случае предсказание предиктора вопроса инструментом будет плохим, а предсказанные значения будут иметь очень малую вариацию. Следовательно, они вряд ли будут иметь большой успех в предсказании конечного результата, когда они используются для замены предиктора вопроса в уравнении второй стадии.
В контексте примера курения и здоровья, рассмотренного выше, налоги на табак являются слабыми инструментами для курения, если статус курения в значительной степени не реагирует на изменения в налогах. Если более высокие налоги не побуждают людей бросать курить (или не начинать курить), то изменение налоговых ставок ничего не говорит нам о влиянии курения на здоровье. Если налоги влияют на здоровье через иные каналы, чем через их влияние на курение, то инструменты недействительны, а подход инструментальных переменных может давать вводящие в заблуждение результаты. Например, места и время с относительно заботящимся о своем здоровье населением могут как вводить высокие налоги на табак, так и демонстрировать лучшее здоровье, даже если уровень курения остается постоянным, поэтому мы бы наблюдали корреляцию между здоровьем и налогами на табак, даже если бы курение не оказывало никакого влияния на здоровье. В этом случае мы бы ошиблись, сделав вывод о причинно-следственной связи курения со здоровьем из наблюдаемой корреляции между налогами на табак и здоровьем.
Силу инструментов можно оценить напрямую, поскольку как эндогенные ковариаты, так и инструменты являются наблюдаемыми. [20] Общее практическое правило для моделей с одним эндогенным регрессором таково: F-статистика по отношению к нулю , показывающая, что исключенные инструменты нерелевантны на первом этапе регрессии, должна быть больше 10.
Когда ковариаты экзогенны, свойства малой выборки оценщика OLS могут быть получены простым способом путем вычисления моментов оценщика, условных на X. Когда некоторые ковариаты эндогенны, так что реализуется оценка инструментальных переменных, простые выражения для моментов оценщика не могут быть получены таким образом. Как правило, оценки инструментальных переменных имеют только желаемые асимптотические, а не конечные выборочные свойства, и вывод основан на асимптотических приближениях к выборочному распределению оценщика. Даже когда инструменты не коррелируют с ошибкой в интересующем уравнении и когда инструменты не слабы, свойства конечной выборки оценщика инструментальных переменных могут быть плохими. Например, точно идентифицированные модели производят оценки конечной выборки без моментов, поэтому оценщик можно назвать ни смещенным, ни несмещенным, номинальный размер тестовой статистики может быть существенно искажен, и оценки обычно могут быть далеки от истинного значения параметра. [21]
Предположение о том, что инструменты не коррелируют с ошибкой в интересующем уравнении, не может быть проверено в точно идентифицированных моделях. Если модель переидентифицирована, имеется информация, которая может быть использована для проверки этого предположения. Наиболее распространенный тест этих ограничений переидентификации , называемый тестом Саргана–Хансена , основан на наблюдении, что остатки должны быть некоррелированы с набором экзогенных переменных, если инструменты действительно экзогенны. [22] Статистика теста Саргана–Хансена может быть рассчитана как (количество наблюдений, умноженное на коэффициент детерминации ) из регрессии OLS остатков на набор экзогенных переменных. Эта статистика будет асимптотически хи-квадрат с m − k степенями свободы при нулевом условии, что ошибка не коррелирует с инструментами.
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь )