В эконометрике эндогенность в широком смысле относится к ситуациям, в которых объясняющая переменная коррелирует с ошибкой . [1] Различие между эндогенными и экзогенными переменными возникло в моделях одновременных уравнений , где переменные, значения которых определяются моделью, отделяются от переменных , которые предопределены. [a] [2] Игнорирование одновременности в оценке приводит к смещенным оценкам, поскольку нарушает предположение об экзогенности теоремы Гаусса-Маркова . Проблема эндогенности часто игнорируется исследователями, проводящими неэкспериментальные исследования, и это исключает возможность выработки рекомендаций по политике. [3] Для смягчения этой проблемы обычно используются методы инструментальных переменных .
Помимо одновременности, корреляция между объясняющими переменными и ошибкой может возникнуть, когда ненаблюдаемая или пропущенная переменная искажает как независимые, так и зависимые переменные, или когда независимые переменные измеряются с ошибкой . [4]
В стохастической модели можно определить понятия обычной экзогенности , последовательной экзогенности , сильной/строгой экзогенности . Экзогенность сформулирована таким образом, что переменная или переменные являются экзогенными для параметра . Даже если переменная является экзогенной для параметра , она может быть эндогенной для параметра .
Если объясняющие переменные не являются стохастическими, то они являются сильно экзогенными для всех параметров.
Если независимая переменная коррелирует с ошибкой в регрессионной модели, то оценка коэффициента регрессии в обычной регрессии наименьших квадратов (OLS) смещена ; однако , если корреляция не является одновременной, то оценка коэффициента все еще может быть последовательной . Существует много методов исправления смещения, включая инструментальную регрессию переменных и коррекцию выбора Хекмана .
Ниже приведены некоторые общие источники эндогенности.
В этом случае эндогенность возникает из-за неконтролируемой вмешивающейся переменной , переменной, которая коррелирует как с независимой переменной в модели, так и с ошибочным членом. (Эквивалентно, пропущенная переменная влияет на независимую переменную и отдельно влияет на зависимую переменную.)
Предположим, что «истинная» модель, подлежащая оценке, — это
но исключен из регрессионной модели (возможно, потому что нет способа измерить его напрямую). Тогда модель, которая фактически оценивается, это
где (таким образом, член был включен в состав ошибки).
Если корреляция и не равна 0 и по отдельности влияет на (значение ), то коррелирует с ошибкой .
Здесь не является экзогенным для и , поскольку при условии распределение зависит не только от и , но также от и .
Предположим, что идеальная мера независимой переменной невозможна. То есть, вместо наблюдения , на самом деле наблюдается то, где есть ошибка измерения или «шум». В этом случае модель, заданная как
можно записать в терминах наблюдаемых величин и ошибок как
Поскольку и зависят от , они коррелируют, поэтому оценка МНК будет смещена в сторону понижения.
Ошибка измерения зависимой переменной не приводит к эндогенности, хотя и увеличивает дисперсию члена ошибки.
Предположим, что две переменные определены совместно, причем каждая из них влияет на другую в соответствии со следующими «структурными» уравнениями :
Оценка любого уравнения сама по себе приводит к эндогенности. В случае первого структурного уравнения, . Решение для при предположении, что приводит к
Предполагая, что и не коррелируют с ,
Поэтому попытки оценки любого структурного уравнения будут затруднены эндогенностью.
Проблема эндогенности особенно актуальна в контексте анализа временных рядов причинных процессов. Обычно некоторые факторы в причинной системе зависят по своему значению в период t от значений других факторов в причинной системе в период t − 1. Предположим, что уровень заражения вредителями не зависит от всех других факторов в течение данного периода, но на него влияет уровень осадков и удобрений в предшествующий период. В этом случае было бы правильно сказать, что заражение экзогенно в течение периода, но эндогенно с течением времени.
Пусть модель будет y = f ( x , z ) + u . Если переменная x является последовательной экзогенной для параметра , и y не вызывает x в смысле Грэнджера , то переменная x является строго экзогенной для параметра .
В общем случае одновременность имеет место в динамической модели так же, как и в примере статической одновременности, приведенном выше.