stringtranslate.com

Разница в различиях

Разница в различиях ( DID [1] или DD [2] ) — это статистический метод , используемый в эконометрике и количественных исследованиях в социальных науках, который пытается имитировать экспериментальный исследовательский дизайн с использованием данных наблюдательного исследования , изучая дифференциальный эффект лечения на «группу лечения» по сравнению с « контрольной группой » в естественном эксперименте . [3] Он вычисляет эффект лечения (т. е. объясняющей переменной или независимой переменной ) на результат (т. е. переменной ответа или зависимой переменной ) путем сравнения среднего изменения с течением времени в переменной результата для группы лечения со средним изменением с течением времени для контрольной группы. Хотя он предназначен для смягчения эффектов посторонних факторов и смещения отбора , в зависимости от того, как выбрана группа лечения, этот метод все еще может быть подвержен определенным смещениям (например, средней регрессии , обратной причинности и смещению пропущенной переменной ).

В отличие от оценки временного ряда эффекта лечения у субъектов (которая анализирует различия с течением времени) или поперечной оценки эффекта лечения (которая измеряет разницу между группами лечения и контроля), разница в различиях использует панельные данные для измерения различий между группами лечения и контроля в изменениях в переменной результата, которые происходят с течением времени.

Общее определение

Разница в различиях требует данных, измеренных в группе лечения и контрольной группе в два или более различных периода времени, а именно, по крайней мере один период времени до «лечения» и по крайней мере один период времени после «лечения». В представленном примере результат в группе лечения представлен линией P, а результат в контрольной группе представлен линией S. Переменная результата (зависимая) в обеих группах измеряется в момент времени 1, до того, как любая из групп получила лечение (т. е. независимая или объясняющая переменная), представленная точками P 1 и S 1 . Затем группа лечения получает или испытывает лечение, и обе группы снова измеряются в момент времени 2. Не все различия между группами лечения и контроля в момент времени 2 (то есть, различия между P 2 и S 2 ) можно объяснить как эффект лечения, поскольку группа лечения и контрольная группа не начинали в одной и той же точке в момент времени 1. Таким образом, DID вычисляет «нормальную» разницу в переменной результата между двумя группами (разницу, которая все еще существовала бы, если бы ни одна из групп не испытывала лечение), представленную пунктирной линией Q . (Обратите внимание, что наклон от P 1 к Q такой же, как наклон от S 1 к S 2 .) Эффект лечения — это разница между наблюдаемым результатом (P 2 ) и «нормальным» результатом (разница между P 2 и Q).

Формальное определение

Рассмотрим модель

где — зависимая переменная для индивидуума и времени , — группа, к которой принадлежит (т. е. группа лечения или контрольная группа), а — сокращение для фиктивной переменной, равной 1, когда событие, описанное в , истинно, и 0 в противном случае. На графике зависимости времени от группы — вертикальный отсекаемый элемент для графика , а — временной тренд, общий для обеих групп в соответствии с предположением о параллельном тренде (см. предположения ниже). — эффект лечения, а — остаточный член .

Рассмотрим среднее значение зависимой переменной и фиктивных показателей по группам и времени:

и предположим для простоты, что и . Обратите внимание, что это не случайно; это просто кодирует, как маркируются группы и периоды. Тогда

Строгое предположение экзогенности тогда подразумевает, что

Без потери общности предположим, что — группа лечения, а — последующий период, тогда и , что дает оценку DID

что можно интерпретировать как эффект лечения, обозначенный . Ниже показано, как эту оценку можно прочитать как коэффициент в обычной регрессии наименьших квадратов. Модель, описанная в этом разделе, чрезмерно параметризована; чтобы исправить это, один из коэффициентов для фиктивных переменных можно установить равным 0, например, мы можем установить .

Предположения

Иллюстрация предположения о параллельной тенденции

Все предположения модели OLS в равной степени применимы к DID. Кроме того, DID требует предположения о параллельной тенденции . Предположение о параллельной тенденции гласит, что одинаковы в обоих случаях и . Учитывая, что формальное определение выше точно отражает реальность, это предположение автоматически выполняется. Однако модель с вполне может быть более реалистичной. Чтобы повысить вероятность выполнения предположения о параллельной тенденции, подход «разница в разностях» часто сочетается с сопоставлением . [4] Это включает «сопоставление» известных единиц «лечения» с имитированными контрфактическими единицами «контроля»: характерно эквивалентными единицами, которые не получали лечения. Определяя переменную результата как временную разницу (изменение наблюдаемого результата между периодами до и после лечения) и сопоставление нескольких единиц в большой выборке на основе схожих историй до лечения, результирующий ATE (т. е. ATT: средний эффект лечения для пролеченных) обеспечивает надежную оценку разницы в разностях эффектов лечения. Это служит двум статистическим целям: во-первых, при условии наличия ковариатов до обработки предположение о параллельных тенденциях, скорее всего, будет верным; во-вторых, этот подход снижает зависимость от сопутствующих предположений об игнорируемости, необходимых для обоснованного вывода.

Как показано справа, эффект лечения — это разница между наблюдаемым значением y и тем, каким было бы значение y при параллельных тенденциях, если бы не было лечения. Ахиллесова пята DID — это когда что-то, кроме лечения, меняется в одной группе, но не в другой одновременно с лечением, что подразумевает нарушение предположения о параллельной тенденции.

Чтобы гарантировать точность оценки DID, предполагается, что состав индивидуумов двух групп остается неизменным с течением времени. При использовании модели DID необходимо учитывать и решать различные проблемы, которые могут скомпрометировать результаты, такие как автокорреляция [5] и провалы Эшенфельтера.

Выполнение

Метод DID можно реализовать в соответствии с таблицей ниже, где нижняя правая ячейка представляет собой оценку DID.

Проведение регрессионного анализа дает тот же результат. Рассмотрим модель OLS

где — фиктивная переменная для периода, равная , когда , а — фиктивная переменная для членства в группе, равная . Составная переменная — фиктивная переменная, указывающая, когда . Хотя здесь это не показано строго, это правильная параметризация формального определения модели, более того, оказывается, что средние значения по группе и периоду в этом разделе связаны с оценками параметров модели следующим образом

где обозначает условные средние значения, вычисленные по выборке, например, — показатель для последующего периода, — показатель для контрольной группы. Обратите внимание, что — оценка контрфактуального значения, а не влияние контрольной группы. Контрольная группа часто используется в качестве заменителя контрфактуального значения (см. Синтетический метод контроля для более глубокого понимания этого момента). Таким образом, можно интерпретировать как влияние как контрольной группы, так и контрфактуального значения вмешательства (лечения). Аналогично, , из-за предположения о параллельной тенденции, также является той же разницей между лечебной и контрольной группами в . Приведенные выше описания не следует толковать как подразумевающие (средний) эффект только контрольной группы для или только разницу лечебной и контрольной групп в предшествующий период для . Как и в случае Карда и Крюгера ниже, первая (временная) разность выходной переменной устраняет необходимость во временном тренде (т. е. ) для формирования несмещенной оценки , подразумевая, что это на самом деле не зависит от группы лечения или контроля. [6] Соответственно, разница между группами лечения и контроля устранит необходимость в дифференциалах лечения (т. е. ) для формирования несмещенной оценки . Этот нюанс важно понимать, когда пользователь полагает, что существуют (слабые) нарушения параллельного пре-тренда или в случае нарушений соответствующих предположений контрфактуальной аппроксимации с учетом существования нетипичных шоков или искажающих событий. Чтобы увидеть связь между этой записью и предыдущим разделом, рассмотрим, как и выше, только одно наблюдение за период времени для каждой группы, тогда

и так далее для других значений и , что эквивалентно

Но это выражение для эффекта лечения, которое было дано в формальном определении и в приведенной выше таблице.

Пример

Статья Карда и Крюгера о минимальной заработной плате в Нью-Джерси , опубликованная в 1994 году, [6] считается одним из самых известных исследований DID; Кард позже был удостоен Нобелевской премии по экономике 2021 года отчасти за эту и связанную с ней работу. Кард и Крюгер сравнили занятость в секторе быстрого питания в Нью-Джерси и в Пенсильвании в феврале 1992 года и в ноябре 1992 года, после того как минимальная заработная плата в Нью-Джерси выросла с 4,25 до 5,05 долларов в апреле 1992 года. Наблюдение за изменением занятости только в Нью-Джерси, до и после лечения, не позволило бы контролировать пропущенные переменные, такие как погода и макроэкономические условия региона. Включая Пенсильванию в качестве контроля в модель «разница в разностях», любое смещение, вызванное переменными, общими для Нью-Джерси и Пенсильвании, неявно контролируется, даже если эти переменные не наблюдаются. Если предположить, что Нью-Джерси и Пенсильвания имеют параллельные тенденции с течением времени, то изменение занятости в Пенсильвании можно интерпретировать как изменение, которое испытал бы Нью-Джерси, если бы они не повысили минимальную заработную плату, и наоборот. Доказательства предполагают, что повышение минимальной заработной платы не привело к снижению занятости в Нью-Джерси, вопреки тому, что предполагает некоторая экономическая теория. В таблице ниже показаны оценки Card & Krueger эффекта лечения на занятость, измеренного в FTE (или эквивалентах полной занятости) . Card и Krueger подсчитали, что повышение минимальной заработной платы на 0,80 доллара в Нью-Джерси привело к увеличению занятости на 2,75 FTE.

Пример программного обеспечения для этого исследования можно найти в команде Stata -diff- [7], автором которой является Хуан Мигель Вилья.

Смотрите также

Ссылки

  1. ^ Абади, А. (2005). «Полупараметрические оценки разности разностей». Обзор экономических исследований . 72 (1): 1–19. CiteSeerX  10.1.1.470.1475 . doi :10.1111/0034-6527.00321. S2CID  8801460.
  2. ^ Бертран, М.; Дюфло, Э .; Муллайнатан, С. (2004). «Насколько мы должны доверять оценкам разностей разностей?» (PDF) . Quarterly Journal of Economics . 119 (1): 249–275. doi :10.1162/003355304772839588. S2CID  470667.
  3. ^ Angrist, JD; Pischke, JS (2008). Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press. С. 227–243. ISBN 978-0-691-12034-8.
  4. ^ Басу, Паллави; Смолл, Дилан (2020). «Построение более близкой контрольной группы в анализе различий в различиях: ее влияние на историю, взаимодействующую с групповым смещением». Observational Studies . 6 : 103–130. doi : 10.1353/obs.2020.0011. S2CID  221702893.
  5. ^ Бертран, Марианна; Дюфло, Эстер; Муллайнатан, Сендхил (2004). «Насколько мы должны доверять оценкам разниц в разностях?» (PDF) . Quarterly Journal of Economics . 119 (1): 249–275. doi :10.1162/003355304772839588. S2CID  470667.
  6. ^ ab Card, David; Krueger, Alan B. (1994). «Минимальная заработная плата и занятость: исследование индустрии быстрого питания в Нью-Джерси и Пенсильвании». American Economic Review . 84 (4): 772–793. JSTOR  2118030.
  7. ^ Вилла, Хуан М. (2016). "diff: упрощение оценки эффектов лечения «разница в разнице». The Stata Journal . 16 (1): 52–71. doi : 10.1177/1536867X1601600108 . S2CID  124464636.

Дальнейшее чтение

Внешние ссылки