Регрессионный разрывный дизайн

В статистике , эконометрике , политологии , эпидемиологии и смежных дисциплинах план разрывной регрессии (RDD) представляет собой квазиэкспериментальный план пре-теста-посттеста, который направлен на определение причинно-следственных эффектов вмешательств путем назначения отсечки или порога, выше или ниже которого назначается вмешательство. Сравнивая наблюдения, лежащие близко по обе стороны порога, можно оценить средний эффект лечения в условиях, в которых рандомизация невозможна. Однако по-прежнему невозможно сделать истинный причинно-следственный вывод с помощью одного только этого метода, поскольку он автоматически не отвергает причинно-следственные эффекты любой потенциальной смешивающей переменной. Впервые примененный Дональдом Тистлтуэйтом и Дональдом Кэмпбеллом (1960) для оценки стипендиальных программ, ^[1] RDD становится все более популярным в последние годы. ^[2] Недавние сравнения исследований рандомизированных контролируемых испытаний (РКИ) и RDD эмпирически продемонстрировали внутреннюю валидность плана. ^[3]

Пример

Интуиция, лежащая в основе RDD, хорошо проиллюстрирована с использованием оценки стипендий, основанных на заслугах. Основная проблема с оценкой причинно-следственной связи такого вмешательства заключается в однородности результатов по отношению к назначению лечения (например, присуждения стипендии). Поскольку высокоуспевающие студенты с большей вероятностью получат стипендию за заслуги и продолжат хорошо учиться в то же время, сравнение результатов награжденных и неполучателей приведет к завышению оценок . Даже если бы стипендия вообще не улучшила оценки, награжденные показали бы лучшие результаты, чем неполученные, просто потому, что стипендии были предоставлены студентам, которые хорошо учились до этого.

Несмотря на отсутствие экспериментального дизайна , RDD может использовать экзогенные характеристики вмешательства для выявления причинно-следственных эффектов . Если всем студентам выше определенного уровня — например, 80% — выдается стипендия, можно выявить локальный эффект лечения, сравнивая студентов около 80% отсечки. Интуиция здесь заключается в том, что студент, набравший 79%, скорее всего, будет очень похож на студента, набравшего 81% — учитывая заранее определенный порог в 80%. Однако один студент получит стипендию, а другой — нет. Сравнение результата получателя (группы лечения) с контрфактическим результатом не получателя (контрольной группы) таким образом обеспечит локальный эффект лечения.

Методология

Два наиболее распространенных подхода к оценке с использованием RDD — непараметрический и параметрический (обычно полиномиальная регрессия ).

Непараметрическая оценка

Наиболее распространенным непараметрическим методом, используемым в контексте RDD, является локальная линейная регрессия. Она имеет вид:

Y=\alpha +\tau D+\beta _{1}(Xc)+\beta _{2}D(Xc)+\varepsilon,

где — порог обработки, а — двоичная переменная, равная единице, если . Если — полоса пропускания используемых данных, то . Различные наклоны и пересечения соответствуют данным по обе стороны от порога. Обычно используется либо прямоугольное ядро (без взвешивания), либо треугольное ядро. Прямоугольное ядро имеет более простую интерпретацию по сравнению со сложными ядрами, которые дают небольшой прирост эффективности. ^[4] $с$ $D$ $X\geq c$ $ч$ $ch\leq X\leq c+h$

Главное преимущество использования непараметрических методов в RDD заключается в том, что они предоставляют оценки, основанные на данных, близких к пороговому значению, что интуитивно привлекательно. Это уменьшает некоторую погрешность, которая может возникнуть из-за использования данных, удаленных от порогового значения, для оценки разрыва на пороговом значении. ^[4] Более формально, локальные линейные регрессии предпочтительны, поскольку они обладают лучшими свойствами смещения ^[5] и лучшей сходимостью. ^[6] Однако использование обоих типов оценки, если это осуществимо, является полезным способом утверждать, что оценочные результаты не слишком сильно зависят от конкретного принятого подхода.

Параметрическая оценка

Пример параметрической оценки:

Y=\альфа +\бета _{1}x_{i}+\бета _{2}c_{i}+\бета _{3}c_{i}^{2}+\бета _{4}c_{i}^{3}+\varepsilon ,

где

x_{i}={\begin{cases}1{\text{ if }}c_{i}\geq {\bar {c}}\\0{\text{ if }}c_{i}<{\bar {c}}\end{cases}}

и является границей обработки. Обратите внимание, что полиномиальная часть может быть сокращена или расширена в соответствии с потребностями. ${\bar {c}}$

Другие примеры

Политика, в которой лечение определяется критерием возрастного соответствия (например, пенсии, минимальный возраст, разрешенный законом для употребления алкоголя). ^[7]^[8]
Выборы, на которых один политик побеждает с незначительным большинством голосов. ^[9]^[10]
Баллы за распределение в рамках образования, которые распределяют студентов по программам лечения. ^[11]

Требуемые предположения

Регрессионный разрывный дизайн требует, чтобы все потенциально значимые переменные, кроме переменной лечения и переменной результата, были непрерывными в точке, где происходят разрывы лечения и результата. Одним достаточным, хотя и не необходимым, ^[10] условием является то, что назначение лечения является «настолько же хорошим, насколько и случайным» на пороге лечения. ^[9] Если это выполняется, то это гарантирует, что те, кто едва получил лечение, сопоставимы с теми, кто едва не получил лечение, поскольку статус лечения фактически случаен.

Назначение лечения на пороге может быть "так же хорошо, как и случайно", если в переменной назначения присутствует случайность, и рассматриваемые агенты (отдельные лица, фирмы и т. д.) не могут идеально манипулировать своим статусом лечения. Например, предположим, что лечение заключается в сдаче экзамена, где требуется оценка 50%. В этом случае этот пример является допустимым планом разрыва регрессии, пока оценки в некоторой степени случайны, либо из-за случайности выставления оценок, либо из-за случайности успеваемости студентов.

Студенты также не должны иметь возможности идеально манипулировать своей оценкой, чтобы идеально определить свой статус лечения. Два примера включают студентов, способных убедить учителей «сдать экзамен пощаде» или студентов, которым разрешено пересдавать экзамен, пока они не сдадут. В первом случае те студенты, которые едва не провалились, но смогли получить «сдачу пощады», могут отличаться от тех, кто едва не провалился, но не смог получить «сдачу пощады». Это приводит к смещению отбора , поскольку теперь различаются группы лечения и контроля. В последнем случае некоторые студенты могут решить пересдать экзамен, остановившись после сдачи. Это также приводит к смещению отбора , поскольку только некоторые студенты решат пересдать экзамен. ^[4]

Проверка обоснованности предположений

Невозможно окончательно проверить валидность, если агенты способны идеально определить свой статус лечения. Однако некоторые тесты могут предоставить доказательства, которые либо подтверждают, либо опровергают валидность дизайна разрыва регрессии.

Тест на плотность

МакКрари (2008) предложил исследовать плотность наблюдений переменной назначения. ^[12] Предположим, что существует разрыв в плотности переменной назначения на пороге лечения. В этом случае это может означать, что некоторые агенты могли идеально манипулировать своим статусом лечения.

Например, если несколько студентов смогут получить «милосердный проход», то будет больше студентов, которые едва сдали экзамен, чем тех, кто едва провалился. Аналогично, если студентам разрешено пересдавать экзамен до тех пор, пока они не сдадут, то будет аналогичный результат. В обоих случаях это, скорее всего, проявится при проверке плотности оценок за экзамен. «Игра с системой» таким образом может сместить оценку эффекта лечения.

Непрерывность наблюдаемых переменных

Поскольку обоснованность дизайна разрыва регрессии основана на том, что те, кого едва лечили, являются такими же, как и те, кого едва не лечили, имеет смысл проверить, основаны ли эти группы на наблюдаемых переменных. Для более раннего примера можно проверить, отличаются ли характеристики тех, кто едва сдал (демографические данные, семейный доход и т. д.), от характеристик тех, кто едва не сдал. Хотя некоторые переменные могут различаться для двух групп на основе случайности, большинство этих переменных должны быть одинаковыми. ^[13]

Тесты на фальсификацию

Предопределенные переменные

Подобно непрерывности наблюдаемых переменных, можно было бы ожидать непрерывности в предопределенных переменных на отсечке лечения. Поскольку эти переменные были определены до решения о лечении, статус лечения не должен влиять на них. Рассмотрим более ранний пример стипендии на основе заслуг. Если интересующий нас результат — будущие оценки, то мы не ожидаем, что стипендия повлияет на предыдущие оценки. Если разрыв в предопределенных переменных присутствует на отсечке лечения, то это ставит под сомнение обоснованность дизайна разрыва регрессии.

Другие разрывы

Если разрывы присутствуют в других точках переменной назначения, где они не ожидаются, то это может сделать дизайн разрыва регрессии подозрительным. Рассмотрим пример Карпентера и Добкина (2011), которые изучали влияние легального доступа к алкоголю в Соединенных Штатах. ^[8] Поскольку доступ к алкоголю увеличивается в возрасте 21 года, это приводит к изменениям в различных результатах, таких как показатели смертности и заболеваемости. Если показатели смертности и заболеваемости также увеличиваются скачкообразно в других возрастах, то это ставит под сомнение интерпретацию разрыва в возрасте 21 года.

Включение и исключение ковариатов

Если оценки параметров чувствительны к удалению или добавлению ковариатов в модель, то это может поставить под сомнение обоснованность дизайна разрыва регрессии. Значительное изменение может предполагать, что те, кто едва получил лечение, отличаются по этим ковариатам от тех, кто едва не получил лечения. Включение ковариатов устранит часть этого смещения. Если присутствует большое количество смещения, и ковариаты объясняют значительную его часть, то их включение или исключение значительно изменит оценку параметра. ^[4]

Недавние исследования показали, как добавлять ковариаты, при каких условиях это допустимо и каков потенциал повышения точности. ^[14]

Преимущества

При правильном применении и анализе RDD дает непредвзятую оценку локального эффекта лечения. ^[15] RDD может быть почти таким же хорошим, как рандомизированный эксперимент, при измерении эффекта лечения.
RDD, как квазиэксперимент , не требует предварительной рандомизации и обходит этические проблемы случайного распределения .
Хорошо выполненные исследования RDD могут генерировать оценки эффекта лечения, аналогичные оценкам рандомизированных исследований. ^[16]

Недостатки

Оценочные эффекты являются беспристрастными только в том случае, если функциональная форма связи между лечением и результатом смоделирована правильно. Наиболее популярными предостережениями являются нелинейные связи, которые ошибочно принимаются за разрыв.
Загрязнение другими методами лечения. Предположим, что другой метод лечения применяется при том же пороговом значении той же переменной назначения. В этом случае измеренный разрыв в переменной результата может быть частично приписан этому другому методу лечения. Например, предположим, что исследователь хочет изучить влияние легального доступа к алкоголю на психическое здоровье, используя регрессионный разрывный дизайн при минимальном разрешенном возрасте употребления алкоголя. Измеренное воздействие можно спутать с легальным доступом к азартным играм, который может применяться в том же возрасте.

Расширения

Нечеткий RDD

Выявление причинно-следственных связей основывается на важном предположении, что действительно существует резкое отсечение, вокруг которого наблюдается разрыв в вероятности присвоения от 0 до 1. Однако в действительности отсечения часто не соблюдаются строго (например, применяются по усмотрению для студентов, которые немного не достигли порогового значения), и поэтому оценки будут смещенными .

В отличие от дизайна с резким разрывом регрессии, дизайн с нечетким разрывом регрессии (FRDD) не требует резкого разрыва в вероятности назначения. Тем не менее, он применим, пока вероятность назначения отличается. Интуиция, стоящая за ним, связана со стратегией инструментальной переменной и намерением лечить . Нечеткий RDD не обеспечивает беспристрастной оценки, когда величина интереса является пропорциональным эффектом (например, эффективность вакцины ), но существуют расширения, которые это делают. ^[17]

Регрессивный дизайн перегиба

Когда переменная назначения непрерывна (например, помощь студентам) и предсказуемо зависит от другой наблюдаемой переменной (например, семейного дохода), можно определить эффекты лечения, используя резкие изменения наклона функции лечения. Этот метод был придуман Нильсеном, Сёренсеном и Табером (2010) как дизайн регрессионного излома , хотя они ссылаются на похожие более ранние анализы. ^[18] Они пишут: «Этот подход напоминает идею разрыва регрессии. Вместо разрыва на уровне функции стипендия-доход мы имеем разрыв на наклоне функции». Строгие теоретические основы были предоставлены Кардом и др. (2012) ^[19] , а эмпирическое применение — Бокерманом и др. (2018). ^[20]

Обратите внимание, что регрессионные перегибы (или перегибы регрессии ) могут также означать тип сегментированной регрессии , которая представляет собой другой тип анализа.

Заключительные соображения

Дизайн RD принимает форму квазиэкспериментального исследовательского дизайна с четкой структурой, которая лишена рандомизированных экспериментальных особенностей. Несколько аспектов лишают дизайн RD возможности сохранения статус-кво. Например, дизайны часто включают серьезные проблемы, которые не оставляют места для случайных экспериментов. Кроме того, дизайн экспериментов зависит от точности процесса моделирования и соотношения между входами и выходами.

Смотрите также

Ссылки

^ Thistlethwaite, D.; Campbell, D. (1960). «Анализ регрессионно-разрывной связи: альтернатива эксперименту ex post facto». Журнал педагогической психологии . 51 (6): 309–317. doi :10.1037/h0044319. S2CID 13668989.
^ Imbens, G.; Lemieux, T. (2008). "Regression Discontinuity Designs: A Guide to Practice" (PDF) . Journal of Econometrics . 142 (2): 615–635. doi :10.1016/j.jeconom.2007.05.001.
^ Чаплин, Дункан Д.; Кук, Томас Д.; Зуровац, Елена; Куперсмит, Джаред С.; Финукейн, Мариэль М.; Фоллмер, Лорен Н.; Моррис, Ребекка Э. (2018). «Внутренняя и внешняя валидность дизайна разрывной регрессии: метаанализ 15 сравнений в рамках исследования». Журнал анализа и управления политикой . 37 (2): 403–429. doi : 10.1002/pam.22051 . ISSN 1520-6688.
^ abcd Ли; Лемье (2010). «Конструкции разрывной регрессии в экономике». Журнал экономической литературы . 48 (2): 281–355. doi :10.1257/jel.48.2.281. S2CID 14166110.
^ Фан; Гейбелс (1996). Локальное полиномиальное моделирование и его приложения . Лондон: Chapman and Hall. ISBN 978-0-412-98321-4.
^ Портер (2003). "Оценка в модели разрыва регрессии" (PDF) . Неопубликованная рукопись .
^ Дюфло (2003). «Бабушки и внучки: пенсии по старости и внутрисемейное распределение в Южной Африке». World Bank Economic Review . 17 (1): 1–25. doi :10.1093/wber/lhg013. hdl : 10986/17173 .
^ ab Carpenter; Dobkin (2011). «Минимальный разрешенный возраст употребления алкоголя и общественное здоровье». Журнал экономических перспектив . 25 (2): 133–156. doi : 10.1257/jep.25.2.133. JSTOR 23049457. PMC 3182479. PMID 21595328.
^ ab Lee (2008). «Рандомизированные эксперименты с неслучайным отбором на выборах в Палату представителей США». Журнал эконометрики . 142 (2): 675–697. CiteSeerX 10.1.1.409.5179 . doi :10.1016/j.jeconom.2007.05.004. S2CID 2293046.
^ ab de la Cuesta, B; Imai, K (2016). «Недоразумения относительно дизайна разрыва регрессии при изучении близких выборов». Annual Review of Political Science . 19 (1): 375–396. doi : 10.1146/annurev-polisci-032015-010115 .
^ Мосс, Б. Г.; Йитон, У. Х.; Ллойд, Дж. Э. (2014). «Оценка эффективности развивающей математики путем внедрения рандомизированного эксперимента в конструкцию разрыва регрессии». Анализ образовательной оценки и политики . 36 (2): 170–185. doi : 10.3102/0162373713504988. S2CID 123440758.
^ ab McCrary (2008). «Манипуляция текущей переменной в дизайне разрыва регрессии: тест плотности». Журнал эконометрики . 142 (2): 698–714. CiteSeerX 10.1.1.395.6501 . doi :10.1016/j.jeconom.2007.05.005.
^ ab Lee; Moretti; Butler (2004). «Избиратели влияют на политику или выбирают ее? Данные Палаты представителей США». Quarterly Journal of Economics . 119 (3): 807–859. doi :10.1162/0033553041502153.
^ Calonico; Cattaneo; Farrell; Titiunik (2018). «Планы разрывной регрессии с использованием ковариатов». arXiv : 1809.03904 [econ.EM].
^ Рубин (1977). «Назначение лечения на основе ковариата». Журнал образовательной и поведенческой статистики . 2 (1): 1–26. doi :10.3102/10769986002001001. S2CID 123013161.
^ Мосс, Б. Г.; Йитон, У. Х.; Ллойд, Дж. Э. (2014). «Оценка эффективности развивающей математики путем внедрения рандомизированного эксперимента в конструкцию разрыва регрессии». Анализ образовательной оценки и политики . 36 (2): 170–185. doi : 10.3102/0162373713504988. S2CID 123440758.
^ Мукерджи, Абхируп; Панайотов, Джордж; Сен, Рик; Датта, Харша; Гош, Пулак (2022). «Измерение эффективности вакцины на основе ограниченных наборов данных общественного здравоохранения: структура и оценки второй волны COVID в Индии». Science Advances . 8 (18): eabn4274. Bibcode :2022SciA....8N4274M. doi :10.1126/sciadv.abn4274. PMC 9075799 . PMID 35522748.
^ Нильсен, Х.С.; Соренсен, Т.; Табер, К.Р. (2010). «Оценка влияния студенческой помощи на зачисление в колледж: данные реформы политики государственных грантов». Американский экономический журнал: Экономическая политика . 2 (2): 185–215. doi :10.1257/pol.2.2.185. hdl : 10419/35588 . JSTOR 25760068.
^ Кард, Дэвид; Ли, Дэвид С.; Пей, Чжуань; Вебер, Андреа (2012). «Нелинейные правила политики и идентификация и оценка причинных эффектов в обобщенном регрессионном изгибном дизайне». Рабочий документ NBER № W18564 . doi : 10.3386/w18564 . SSRN 2179402.
^ Бокерман, Петри; Каннинен, Ото; Суониеми, Ильпо (2018). «Излом, от которого вас тошнит: влияние больничного на отсутствие». Журнал прикладной эконометрики . 33 (4): 568–579. дои : 10.1002/jae.2620 .

Дальнейшее чтение

Angrist, JD ; Pischke, J.-S. (2008). "Getting a Little Jumpy: Regression Discontinuity Designs". Mostly Harmless Econometrics: An Empiricist's Companion . Princeton University Press. стр. 251–268. ISBN 978-0-691-12035-5.
Каттанео, Матиас Д.; Титиуник, Росио (2022). «Конструкции разрывной регрессии». Annual Review of Economics . 14 : 821–851. doi :10.1146/annurev-economics-051520-021409. S2CID 125763727.
Каттанео, Матиас Д.; Идробо, Николас; Титиуник, Росио (2024). Практическое введение в планы разрывной регрессии: расширения . Издательство Кембриджского университета.
Кук, Томас Д. (2008).«Ожидание наступления жизни»: история регрессионно-разрывного дизайна в психологии, статистике и экономике». Журнал эконометрики . 142 (2): 636–654. doi :10.1016/j.jeconom.2007.05.002.
Imbens, Guido W.; Wooldridge, Jeffrey M. (2009). «Последние разработки в эконометрике оценки программ». Журнал экономической литературы . 47 (1): 5–86. doi :10.1257/jel.47.1.5.
Маас, Айрис Л.; Нолте, Сандра; Вальтер, Отто Б.; Бергер, Томас; Хаутцингер, Мартин (2017). «Дизайн разрывной регрессии показал себя как надежная альтернатива рандомизированному контролируемому исследованию для оценки эффектов лечения». Журнал клинической эпидемиологии . 82 : 94–102. doi :10.1016/j.jclinepi.2016.11.008. PMID 27865902.

Внешние ссылки

Анализ регрессии-разрыва в базе знаний Research Methods