Причинно-следственная модель Рубина ( RCM ) , также известная как причинно-следственная модель Неймана–Рубина , [1] представляет собой подход к статистическому анализу причин и следствий, основанный на структуре потенциальных результатов , названной в честь Дональда Рубина . Название «причинно-следственная модель Рубина» впервые было придумано Полом В. Холландом . [2] Структура потенциальных результатов была впервые предложена Ежи Нейманом в его магистерской диссертации 1923 года, [3] хотя он обсуждал ее только в контексте полностью рандомизированных экспериментов. [4] Рубин расширил ее до общей структуры для размышлений о причинно-следственной связи как в наблюдательных, так и в экспериментальных исследованиях. [1]
Причинно-следственная модель Рубина основана на идее потенциальных результатов. Например, человек имел бы определенный доход в возрасте 40 лет, если бы он учился в колледже, тогда как он имел бы другой доход в возрасте 40 лет, если бы он не учился в колледже. Чтобы измерить причинно-следственный эффект поступления в колледж для этого человека, нам нужно сравнить результат для одного и того же человека в обоих альтернативных будущих. Поскольку невозможно увидеть оба потенциальных результата одновременно, один из потенциальных результатов всегда отсутствует. Эта дилемма является «фундаментальной проблемой причинно-следственной связи ». [2]
Из-за фундаментальной проблемы причинно-следственной связи причинные эффекты на уровне единиц нельзя наблюдать напрямую. Однако рандомизированные эксперименты позволяют оценить причинные эффекты на уровне популяции. [5] Рандомизированный эксперимент случайным образом распределяет людей по видам лечения: колледж или отсутствие колледжа. Из-за этого случайного распределения группы (в среднем) эквивалентны, и разницу в доходе в возрасте 40 лет можно отнести к распределению по колледжам, поскольку это было единственное различие между группами. Затем можно получить оценку среднего причинного эффекта (также называемого средним эффектом лечения или ATE) путем вычисления разницы в средних значениях между обработанными (посещающими колледж) и контрольными (не посещающими колледж) выборками.
Однако во многих случаях рандомизированные эксперименты невозможны из-за этических или практических соображений. В таких сценариях существует механизм неслучайного назначения. Это касается примера с посещением колледжа: люди не случайным образом назначаются для посещения колледжа. Скорее, люди могут выбирать колледж на основе своего финансового положения, образования родителей и т. д. Было разработано много статистических методов для причинно-следственной связи, таких как сопоставление баллов склонности . Эти методы пытаются скорректировать механизм назначения, находя контрольные единицы, похожие на единицы лечения.
Рубин определяет причинно-следственную связь:
Интуитивно, причинно-следственный эффект одного лечения, E, по сравнению с другим, C, для конкретной единицы и интервала времени от до представляет собой разницу между тем, что произошло бы в момент времени, если бы единица была подвергнута воздействию E, начатому в , и тем, что произошло бы в , если бы единица была подвергнута воздействию C, начатому в : «Если бы час назад я принял две таблетки аспирина вместо просто стакана воды, моя головная боль теперь прошла бы» или «потому что час назад я принял две таблетки аспирина вместо просто стакана воды, моя головная боль теперь прошла». Наше определение причинно-следственного эффекта лечения E по сравнению с C будет отражать это интуитивное значение». [5]
Согласно RCM, причинно-следственный эффект приема или не приема аспирина час назад — это разница между тем, как бы чувствовала себя ваша голова в случае 1 (прием аспирина) и случае 2 (не прием аспирина). Если ваша головная боль осталась бы без аспирина, но исчезла бы, если бы вы приняли аспирин, то причинно-следственный эффект приема аспирина — облегчение головной боли. В большинстве случаев мы заинтересованы в сравнении двух будущих вариантов, один из которых обычно называют «лечением», а другой — «контролем». Эти обозначения несколько условны.
Предположим, что Джо участвует в тесте FDA нового препарата от гипертонии. Всезнающий наблюдатель будет знать результаты для Джо как при лечении (новый препарат), так и при контроле (либо без лечения, либо текущее стандартное лечение). Причинно-следственный эффект, или эффект лечения, — это разница между этими двумя потенциальными результатами.
— это артериальное давление Джо, если он примет новую таблетку. В общем, эта нотация выражает потенциальный результат, который является результатом лечения, t , на единицу, u . Аналогично, — это эффект другого лечения, c или контроля, на единицу, u . В этом случае — это артериальное давление Джо, если он не примет таблетку. — это причинно-следственный эффект приема нового препарата.
Из этой таблицы мы знаем только причинный эффект для Джо. У всех остальных участников исследования может повыситься артериальное давление, если они примут таблетку. Однако, независимо от того, каков причинный эффект для других субъектов, причинный эффект для Джо — более низкое артериальное давление по сравнению с тем, каким было бы его артериальное давление, если бы он не принял таблетку.
Рассмотрим более крупную выборку пациентов:
Причинно-следственный эффект различен для каждого субъекта, но препарат работает для Джо, Мэри и Боба, потому что причинно-следственный эффект отрицательный. Их кровяное давление ниже с препаратом, чем было бы, если бы каждый из них не принимал препарат. У Салли, с другой стороны, препарат вызывает повышение кровяного давления.
Для того чтобы потенциальный результат имел смысл, он должен быть возможен, по крайней мере, априори . Например, если у Джо нет возможности, ни при каких обстоятельствах, получить новый препарат, то для него это невозможно. Этого никогда не может произойти. А если его никогда нельзя наблюдать, даже в теории, то причинно-следственное влияние лечения на артериальное давление Джо не определено.
Причинно-следственный эффект нового препарата хорошо определен, поскольку это простая разница двух потенциальных результатов, оба из которых могут произойти. В этом случае мы (или что-то еще) можем манипулировать миром, по крайней мере концептуально, так что возможно, что может произойти одно или другое событие.
Это определение причинно-следственных эффектов становится гораздо более проблематичным, если нет возможности, чтобы один из потенциальных результатов когда-либо произошел. Например, каково причинно-следственное влияние роста Джо на его вес? Наивно, это кажется похожим на наши другие примеры. Нам просто нужно сравнить два потенциальных результата: каким был бы вес Джо при лечении (где лечение определяется как рост на 3 дюйма) и каким был бы вес Джо при контроле (где контроль определяется как его текущий рост).
Минутное размышление высвечивает проблему: мы не можем увеличить рост Джо. Нет способа наблюдать, даже концептуально, каким был бы вес Джо, если бы он был выше, потому что нет способа сделать его выше. Мы не можем манипулировать ростом Джо, поэтому нет смысла исследовать причинно-следственное влияние роста на вес. Отсюда и лозунг: Нет причинно-следственной связи без манипуляции .
Мы требуем, чтобы «[потенциальный результат] наблюдения на одной единице не был затронут конкретным назначением лечения другим единицам» (Кокс, 1958, §2.4). Это называется предположением о стабильной ценности лечения единицы (SUTVA), которое выходит за рамки концепции независимости.
В контексте нашего примера кровяное давление Джо не должно зависеть от того, получает ли Мэри лекарство. Но что, если это так? Предположим, что Джо и Мэри живут в одном доме, и Мэри всегда готовит. Лекарство вызывает у Мэри тягу к соленой пище, поэтому, если она примет лекарство, она будет готовить с большим количеством соли, чем в противном случае. Диета с высоким содержанием соли повышает кровяное давление Джо. Следовательно, его результат будет зависеть как от того, какое лечение получил он, так и от того, какое лечение получила Мэри.
Нарушение SUTVA затрудняет причинно-следственные связи. Мы можем учитывать зависимые наблюдения, рассматривая больше видов лечения. Мы создаем 4 вида лечения, принимая во внимание, получает ли Мэри лечение или нет.
Напомним, что причинно-следственный эффект определяется как разница между двумя потенциальными результатами. В этом случае существует несколько причинно-следственных эффектов, поскольку существует более двух потенциальных результатов. Один из них — причинно-следственный эффект препарата на Джо, когда Мэри получает лечение и рассчитывается, . Другой — причинно-следственный эффект на Джо, когда Мэри не получает лечения и рассчитывается . Третий — причинно-следственный эффект лечения Мэри на Джо, когда Джо не лечится. Он рассчитывается как . Лечение, которое получает Мэри, оказывает большее причинно-следственное воздействие на Джо, чем лечение, которое получил Джо, на Джо, и оно противоположно.
Рассматривая больше потенциальных результатов таким образом, мы можем заставить SUTVA выполняться. Однако, если какие-либо единицы, кроме Джо, зависят от Мэри, то мы должны рассмотреть дальнейшие потенциальные результаты. Чем больше число зависимых единиц, тем больше потенциальных результатов мы должны рассмотреть и тем сложнее становятся вычисления (рассмотрите эксперимент с 20 разными людьми, каждый из которых, статус лечения которых может влиять на результаты для всех остальных). Чтобы (легко) оценить причинно-следственный эффект одного лечения по сравнению с контролем, SUTVA должна выполняться.
Учитывать:
Средний причинный эффект (также известный как средний эффект лечения или ATE) можно рассчитать , взяв среднее значение всех причинных эффектов.
То, как мы измеряем ответ, влияет на то, какие выводы мы делаем. Предположим, что мы измеряем изменения артериального давления как процентное изменение, а не в абсолютных значениях. Тогда, в зависимости от точных чисел, средний причинный эффект может быть повышением артериального давления. Например, предположим, что артериальное давление Джорджа будет 154 при контроле и 140 при лечении. Абсолютный размер причинного эффекта равен −14, но процентная разница (с точки зрения уровня лечения 140) составляет −10%. Если артериальное давление Сары составляет 200 при лечении и 184 при контроле, то причинный эффект составляет 16 в абсолютном выражении, но 8% с точки зрения значения лечения. Меньшее абсолютное изменение артериального давления (−14 против 16) дает большее процентное изменение (−10% против 8%) для Джорджа. Несмотря на то, что средний причинный эффект для Джорджа и Сары составляет +2 в абсолютном выражении, он составляет −2 в процентном выражении.
Результаты, которые мы видели до этого момента, никогда не будут измерены на практике. По определению невозможно наблюдать эффект более чем одного лечения на субъекте в течение определенного периода времени. Джо не может одновременно принимать и не принимать таблетку. Поэтому данные будут выглядеть примерно так:
Вопросительные знаки — это ответы, которые невозможно наблюдать. Основная проблема причинно-следственной связи [2] заключается в том, что непосредственное наблюдение причинно-следственных связей невозможно. Однако это не делает причинно-следственную связь невозможной. Определенные методы и предположения позволяют преодолеть основную проблему.
Предположим, что у нас есть следующие данные:
Мы можем сделать вывод о том, каким мог бы быть потенциальный результат Джо под контролем, если сделаем предположение о постоянном эффекте:
и
Где T — средний эффект лечения. В данном случае -10.
Если бы мы хотели вывести ненаблюдаемые значения, мы могли бы предположить постоянный эффект. В следующих таблицах показаны данные, соответствующие предположению о постоянном эффекте.
Все субъекты имеют одинаковый причинно-следственный эффект, хотя у них разные результаты лечения.
Механизм назначения, метод, с помощью которого единицам назначается лечение, влияет на расчет среднего причинно-следственного эффекта. Одним из таких механизмов назначения является рандомизация. Для каждого субъекта мы могли бы подбросить монетку, чтобы определить, получает ли он лечение. Если бы мы хотели, чтобы пять субъектов получили лечение, мы могли бы назначить лечение первым пяти именам, которые мы вытащим из шляпы. Когда мы случайным образом назначаем лечение, мы можем получить разные ответы.
Предположим, что эти данные верны:
Истинный средний причинный эффект равен −8. Но причинный эффект для этих людей никогда не равен этому среднему значению. Причинный эффект варьируется, как это обычно (всегда?) происходит в реальной жизни. После назначения лечения случайным образом мы можем оценить причинный эффект как:
Различное случайное распределение методов лечения дает иную оценку среднего причинно-следственного эффекта.
Средний причинный эффект варьируется, поскольку наша выборка мала, а ответы имеют большую дисперсию . Если бы выборка была больше, а дисперсия была меньше, средний причинный эффект был бы ближе к истинному среднему причинному эффекту независимо от конкретных единиц, случайно назначенных для лечения.
В качестве альтернативы предположим, что механизм назначает лечение всем мужчинам и только им.
При таком механизме назначения женщины не могут получить лечение, и, следовательно, невозможно определить средний причинно-следственный эффект на субъектов женского пола. Чтобы сделать какие-либо выводы о причинно-следственном эффекте на субъекта, вероятность того, что субъект получит лечение, должна быть больше 0 и меньше 1.
Рассмотрим использование идеального врача в качестве механизма назначения. Идеальный врач знает, как каждый субъект отреагирует на препарат или контроль, и назначает каждому субъекту лечение, которое принесет ему наибольшую пользу. Идеальный врач знает следующую информацию о выборке пациентов:
На основании этих знаний она даст следующие назначения по лечению:
Идеальный врач искажает оба средних значения, отфильтровывая плохие ответы как на лечение, так и на контроль. Разница между средними значениями, которая является предполагаемым средним причинным эффектом, искажается в направлении, которое зависит от деталей. Например, субъект вроде Лайлы, которому навредил прием препарата, был бы назначен в контрольную группу идеальным врачом, и таким образом отрицательный эффект препарата был бы замаскирован.
Причинно-следственный эффект лечения на единичную единицу в определенный момент времени — это разница между переменной результата с лечением и без лечения. Основная проблема причинно-следственного вывода заключается в том, что невозможно наблюдать причинно-следственный эффект на единичной единице. Вы либо принимаете аспирин сейчас, либо нет. Как следствие, необходимо сделать предположения, чтобы оценить недостающие контрфактуальные данные.
Причинно-следственная модель Рубина также была связана с инструментальными переменными (Angrist, Imbens и Rubin, 1996) [6] и другими методами причинно-следственной связи. Более подробную информацию о связях между причинно-следственной моделью Рубина, моделированием структурных уравнений и другими статистическими методами причинно-следственной связи см. в работах Моргана и Уиншипа (2007), [7] Перла (2000), [8] Питерса и др. (2017), [9] и Ибелинга и Икарда (2023). [10] Перл (2000) утверждает, что все потенциальные результаты могут быть получены из моделей структурных уравнений (SEM), тем самым объединяя эконометрику и современный причинно-следственный анализ.