Средний эффект лечения ( ATE ) — это показатель, используемый для сравнения методов лечения (или вмешательств) в рандомизированных экспериментах, оценке политических мер и медицинских исследованиях. ATE измеряет разницу в средних (средних) результатах между единицами, отнесенными к лечению, и единицами, отнесенными к контролю. В рандомизированном исследовании (т.е. экспериментальном исследовании) средний эффект лечения можно оценить на основе выборки, используя сравнение средних результатов для леченых и нелеченных единиц. Однако под ATE обычно понимают причинный параметр (т. е. оценку или свойство популяции ) , который желает знать исследователь, определяемый безотносительно к плану исследования или процедуре оценки. Как наблюдательные исследования, так и экспериментальные исследования со случайным распределением могут позволить оценить ATE различными способами.
Средний эффект лечения при некоторых условиях напрямую связан с графиком частичной зависимости [1]
Возникнув на основе раннего статистического анализа в области сельского хозяйства и медицины, термин «лечение» теперь применяется в более широком смысле к другим областям естественных и социальных наук, особенно к психологии , политологии и экономике, таким как, например, оценка воздействия государственной политики. Характер лечения или исход относительно неважен при оценке ATE, то есть расчет ATE требует, чтобы лечение применялось к одним единицам, а не к другим, но характер этого лечения (например, фармацевтическое лечение) , поощрительная выплата, политическая реклама) не имеет отношения к определению и оценке ATE.
Выражение «эффект лечения» относится к причинному эффекту данного лечения или вмешательства (например, введения лекарственного средства) на интересующую переменную результата (например, здоровье пациента). В «структуре потенциальных результатов» Неймана-Рубина эффект лечения определяется для каждой отдельной единицы в терминах двух «потенциальных результатов». У каждой единицы есть один результат, который проявился бы, если бы единица подверглась лечению, и другой результат, который проявился бы, если бы единица подверглась контролю. «Эффект лечения» — это разница между этими двумя потенциальными результатами. Однако этот эффект лечения на индивидуальном уровне ненаблюдаем, поскольку отдельные единицы могут получать только лечение или контроль, но не то и другое. Случайное назначение на лечение гарантирует, что единицы, назначенные на обработку, и единицы, назначенные на контроль, идентичны (в течение большого количества итераций эксперимента). Действительно , единицы в обеих группах имеют одинаковое распределение ковариат и потенциальных результатов. Таким образом, средний результат среди лечебных отделений противопоставляется среднему результату среди контрольных отделений. Разница между этими двумя средними значениями представляет собой ATE, который представляет собой оценку центральной тенденции распределения ненаблюдаемых эффектов лечения на индивидуальном уровне. [2] Если выборка формируется случайным образом из совокупности, выборка ATE (сокращенно SATE) также является оценкой генеральной совокупности ATE (сокращенно PATE). [3]
Хотя эксперимент гарантирует, что потенциальные результаты (и все ковариаты) будут одинаково распределены в экспериментальной и контрольной группах, в обсервационном исследовании дело обстоит иначе . В обсервационном исследовании единицы не назначаются для лечения и контроля случайным образом, поэтому их назначение на лечение может зависеть от ненаблюдаемых или ненаблюдаемых факторов. Наблюдаемые факторы можно статистически контролировать (например, посредством регрессии или сопоставления ), но любая оценка ATE может быть испорчена ненаблюдаемыми факторами, влияющими на то, какие подразделения получали лечение по сравнению с контрольной группой.
Чтобы формально определить ATE, мы определяем два потенциальных результата: значение переменной результата для человека , если его не лечить, и значение переменной результата для человека, если его лечат. Например, это состояние здоровья человека, если ему не вводят исследуемый препарат, и состояние здоровья, если ему вводят препарат.
Эффект лечения для человека определяется выражением . В общем случае нет оснований ожидать, что этот эффект будет постоянным для разных людей. Средний эффект лечения определяется выражением
и может быть оценено (если выполняется закон больших чисел )
где суммирование происходит по всем особям в популяции.
Если бы мы могли наблюдать за каждым человеком и среди большой репрезентативной выборки населения, мы могли бы оценить ATE, просто взяв среднее значение по всей выборке. Однако мы не можем наблюдать и то, и другое для каждого индивидуума, поскольку индивида нельзя одновременно лечить и не лечить. Например, в примере с наркотиками мы можем наблюдать только за людьми, которые получали препарат, и за теми, кто его не получал. Это основная проблема, с которой сталкиваются ученые при оценке эффектов лечения, и она привела к появлению большого количества методов оценки.
В зависимости от данных и лежащих в их основе обстоятельств для оценки ATE можно использовать множество методов. Наиболее распространенными из них являются:
Рассмотрим пример, когда все подразделения являются безработными, и некоторые подвергаются политическому вмешательству (группа лечения), а другие нет (контрольная группа). Причинно-следственным эффектом интереса является влияние политики мониторинга поиска работы (лечения) на продолжительность периода безработицы: в среднем, насколько короче была бы безработица, если бы они подверглись вмешательству? В данном случае ATE представляет собой разницу ожидаемых значений (средних значений) продолжительности безработицы в экспериментальной и контрольной группах.
Положительное значение ATE в этом примере предполагает, что политика занятости увеличила продолжительность безработицы. Отрицательное значение ATE предполагает, что политика занятости сократила продолжительность безработицы. Оценка ATE, равная нулю, предполагает, что предоставление лечения не имеет преимуществ или недостатков с точки зрения продолжительности безработицы. Определение того, отличима ли оценка ATE от нуля (положительная или отрицательная), требует статистического вывода .
Поскольку ATE представляет собой оценку среднего эффекта лечения, положительная или отрицательная ATE не указывает на то, что лечение принесет пользу или вред конкретному человеку. Таким образом, средний эффект лечения не учитывает распределение эффекта лечения. Некоторые части населения могут пострадать от лечения, даже если средний эффект положительный.
Некоторые исследователи называют эффект лечения «гетерогенным», если он по-разному (гетерогенно) влияет на разных людей. Например, возможно, описанное выше отношение к политике мониторинга поиска работы по-разному повлияло на мужчин и женщин или на людей, живущих в разных штатах. ATE требует сильного предположения, известного как предположение о стабильной единичной стоимости лечения (SUTVA), которое требует, чтобы на ценность потенциального результата не влиял механизм, используемый для назначения лечения и воздействия лечения на всех остальных лиц. Пусть будет лечение, эффект лечения для человека определяется выражением . Предположение SUTVA позволяет нам объявить .
Один из способов поиска гетерогенных эффектов лечения — разделить данные исследования на подгруппы (например, мужчин и женщин или по штатам) и посмотреть, различаются ли средние эффекты лечения по подгруппам. Если средние эффекты лечения различны, SUTVA нарушается. ATE для каждой подгруппы называется «условным средним эффектом лечения» (CATE), т.е. ATE, обусловленным членством в подгруппе. CATE можно использовать в качестве оценки, если SUTVA не соблюдается.
Проблема с этим подходом заключается в том, что каждая подгруппа может иметь значительно меньше данных, чем исследование в целом, поэтому, если исследование было направлено на выявление основных эффектов без анализа подгрупп, данных может не хватить для правильной оценки воздействия на подгруппы. .
Существует некоторая работа по обнаружению неоднородных эффектов лечения с использованием случайных лесов [4] [5], а также по обнаружению гетерогенных субпопуляций с использованием кластерного анализа . [6] [7] Недавно были разработаны подходы к метаобучению, которые используют произвольные структуры регрессии в качестве базовых обучающихся для вывода CATE. [8] [9] Обучение представлению можно использовать для дальнейшего улучшения производительности этих методов. [10] [11]