stringtranslate.com

Средний эффект лечения

Средний эффект лечения ( ATE ) — это показатель, используемый для сравнения методов лечения (или вмешательств) в рандомизированных экспериментах, оценке политических мер и медицинских исследованиях. ATE измеряет разницу в средних (средних) результатах между единицами, отнесенными к лечению, и единицами, отнесенными к контролю. В рандомизированном исследовании (т.е. экспериментальном исследовании) средний эффект лечения можно оценить на основе выборки, используя сравнение средних результатов для леченых и нелеченных единиц. Однако под ATE обычно понимают причинный параметр (т. е. оценку или свойство популяции ) , который желает знать исследователь, определяемый безотносительно к плану исследования или процедуре оценки. Как наблюдательные исследования, так и экспериментальные исследования со случайным распределением могут позволить оценить ATE различными способами.

Средний эффект лечения при некоторых условиях напрямую связан с графиком частичной зависимости [1]

Общее определение

Возникнув на основе раннего статистического анализа в области сельского хозяйства и медицины, термин «лечение» теперь применяется в более широком смысле к другим областям естественных и социальных наук, особенно к психологии , политологии и экономике, таким как, например, оценка воздействия государственной политики. Характер лечения или исход относительно неважен при оценке ATE, то есть расчет ATE требует, чтобы лечение применялось к одним единицам, а не к другим, но характер этого лечения (например, фармацевтическое лечение) , поощрительная выплата, политическая реклама) не имеет отношения к определению и оценке ATE.

Выражение «эффект лечения» относится к причинному эффекту данного лечения или вмешательства (например, введения лекарственного средства) на интересующую переменную результата (например, здоровье пациента). В «структуре потенциальных результатов» Неймана-Рубина эффект лечения определяется для каждой отдельной единицы в терминах двух «потенциальных результатов». У каждой единицы есть один результат, который проявился бы, если бы единица подверглась лечению, и другой результат, который проявился бы, если бы единица подверглась контролю. «Эффект лечения» — это разница между этими двумя потенциальными результатами. Однако этот эффект лечения на индивидуальном уровне ненаблюдаем, поскольку отдельные единицы могут получать только лечение или контроль, но не то и другое. Случайное назначение на лечение гарантирует, что единицы, назначенные на обработку, и единицы, назначенные на контроль, идентичны (в течение большого количества итераций эксперимента). Действительно , единицы в обеих группах имеют одинаковое распределение ковариат и потенциальных результатов. Таким образом, средний результат среди лечебных отделений противопоставляется среднему результату среди контрольных отделений. Разница между этими двумя средними значениями представляет собой ATE, который представляет собой оценку центральной тенденции распределения ненаблюдаемых эффектов лечения на индивидуальном уровне. [2] Если выборка формируется случайным образом из совокупности, выборка ATE (сокращенно SATE) также является оценкой генеральной совокупности ATE (сокращенно PATE). [3]

Хотя эксперимент гарантирует, что потенциальные результаты (и все ковариаты) будут одинаково распределены в экспериментальной и контрольной группах, в обсервационном исследовании дело обстоит иначе . В обсервационном исследовании единицы не назначаются для лечения и контроля случайным образом, поэтому их назначение на лечение может зависеть от ненаблюдаемых или ненаблюдаемых факторов. Наблюдаемые факторы можно статистически контролировать (например, посредством регрессии или сопоставления ), но любая оценка ATE может быть испорчена ненаблюдаемыми факторами, влияющими на то, какие подразделения получали лечение по сравнению с контрольной группой.

Формальное определение

Чтобы формально определить ATE, мы определяем два потенциальных результата: значение переменной результата для человека , если его не лечить, и значение переменной результата для человека, если его лечат. Например, это состояние здоровья человека, если ему не вводят исследуемый препарат, и состояние здоровья, если ему вводят препарат.

Эффект лечения для человека определяется выражением . В общем случае нет оснований ожидать, что этот эффект будет постоянным для разных людей. Средний эффект лечения определяется выражением

и может быть оценено (если выполняется закон больших чисел )

где суммирование происходит по всем особям в популяции.

Если бы мы могли наблюдать за каждым человеком и среди большой репрезентативной выборки населения, мы могли бы оценить ATE, просто взяв среднее значение по всей выборке. Однако мы не можем наблюдать и то, и другое для каждого индивидуума, поскольку индивида нельзя одновременно лечить и не лечить. Например, в примере с наркотиками мы можем наблюдать только за людьми, которые получали препарат, и за теми, кто его не получал. Это основная проблема, с которой сталкиваются ученые при оценке эффектов лечения, и она привела к появлению большого количества методов оценки.

Оценка

В зависимости от данных и лежащих в их основе обстоятельств для оценки ATE можно использовать множество методов. Наиболее распространенными из них являются:

Пример

Рассмотрим пример, когда все подразделения являются безработными, и некоторые подвергаются политическому вмешательству (группа лечения), а другие нет (контрольная группа). Причинно-следственным эффектом интереса является влияние политики мониторинга поиска работы (лечения) на продолжительность периода безработицы: в среднем, насколько короче была бы безработица, если бы они подверглись вмешательству? В данном случае ATE представляет собой разницу ожидаемых значений (средних значений) продолжительности безработицы в экспериментальной и контрольной группах.

Положительное значение ATE в этом примере предполагает, что политика занятости увеличила продолжительность безработицы. Отрицательное значение ATE предполагает, что политика занятости сократила продолжительность безработицы. Оценка ATE, равная нулю, предполагает, что предоставление лечения не имеет преимуществ или недостатков с точки зрения продолжительности безработицы. Определение того, отличима ли оценка ATE от нуля (положительная или отрицательная), требует статистического вывода .

Поскольку ATE представляет собой оценку среднего эффекта лечения, положительная или отрицательная ATE не указывает на то, что лечение принесет пользу или вред конкретному человеку. Таким образом, средний эффект лечения не учитывает распределение эффекта лечения. Некоторые части населения могут пострадать от лечения, даже если средний эффект положительный.

Гетерогенные эффекты лечения

Некоторые исследователи называют эффект лечения «гетерогенным», если он по-разному (гетерогенно) влияет на разных людей. Например, возможно, описанное выше отношение к политике мониторинга поиска работы по-разному повлияло на мужчин и женщин или на людей, живущих в разных штатах. ATE требует сильного предположения, известного как предположение о стабильной единичной стоимости лечения (SUTVA), которое требует, чтобы на ценность потенциального результата не влиял механизм, используемый для назначения лечения и воздействия лечения на всех остальных лиц. Пусть будет лечение, эффект лечения для человека определяется выражением . Предположение SUTVA позволяет нам объявить .

Один из способов поиска гетерогенных эффектов лечения — разделить данные исследования на подгруппы (например, мужчин и женщин или по штатам) и посмотреть, различаются ли средние эффекты лечения по подгруппам. Если средние эффекты лечения различны, SUTVA нарушается. ATE для каждой подгруппы называется «условным средним эффектом лечения» (CATE), т.е. ATE, обусловленным членством в подгруппе. CATE можно использовать в качестве оценки, если SUTVA не соблюдается.

Проблема с этим подходом заключается в том, что каждая подгруппа может иметь значительно меньше данных, чем исследование в целом, поэтому, если исследование было направлено на выявление основных эффектов без анализа подгрупп, данных может не хватить для правильной оценки воздействия на подгруппы. .

Существует некоторая работа по обнаружению неоднородных эффектов лечения с использованием случайных лесов [4] [5], а также по обнаружению гетерогенных субпопуляций с использованием кластерного анализа . [6] [7] Недавно были разработаны подходы к метаобучению, которые используют произвольные структуры регрессии в качестве базовых обучающихся для вывода CATE. [8] [9] Обучение представлению можно использовать для дальнейшего улучшения производительности этих методов. [10] [11]

Рекомендации

  1. ^ Чжао, К., и Хасти, Т. (2019). Причинные интерпретации моделей черного ящика. Журнал деловой и экономической статистики, 39 (1), 272–281. https://doi.org/10.1080/07350015.2019.1624293 онлайн ncbi/
  2. ^ Голландия, Пол В. (1986). «Статистика и причинно-следственный вывод». Дж. Амер. Статист. доц. 81 (396): 945–960. дои : 10.1080/01621459.1986.10478354. JSTOR  2289064.
  3. ^ Имаи, Косуке; Кинг, Гэри; Стюарт, Элизабет А. (2008). «Недоразумения между экспериментаторами и наблюдателями по поводу причинного вывода». JR Стат. Соц. Сер. А.171 (2): 481–502. дои : 10.1111/j.1467-985X.2007.00527.x. S2CID  17852724.
  4. ^ Вейгер, Стефан; Эти, Сьюзен (2015). «Оценка и вывод эффектов гетерогенного лечения с использованием случайных лесов». arXiv : 1510.04342 [stat.ME].
  5. ^ «Явная оптимизация причинных эффектов с помощью причинного случайного леса: практическое введение и руководство». 14 октября 2018 г.
  6. ^ Маркхэм, Алекс; Дас, Ричик; Гросс-Вентруп, Мориц (2022). «Ядро на основе дистанционной ковариации для нелинейной причинной кластеризации в гетерогенных популяциях». Учеб. Прозрачный . ПМЛР 177: 542–558.
  7. ^ Хуан, Бивэй; Чжан, Кун; Се, Пэнтао; Гонг, Минмин; Син, Эрик П.; Глимур, Кларк (2019). «Моделирование конкретных и общих причинно-следственных связей и кластеризация на основе механизмов». Достижения в области нейронных систем обработки информации (NeurIPS) . 32 .
  8. ^ Не, Синькунь; Вагер, Стефан (2021). «Квази-оракул оценки эффектов гетерогенного лечения». Биометрика . 108 (2): 299–319. arXiv : 1712.04912 . doi : 10.1093/biomet/asaa076.
  9. ^ Кюнцель, Сёрен; Сехон, Джасджит; Бикель, Питер; Ю, Бин (2019). «Метал-обучающие для оценки эффектов гетерогенного лечения с использованием машинного обучения». Труды Национальной академии наук . 116 (10): 4156–4165. дои : 10.1073/pnas.1804597116 . ПМК 6410831 . ПМИД  30770453. 
  10. ^ Йоханссон, Фредрик; Шалит, Ури; Зонтаг, Дэвид (2016). «Изучение представлений для контрфактического вывода». Учеб. ИКМЛ . ПМЛР 48: 3020–3029.
  11. ^ Беркхарт, Майкл С.; Руис, Габриэль (2022). «Нейроэволюционные представления признаков для причинного вывода». Вычислительная наука – ICCS 2022 . Конспекты лекций по информатике. Том. 13351. стр. 3–10. arXiv : 2205.10541 . дои : 10.1007/978-3-031-08754-7_1. ISBN 978-3-031-08753-0. S2CID  248987304.

дальнейшее чтение