stringtranslate.com

Соответствие показателя склонности

В статистическом анализе наблюдаемых данных сопоставление показателей склонности ( PSM ) представляет собой статистический метод сопоставления , который пытается оценить эффект лечения, политики или другого вмешательства путем учета ковариатов , которые предсказывают получение лечения. PSM пытается уменьшить смещение из-за смешивающих переменных, которые могут быть обнаружены в оценке эффекта лечения, полученной путем простого сравнения результатов среди единиц , которые получили лечение, и тех, которые не получили .

Пол Р. Розенбаум и Дональд Рубин представили эту методику в 1983 году, определив показатель склонности как условную вероятность того, что единица (например, человек, класс, школа) будет назначена на воздействие, учитывая набор наблюдаемых ковариатов. [1]

Возможность смещения возникает из-за того, что разница в результатах лечения (например, средний эффект лечения ) между группами, получавшими лечение, и группами, не получавшими лечение, может быть вызвана фактором, который предсказывает лечение, а не самим лечением. В рандомизированных экспериментах рандомизация позволяет проводить непредвзятую оценку эффектов лечения; для каждого ковариата рандомизация подразумевает, что группы лечения будут сбалансированы в среднем по закону больших чисел . К сожалению, в наблюдательных исследованиях назначение лечения субъектам исследования обычно не является случайным. Сопоставление пытается уменьшить смещение назначения лечения и имитировать рандомизацию, создавая выборку единиц, которые получили лечение, которая сопоставима по всем наблюдаемым ковариатам с выборкой единиц, которые не получили лечение.

«Склонность» описывает, насколько вероятно, что единица была подвергнута лечению, учитывая ее значения ковариатов. Чем сильнее смешение лечения и ковариатов, и, следовательно, чем сильнее смещение в анализе эффекта наивного лечения, тем лучше ковариаты предсказывают, подвергается ли единица лечению или нет. При наличии единиц с похожими показателями склонности как в лечении, так и в контроле, такое смешение уменьшается.

Например, может быть интересно узнать последствия курения . Необходимо обсервационное исследование, поскольку неэтично случайным образом назначать людям лечение «курение». Эффект лечения, оцененный путем простого сравнения курящих с некурящими, будет смещен любыми факторами, которые предсказывают курение (например, пол и возраст). PSM пытается контролировать эти смещения, делая группы, получающие лечение и не получающие лечение, сопоставимыми по отношению к контрольным переменным.

PSM использует прогнозируемую вероятность членства в группе — например, группа лечения против контрольной группы — на основе наблюдаемых предикторов, обычно получаемых из логистической регрессии для создания контрфактуальной группы . Оценки склонности могут использоваться для сопоставления или как ковариаты , отдельно или с другими сопоставляемыми переменными или ковариатами.

Общая процедура

1. Оцените показатели склонности, например, с помощью логистической регрессии :

2. Сопоставьте каждого участника с одним или несколькими неучастниками по показателю склонности, используя один из следующих методов:

3. Проверьте, сбалансированы ли ковариаты между группами лечения и сравнения в пределах страт показателя склонности.

4. Оцените эффекты на основе новой выборки

Формальные определения

Базовые настройки

Базовый случай [1] состоит из двух видов лечения (пронумерованных 1 и 0) с N независимыми и одинаково распределенными случайными переменными субъектов. Каждый субъект i будет реагировать на лечение с помощью и на контроль с помощью . Оцениваемая величина — это средний эффект лечения : . Переменная указывает, получил ли субъект i лечение ( ) или контроль ( ). Пусть будет вектором наблюдаемых измерений до лечения (или ковариатов) для i- го субъекта. Наблюдения производятся до назначения лечения, но признаки в могут не включать все (или какие-либо) из тех, которые использовались для принятия решения о назначении лечения. Предполагается, что нумерация единиц (т. е.: i  = 1, ...,  N ) не содержит никакой информации, выходящей за рамки содержащейся в . В следующих разделах индекс i будет опущен , при этом будет по-прежнему обсуждаться стохастическое поведение некоторого субъекта.

Категорически игнорируемое назначение лечения

Пусть некоторый субъект имеет вектор ковариатов X (т.е. условно несмешанный), и некоторые потенциальные результаты r 0 и r 1 под контролем и лечением соответственно. Назначение лечения считается строго игнорируемым, если потенциальные результаты не зависят от лечения ( Z ) условно на фоновых переменных X . Это можно записать компактно как

где обозначает статистическую независимость . [1]

Балансировка баллов

Балансировочная оценка b ( X ) является функцией наблюдаемых ковариатов X, такой что условное распределение X при заданном b ( X ) одинаково для обработанных ( Z  = 1) и контрольных ( Z  = 0) единиц:

Самая тривиальная функция — .

Оценка склонности

Оценка склонности — это условная вероятность того, что единица (например, человек, класс, школа) будет назначена определенному лечению, учитывая набор наблюдаемых ковариатов. Оценки склонности используются для уменьшения смешения путем уравнивания групп на основе этих ковариатов.

Предположим, что у нас есть бинарный индикатор лечения Z , переменная отклика r и фоновые наблюдаемые ковариаты X. Показатель склонности определяется как условная вероятность лечения при заданных фоновых переменных:

В контексте причинно-следственной связи и методологии опроса оценки склонности оцениваются (с помощью таких методов, как логистическая регрессия , случайные леса или другие) с использованием некоторого набора ковариатов. Эти оценки склонности затем используются в качестве оценщиков для весов, которые будут использоваться с методами обратного взвешивания вероятности .

Основные теоремы

Следующие положения были впервые представлены и доказаны Розенбаумом и Рубином в 1983 году: [1]

  • Это также строго игнорируется при любой балансирующей функции. В частности, при оценке склонности:
  • Для любого значения балансировочного балла разница между средними значениями обработки и контроля имеющихся образцов (т.е. ), основанная на субъектах, имеющих одинаковое значение балансировочного балла, может служить беспристрастной оценкой среднего эффекта обработки : .

Отношение к достаточности

Если мы думаем о значении Z как о параметре популяции, который влияет на распределение X , то балансировочная оценка служит достаточной статистикой для Z. Кроме того, приведенные выше теоремы указывают на то, что оценка склонности является минимально достаточной статистикой, если рассматривать Z как параметр X. Наконец, если назначение лечения Z строго игнорируется при заданном X , то оценка склонности является минимально достаточной статистикой для совместного распределения .

Графический тест для обнаружения наличия мешающих переменных

Judea Pearl показала, что существует простой графический тест, называемый критерием бэкдора, который обнаруживает наличие вмешивающихся переменных. Чтобы оценить эффект лечения, фоновые переменные X должны блокировать все пути бэкдора в графике. Это блокирование может быть выполнено либо путем добавления вмешивающейся переменной в качестве контроля в регрессии, либо путем сопоставления вмешивающейся переменной. [2]

Недостатки

Было показано, что PSM увеличивает «дисбаланс, неэффективность, зависимость и смещение модели», чего не происходит с большинством других методов сопоставления. [3] Идеи, лежащие в основе использования сопоставления, остаются в силе, но их следует применять с другими методами сопоставления; оценки склонности также имеют другие продуктивные применения при взвешивании и двойной надежной оценке.

Как и другие процедуры сопоставления, PSM оценивает средний эффект лечения по данным наблюдений. Главные преимущества PSM на момент его введения заключались в том, что, используя линейную комбинацию ковариатов для одного балла, он уравновешивает группы лечения и контроля по большому количеству ковариатов без потери большого количества наблюдений. Если бы единицы в лечении и контроле были уравновешены по большому количеству ковариатов по одному за раз, потребовалось бы большое количество наблюдений, чтобы преодолеть « проблему размерности », при которой введение нового балансирующего ковариата геометрически увеличивает минимально необходимое количество наблюдений в выборке .

Одним из недостатков PSM является то, что он учитывает только наблюдаемые (и наблюдаемые) ковариаты, а не скрытые характеристики. Факторы, которые влияют на назначение лечения и исход, но которые не могут быть обнаружены, не могут быть учтены в процедуре сопоставления. [4] Поскольку процедура контролирует только наблюдаемые переменные, любые скрытые смещения из-за скрытых переменных могут остаться после сопоставления. [5] Другая проблема заключается в том, что PSM требует больших выборок со значительным перекрытием между группами лечения и контроля.

Общие опасения по поводу сопоставления также были подняты Джудеей Перлом , который утверждал, что скрытое смещение может фактически увеличиться, поскольку сопоставление наблюдаемых переменных может высвободить смещение из-за спящих ненаблюдаемых факторов, которые могут помешать. Аналогично, Перл утверждал, что уменьшение смещения может быть гарантировано только (асимптотически) путем моделирования качественных причинно-следственных связей между лечением, результатом, наблюдаемыми и ненаблюдаемыми ковариатами. [6] Смешивание происходит, когда экспериментатор не может контролировать альтернативные, не причинные объяснения для наблюдаемой связи между независимыми и зависимыми переменными. Такой контроль должен удовлетворять « критерию бэкдора » Перла. [2]

Реализации в статистических пакетах

Смотрите также

Ссылки

  1. ^ abcd Розенбаум, Пол Р.; Рубин, Дональд Б. (1983). «Центральная роль показателя склонности в наблюдательных исследованиях причинных эффектов». Biometrika . 70 (1): 41–55. doi : 10.1093/biomet/70.1.41 .
  2. ^ ab Pearl, J. (2000). Причинность: модели, рассуждения и выводы . Нью-Йорк: Cambridge University Press. ISBN 978-0-521-77362-1.
  3. ^ Кинг, Гэри; Нильсен, Ричард (2019-05-07). «Почему оценки склонности не следует использовать для сопоставления». Политический анализ . 27 (4): 435–454. doi : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN  1047-1987.| ссылка на полную статью (с домашней страницы автора)
  4. ^ Гарридо ММ и др. (2014). «Методы построения и оценки показателей склонности». Health Services Research . 49 (5): 1701–20. doi :10.1111 / 1475-6773.12182. PMC 4213057. PMID  24779867. 
  5. ^ Шадиш, У. Р.; Кук, Т. Д.; Кэмпбелл, Д. Т. (2002). Экспериментальные и квазиэкспериментальные проекты для обобщенного причинного вывода . Бостон: Houghton Mifflin. ISBN 978-0-395-61556-0.
  6. ^ Pearl, J. (2009). "Понимание оценок склонности". Причинность: модели, рассуждения и выводы (второе изд.). Нью-Йорк: Cambridge University Press. ISBN 978-0-521-89560-6.
  7. ^ Хо, Дэниел; Имаи, Косуке; Кинг, Гэри ; Стюарт, Элизабет (2007). «Соответствие как непараметрическая предварительная обработка для снижения зависимости модели в параметрическом причинном выводе». Политический анализ . 15 (3): 199–236. doi : 10.1093/pan/mpl013 .
  8. ^ "MatchIt: Непараметрическая предварительная обработка для параметрического причинного вывода". Проект R. 16 ноября 2022 г.
  9. ^ Хансен, Бен Б.; Клопфер, Стефани Олсен (2006). «Оптимальное полное соответствие и связанные с ним конструкции с помощью сетевых потоков». Журнал вычислительной и графической статистики . 15 (3). Informa UK Limited: 609–627. doi : 10.1198/106186006x137047. ISSN  1061-8600. S2CID  10138048.
  10. ^ Парсонс, Лори. «Выполнение сопоставления случай-контроль 1:N по показателю склонности» (PDF) . SUGI 29: Институт SAS . Получено 10 июня 2016 г.{{cite web}}: CS1 maint: местоположение ( ссылка )
  11. ^ Реализация оценок соответствия склонности с помощью STATA. Конспект лекций 2001 г.
  12. ^ Лёвен, Э.; Сианези, Б. (2003). "PSMATCH2: модуль Stata для выполнения полного сопоставления Махаланобиса и оценок склонности, построения графиков общей поддержки и тестирования дисбаланса ковариатов". Статистические программные компоненты .
  13. ^ "teffects psmatch — Сопоставление показателей склонности" (PDF) . Stata Manual .

Библиография