В статистическом анализе наблюдаемых данных сопоставление показателей склонности ( PSM ) представляет собой статистический метод сопоставления , который пытается оценить эффект лечения, политики или другого вмешательства путем учета ковариатов , которые предсказывают получение лечения. PSM пытается уменьшить смещение из-за смешивающих переменных, которые могут быть обнаружены в оценке эффекта лечения, полученной путем простого сравнения результатов среди единиц , которые получили лечение, и тех, которые не получили .
Пол Р. Розенбаум и Дональд Рубин представили эту методику в 1983 году, определив показатель склонности как условную вероятность того, что единица (например, человек, класс, школа) будет назначена на воздействие, учитывая набор наблюдаемых ковариатов. [1]
Возможность смещения возникает из-за того, что разница в результатах лечения (например, средний эффект лечения ) между группами, получавшими лечение, и группами, не получавшими лечение, может быть вызвана фактором, который предсказывает лечение, а не самим лечением. В рандомизированных экспериментах рандомизация позволяет проводить непредвзятую оценку эффектов лечения; для каждого ковариата рандомизация подразумевает, что группы лечения будут сбалансированы в среднем по закону больших чисел . К сожалению, в наблюдательных исследованиях назначение лечения субъектам исследования обычно не является случайным. Сопоставление пытается уменьшить смещение назначения лечения и имитировать рандомизацию, создавая выборку единиц, которые получили лечение, которая сопоставима по всем наблюдаемым ковариатам с выборкой единиц, которые не получили лечение.
«Склонность» описывает, насколько вероятно, что единица была подвергнута лечению, учитывая ее значения ковариатов. Чем сильнее смешение лечения и ковариатов, и, следовательно, чем сильнее смещение в анализе эффекта наивного лечения, тем лучше ковариаты предсказывают, подвергается ли единица лечению или нет. При наличии единиц с похожими показателями склонности как в лечении, так и в контроле, такое смешение уменьшается.
Например, может быть интересно узнать последствия курения . Необходимо обсервационное исследование, поскольку неэтично случайным образом назначать людям лечение «курение». Эффект лечения, оцененный путем простого сравнения курящих с некурящими, будет смещен любыми факторами, которые предсказывают курение (например, пол и возраст). PSM пытается контролировать эти смещения, делая группы, получающие лечение и не получающие лечение, сопоставимыми по отношению к контрольным переменным.
PSM использует прогнозируемую вероятность членства в группе — например, группа лечения против контрольной группы — на основе наблюдаемых предикторов, обычно получаемых из логистической регрессии для создания контрфактуальной группы . Оценки склонности могут использоваться для сопоставления или как ковариаты , отдельно или с другими сопоставляемыми переменными или ковариатами.
1. Оцените показатели склонности, например, с помощью логистической регрессии :
2. Сопоставьте каждого участника с одним или несколькими неучастниками по показателю склонности, используя один из следующих методов:
3. Проверьте, сбалансированы ли ковариаты между группами лечения и сравнения в пределах страт показателя склонности.
4. Оцените эффекты на основе новой выборки
Базовый случай [1] состоит из двух видов лечения (пронумерованных 1 и 0) с N независимыми и одинаково распределенными случайными переменными субъектов. Каждый субъект i будет реагировать на лечение с помощью и на контроль с помощью . Оцениваемая величина — это средний эффект лечения : . Переменная указывает, получил ли субъект i лечение ( ) или контроль ( ). Пусть будет вектором наблюдаемых измерений до лечения (или ковариатов) для i- го субъекта. Наблюдения производятся до назначения лечения, но признаки в могут не включать все (или какие-либо) из тех, которые использовались для принятия решения о назначении лечения. Предполагается, что нумерация единиц (т. е.: i = 1, ..., N ) не содержит никакой информации, выходящей за рамки содержащейся в . В следующих разделах индекс i будет опущен , при этом будет по-прежнему обсуждаться стохастическое поведение некоторого субъекта.
Пусть некоторый субъект имеет вектор ковариатов X (т.е. условно несмешанный), и некоторые потенциальные результаты r 0 и r 1 под контролем и лечением соответственно. Назначение лечения считается строго игнорируемым, если потенциальные результаты не зависят от лечения ( Z ) условно на фоновых переменных X . Это можно записать компактно как
где обозначает статистическую независимость . [1]
Балансировочная оценка b ( X ) является функцией наблюдаемых ковариатов X, такой что условное распределение X при заданном b ( X ) одинаково для обработанных ( Z = 1) и контрольных ( Z = 0) единиц:
Самая тривиальная функция — .
Оценка склонности — это условная вероятность того, что единица (например, человек, класс, школа) будет назначена определенному лечению, учитывая набор наблюдаемых ковариатов. Оценки склонности используются для уменьшения смешения путем уравнивания групп на основе этих ковариатов.
Предположим, что у нас есть бинарный индикатор лечения Z , переменная отклика r и фоновые наблюдаемые ковариаты X. Показатель склонности определяется как условная вероятность лечения при заданных фоновых переменных:
В контексте причинно-следственной связи и методологии опроса оценки склонности оцениваются (с помощью таких методов, как логистическая регрессия , случайные леса или другие) с использованием некоторого набора ковариатов. Эти оценки склонности затем используются в качестве оценщиков для весов, которые будут использоваться с методами обратного взвешивания вероятности .
Следующие положения были впервые представлены и доказаны Розенбаумом и Рубином в 1983 году: [1]
Если мы думаем о значении Z как о параметре популяции, который влияет на распределение X , то балансировочная оценка служит достаточной статистикой для Z. Кроме того, приведенные выше теоремы указывают на то, что оценка склонности является минимально достаточной статистикой, если рассматривать Z как параметр X. Наконец, если назначение лечения Z строго игнорируется при заданном X , то оценка склонности является минимально достаточной статистикой для совместного распределения .
Judea Pearl показала, что существует простой графический тест, называемый критерием бэкдора, который обнаруживает наличие вмешивающихся переменных. Чтобы оценить эффект лечения, фоновые переменные X должны блокировать все пути бэкдора в графике. Это блокирование может быть выполнено либо путем добавления вмешивающейся переменной в качестве контроля в регрессии, либо путем сопоставления вмешивающейся переменной. [2]
Было показано, что PSM увеличивает «дисбаланс, неэффективность, зависимость и смещение модели», чего не происходит с большинством других методов сопоставления. [3] Идеи, лежащие в основе использования сопоставления, остаются в силе, но их следует применять с другими методами сопоставления; оценки склонности также имеют другие продуктивные применения при взвешивании и двойной надежной оценке.
Как и другие процедуры сопоставления, PSM оценивает средний эффект лечения по данным наблюдений. Главные преимущества PSM на момент его введения заключались в том, что, используя линейную комбинацию ковариатов для одного балла, он уравновешивает группы лечения и контроля по большому количеству ковариатов без потери большого количества наблюдений. Если бы единицы в лечении и контроле были уравновешены по большому количеству ковариатов по одному за раз, потребовалось бы большое количество наблюдений, чтобы преодолеть « проблему размерности », при которой введение нового балансирующего ковариата геометрически увеличивает минимально необходимое количество наблюдений в выборке .
Одним из недостатков PSM является то, что он учитывает только наблюдаемые (и наблюдаемые) ковариаты, а не скрытые характеристики. Факторы, которые влияют на назначение лечения и исход, но которые не могут быть обнаружены, не могут быть учтены в процедуре сопоставления. [4] Поскольку процедура контролирует только наблюдаемые переменные, любые скрытые смещения из-за скрытых переменных могут остаться после сопоставления. [5] Другая проблема заключается в том, что PSM требует больших выборок со значительным перекрытием между группами лечения и контроля.
Общие опасения по поводу сопоставления также были подняты Джудеей Перлом , который утверждал, что скрытое смещение может фактически увеличиться, поскольку сопоставление наблюдаемых переменных может высвободить смещение из-за спящих ненаблюдаемых факторов, которые могут помешать. Аналогично, Перл утверждал, что уменьшение смещения может быть гарантировано только (асимптотически) путем моделирования качественных причинно-следственных связей между лечением, результатом, наблюдаемыми и ненаблюдаемыми ковариатами. [6] Смешивание происходит, когда экспериментатор не может контролировать альтернативные, не причинные объяснения для наблюдаемой связи между независимыми и зависимыми переменными. Такой контроль должен удовлетворять « критерию бэкдора » Перла. [2]
MatchIt
, [7] [8] optmatch
, [9] или других пакетов.OneToManyMTCH
за соответствием, основанные на показателе склонности. [10]psmatch2
. [12] Stata версии 13 и более поздние также предлагают встроенную команду teffects psmatch
. [13]PsmPy
библиотека для сопоставления оценок склонности в Python{{cite web}}
: CS1 maint: местоположение ( ссылка )