stringtranslate.com

Сопоставление (статистика)

Сопоставление — это статистический метод, который оценивает эффект лечения путем сравнения обработанных и необработанных единиц в наблюдательном исследовании или квазиэксперименте (т. е. когда лечение не назначается случайным образом). Целью сопоставления является снижение смещения для предполагаемого эффекта лечения в исследовании наблюдательных данных путем нахождения для каждой обработанной единицы одной (или нескольких) необработанной единицы со схожими наблюдаемыми характеристиками, по которым ковариаты уравновешиваются (аналогично алгоритму K-ближайших соседей ). Сопоставляя обработанные единицы с похожими необработанными единицами, сопоставление позволяет сравнивать результаты между обработанными и необработанными единицами для оценки эффекта лечения, уменьшая смещение из-за смешения . [1] [2] [3] Сопоставление баллов склонности , ранний метод сопоставления, был разработан как часть причинной модели Рубина , [4], но было показано, что он увеличивает зависимость модели, смещение, неэффективность и мощность и больше не рекомендуется по сравнению с другими методами сопоставления. [5] Простой, понятный и статистически мощный метод сопоставления, известный как укрупненное точное сопоставление или CEM. [6]

Метод сопоставления был популярен Дональдом Рубином . [4] Он подвергся резкой критике в экономике Робертом Лалондом (1986), [7] который сравнил оценки эффектов воздействия из эксперимента с сопоставимыми оценками, полученными с помощью методов сопоставления, и показал, что методы сопоставления являются предвзятыми . Раджив Дехеджия и Садек Вахба (1999) переоценили критику Лалонда и показали, что сопоставление является хорошим решением. [8] Подобная критика была высказана в журналах по политологии [9] и социологии [10] .

Анализ

Когда интересующий нас результат является бинарным, наиболее общим инструментом для анализа сопоставленных данных является условная логистическая регрессия , поскольку она обрабатывает слои произвольного размера и непрерывные или бинарные обработки (предикторы) и может контролировать ковариаты. В особых случаях доступны более простые тесты, такие как парный разностный тест , тест Макнемара и тест Кохрана–Мантеля–Хензеля .

Если интересующий нас результат является непрерывным, выполняется оценка среднего эффекта лечения .

Сопоставление также можно использовать для «предварительной обработки» образца перед анализом с помощью другого метода, например, регрессионного анализа . [11]

Превосходство

Избыточное соответствие или смещение после лечения — это сопоставление для кажущегося медиатора, который на самом деле является результатом воздействия. [12] Если сам медиатор стратифицирован, то весьма вероятно, что будет вызвана неясная связь воздействия с болезнью. [13] Избыточное соответствие, таким образом, вызывает статистическое смещение . [13]

Например, сопоставление контрольной группы по продолжительности беременности и/или количеству многоплодных родов при оценке перинатальной смертности и веса при рождении после экстракорпорального оплодотворения (ЭКО) является избыточным, поскольку само ЭКО увеличивает риск преждевременных родов и многоплодных родов. [14]

Это можно рассматривать как смещение выборки, приводящее к снижению внешней валидности исследования, поскольку контрольные группы становятся более похожими на случаи с точки зрения воздействия, чем общая популяция.

Смотрите также

Ссылки

  1. ^ Рубин, Дональд Б. (1973). «Соответствие для устранения смещения в наблюдательных исследованиях». Биометрия . 29 (1): 159–183. doi :10.2307/2529684. JSTOR  2529684.
  2. ^ Андерсон, Даллас В.; Киш, Лесли; Корнелл, Ричард Г. (1980). «О стратификации, группировке и сопоставлении». Scandinavian Journal of Statistics . 7 (2): 61–66. JSTOR  4615774.
  3. ^ Куппер, Лоуренс Л.; Карон, Джон М.; Кляйнбаум, Дэвид Г.; Моргенштерн, Хэл; Льюис, Дональд К. (1981). «Соответствие в эпидемиологических исследованиях: вопросы валидности и эффективности». Биометрия . 37 (2): 271–291. CiteSeerX 10.1.1.154.1197 . doi :10.2307/2530417. JSTOR  2530417. PMID  7272415. 
  4. ^ ab Розенбаум, Пол Р.; Рубин, Дональд Б. (1983). «Центральная роль показателя склонности в наблюдательных исследованиях причинных эффектов». Biometrika . 70 (1): 41–55. doi : 10.1093/biomet/70.1.41 .
  5. ^ Кинг, Гэри; Нильсен, Ричард (октябрь 2019 г.). «Почему оценки склонности не следует использовать для сопоставления». Политический анализ . 27 (4): 435–454. doi : 10.1017/pan.2019.11 . hdl : 1721.1/128459 . ISSN  1047-1987.
  6. ^ Iacus, Stefano M.; King, Gary; Porro, Giuseppe (2011). «Многомерные методы сопоставления, ограничивающие монотонный дисбаланс». Журнал Американской статистической ассоциации . 106 (493): 345–361. doi : 10.1198/jasa.2011.tm09599. hdl : 2434/151476 . ISSN  0162-1459. S2CID  14790456.
  7. ^ Лалонд, Роберт Дж. (1986). «Оценка эконометрических оценок программ обучения с использованием экспериментальных данных». American Economic Review . 76 (4): 604–620. JSTOR  1806062.
  8. ^ Дехеджия, Р. Х.; Вахба, С. (1999). «Причинные эффекты в неэкспериментальных исследованиях: переоценка оценки программ обучения» (PDF) . Журнал Американской статистической ассоциации . 94 (448): 1053–1062. doi :10.1080/01621459.1999.10473858.
  9. ^ Арсено, Кевин; Гербер, Алан С.; Грин, Дональд П. (2006). «Сравнение экспериментальных и соответствующих методов с использованием крупномасштабного полевого эксперимента по мобилизации избирателей». Политический анализ . 14 (1): 37–62. doi :10.1093/pan/mpj001.
  10. ^ Арсено, Кевин; Гербер, Алан С.; Грин, Дональд П. (2010). «Предостережение об использовании сопоставления для оценки причинно-следственных связей: эмпирический пример сравнения оценок сопоставления с экспериментальным эталоном». Социологические методы и исследования . 39 (2): 256–282. doi :10.1177/0049124110378098. S2CID  37012563.
  11. ^ Хо, Дэниел Э.; Имаи, Косуке; Кинг, Гэри; Стюарт, Элизабет А. (2007). «Соответствие как непараметрическая предварительная обработка для снижения зависимости модели в параметрическом причинном выводе». Политический анализ . 15 (3): 199–236. doi : 10.1093/pan/mpl013 .
  12. ^ Кинг, Гэри; Цзэн, Лангче (2007). «Обнаружение зависимости модели в статистическом выводе: ответ». International Studies Quarterly . 51 (1): 231–241. doi :10.1111/j.1468-2478.2007.00449.x. ISSN  0020-8833. JSTOR  4621711. S2CID  12669035.
  13. ^ ab Marsh, JL; Hutton, JL ; Binks, K. (2002). «Устранение эффектов реакции на дозу радиации: пример избыточного соответствия». British Medical Journal . 325 (7359): 327–330. doi :10.1136/bmj.325.7359.327. PMC 1123834. PMID  12169512 . 
  14. ^ Gissler, M.; Hemminki, E. (1996). «Опасность избыточного сопоставления в исследованиях перинатальной смертности и веса при рождении детей, рожденных после вспомогательного зачатия». Eur J Obstet Gynecol Reprod Biol . 69 (2): 73–75. doi :10.1016/0301-2115(95)02517-0. PMID  8902436.

Дальнейшее чтение