stringtranslate.com

Сбивающий с толку

В то время как посредник — это фактор в причинно-следственной цепочке (вверху), искажающий фактор — это ложный фактор, неправильно подразумевающий причинно-следственную связь (внизу).

В причинном выводе искажающая переменная (также искажающая переменная , искажающий фактор , посторонняя детерминанта или скрытая переменная ) — это переменная, которая влияет как на зависимую переменную, так и на независимую переменную , вызывая ложную ассоциацию . Смешение — это причинная концепция, и поэтому ее нельзя описать в терминах корреляций или ассоциаций. [1] [2] [3] Существование искажающих факторов является важным количественным объяснением того, почему корреляция не подразумевает причинно-следственную связь . Некоторые обозначения специально предназначены для определения существования, возможного существования или отсутствия факторов, искажающих причинно-следственные связи между элементами системы.

Смущение – это угроза внутренней валидности . [4]

Определение

Смешение определяется с точки зрения модели генерации данных. Пусть X — некоторая независимая переменная , а Y — некоторая зависимая переменная . Чтобы оценить влияние X на Y , статистик должен исключить влияние посторонних переменных , которые влияют как на X , так и на Y. Мы говорим, что X и Y смешиваются с какой-то другой переменной Z , если Z причинно влияет как на X , так и на Y.

Пусть – вероятность события Y = y при гипотетическом вмешательстве X = x . X и Y не смешиваются тогда и только тогда, когда выполняется следующее:

для всех значений X = x и Y = y , где — условная вероятность увидеть X = x . Интуитивно это равенство означает, что X и Y не смешиваются, если связь между ними, наблюдаемая наблюдениями, такая же, как связь, которая была бы измерена в контролируемом эксперименте с рандомизированным x .

В принципе, определяющее равенство можно проверить на основе модели генерации данных, предполагая, что у нас есть все уравнения и вероятности, связанные с моделью. Это делается путем моделирования вмешательства (см. Байесовскую сеть ) и проверки, равна ли результирующая вероятность Y условной вероятности . Однако оказывается, что одной только структуры графа достаточно для проверки равенства .

Контроль

Рассмотрим исследователя, пытающегося оценить эффективность препарата X на основе данных о популяции, в которых употребление препарата было выбором пациента. Данные показывают, что пол ( Z ) влияет на выбор препарата пациентом, а также на его шансы на выздоровление ( Y ). В этом сценарии пол Z смешивает отношения между X и Y, поскольку Z является причиной как X , так и Y :

Причинно-следственная диаграмма гендера как распространенной причины употребления наркотиков и выздоровления

У нас есть это

потому что наблюдательная величина содержит информацию о корреляции между X и Z , а интервенционная величина - нет (поскольку X не коррелирует с Z в рандомизированном эксперименте). Можно показать [5] , что в тех случаях, когда доступны только данные наблюдений, несмещенную оценку искомой величины можно получить путем «поправки» на все мешающие факторы, а именно, обусловления их различных значений и усреднения результата. В случае одного искажающего фактора Z это приводит к «формуле корректировки»:

что дает несмещенную оценку причинного влияния X на Y. Та же самая формула корректировки работает, когда имеется несколько искажающих факторов, за исключением того, что в этом случае выбор набора Z переменных, который гарантировал бы несмещенные оценки, должен осуществляться с осторожностью. Критерий правильного выбора переменных называется «Черным ходом» [5] [6] и требует, чтобы выбранный набор Z «блокировал» (или перехватывал) каждый путь между X и Y , который содержит стрелку в X. Такие наборы называется «допустимым черным ходом» и может включать переменные, которые не являются общими причинами X и Y , а просто их доверенными лицами.

Возвращаясь к примеру с употреблением наркотиков, поскольку Z соответствует требованию «Черного хода» (т. е. перехватывает один путь «Черного хода »), формула корректировки «Черного хода» действительна:

Таким образом, врач может предсказать вероятный эффект от введения препарата на основе наблюдательных исследований, в которых условные вероятности, стоящие в правой части уравнения, можно оценить с помощью регрессии.

Вопреки распространенному мнению, добавление ковариат в набор корректировок Z может привести к смещению. [7] Типичный контрпример возникает, когда Z является общим эффектом X и Y , [8] случай, в котором Z не является искажающим фактором (т. е. нулевой набор является допустимым «черным ходом»), и поправка на Z создаст известную предвзятость. как « предвзятость коллайдера » или « парадокс Берксона ». Средства контроля, которые не являются хорошими помехами, иногда называют плохими средствами контроля .

В общем, смешивание можно контролировать путем корректировки тогда и только тогда, когда существует набор наблюдаемых ковариат, который удовлетворяет условию «черного хода». Более того, если Z является таким набором, то корректировочная формула уравнения. (3) справедливо. [5] [6] До-исчисление Перла обеспечивает все возможные условия, при которых можно оценить, не обязательно путем корректировки. [9]

История

По мнению Морабиа (2011), [10] слово « смешивать » происходит от средневекового латинского глагола «confundere», который означал «смешивание», и, вероятно, было выбрано для обозначения путаницы (от латыни: con=with + fusus=смешать или слить вместе) между причиной, которую необходимо оценить, и другими причинами, которые могут повлиять на результат и, таким образом, сбить с толку или помешать желаемой оценке. Гренланд, Робинс и Перл [11] отмечают раннее использование термина «смешение» в причинном выводе Джоном Стюартом Миллем в 1843 году.

Фишер ввел слово «смешение» в своей книге 1935 года «План экспериментов» [12] специально для обозначения последствий блокировки (т. е. разделения ) набора комбинаций лечения в факторном эксперименте , в результате чего определенные взаимодействия могут быть «смешаны». с блоками». Это популяризировало идею смешения статистических данных, хотя Фишера интересовал контроль неоднородности в экспериментальных единицах, а не причинно-следственные выводы.

По мнению Ванденбрука (2004) [13], именно Киш [14] использовал слово «смешение» в смысле «несравнимости» двух или более групп (например, подвергшихся и необлученных) в обсервационном исследовании. Формальные условия, определяющие, что делает одни группы «сопоставимыми», а другие — «несравнимыми», были позже разработаны в эпидемиологии Гренландом и Робинсом (1986) [15] с использованием контрфактического языка Неймана (1935) [16] и Рубина (1974). [17] Позже они были дополнены графическими критериями, такими как условие «черной двери» ( Pearl 1993; Greenland, Robins and Pearl 1999). [11] [5]

Было показано, что графические критерии формально эквивалентны контрфактическому определению [18] , но более прозрачны для исследователей, опирающихся на модели процессов.

Типы

В случае оценок риска , оценивающих величину и характер риска для здоровья человека , важно контролировать смешивание, чтобы изолировать эффект конкретной опасности, такой как пищевая добавка, пестицид или новый препарат. Для проспективных исследований трудно набирать и проверять добровольцев с одинаковым опытом (возраст, диета, образование, географическое положение и т. д.), а в исторических исследованиях может наблюдаться аналогичная вариабельность. Из-за неспособности контролировать изменчивость добровольцев и исследований на людях, смешивание является особой проблемой. По этим причинам эксперименты предлагают способ избежать большинства форм путаницы.

В некоторых дисциплинах смешение подразделяется на разные типы. В эпидемиологии один из типов — это «вмешательство по показаниям» [19] , которое относится к введению в заблуждение наблюдательными исследованиями . Поскольку прогностические факторы могут влиять на решения о лечении (и систематические оценки эффектов лечения), контроль известных прогностических факторов может уменьшить эту проблему, но всегда возможно, что забытый или неизвестный фактор не был включен или что факторы взаимодействуют сложно. Смешение по показаниям было описано как наиболее важное ограничение наблюдательных исследований. На рандомизированные исследования не влияет влияние показаний из-за случайного распределения .

Смешивающие переменные также можно классифицировать в зависимости от их источника. Выбор инструмента измерения (операционная путаница), ситуационных характеристик (процедурная путаница) или межиндивидуальных различий (личностная путаница).

Примеры

Допустим, кто-то изучает связь между порядком рождения (1-й ребенок, 2-й ребенок и т. д.) и наличием у ребенка синдрома Дауна . В этом сценарии возраст матери будет вмешивающейся переменной:

  1. Более высокий возраст матери напрямую связан с синдромом Дауна у ребенка.
  2. Более высокий возраст матери напрямую связан с синдромом Дауна, независимо от порядка рождения (мать, рожающая первого и третьего ребенка в возрасте 50 лет, подвергается такому же риску).
  3. Возраст матери напрямую связан с порядком рождения (2-й ребенок, за исключением близнецов, рождается, когда мать старше, чем она была на момент рождения 1-го ребенка)
  4. Возраст матери не является следствием порядка рождения (рождение второго ребенка не меняет возраст матери).

При оценке риска такие факторы, как возраст, пол и уровень образования, часто влияют на состояние здоровья, и поэтому их следует контролировать. Помимо этих факторов, исследователи могут не учитывать или не иметь доступа к данным о других причинных факторах. Примером может служить изучение влияния курения табака на здоровье человека. Курение, употребление алкоголя и диета — это связанные между собой образ жизни. Оценка риска, учитывающая последствия курения, но не учитывающая потребление алкоголя или диету, может переоценить риск курения. [22] Курение и путаница рассматриваются в оценках профессиональных рисков, таких как безопасность добычи угля. [23] Если в конкретной профессии нет большой выборки некурящих или непьющих людей, оценка риска может быть смещена в сторону обнаружения негативного воздействия на здоровье.

Уменьшение вероятности путаницы

Снижения вероятности возникновения и влияния мешающих факторов можно добиться за счет увеличения типов и количества сравнений, выполняемых в анализе. Если меры или манипуляции с основными конструкциями смешаны (т.е. существуют операционные или процедурные помехи), анализ подгрупп может не выявить проблем в анализе. Кроме того, увеличение количества сравнений может создать другие проблемы (см. множественные сравнения ).

Экспертная оценка — это процесс, который может помочь уменьшить количество случаев путаницы как до проведения исследования, так и после проведения анализа. Рецензирование опирается на коллективный опыт в рамках дисциплины для выявления потенциальных недостатков в дизайне и анализе исследования, включая способы, которыми результаты могут зависеть от искажающих факторов. Аналогичным образом, репликация может проверить надежность результатов одного исследования в альтернативных условиях исследования или альтернативных анализах (например, с учетом потенциальных искажающих факторов, не выявленных в первоначальном исследовании).

Смешивающие эффекты могут возникать с меньшей вероятностью и действовать одинаково в разных случаях и в разных местах. [ нужна цитата ] При выборе участков для исследования можно подробно охарактеризовать окружающую среду на участках исследования, чтобы гарантировать, что места экологически схожи и, следовательно, с меньшей вероятностью будут иметь мешающие переменные. Наконец, можно изучить взаимосвязь между переменными окружающей среды, которые могут исказить анализ, и измеряемыми параметрами. Информация, относящаяся к переменным окружающей среды, может затем использоваться в моделях для конкретного участка для выявления остаточной дисперсии, которая может быть связана с реальными последствиями. [24]

В зависимости от типа плана исследования существуют различные способы его изменения, чтобы активно исключать или контролировать мешающие переменные: [25]

Все эти методы имеют свои недостатки:

  1. Наилучшая доступная защита от возможности получения ложных результатов из-за смешивания часто состоит в том, чтобы отказаться от усилий по стратификации и вместо этого провести рандомизированное исследование достаточно большой выборки, взятой в целом, так, чтобы все потенциальные искажающие переменные (известные и неизвестные) были распределены случайно по всем исследовательским группам и, следовательно, не будут коррелировать с бинарной переменной для включения/исключения в любую группу.
  2. Этические соображения. В двойных слепых и рандомизированных контролируемых исследованиях участники не знают, что они получают фиктивное лечение , и им может быть отказано в эффективном лечении. [26] Существует вероятность того, что пациенты соглашаются на инвазивную операцию (которая несет в себе реальные медицинские риски) только при условии, что они получают лечение. Хотя это и является этической проблемой, это не является полным описанием ситуации. Для операций, которые в настоящее время проводятся регулярно, но для которых нет конкретных доказательств подлинного эффекта, могут возникнуть этические проблемы, связанные с продолжением таких операций. В таких обстоятельствах многие люди подвергаются реальному риску хирургического вмешательства, однако эти методы лечения могут не принести заметной пользы. Контроль ложной операции — это метод, который может позволить медицинской науке определить, эффективна ли хирургическая процедура или нет. Учитывая, что существуют известные риски, связанные с медицинскими операциями, сомнительно этично допускать проведение непроверенных операций до бесконечности в будущем.

Артефакты

Артефакты — это переменные, которые должны были систематически изменяться как внутри, так и между исследованиями, но случайно остались постоянными. Таким образом, артефакты представляют собой угрозу внешней достоверности . Артефакты – это факторы, которые зависят от лечения и его результата. Кэмпбелл и Стэнли [27] идентифицируют несколько артефактов. Основными угрозами внутренней валидности являются история, созревание, тестирование, инструментарий, статистическая регрессия , отбор, экспериментальная смертность и взаимодействие отбора и истории.

Один из способов минимизировать влияние артефактов — использовать структуру контрольной группы до и после тестирования . В рамках этой схемы «группы людей, которые изначально эквивалентны (на этапе предварительного тестирования), случайным образом распределяются для получения экспериментального лечения или контрольного состояния, а затем снова оцениваются после этого дифференциального опыта (фаза после тестирования)». [28] Таким образом, любые эффекты артефактов (в идеале) одинаково распределяются среди участников как в условиях лечения, так и в контрольных условиях.

Смотрите также

Рекомендации

  1. ^ Перл, Дж. (2009). Парадокс Симпсона , путаница и свертываемость в причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк: Издательство Кембриджского университета.
  2. ^ ВандерВил, Ти Джей; Шпицер, И. (2013). «Об определении конфаундера». Анналы статистики . 41 (1): 196–220. arXiv : 1304.0564 . дои : 10.1214/12-aos1058. ПМК  4276366 . ПМИД  25544784.
  3. ^ Гренландия, С.; Робинс, Дж. М.; Перл, Дж. (1999). «Смешение и свертываемость в причинном выводе». Статистическая наука . 14 (1): 29–46. дои : 10.1214/ss/1009211805 .
  4. ^ Шадиш, WR; Кук, Т.Д.; Кэмпбелл, DT (2002). Экспериментальные и квазиэкспериментальные планы обобщенного причинно-следственного вывода . Бостон, Массачусетс: Houghton-Mifflin .
  5. ^ abcd Перл, Дж. (1993). «Аспекты графических моделей, связанные с причинностью», в материалах 49-й сессии Международного института статистических наук, стр. 391–401.
  6. ^ Аб Перл, Дж. (2009). Причинные диаграммы и идентификация причинных эффектов в причинности: модели, рассуждения и выводы (2-е изд.). Нью-Йорк, штат Нью-Йорк, США: Издательство Кембриджского университета.
  7. ^ Синелли, К.; Форни, А.; Перл, Дж. (март 2022 г.). «Ускоренный курс хорошего и плохого контроля» (PDF) . Лаборатория когнитивных систем Калифорнийского университета в Лос-Анджелесе, технический отчет (R-493) .
  8. ^ Ли, PH (2014). «Следует ли нам делать поправку на искажающий фактор, если эмпирические и теоретические критерии дают противоречивые результаты? Моделирование». Научный представитель . 4 : 6085. Бибкод : 2014NatSR...4E6085L. дои : 10.1038/srep06085. ПМК 5381407 . ПМИД  25124526. 
  9. ^ Шпицер, И.; Перл, Дж. (2008). «Полные методы идентификации причинной иерархии». Журнал исследований машинного обучения . 9 : 1941–1979.
  10. ^ Морабия, А (2011). «История современной эпидемиологической концепции смешения» (PDF) . Журнал эпидемиологии и общественного здравоохранения . 65 (4): 297–300. дои : 10.1136/jech.2010.112565 . PMID  20696848. S2CID  9068532.
  11. ^ аб Гренландия, С.; Робинс, Дж. М.; Перл, Дж. (1999). «Смешение и свертываемость в причинном выводе». Статистическая наука . 14 (1): 31. дои : 10.1214/ss/1009211805 .
  12. ^ Фишер, РА (1935). План экспериментов (стр. 114–145).
  13. ^ Ванденбрук, JP (2004). «История смешения». Соз Правентивмед . 47 (4): 216–224. дои : 10.1007/BF01326402. PMID  12415925. S2CID  198174446.
  14. ^ Киш, Л (1959). «Некоторые статистические проблемы в планировании исследований». Я социальный . 26 (3): 328–338. дои : 10.2307/2089381. JSTOR  2089381.
  15. ^ Гренландия, С.; Робинс, Дж. М. (1986). «Идентифицируемость, возможность обмена и эпидемиологическое смешивание». Международный журнал эпидемиологии . 15 (3): 413–419. CiteSeerX 10.1.1.157.6445 . дои : 10.1093/ije/15.3.413. ПМИД  3771081. 
  16. ^ Нейман, Дж., при сотрудничестве К. Иваскевича и Св. Колодзейчика (1935). Статистические проблемы в сельскохозяйственном экспериментировании (с обсуждением). Приложение J Roy Statist Soc Ser B 2 107-180.
  17. ^ Рубин, Д.Б. (1974). «Оценка причинных эффектов лечения в рандомизированных и нерандомизированных исследованиях». Журнал педагогической психологии . 66 (5): 688–701. дои : 10.1037/h0037350. S2CID  52832751.
  18. ^ Перл, Дж. (2009). Причинность: модели, рассуждения и выводы (2-е изд.). Нью-Йорк, штат Нью-Йорк, США: Издательство Кембриджского университета.
  19. ^ Джонстон, Южная Каролина (2001). «Выявление искажений по показаниям посредством слепого проспективного обзора». Американский журнал эпидемиологии . 154 (3): 276–284. дои : 10.1093/aje/154.3.276 . ПМИД  11479193.
  20. ^ Аб Пелхэм, Бретт (2006). Проведение исследований в области психологии . Бельмонт: Уодсворт. ISBN 978-0-534-53294-9.
  21. ^ Стег, Л.; Буунк, АП; Ротенгаттер, Т. (2008). "Глава 4". Прикладная социальная психология: понимание и решение социальных проблем . Кембридж, Великобритания: Издательство Кембриджского университета.
  22. ^ Тьённеланд, Энн; Грёнбек, Мортен; Стриппинг, Конни; Овервад, Ким (январь 1999 г.). «Потребление вина и диета в случайной выборке из 48763 датских мужчин и женщин». Американский журнал клинического питания . 69 (1): 49–54. дои : 10.1093/ajcn/69.1.49 . ПМИД  9925122.
  23. ^ Аксельсон, О. (1989). «Смешение от курения в профессиональной эпидемиологии». Британский журнал промышленной медицины . 46 (8): 505–07. дои : 10.1136/oem.46.8.505. ПМЦ 1009818 . ПМИД  2673334. 
  24. ^ Калоу, Питер П. (2009) Справочник по оценке и управлению экологическими рисками , Wiley
  25. ^ Мэйрент, Шерри Л. (1987). Эпидемиология в медицине . Липпинкотт Уильямс и Уилкинс . ISBN 978-0-316-35636-7.
  26. ^ Эмануэль, Иезекииль Дж; Миллер, Франклин Дж. (20 сентября 2001 г.). «Этика плацебо-контролируемых исследований — золотая середина». Медицинский журнал Новой Англии . 345 (12): 915–9. дои : 10.1056/nejm200109203451211. ПМИД  11565527.
  27. ^ Кэмпбелл, DT; Стэнли, Джей Си (1966). Экспериментальные и квазиэкспериментальные планы исследований . Чикаго: Рэнд МакНелли.
  28. ^ Крано, WD; Брюэр, МБ (2002). Принципы и методы социальных исследований (2-е изд.). Махва, Нью-Джерси: Lawrence Erlbaum Associates . п. 28.

дальнейшее чтение

Внешние ссылки