Исследование с неконтролируемой переменной, представляющей интерес
В таких областях, как эпидемиология , социальные науки , психология и статистика , наблюдательное исследование делает выводы из выборки для популяции , где независимая переменная не находится под контролем исследователя из-за этических проблем или логистических ограничений. Одно из распространенных наблюдательных исследований касается возможного эффекта лечения на субъектов, где распределение субъектов в группу лечения по сравнению с контрольной группой находится вне контроля исследователя. [1] [2] Это контрастирует с экспериментами , такими как рандомизированные контролируемые испытания , где каждый субъект случайным образом распределяется в группу лечения или контрольную группу. Наблюдательные исследования, из-за отсутствия механизма распределения, естественно, представляют трудности для выводного анализа.
Мотивация
Независимая переменная может находиться вне контроля исследователя по ряду причин:
Рандомизированный эксперимент нарушил бы этические стандарты. Предположим, что кто-то хочет исследовать гипотезу аборта–рака груди , которая постулирует причинно-следственную связь между искусственным абортом и заболеваемостью раком груди. В гипотетическом контролируемом эксперименте можно начать с большой группы беременных женщин и случайным образом разделить их на группу лечения (получающих искусственные аборты) и контрольную группу (не получающих аборты), а затем проводить регулярные скрининги рака у женщин из обеих групп. Излишне говорить, что такой эксперимент будет противоречить общим этическим принципам. (Он также будет страдать от различных помех и источников предвзятости, например, его будет невозможно провести как слепой эксперимент .) Опубликованные исследования, исследующие гипотезу аборта–рака груди, обычно начинаются с группы женщин, которые уже делали аборты. Членство в этой «леченой» группе не контролируется исследователем: группа формируется после того, как было назначено «лечение». [ необходима цитата ]
У исследователя может просто не быть необходимого влияния. Предположим, что ученый хочет изучить влияние на здоровье населения запрета на курение в общественных помещениях. В контролируемом эксперименте исследователь случайным образом выбирает набор сообществ для включения в группу лечения. Однако, как правило, каждое сообщество и/или его законодательный орган принимают решение о введении запрета на курение . Можно ожидать, что у исследователя не будет политической власти, чтобы заставить именно те сообщества в случайно выбранной группе лечения принять запрет на курение. В наблюдательном исследовании исследователь обычно начинает с группы лечения, состоящей из тех сообществ, где запрет на курение уже действует. [ необходима ссылка ]
Рандомизированный эксперимент может быть непрактичным. Предположим, что исследователь хочет изучить предполагаемую связь между определенным лекарством и очень редкой группой симптомов, возникающих как побочный эффект. Оставив в стороне любые этические соображения, рандомизированный эксперимент был бы непрактичным из-за редкости эффекта. Может не быть достаточно большого пула субъектов, чтобы симптомы наблюдались по крайней мере у одного из прошедших лечение субъектов. Наблюдательное исследование обычно начинается с группы симптоматических субъектов и работает в обратном направлении, чтобы найти тех, кому давали лекарство и у которых позже развились симптомы. Таким образом, подгруппа прошедшей лечение группы определялась на основе наличия симптомов, а не путем случайного распределения. [ необходима цитата ]
Многие рандомизированные контролируемые испытания не являются широко репрезентативными для реальных пациентов, и это может ограничить их внешнюю валидность . Пациенты, которые имеют право на включение в рандомизированное контролируемое испытание, обычно моложе, с большей вероятностью являются мужчинами, более здоровыми и с большей вероятностью будут лечиться в соответствии с рекомендациями руководств. [3] Если и когда вмешательство позже будет добавлено к обычному уходу, большая часть пациентов, которые будут его получать, могут быть пожилыми со многими сопутствующими заболеваниями и лекарственной терапией, хотя
Типы
Исследование случай-контроль : исследование, изначально разработанное в эпидемиологии, в котором две существующие группы, различающиеся по результатам, идентифицируются и сравниваются на основе некоторого предполагаемого причинного признака.
Поперечное исследование : включает сбор данных среди населения или репрезентативной подгруппы в определенный момент времени.
«Хотя наблюдательные исследования не могут быть использованы для окончательных утверждений о «безопасности, эффективности или результативности» практики, они могут: [4]
предоставить информацию об использовании и практике в «реальном мире»;
обнаружить сигналы о преимуществах и рисках...[использования] [практик] среди населения в целом;
помочь сформулировать гипотезы для проверки в последующих экспериментах;
предоставить часть данных на уровне сообщества, необходимых для разработки более информативных прагматичных клинических испытаний; и
информировать клиническую практику." [4]
Методы смещения и компенсации
Во всех этих случаях, если рандомизированный эксперимент не может быть проведен, альтернативная линия исследования страдает от проблемы, что решение о том, какие субъекты получают лечение, не является полностью случайным и, таким образом, является потенциальным источником смещения . Основная проблема при проведении наблюдательных исследований заключается в том, чтобы сделать выводы, которые приемлемо свободны от влияния явных смещений, а также оценить влияние потенциальных скрытых смещений. Ниже приведен неисчерпывающий набор проблем, особенно распространенных в наблюдательных исследованиях.
Методы сопоставления предвзятости
Вместо экспериментального контроля многомерные статистические методы позволяют приблизить экспериментальный контроль к статистическому контролю с помощью методов сопоставления. Методы сопоставления учитывают влияние наблюдаемых факторов, которые могут влиять на причинно-следственную связь. В здравоохранении и социальных науках исследователи могут использовать сопоставление для сравнения единиц, которые неслучайно получили лечение и контроль. Одним из распространенных подходов является использование сопоставления оценок склонности для уменьшения смешения [5] , хотя в последнее время это подвергается критике за обострение тех самых проблем, которые оно пытается решить. [6]
Ошибка множественного сравнения
Ошибка множественного сравнения может возникнуть, когда одновременно проверяются несколько гипотез. По мере увеличения числа зарегистрированных факторов увеличивается вероятность того, что по крайней мере один из зарегистрированных факторов будет сильно коррелировать с выходными данными просто случайно. [7]
Смещение пропущенной переменной
Наблюдатель неконтролируемого эксперимента (или процесса) записывает потенциальные факторы и выходные данные: цель состоит в том, чтобы определить эффекты факторов. Иногда записанные факторы могут не быть прямой причиной различий в выходных данных. Могут быть более важные факторы, которые не были записаны, но на самом деле являются причинными. Кроме того, записанные или незаписанные факторы могут быть коррелированы, что может привести к неверным выводам. [8]
Смещение отбора
Другая сложность с наблюдательными исследованиями заключается в том, что сами исследователи могут быть предвзяты в своих навыках наблюдения. Это позволило бы исследователям (сознательно или бессознательно) искать информацию, которую они ищут, во время проведения своего исследования. Например, исследователи могут преувеличивать влияние одной переменной или преуменьшать влияние другой: исследователи могут даже выбирать субъектов, которые соответствуют их выводам. Такое смещение отбора может произойти на любой стадии процесса исследования. Это вносит смещение в данные, когда определенные переменные систематически неправильно измеряются. [9]
Качество
Обзор Cochrane 2014 года (обновлен в 2024 году) пришел к выводу, что наблюдательные исследования дают результаты, аналогичные результатам, проведенным в ходе рандомизированных контролируемых испытаний . [10] В обзоре сообщается о небольшом количестве доказательств существенных различий в эффектах между наблюдательными исследованиями и рандомизированными контролируемыми испытаниями, независимо от дизайна. [10] Различия необходимо оценивать, рассматривая популяцию, компаратор, гетерогенность и результаты. [10]
^ Porta M, ред. (2008). Словарь эпидемиологии (5-е изд.). Нью-Йорк: Oxford University Press. ISBN9780195314496.
^ Кеннеди-Мартин Т., Кертис С., Фэриес Д., Робинсон С., Джонстон Дж. (ноябрь 2015 г.). «Обзор литературы по репрезентативности выборок рандомизированных контролируемых испытаний и последствия для внешней валидности результатов испытаний». Испытания . 16 (1): 495. doi : 10.1186/s13063-015-1023-4 . PMC 4632358 . PMID 26530985.
^ ab "Хотя наблюдательные исследования не могут предоставить окончательных доказательств безопасности, эффективности или результативности, они могут: 1) предоставить информацию об использовании и практике в "реальном мире"; 2) обнаружить сигналы о преимуществах и рисках использования дополнительных методов лечения среди населения в целом; 3) помочь сформулировать гипотезы для проверки в последующих экспериментах; 4) предоставить часть данных на уровне сообщества, необходимых для разработки более информативных прагматичных клинических испытаний; и 5) информировать клиническую практику". "Наблюдательные исследования и вторичный анализ данных для оценки результатов в комплементарном и интегративном здравоохранении". Архивировано 29.09.2019 в Wayback Machine Ричард Нахин, доктор философии, магистр общественного здравоохранения, старший советник по научной координации и работе с общественностью, Национальный центр комплементарного и интегративного здравоохранения , 25 июня 2012 г.
^ Розенбаум, Пол Р. 2009. Дизайн наблюдательных исследований . Нью-Йорк: Springer.
^ Кинг, Гэри; Нильсен, Ричард (2019-05-07). «Почему оценки склонности не следует использовать для сопоставления». Политический анализ . 27 (4): 435–454. doi : 10.1017/pan.2019.11. hdl : 1721.1/128459 . ISSN 1047-1987. S2CID 53585283.| ссылка на полную статью (с домашней страницы автора)
^ Бенджамини, Йоав (2010). «Одновременный и выборочный вывод: текущие успехи и будущие проблемы». Биометрический журнал . 52 (6): 708–721. doi :10.1002/bimj.200900299. PMID 21154895. S2CID 8806192.
^ "Введение в эконометрику Глава 18: Смещение пропущенной переменной". www3.wabash.edu . Получено 16 июля 2022 г.
^ Хаммер, Гаэль П; дю Прель, Жан-Баптист; Блеттнер, Мария (01 октября 2009 г.). «Избежание предвзятости в наблюдательных исследованиях». Deutsches Ärzteblatt International . 106 (41): 664–668. doi : 10.3238/arztebl.2009.0664. ISSN 1866-0452. ПМК 2780010 . ПМИД 19946431.
^ abc Toews, Ingrid; Anglemyer, Andrew; Nyirenda, John Lz; Alsaid, Dima; Balduzzi, Sara; Grummich, Kathrin; Schwingshackl, Lukas; Bero, Lisa (2024-01-04). "Результаты оказания медицинской помощи, оцененные с помощью наблюдательных исследований по сравнению с результатами, оцененными в рандомизированных исследованиях: метаэпидемиологическое исследование". База данных систематических обзоров Cochrane . 1 (1): MR000034. doi :10.1002/14651858.MR000034.pub3. ISSN 1469-493X. PMC 10765475. PMID 38174786.
Дальнейшее чтение
Rosenbaum PR (2002). Наблюдательные исследования (2-е изд.). Нью-Йорк: Springer-Verlag. ISBN 0387989676.
«Справочник NIST/SEMATECH по инженерной статистике» на сайте NIST