stringtranslate.com

Исследование неоднородности

В статистике (между)исследованиями неоднородность — это явление, которое обычно возникает при попытке провести метаанализ . В упрощенном сценарии исследования, результаты которых должны быть объединены в метаанализе, будут проводиться одинаково и по одним и тем же экспериментальным протоколам. Различия между результатами будут возникать только из-за ошибки измерения (и исследования, следовательно, будут однородными ). Исследования неоднородны, что означает изменчивость результатов, которая выходит за рамки ожидаемого (или может быть объяснена) только из-за ошибки измерения. [1]

Введение

Метаанализ — это метод, используемый для объединения результатов различных испытаний с целью получения количественного синтеза. Размер отдельных клинических испытаний часто слишком мал для надежного определения эффектов лечения. Метаанализ увеличивает мощность статистического анализа, объединяя результаты всех доступных испытаний.

Поскольку кто-то пытается использовать метаанализ для оценки комбинированного эффекта из группы схожих исследований, эффекты, обнаруженные в отдельных исследованиях, должны быть достаточно схожи, чтобы можно было быть уверенным, что комбинированная оценка будет значимым описанием набора исследований. Однако индивидуальные оценки эффекта лечения будут варьироваться случайно; некоторые вариации ожидаются из-за ошибки наблюдения . Любая избыточная вариация (явная или обнаруживаемая или нет) называется (статистической) гетерогенностью . [2] Наличие некоторой гетерогенности не является чем-то необычным, например, аналогичные эффекты также часто встречаются даже в пределах исследований, в многоцентровых испытаниях (межцентровая гетерогенность ).

Причинами дополнительной изменчивости обычно являются различия в самих исследованиях, исследуемых популяциях, схемах лечения, определениях конечных точек или других обстоятельствах («клиническое разнообразие»), или в способе анализа данных, используемых моделях или в том, были ли оценки скорректированы каким-либо образом («методологическое разнообразие»). [1] Различные типы мер эффекта (например, отношение шансов против относительного риска ) также могут быть более или менее подвержены гетерогенности. [3]

Моделирование

В случае, если источник гетерогенности может быть идентифицирован и может быть отнесен к определенным особенностям исследования, анализ может быть стратифицирован (рассмотрев подгруппы исследований, которые затем, как можно надеяться, будут более однородными), или путем расширения анализа до метарегрессии , учитывающей (непрерывные или категориальные ) переменные-модераторы . К сожалению, основанный на литературе метаанализ часто не позволяет собрать данные по всем (потенциально) релевантным модераторам. [4]

Кроме того, гетерогенность обычно учитывается с помощью модели случайных эффектов , в которой гетерогенность затем представляет собой компонент дисперсии . [5] Модель отражает отсутствие знаний о том, почему эффекты лечения могут отличаться, рассматривая (потенциальные) различия как неизвестные. Центр этого симметричного распределения описывает среднее значение эффектов, в то время как его ширина описывает степень гетерогенности. Очевидный и общепринятый выбор распределения — это нормальное распределение . Трудно установить обоснованность любого предположения о распределении, и это является распространенной критикой метаанализов случайных эффектов. Однако вариации точной формы распределения могут не иметь большого значения, [6] и моделирование показало, что методы относительно надежны даже при экстремальных предположениях о распределении, как при оценке гетерогенности, [7], так и при расчете общего размера эффекта. [8]

Включение случайного эффекта в модель приводит к тому, что выводы (в некотором смысле) становятся более консервативными или осторожными, поскольку (ненулевая) неоднородность приведет к большей неопределенности (и избежит излишней уверенности) в оценке общих эффектов. В особом случае нулевой дисперсии неоднородности модель случайных эффектов снова сводится к особому случаю модели общих эффектов . [9]

Однако общие модели метаанализа, конечно, не следует применять слепо или наивно к собранным наборам оценок. В случае, если результаты, которые необходимо объединить, существенно различаются (по контексту или по предполагаемым эффектам), полученное метааналитическое среднее может в конечном итоге не соответствовать разумной оценке . [ 10] [11] Когда отдельные исследования демонстрируют противоречивые результаты, вероятно, есть некоторые причины, по которым результаты различаются; например, две субпопуляции могут испытывать разные фармакокинетические пути . [12] В таком сценарии важно знать и учитывать соответствующие ковариаты в анализе.

Тестирование

Статистическое тестирование на ненулевую дисперсию неоднородности часто выполняется на основе Q Кохрана [ 13] или связанных с ним тестовых процедур. Однако эта общая процедура сомнительна по нескольким причинам, а именно, низкая мощность таких тестов [14], особенно в очень распространенном случае объединения в анализе лишь нескольких оценок, [15] [7], а также спецификация однородности как нулевой гипотезы , которая затем отвергается только при наличии достаточных доказательств против нее. [16]

Оценка

Хотя основной целью метаанализа обычно является оценка основного эффекта , исследование неоднородности также имеет решающее значение для его интерпретации. Доступно большое количество ( частотных и байесовских ) оценок . [17] Байесовская оценка неоднородности обычно требует спецификации соответствующего предварительного распределения . [9] [18]

Хотя многие из этих оценщиков ведут себя одинаково в случае большого количества исследований, различия, в частности, возникают в их поведении в общем случае только нескольких оценок. [19] Часто получается неверная нулевая оценка дисперсии между исследованиями, что приводит к ложному предположению однородности. В целом, похоже, что неоднородность постоянно недооценивается в метаанализах. [7]

Количественная оценка

Дисперсия неоднородности обычно обозначается как τ², а стандартное отклонение (ее квадратный корень) как τ. Неоднородность, вероятно, проще всего интерпретировать в терминах τ, поскольку это параметр масштаба распределения неоднородности , который измеряется в тех же единицах , что и сам общий эффект. [18]

Другой распространенной мерой неоднородности является I², статистика, которая указывает процент дисперсии в метаанализе, который можно отнести к неоднородности исследования (несколько похоже на коэффициент детерминации ). [20] I² связывает величину дисперсии неоднородности с размером дисперсий индивидуальных оценок (квадратами стандартных ошибок ); однако при этой нормализации не совсем очевидно, что именно будет составлять «малые» или «большие» количества неоднородности. Для постоянной неоднородности (τ) наличие меньших или больших исследований (с соответственно различными связанными стандартными ошибками) будет влиять на меру I²; поэтому фактическая интерпретация значения I² не является простой. [21] [22]

Совместное рассмотрение интервала прогнозирования вместе с доверительным интервалом для основного эффекта может помочь лучше понять вклад неоднородности в неопределенность вокруг оценки эффекта. [5] [23] [24] [25]

Смотрите также

Ссылки

  1. ^ ab Deeks, JJ; Higgins, JPT; Altman, DG (2021), "10.10 Гетерогенность", в Higgins, JPT; Thomas, J.; Chandler, J.; Cumpston, M.; Li, T.; Page, MJ; Welch, VA (ред.), Cochrane Handbook for Systematic Reviews of Interventions (6.2 ред.)
  2. ^ Сингх, А.; Хуссейн, С.; Наджми, А.Н. (2017), «Количество исследований, гетерогенность, обобщаемость и выбор метода для метаанализа», Журнал неврологических наук , 15 (381): 347, doi :10.1016/j.jns.2017.09.026, PMID  28967410, S2CID  31073171
  3. ^ Deeks, JJ; Altman, DG (2001), «Измерения эффекта для метаанализа испытаний с бинарными результатами», в Egger, M.; Davey Smith, G.; Altman, D. (ред.), Систематические обзоры в здравоохранении: метаанализ в контексте (2-е изд.), BMJ Publishing, стр. 313–335, doi :10.1002/9780470693926.ch16, ISBN 9780470693926
  4. ^ Купер, Харрис; Хеджес, Ларри В.; Валентайн, Джеффри К. (2019-06-14). Справочник по исследовательскому синтезу и метаанализу. Фонд Рассела Сейджа. ISBN 978-1-61044-886-4.
  5. ^ ab Райли, RD; Хиггинс, JP; Дикс, JJ (2011), "Интерпретация метаанализов случайных эффектов", BMJ , 342 : d549, doi : 10.1136/bmj.d549, PMID  21310794, S2CID  32994689
  6. ^ Бреттхорст, ГЛ (1999), «Почти нерелевантность распределений частоты выборки», в фон дер Линден, В.; и др. (ред.), Максимальная энтропия и байесовские методы , Kluwer Academic Publishers, стр. 21–46, doi :10.1007/978-94-011-4710-1_3, ISBN 978-94-010-5982-4
  7. ^ abc Kontopantelis, E.; Springate, DA; Reeves, D. (2013). «Повторный анализ данных библиотеки Кокрейна: опасности ненаблюдаемой гетерогенности в метаанализах». PLOS ONE . ​​8 (7): e69930. Bibcode :2013PLoSO...869930K. doi : 10.1371/journal.pone.0069930 . PMC 3724681 . PMID  23922860. 
  8. ^ Контопантелис, Э.; Ривз, Д. (2012). «Производительность статистических методов для метаанализа, когда истинные эффекты исследования распределены ненормально: имитационное исследование». Статистические методы в медицинских исследованиях . 21 (4): 409–26. doi :10.1177/0962280210392008. PMID  21148194. S2CID  152379.
  9. ^ ab Röver, C. (2020), «Байесовский метаанализ случайных эффектов с использованием пакета bayesmeta R», Журнал статистического программного обеспечения , 93 (6): 1–51, arXiv : 1711.08683 , doi : 10.18637/jss.v093.i06
  10. ^ Корнелл, Джон Э.; Малроу, Синтия Д.; Локалио, Рассел; Стэк, Кэтрин Б.; Мейбом, Энн Р.; Гуаллар, Элизео; Гудман, Стивен Н. (18.02.2014). «Метаанализ случайных эффектов непоследовательных эффектов: время перемен». Annals of Internal Medicine . 160 (4): 267–270. doi :10.7326/M13-2886. ISSN  0003-4819. PMID  24727843. S2CID  9210956.
  11. ^ Мазиаж, Мариуш (2022-02-01). «Является ли метаанализ РКИ, оценивающих эффективность вмешательств, надежным источником доказательств для терапевтических решений?». Исследования по истории и философии науки . 91 : 159–167. doi : 10.1016/j.shpsa.2021.11.007 . ISSN  0039-3681. PMID  34922183. S2CID  245241150.
  12. ^ Боренштейн, Майкл; Хеджес, Ларри В.; Хиггинс, Джулиан ПТ; Ротштейн, Ханна Р. (2010). «Базовое введение в модели с фиксированными и случайными эффектами для метаанализа» . Методы синтеза исследований . 1 (2): 97–111. doi :10.1002/jrsm.12. ISSN  1759-2887. PMID  26061376. S2CID  1040498.
  13. ^ Cochran, WG (1954), «Комбинация оценок из разных экспериментов», Biometrics , 10 (1): 101–129, doi :10.2307/3001666, JSTOR  3001666
  14. ^ Харди, Р. Дж.; Томпсон, С. Г. (1998), «Обнаружение и описание гетерогенности в метаанализе», Статистика в медицине , 17 (8): 841–856, doi :10.1002/(SICI)1097-0258(19980430)17:8<841::AID-SIM781>3.0.CO;2-D, PMID  9595615
  15. ^ Дэйви, Дж.; Тернер, Р.М.; Кларк, М.Дж.; Хиггинс, Дж.ПТ. (2011), «Характеристики метаанализов и их компонентных исследований в Кокрановской базе данных систематических обзоров: поперечный, описательный анализ», BMC Medical Research Methodology , 11 (1): 160, doi : 10.1186/1471-2288-11-160 , PMC 3247075 , PMID  22114982 
  16. ^ Ли, В.; Лю, Ф.; Снавели, Д. (2020), «Пересмотр методов «тест-затем-пул» и некоторые практические соображения», Фармацевтическая статистика , 19 (5): 498–517, doi :10.1002/pst.2009, PMID  32171048, S2CID  212718520
  17. ^ Вероники, AA; Джексон, Д.; Фихтбауэр, В.; Бендер, Р.; Боуден, Дж.; Кнапп, Г.; Кусс, О.; Хиггинс, Дж. П. Т.; Ланган, Д.; Саланти, Г. (2016), «Методы оценки дисперсии между исследованиями и ее неопределенности в метаанализе», Research Synthesis Methods , 7 (1): 55–79, doi : 10.1002/jrsm.1164 , PMC 4950030 , PMID  26332144 
  18. ^ ab Röver, C.; Bender, R.; Dias, S.; Schmid, CH; Schmidli, H.; Sturtz, S.; Weber, S.; Friede, T. (2021), «О слабоинформативных априорных распределениях для параметра гетерогенности в байесовском метаанализе случайных эффектов», Research Synthesis Methods , 12 (4): 448–474, arXiv : 2007.08352 , doi : 10.1002/jrsm.1475, PMID  33486828, S2CID  220546288
  19. ^ Фриде, Т.; Рёвер, К.; Вандель, С.; Нойеншвандер, Б. (2017), «Метаанализ нескольких небольших исследований по орфанным заболеваниям», Research Synthesis Methods , 8 (1): 79–91, arXiv : 1601.06533 , doi : 10.1002/jrsm.1217, PMC 5347842 , PMID  27362487 
  20. ^ Хиггинс, Дж. П. Т.; Томпсон, С. Г.; Дикс, Дж. Дж.; Альтман, Д. Г. (2003), «Измерение непоследовательности в метаанализах», BMJ , 327 (7414): 557–560, doi : 10.1136/bmj.327.7414.557, PMC 192859 , PMID  12958120 
  21. ^ Рюккер, Г.; Шварцер, Г.; Карпентер, Дж. Р.; Шумахер, М. (2008), «Чрезмерная зависимость от I² при оценке гетерогенности может ввести в заблуждение», BMC Medical Research Methodology , 8 (79): 79, doi : 10.1186/1471-2288-8-79 , PMC 2648991 , PMID  19036172 
  22. ^ Боренштейн, М.; Хиггинс, Дж. П. Т.; Хеджес, Л. В.; Ротштейн, Х. Р. (2017), «Основы метаанализа: I² не является абсолютной мерой гетерогенности» (PDF) , Методы исследовательского синтеза , 8 (1): 5–18, doi : 10.1002/jrsm.1230, hdl : 1983/9cea2307-8e9b-4583-9403-3a37409ed1cb , PMID  28058794, S2CID  4235538
  23. ^ Chiolero, A; Santschi, V.; Burnand, B.; Platt, RW; Paradis, G. (2012), «Метаанализы: с доверительными или прогностическими интервалами?» (PDF) , Европейский журнал эпидемиологии , 27 (10): 823–5, doi :10.1007/s10654-012-9738-y, PMID  23070657, S2CID  20413290
  24. ^ Бендер, Р.; Кусс, О.; Кох, А.; Швенке, К.; Хаушке, Д. (2014), Применение интервалов прогнозирования в метаанализе со случайными эффектами (PDF) , Совместное заявление IQWiG , GMDS и IBS-DR
  25. ^ IntHout, J; Ioannidis, JPA; Rovers, MM; Goeman, JJ (2016), «Призыв к рутинному представлению интервалов прогнозирования в метаанализе» (PDF) , BMJ Open , 6 (7): e010247, doi : 10.1136/bmjopen-2015-010247 , PMC 4947751 , PMID  27406637 

Дальнейшее чтение