Изменчивость исследований, учитываемая в ходе метааналитических, систематических обзоров
В статистике (между)исследованиями неоднородность — это явление, которое обычно возникает при попытке провести метаанализ . В упрощенном сценарии исследования, результаты которых должны быть объединены в метаанализе, будут проводиться одинаково и по одним и тем же экспериментальным протоколам. Различия между результатами будут возникать только из-за ошибки измерения (и исследования, следовательно, будут однородными ). Исследования неоднородны, что означает изменчивость результатов, которая выходит за рамки ожидаемого (или может быть объяснена) только из-за ошибки измерения. [1]
Введение
Метаанализ — это метод, используемый для объединения результатов различных испытаний с целью получения количественного синтеза. Размер отдельных клинических испытаний часто слишком мал для надежного определения эффектов лечения. Метаанализ увеличивает мощность статистического анализа, объединяя результаты всех доступных испытаний.
Поскольку кто-то пытается использовать метаанализ для оценки комбинированного эффекта из группы схожих исследований, эффекты, обнаруженные в отдельных исследованиях, должны быть достаточно схожи, чтобы можно было быть уверенным, что комбинированная оценка будет значимым описанием набора исследований. Однако индивидуальные оценки эффекта лечения будут варьироваться случайно; некоторые вариации ожидаются из-за ошибки наблюдения . Любая избыточная вариация (явная или обнаруживаемая или нет) называется (статистической) гетерогенностью . [2]
Наличие некоторой гетерогенности не является чем-то необычным, например, аналогичные эффекты также часто встречаются даже в пределах исследований, в многоцентровых испытаниях (межцентровая гетерогенность ).
Причинами дополнительной изменчивости обычно являются различия в самих исследованиях, исследуемых популяциях, схемах лечения, определениях конечных точек или других обстоятельствах («клиническое разнообразие»), или в способе анализа данных, используемых моделях или в том, были ли оценки скорректированы каким-либо образом («методологическое разнообразие»). [1] Различные типы мер эффекта (например, отношение шансов против относительного риска ) также могут быть более или менее подвержены гетерогенности. [3]
Моделирование
В случае, если источник гетерогенности может быть идентифицирован и может быть отнесен к определенным особенностям исследования, анализ может быть стратифицирован (рассмотрев подгруппы исследований, которые затем, как можно надеяться, будут более однородными), или путем расширения анализа до метарегрессии , учитывающей (непрерывные или категориальные ) переменные-модераторы . К сожалению, основанный на литературе метаанализ часто не позволяет собрать данные по всем (потенциально) релевантным модераторам. [4]
Кроме того, гетерогенность обычно учитывается с помощью модели случайных эффектов , в которой гетерогенность затем представляет собой компонент дисперсии . [5] Модель отражает отсутствие знаний о том, почему эффекты лечения могут отличаться, рассматривая (потенциальные) различия как неизвестные. Центр этого симметричного распределения описывает среднее значение эффектов, в то время как его ширина описывает степень гетерогенности. Очевидный и общепринятый выбор распределения — это нормальное распределение . Трудно установить обоснованность любого предположения о распределении, и это является распространенной критикой метаанализов случайных эффектов. Однако вариации точной формы распределения могут не иметь большого значения, [6] и моделирование показало, что методы относительно надежны даже при экстремальных предположениях о распределении, как при оценке гетерогенности, [7], так и при расчете общего размера эффекта. [8]
Включение случайного эффекта в модель приводит к тому, что выводы (в некотором смысле) становятся более консервативными или осторожными, поскольку (ненулевая) неоднородность приведет к большей неопределенности (и избежит излишней уверенности) в оценке общих эффектов. В особом случае нулевой дисперсии неоднородности модель случайных эффектов снова сводится к особому случаю модели общих эффектов . [9]
Однако общие модели метаанализа, конечно, не следует применять слепо или наивно к собранным наборам оценок. В случае, если результаты, которые необходимо объединить, существенно различаются (по контексту или по предполагаемым эффектам), полученное метааналитическое среднее может в конечном итоге не соответствовать разумной оценке . [ 10] [11]
Когда отдельные исследования демонстрируют противоречивые результаты, вероятно, есть некоторые причины, по которым результаты различаются; например, две субпопуляции могут испытывать разные фармакокинетические пути . [12] В таком сценарии важно знать и учитывать соответствующие ковариаты в анализе.
Тестирование
Статистическое тестирование на ненулевую дисперсию неоднородности часто выполняется на основе Q Кохрана [ 13] или связанных с ним тестовых процедур. Однако эта общая процедура сомнительна по нескольким причинам, а именно, низкая мощность таких тестов [14], особенно в очень распространенном случае объединения в анализе лишь нескольких оценок, [15] [7], а также спецификация однородности как нулевой гипотезы , которая затем отвергается только при наличии достаточных доказательств против нее. [16]
Оценка
Хотя основной целью метаанализа обычно является оценка основного эффекта , исследование неоднородности также имеет решающее значение для его интерпретации. Доступно большое количество ( частотных и байесовских ) оценок . [17] Байесовская оценка неоднородности обычно требует спецификации соответствующего предварительного распределения . [9] [18]
Хотя многие из этих оценщиков ведут себя одинаково в случае большого количества исследований, различия, в частности, возникают в их поведении в общем случае только нескольких оценок. [19] Часто получается неверная нулевая оценка дисперсии между исследованиями, что приводит к ложному предположению однородности. В целом, похоже, что неоднородность постоянно недооценивается в метаанализах. [7]
Количественная оценка
Дисперсия неоднородности обычно обозначается как τ², а стандартное отклонение (ее квадратный корень) как τ. Неоднородность, вероятно, проще всего интерпретировать в терминах τ, поскольку это параметр масштаба распределения неоднородности , который измеряется в тех же единицах , что и сам общий эффект. [18]
Другой распространенной мерой неоднородности является I², статистика, которая указывает процент дисперсии в метаанализе, который можно отнести к неоднородности исследования (несколько похоже на коэффициент детерминации ). [20]
I² связывает величину дисперсии неоднородности с размером дисперсий индивидуальных оценок (квадратами стандартных ошибок ); однако при этой нормализации не совсем очевидно, что именно будет составлять «малые» или «большие» количества неоднородности. Для постоянной неоднородности (τ) наличие меньших или больших исследований (с соответственно различными связанными стандартными ошибками) будет влиять на меру I²; поэтому фактическая интерпретация значения I² не является простой. [21] [22]
Совместное рассмотрение интервала прогнозирования вместе с доверительным интервалом для основного эффекта может помочь лучше понять вклад неоднородности в неопределенность вокруг оценки эффекта. [5] [23] [24] [25]
Смотрите также
Ссылки
- ^ ab Deeks, JJ; Higgins, JPT; Altman, DG (2021), "10.10 Гетерогенность", в Higgins, JPT; Thomas, J.; Chandler, J.; Cumpston, M.; Li, T.; Page, MJ; Welch, VA (ред.), Cochrane Handbook for Systematic Reviews of Interventions (6.2 ред.)
- ^ Сингх, А.; Хуссейн, С.; Наджми, А.Н. (2017), «Количество исследований, гетерогенность, обобщаемость и выбор метода для метаанализа», Журнал неврологических наук , 15 (381): 347, doi :10.1016/j.jns.2017.09.026, PMID 28967410, S2CID 31073171
- ^ Deeks, JJ; Altman, DG (2001), «Измерения эффекта для метаанализа испытаний с бинарными результатами», в Egger, M.; Davey Smith, G.; Altman, D. (ред.), Систематические обзоры в здравоохранении: метаанализ в контексте (2-е изд.), BMJ Publishing, стр. 313–335, doi :10.1002/9780470693926.ch16, ISBN 9780470693926
- ^ Купер, Харрис; Хеджес, Ларри В.; Валентайн, Джеффри К. (2019-06-14). Справочник по исследовательскому синтезу и метаанализу. Фонд Рассела Сейджа. ISBN 978-1-61044-886-4.
- ^ ab Райли, RD; Хиггинс, JP; Дикс, JJ (2011), "Интерпретация метаанализов случайных эффектов", BMJ , 342 : d549, doi : 10.1136/bmj.d549, PMID 21310794, S2CID 32994689
- ^ Бреттхорст, ГЛ (1999), «Почти нерелевантность распределений частоты выборки», в фон дер Линден, В.; и др. (ред.), Максимальная энтропия и байесовские методы , Kluwer Academic Publishers, стр. 21–46, doi :10.1007/978-94-011-4710-1_3, ISBN 978-94-010-5982-4
- ^ abc Kontopantelis, E.; Springate, DA; Reeves, D. (2013). «Повторный анализ данных библиотеки Кокрейна: опасности ненаблюдаемой гетерогенности в метаанализах». PLOS ONE . 8 (7): e69930. Bibcode :2013PLoSO...869930K. doi : 10.1371/journal.pone.0069930 . PMC 3724681 . PMID 23922860.
- ^ Контопантелис, Э.; Ривз, Д. (2012). «Производительность статистических методов для метаанализа, когда истинные эффекты исследования распределены ненормально: имитационное исследование». Статистические методы в медицинских исследованиях . 21 (4): 409–26. doi :10.1177/0962280210392008. PMID 21148194. S2CID 152379.
- ^ ab Röver, C. (2020), «Байесовский метаанализ случайных эффектов с использованием пакета bayesmeta R», Журнал статистического программного обеспечения , 93 (6): 1–51, arXiv : 1711.08683 , doi : 10.18637/jss.v093.i06
- ^ Корнелл, Джон Э.; Малроу, Синтия Д.; Локалио, Рассел; Стэк, Кэтрин Б.; Мейбом, Энн Р.; Гуаллар, Элизео; Гудман, Стивен Н. (18.02.2014). «Метаанализ случайных эффектов непоследовательных эффектов: время перемен». Annals of Internal Medicine . 160 (4): 267–270. doi :10.7326/M13-2886. ISSN 0003-4819. PMID 24727843. S2CID 9210956.
- ^ Мазиаж, Мариуш (2022-02-01). «Является ли метаанализ РКИ, оценивающих эффективность вмешательств, надежным источником доказательств для терапевтических решений?». Исследования по истории и философии науки . 91 : 159–167. doi : 10.1016/j.shpsa.2021.11.007 . ISSN 0039-3681. PMID 34922183. S2CID 245241150.
- ^ Боренштейн, Майкл; Хеджес, Ларри В.; Хиггинс, Джулиан ПТ; Ротштейн, Ханна Р. (2010). «Базовое введение в модели с фиксированными и случайными эффектами для метаанализа» . Методы синтеза исследований . 1 (2): 97–111. doi :10.1002/jrsm.12. ISSN 1759-2887. PMID 26061376. S2CID 1040498.
- ^ Cochran, WG (1954), «Комбинация оценок из разных экспериментов», Biometrics , 10 (1): 101–129, doi :10.2307/3001666, JSTOR 3001666
- ^ Харди, Р. Дж.; Томпсон, С. Г. (1998), «Обнаружение и описание гетерогенности в метаанализе», Статистика в медицине , 17 (8): 841–856, doi :10.1002/(SICI)1097-0258(19980430)17:8<841::AID-SIM781>3.0.CO;2-D, PMID 9595615
- ^ Дэйви, Дж.; Тернер, Р.М.; Кларк, М.Дж.; Хиггинс, Дж.ПТ. (2011), «Характеристики метаанализов и их компонентных исследований в Кокрановской базе данных систематических обзоров: поперечный, описательный анализ», BMC Medical Research Methodology , 11 (1): 160, doi : 10.1186/1471-2288-11-160 , PMC 3247075 , PMID 22114982
- ^ Ли, В.; Лю, Ф.; Снавели, Д. (2020), «Пересмотр методов «тест-затем-пул» и некоторые практические соображения», Фармацевтическая статистика , 19 (5): 498–517, doi :10.1002/pst.2009, PMID 32171048, S2CID 212718520
- ^ Вероники, AA; Джексон, Д.; Фихтбауэр, В.; Бендер, Р.; Боуден, Дж.; Кнапп, Г.; Кусс, О.; Хиггинс, Дж. П. Т.; Ланган, Д.; Саланти, Г. (2016), «Методы оценки дисперсии между исследованиями и ее неопределенности в метаанализе», Research Synthesis Methods , 7 (1): 55–79, doi : 10.1002/jrsm.1164 , PMC 4950030 , PMID 26332144
- ^ ab Röver, C.; Bender, R.; Dias, S.; Schmid, CH; Schmidli, H.; Sturtz, S.; Weber, S.; Friede, T. (2021), «О слабоинформативных априорных распределениях для параметра гетерогенности в байесовском метаанализе случайных эффектов», Research Synthesis Methods , 12 (4): 448–474, arXiv : 2007.08352 , doi : 10.1002/jrsm.1475, PMID 33486828, S2CID 220546288
- ^ Фриде, Т.; Рёвер, К.; Вандель, С.; Нойеншвандер, Б. (2017), «Метаанализ нескольких небольших исследований по орфанным заболеваниям», Research Synthesis Methods , 8 (1): 79–91, arXiv : 1601.06533 , doi : 10.1002/jrsm.1217, PMC 5347842 , PMID 27362487
- ^ Хиггинс, Дж. П. Т.; Томпсон, С. Г.; Дикс, Дж. Дж.; Альтман, Д. Г. (2003), «Измерение непоследовательности в метаанализах», BMJ , 327 (7414): 557–560, doi : 10.1136/bmj.327.7414.557, PMC 192859 , PMID 12958120
- ^ Рюккер, Г.; Шварцер, Г.; Карпентер, Дж. Р.; Шумахер, М. (2008), «Чрезмерная зависимость от I² при оценке гетерогенности может ввести в заблуждение», BMC Medical Research Methodology , 8 (79): 79, doi : 10.1186/1471-2288-8-79 , PMC 2648991 , PMID 19036172
- ^ Боренштейн, М.; Хиггинс, Дж. П. Т.; Хеджес, Л. В.; Ротштейн, Х. Р. (2017), «Основы метаанализа: I² не является абсолютной мерой гетерогенности» (PDF) , Research Synthesis Methods , 8 (1): 5–18, doi : 10.1002/jrsm.1230, hdl : 1983/9cea2307-8e9b-4583-9403-3a37409ed1cb , PMID 28058794, S2CID 4235538
- ^ Chiolero, A; Santschi, V.; Burnand, B.; Platt, RW; Paradis, G. (2012), «Метаанализы: с доверительными или прогностическими интервалами?» (PDF) , Европейский журнал эпидемиологии , 27 (10): 823–5, doi :10.1007/s10654-012-9738-y, PMID 23070657, S2CID 20413290
- ^ Бендер, Р.; Кусс, О.; Кох, А.; Швенке, К.; Хаушке, Д. (2014), Применение интервалов прогнозирования в метаанализе со случайными эффектами (PDF) , Совместное заявление IQWiG , GMDS и IBS-DR
- ^ IntHout, J; Ioannidis, JPA; Rovers, MM; Goeman, JJ (2016), «Призыв к рутинному представлению интервалов прогнозирования в метаанализе» (PDF) , BMJ Open , 6 (7): e010247, doi : 10.1136/bmjopen-2015-010247 , PMC 4947751 , PMID 27406637
Дальнейшее чтение
- Боренштейн, М.; Хеджес, Л. В.; Хиггинс, Дж. П. Т.; Ротштейн, Х. Р. (2010), «Базовое введение в модели с фиксированными и случайными эффектами для метаанализа», Research Synthesis Methods , 1 (2): 97–111, doi :10.1002/jrsm.12, PMID 26061376, S2CID 1040498
- Флейсс, Дж. Л. (1993), «Статистическая основа метаанализа», Статистические методы в медицинских исследованиях , 2 (2): 121–145, doi : 10.1177/096228029300200202, PMID 8261254, S2CID 121128494
- Хиггинс, Дж. П. Т.; Томас, Дж.; Чендлер, Дж.; Кампстон, М.; Ли, Т.; Пейдж, М. Дж.; Уэлч, В. А. (2019), Кокрейновское руководство по систематическим обзорам вмешательств (2-е изд.), Wiley Blackwell, ISBN 9781119536611
- Мостеллер, Ф.; Колдитц, ГА (1996), «Понимание исследовательского синтеза (метаанализ)», Ежегодный обзор общественного здравоохранения , 17 : 1–23, doi : 10.1146/annurev.pu.17.050196.000245 , PMID 8724213
- Саттон, А. Дж.; Абрамс, К. Р.; Джонс, Д. Р. (2001), «Иллюстрированное руководство по методам метаанализа», Журнал оценки в клинической практике , 7 (2): 135–148, doi : 10.1046/j.1365-2753.2001.00281.x, PMID 11489039