Статистический метод, который суммирует и/или интегрирует данные из нескольких источников.
Метаанализ — это метод синтеза количественных данных из нескольких независимых исследований, посвященных общему исследовательскому вопросу. Важная часть этого метода включает вычисление объединенного размера эффекта по всем исследованиям. Таким образом, этот статистический подход включает извлечение размеров эффекта и мер дисперсии из различных исследований. Объединяя эти размеры эффекта, статистическая мощность улучшается и может разрешить неопределенности или расхождения, обнаруженные в отдельных исследованиях. Метаанализы являются неотъемлемой частью поддержки заявок на исследовательские гранты, формирования руководств по лечению и влияния на политику здравоохранения. Они также играют ключевую роль в обобщении существующих исследований для руководства будущими исследованиями, тем самым закрепляя их роль в качестве фундаментальной методологии в метанауке . Метаанализы часто, но не всегда, являются важными компонентами систематического обзора .
История
Термин «метаанализ» был придуман в 1976 году статистиком Джином Глассом , [1] [2], который заявил, что «метаанализ относится к анализу анализов» . [3] Работа Гласса была направлена на описание агрегированных мер взаимосвязей и эффектов. [4] Хотя Глассу приписывают авторство первого современного метаанализа, статья, опубликованная в 1904 году статистиком Карлом Пирсоном в British Medical Journal [5], сопоставила данные из нескольких исследований прививки от брюшного тифа и считается первым случаем использования метааналитического подхода для агрегирования результатов нескольких клинических исследований. [6] [7] Можно найти множество других примеров ранних метаанализов, включая тестирование профессиональной пригодности, [8] [9] и сельское хозяйство. [10]
Первая модель метаанализа была опубликована в 1978 году по эффективности результатов психотерапии Мэри Ли Смит и Джин Гласс . [2] [11] После публикации их статьи возникла критика полезности и обоснованности метаанализа как инструмента для синтеза доказательств. Первым примером этого был Хан Айзенк , который в статье 1978 года в ответ на работу, проделанную Мэри Ли Смит и Джин Гласс, назвал метаанализ «упражнением в мегаглупости». [12] [13] Позже Айзенк будет называть метаанализ «статистической алхимией». [14] Несмотря на эту критику, использование метаанализа только возросло с момента его современного введения. К 1991 году было опубликовано 334 метаанализа; [13] это число выросло до 9 135 к 2014 году. [1] [15]
Область метаанализа значительно расширилась с 1970-х годов и затрагивает множество дисциплин, включая психологию, медицину и экологию. [1] Кроме того, недавнее создание сообществ по синтезу доказательств увеличило перекрестное опыление идей, методов и создание программных инструментов в разных дисциплинах. [16] [17] [18]
Поиск литературы
Одним из важнейших этапов метаанализа является сбор данных. Для эффективного поиска в базе данных необходимо определить соответствующие ключевые слова и пределы поиска. [19] Использование булевых операторов и пределов поиска может помочь в поиске литературы. [20] [21] Доступно несколько баз данных (например, PubMed, Embase, PsychInfo), однако исследователь должен сам выбрать наиболее подходящие источники для своей области исследования. [22] Действительно, многие ученые используют дублирующиеся поисковые термины в двух или более базах данных, чтобы охватить несколько источников. [23] Списки ссылок на подходящие исследования также можно искать для подходящих исследований (т. е. снежный ком). [24] Первоначальный поиск может вернуть большой объем исследований. [24] Довольно часто аннотация или название рукописи показывают, что исследование не подходит для включения на основании заранее указанных критериев. [22] Эти исследования можно отбросить. Однако, если окажется, что исследование может быть подходящим (или даже если есть некоторые сомнения), полную статью можно сохранить для более тщательного изучения. Списки ссылок подходящих статей также можно искать для любых соответствующих статей. [23] [25] Эти результаты поиска должны быть детализированы в диаграмме потока PRIMSA [26], которая детализирует поток информации на всех этапах обзора. Таким образом, важно отметить, сколько исследований было возвращено после использования указанных поисковых терминов и сколько из этих исследований было отклонено, и по какой причине. [22] Поисковые термины и стратегия должны быть достаточно конкретными, чтобы читатель мог воспроизвести поиск. [27] Также следует указать диапазон дат исследований, а также дату (или период дат), когда был проведен поиск. [28]
Форма сбора данных предоставляет стандартизированные средства сбора данных из соответствующих исследований. [29] Для метаанализа корреляционных данных информация о размере эффекта обычно собирается в виде статистики r Пирсона. [30] [31] Частичные корреляции часто сообщаются в исследованиях, однако они могут преувеличивать отношения по сравнению с корреляциями нулевого порядка. [32] Более того, частично исключенные переменные, вероятно, будут различаться от исследования к исследованию. Как следствие, многие метаанализы исключают частичные корреляции из своего анализа. [22] В качестве последнего средства можно использовать оцифровщики графиков для извлечения точек данных из диаграмм рассеяния (если они доступны) для расчета r Пирсона . [33] [34] Также следует собирать данные, сообщающие важные характеристики исследования, которые могут смягчать эффекты, такие как средний возраст участников. [35] В эти формы также может быть включена мера качества исследования для оценки качества доказательств из каждого исследования. [36] Существует более 80 инструментов для оценки качества и риска смещения в наблюдательных исследованиях, отражающих разнообразие исследовательских подходов в разных областях. [36] [37] [38] Эти инструменты обычно включают оценку того, как измерялись зависимые переменные, соответствующий выбор участников и соответствующий контроль за сопутствующими факторами. Другие меры качества, которые могут быть более релевантными для корреляционных исследований, включают размер выборки, психометрические свойства и отчетность о методах. [22]
Последнее соображение заключается в том, следует ли включать исследования из серой литературы, [39] которая определяется как исследование, которое не было официально опубликовано. [40] Этот тип литературы включает в себя тезисы конференций, [41] диссертации, [42] и препринты. [43] Хотя включение серой литературы снижает риск предвзятости публикации, методологическое качество работы часто (но не всегда) ниже, чем у официально опубликованной работы. [44] [45] Отчеты из трудов конференций, которые являются наиболее распространенным источником серой литературы, [46] плохо представлены [47], а данные в последующей публикации часто непоследовательны, при этом различия наблюдаются почти в 20% опубликованных исследований. [48]
Методы и предположения
Подходы
В целом, при проведении метаанализа можно выделить два типа доказательств: данные индивидуальных участников (IPD) и совокупные данные (AD). [49] Совокупные данные могут быть прямыми или косвенными.
AD более доступен (например, из литературы) и обычно представляет собой сводные оценки, такие как отношение шансов [50] или относительные риски. [51] Это может быть напрямую синтезировано в концептуально схожих исследованиях с использованием нескольких подходов. С другой стороны, косвенные совокупные данные измеряют эффект двух видов лечения, каждое из которых сравнивалось с аналогичной контрольной группой в метаанализе. Например, если лечение A и лечение B напрямую сравнивались с плацебо в отдельных метаанализах, мы можем использовать эти два объединенных результата, чтобы получить оценку эффектов A против B в косвенном сравнении как эффект A против плацебо минус эффект B против плацебо.
Доказательства IPD представляют собой необработанные данные, собранные исследовательскими центрами. Это различие вызвало необходимость в различных методах метаанализа, когда требуется синтез доказательств, и привело к разработке одноэтапных и двухэтапных методов. [52] В одноэтапных методах IPD из всех исследований моделируется одновременно с учетом кластеризации участников в рамках исследований. Двухэтапные методы сначала вычисляют сводную статистику для AD из каждого исследования, а затем вычисляют общую статистику как средневзвешенное значение статистики исследования. Уменьшая IPD до AD, двухэтапные методы также могут применяться, когда доступен IPD; это делает их привлекательным выбором при выполнении метаанализа. Хотя традиционно считается, что одноэтапные и двухэтапные методы дают схожие результаты, недавние исследования показали, что иногда они могут приводить к разным выводам. [53] [54]
Статистические модели для агрегированных данных
Модель с фиксированным эффектом
Модель с фиксированными эффектами обеспечивает средневзвешенное значение ряда оценок исследования. [55] Обратное значение дисперсии оценок обычно используется в качестве веса исследования, так что более крупные исследования, как правило, вносят больший вклад в средневзвешенное значение, чем более мелкие исследования. [56] Следовательно, когда исследования в рамках метаанализа доминируют в очень крупном исследовании, результаты более мелких исследований практически игнорируются. [57] Самое главное, что модель с фиксированными эффектами предполагает, что все включенные исследования изучают одну и ту же популяцию, используют одни и те же определения переменных и результатов и т. д. [58] Это предположение, как правило, нереалистично, поскольку исследования часто подвержены нескольким источникам гетерогенности . [59] [60]
Если мы начнем с набора независимых оценок размера эффекта, каждая оценка соответствующего размера эффекта, мы можем предположить, что где обозначает наблюдаемый эффект в -ом исследовании, соответствующий (неизвестный) истинный эффект, является ошибкой выборки, и . Таким образом, предполагается, что ' являются несмещенными и нормально распределенными оценками их соответствующих истинных эффектов. Дисперсии выборки (т.е. значения) предполагаются известными. [61]
Модель случайных эффектов
Большинство метаанализов основаны на наборах исследований, которые не совсем идентичны по своим методам и/или характеристикам включенных образцов. [61] Различия в методах и характеристиках образцов могут вносить изменчивость («гетерогенность») среди истинных эффектов. [61] [62] Один из способов моделирования гетерогенности — рассматривать ее как чисто случайную. Вес, который применяется в этом процессе взвешенного усреднения с метаанализом случайных эффектов, достигается в два этапа: [63]
Шаг 1: Взвешивание обратной дисперсии
Шаг 2: Освобождение от веса обратной дисперсии путем применения компонента дисперсии случайных эффектов (REVC), который просто выводится из степени изменчивости размеров эффектов базовых исследований.
Это означает, что чем больше эта изменчивость в размерах эффектов (иначе называемая гетерогенностью ), тем больше невзвешивание, и это может достичь точки, когда результат метаанализа случайных эффектов становится просто невзвешенным средним размером эффекта по всем исследованиям. В другом крайнем случае, когда все размеры эффектов схожи (или изменчивость не превышает ошибку выборки), REVC не применяется, и метаанализ случайных эффектов по умолчанию становится просто метаанализом фиксированных эффектов (только обратное взвешивание дисперсии).
Степень этого изменения зависит исключительно от двух факторов: [64]
Неоднородность точности
Неоднородность величины эффекта
Поскольку ни один из этих факторов автоматически не указывает на ошибочное более крупное исследование или более надежные более мелкие исследования, перераспределение весов в рамках этой модели не будет иметь отношения к тому, что эти исследования на самом деле могут предложить. Действительно, было продемонстрировано, что перераспределение весов происходит просто в одном направлении от более крупных к более мелким исследованиям по мере увеличения неоднородности до тех пор, пока в конечном итоге все исследования не будут иметь равный вес, и дальнейшее перераспределение станет невозможным. [64]
Другая проблема с моделью случайных эффектов заключается в том, что наиболее часто используемые доверительные интервалы, как правило, не сохраняют свою вероятность покрытия выше указанного номинального уровня и, таким образом, существенно занижают статистическую погрешность и потенциально чрезмерно уверены в своих выводах. [65] [66] Было предложено несколько исправлений [67] [68], но дебаты продолжаются. [66] [69] Еще одна проблема заключается в том, что средний эффект лечения иногда может быть даже менее консервативным по сравнению с моделью фиксированного эффекта [70] и, следовательно, вводить в заблуждение на практике. Одно из предложенных интерпретационных исправлений заключается в создании интервала прогнозирования вокруг оценки случайных эффектов для отображения диапазона возможных эффектов на практике. [71] Однако предположение, лежащее в основе расчета такого интервала прогнозирования, заключается в том, что испытания считаются более или менее однородными образованиями, а включенные популяции пациентов и методы сравнительного лечения следует считать взаимозаменяемыми [72], а на практике это обычно недостижимо.
Существует много методов, используемых для оценки дисперсии между исследованиями, при этом оценка ограниченного максимального правдоподобия является наименее подверженной смещению и одной из наиболее часто используемых. [73] Существует несколько передовых итеративных методов для вычисления дисперсии между исследованиями, включая как методы максимального правдоподобия, так и методы ограниченного максимального правдоподобия, а модели случайных эффектов, использующие эти методы, можно запускать на нескольких программных платформах, включая Excel, [74] Stata, [75] SPSS, [76] и R. [61]
Большинство метаанализов включают от 2 до 4 исследований, и такая выборка чаще всего недостаточна для точной оценки гетерогенности . Таким образом, кажется, что в небольших метаанализах получается неверная нулевая оценка дисперсии между исследованиями, что приводит к ложному предположению об однородности. В целом, кажется, что гетерогенность постоянно недооценивается в метаанализах, и анализы чувствительности, в которых предполагаются высокие уровни гетерогенности, могут быть информативными. [77] Эти модели случайных эффектов и программные пакеты, упомянутые выше, относятся к метаанализам совокупности исследований, и исследователям, желающим провести метаанализ данных отдельных пациентов (IPD), необходимо учитывать подходы моделирования смешанных эффектов. [78] /
Модель качественных эффектов
Первоначально модель эффектов качества представили Дои и Талиб. [79] Они [80] представили новый подход к корректировке изменчивости между исследованиями, включив вклад дисперсии из-за соответствующего компонента (качества) в дополнение к вкладу дисперсии из-за случайной ошибки, который используется в любой модели метаанализа фиксированных эффектов для генерации весов для каждого исследования. Сила метаанализа эффектов качества заключается в том, что он позволяет использовать имеющиеся методологические доказательства вместо субъективных случайных эффектов и, таким образом, помогает закрыть разрушительный разрыв, который образовался между методологией и статистикой в клинических исследованиях. Для этого вычисляется синтетическая дисперсия смещения на основе информации о качестве для корректировки весов обратной дисперсии, и вводится скорректированный по качеству вес i- го исследования. [79] Затем эти скорректированные веса используются в метаанализе. Другими словами, если исследование i хорошего качества, а другие исследования плохого качества, часть их скорректированных по качеству весов математически перераспределяется в исследование i, придавая ему больший вес по отношению к общему размеру эффекта. По мере того, как исследования становятся все более схожими по качеству, перераспределение становится все меньше и прекращается, когда все исследования имеют одинаковое качество (в случае одинакового качества модель эффектов качества по умолчанию соответствует модели IVhet – см. предыдущий раздел). Недавняя оценка модели эффектов качества (с некоторыми обновлениями) показывает, что, несмотря на субъективность оценки качества, производительность (MSE и истинная дисперсия при моделировании) превосходит ту, которая достигается с помощью модели случайных эффектов. [81] [82] Таким образом, эта модель заменяет несостоятельные интерпретации, которые изобилуют в литературе, и доступно программное обеспечение для дальнейшего изучения этого метода. [83]
Методы сетевого метаанализа
Методы метаанализа косвенных сравнений (также называемые сетевыми метаанализами, в частности, когда одновременно оцениваются несколько видов лечения) обычно используют две основные методологии. [84] [85] Во-первых, это метод Бухера [86] , который представляет собой однократное или многократное сравнение замкнутого цикла из трех видов лечения, так что один из них является общим для двух исследований и образует узел, где цикл начинается и заканчивается. Поэтому для сравнения нескольких видов лечения необходимы множественные сравнения по два (циклы из трех видов лечения). Эта методология требует, чтобы испытания с более чем двумя группами имели только две выбранные группы, поскольку требуются независимые попарные сравнения. Альтернативная методология использует сложное статистическое моделирование для включения испытаний с несколькими группами и сравнений одновременно между всеми конкурирующими видами лечения. Они были выполнены с использованием байесовских методов, смешанных линейных моделей и подходов метарегрессии. [ необходима цитата ]
Байесовская структура
Определение модели метаанализа байесовской сети включает написание модели направленного ациклического графа (DAG) для программного обеспечения общего назначения Монте-Карло на основе цепей Маркова (MCMC), такого как WinBUGS. [87] Кроме того, для ряда параметров должны быть указаны априорные распределения, а данные должны быть предоставлены в определенном формате. [87] Вместе DAG, априорные распределения и данные образуют байесовскую иерархическую модель. Чтобы еще больше усложнить ситуацию, из-за природы оценки MCMC необходимо выбрать сверхдисперсные начальные значения для ряда независимых цепей, чтобы можно было оценить сходимость. [88] Недавно было разработано несколько пакетов программного обеспечения R для упрощения подгонки модели (например, metaBMA [89] и RoBMA [90] ) и даже реализовано в статистическом программном обеспечении с графическим пользовательским интерфейсом ( GUI ): JASP . Хотя сложность байесовского подхода ограничивает использование этой методологии, недавние учебные статьи пытаются повысить доступность методов. [91] [92] Была предложена методология автоматизации этого метода [87], но она требует, чтобы были доступны данные о результатах на уровне группы, а это обычно недоступно. Иногда делаются большие заявления о присущей байесовской структуре способности обрабатывать сетевой метаанализ и ее большей гибкости. Однако этот выбор реализации структуры для вывода, байесовский или частотный, может быть менее важным, чем другие выборы относительно моделирования эффектов [93] (см. обсуждение моделей выше).
Частотная многомерная структура
С другой стороны, частотные многомерные методы включают приближения и предположения, которые не указаны явно или не проверены при применении методов (см. обсуждение моделей метаанализа выше). Например, пакет mvmeta для Stata позволяет проводить сетевой метаанализ в частотном фреймворке. [94] Однако, если в сети нет общего компаратора, то это должно быть обработано путем дополнения набора данных вымышленными плечами с высокой дисперсией, что не очень объективно и требует решения относительно того, что составляет достаточно высокую дисперсию. [87] Другая проблема заключается в использовании модели случайных эффектов как в этом частотном фреймворке, так и в байесовском фреймворке. Сенн советует аналитикам быть осторожными при интерпретации анализа «случайных эффектов», поскольку допускается только один случайный эффект, но можно предусмотреть много. [93] Сенн продолжает говорить, что довольно наивно, даже в случае, когда сравниваются только два метода лечения, предполагать, что анализ случайных эффектов учитывает всю неопределенность относительно того, как эффекты могут меняться от испытания к испытанию. Более новые модели метаанализа, такие как те, что обсуждались выше, безусловно, помогли бы облегчить эту ситуацию и были реализованы в следующей структуре.
Обобщенная структура парного моделирования
Подход, который был опробован с конца 1990-х годов, представляет собой реализацию множественного трехкомпонентного анализа замкнутого цикла. Это не было популярным, поскольку процесс быстро становится подавляющим по мере увеличения сложности сети. Развитие в этой области затем было прекращено в пользу байесовского и многомерного частотного методов, которые появились в качестве альтернатив. Совсем недавно автоматизация трехкомпонентного метода замкнутого цикла была разработана для сложных сетей некоторыми исследователями [74] как способ сделать эту методологию доступной для основного исследовательского сообщества. Это предложение ограничивает каждое испытание двумя вмешательствами, но также вводит обходной путь для испытаний с несколькими группами: другой фиксированный контрольный узел может быть выбран в разных запусках. Он также использует надежные методы метаанализа, так что многие из проблем, выделенных выше, избегаются. Требуются дальнейшие исследования вокруг этой структуры, чтобы определить, действительно ли она превосходит байесовскую или многомерную частотную структуру. Исследователи, желающие попробовать это, имеют доступ к этой структуре через бесплатное программное обеспечение. [83]
Специализированный метаанализ
Другая форма дополнительной информации исходит из предполагаемой настройки. Если целевая настройка для применения результатов метаанализа известна, то может быть возможным использовать данные из настройки для адаптации результатов, таким образом создавая «адаптированный метаанализ»., [95] [96] Это использовалось в метаанализах точности теста, где эмпирические знания о положительном показателе теста и распространенности использовались для получения области в пространстве рабочей характеристики приемника (ROC), известной как «применимая область». Затем исследования выбираются для целевой настройки на основе сравнения с этой областью и агрегируются для получения сводной оценки, которая адаптирована к целевой настройке.
Агрегирование IPD и AD
Метаанализ также может применяться для объединения IPD и AD. Это удобно, когда исследователи, проводящие анализ, имеют собственные необработанные данные при сборе совокупных или сводных данных из литературы. Обобщенная интеграционная модель (GIM) [97] является обобщением метаанализа. Она позволяет, чтобы модель, подобранная на основе данных отдельных участников (IPD), отличалась от тех, которые использовались для вычисления совокупных данных (AD). GIM можно рассматривать как метод калибровки модели для интеграции информации с большей гибкостью.
Проверка результатов метаанализа
Оценка метаанализа представляет собой средневзвешенное значение по всем исследованиям, и когда есть неоднородность , это может привести к тому, что сводная оценка не будет репрезентативной для отдельных исследований. Качественная оценка первичных исследований с использованием установленных инструментов может выявить потенциальные смещения, [98] [99], но не количественно определяет совокупное влияние этих смещений на сводную оценку. Хотя результат метаанализа можно сравнить с независимым перспективным первичным исследованием, такая внешняя проверка часто нецелесообразна. Это привело к разработке методов, которые используют форму перекрестной проверки с исключением одного , иногда называемую внутренней-внешней перекрестной проверкой (IOCV). [100] Здесь каждое из k включенных исследований по очереди опускается и сравнивается с суммарной оценкой, полученной путем агрегирования оставшихся k-1 исследований. Была разработана общая статистика проверки, Vn, основанная на IOCV, для измерения статистической достоверности результатов метаанализа. [101] Для точности теста и прогнозирования, особенно при наличии многомерных эффектов, были также предложены другие подходы, направленные на оценку ошибки прогнозирования. [102]
Вызовы
Метаанализ нескольких небольших исследований не всегда предсказывает результаты одного большого исследования. [103] Некоторые утверждают, что слабость метода заключается в том, что источники смещения не контролируются методом: хороший метаанализ не может исправить плохой дизайн или смещение в исходных исследованиях. [104] Это означало бы, что только методологически обоснованные исследования должны быть включены в метаанализ, практика, называемая «лучшим синтезом доказательств». [104] Другие метааналитики включали бы более слабые исследования и добавляли бы предикторную переменную на уровне исследования, которая отражает методологическое качество исследований, чтобы изучить влияние качества исследования на размер эффекта. [105] Однако другие утверждали, что лучший подход — сохранить информацию о дисперсии в выборке исследования, забрасывая как можно более широкую сеть, и что методологические критерии отбора вносят нежелательную субъективность, сводя на нет цель подхода. [106] Совсем недавно, под влиянием стремления к открытым практикам в науке, были разработаны инструменты для разработки «краудсорсинговых» живых метаанализов, которые обновляются сообществами ученых [107] [108] в надежде сделать все субъективные выборы более явными.
Предвзятость публикации: проблема картотечного ящика
Еще одной потенциальной ловушкой является опора на имеющийся массив опубликованных исследований, что может привести к преувеличенным результатам из-за предвзятости публикации , [109] поскольку исследования, которые показывают отрицательные результаты или незначительные результаты, с меньшей вероятностью будут опубликованы. [110] Например, известно, что фармацевтические компании скрывают отрицательные исследования [111] , а исследователи могли пропустить неопубликованные исследования, такие как диссертационные исследования или тезисы конференций, которые не были опубликованы. [112] Эту проблему нелегко решить, поскольку невозможно узнать, сколько исследований остались незарегистрированными. [113] [114]
Эта проблема ящика для хранения файлов, характеризующаяся тем, что отрицательные или незначительные результаты спрятаны в шкафу, может привести к предвзятому распределению размеров эффекта, тем самым создавая серьезную ошибку базовой ставки , в которой значимость опубликованных исследований переоценивается, поскольку другие исследования либо не были представлены для публикации, либо были отклонены. Это следует серьезно учитывать при интерпретации результатов метаанализа. [113] [115]
Распределение размеров эффекта можно визуализировать с помощью воронкообразной диаграммы , которая (в наиболее распространенной версии) представляет собой диаграмму рассеяния стандартной ошибки в зависимости от размера эффекта. [116] Она использует тот факт, что меньшие исследования (следовательно, большие стандартные ошибки) имеют больший разброс величины эффекта (будучи менее точными), в то время как более крупные исследования имеют меньший разброс и образуют кончик воронки. Если многие отрицательные исследования не были опубликованы, оставшиеся положительные исследования приводят к воронкообразной диаграмме, в которой основание скошено в одну сторону (асимметрия воронкообразной диаграммы). Напротив, когда нет смещения публикации, эффект меньших исследований не имеет причин быть скошенным в одну сторону, и поэтому получается симметричная воронкообразная диаграмма. Это также означает, что если нет смещения публикации, не будет никакой связи между стандартной ошибкой и размером эффекта. [117] Отрицательная или положительная связь между стандартной ошибкой и размером эффекта будет означать, что меньшие исследования, которые обнаружили эффекты только в одном направлении, с большей вероятностью будут опубликованы и/или представлены для публикации.
Помимо визуальной воронкообразной диаграммы, также были предложены статистические методы обнаружения публикационной предвзятости. [114] Они являются спорными, поскольку обычно имеют низкую мощность для обнаружения предвзятости, но также могут давать ложноположительные результаты при некоторых обстоятельствах. [118] Например, небольшие эффекты исследования (предвзятые меньшие исследования), в которых существуют методологические различия между меньшими и большими исследованиями, могут вызывать асимметрию в размерах эффекта, которая напоминает публикационную предвзятость. Однако небольшие эффекты исследования могут быть столь же проблематичны для интерпретации метаанализов, и авторам метаанализа необходимо исследовать потенциальные источники предвзятости. [119]
Проблема предвзятости публикации не является тривиальной, поскольку предполагается, что 25% метаанализов в психологических науках могли страдать от предвзятости публикации. [120] Однако низкая мощность существующих тестов и проблемы с визуальным представлением воронкообразного графика остаются проблемой, и оценки предвзятости публикации могут оставаться ниже тех, которые существуют на самом деле.
Большинство обсуждений предвзятости публикации сосредоточены на журнальных практиках, благоприятствующих публикации статистически значимых результатов. Однако сомнительные исследовательские практики, такие как переработка статистических моделей до тех пор, пока не будет достигнута значимость, также могут благоприятствовать статистически значимым результатам в поддержку гипотез исследователей. [121] [122]
Проблемы, связанные с исследованиями, не сообщающими о статистически значимых эффектах
Исследования часто не сообщают об эффектах, когда они не достигают статистической значимости. [123] Например, они могут просто сказать, что группы не показали статистически значимых различий, не сообщая никакой другой информации (например, статистику или p-значение). [124] Исключение этих исследований привело бы к ситуации, аналогичной публикационной ошибке, но их включение (предполагая нулевые эффекты) также привело бы к смещению метаанализа.
Проблемы, связанные со статистическим подходом
Другие недостатки заключаются в том, что не было определено, является ли наиболее статистически точным методом объединения результатов фиксированная, IVhet, случайная или модель с эффектом качества, хотя критика в адрес модели случайных эффектов усиливается из-за восприятия того, что новые случайные эффекты (используемые в метаанализе) по сути являются формальными устройствами для облегчения сглаживания или сжатия, а прогнозирование может быть невозможным или нецелесообразным. [ 125] Основная проблема подхода случайных эффектов заключается в том, что он использует классическую статистическую идею создания «компромиссной оценки», которая делает веса близкими к естественно взвешенной оценке, если неоднородность между исследованиями велика, но близкими к обратной дисперсии взвешенной оценки, если неоднородность между исследованиями мала. Однако то, что было проигнорировано, — это различие между моделью, которую мы выбираем для анализа данного набора данных, и механизмом, с помощью которого данные появились . [126] Случайный эффект может присутствовать в любой из этих ролей, но эти две роли совершенно различны. Нет никаких оснований полагать, что модель анализа и механизм генерации данных (модель) похожи по форме, но многие подобласти статистики выработали привычку предполагать, для теории и моделирования, что механизм генерации данных (модель) идентичен модели анализа, которую мы выбираем (или хотели бы, чтобы выбрали другие). Как предполагаемый механизм для получения данных, модель случайного эффекта для метаанализа глупа, и более уместно думать об этой модели как о поверхностном описании и чем-то, что мы выбираем в качестве аналитического инструмента – но этот выбор для метаанализа может не сработать, потому что эффекты исследования являются фиксированной характеристикой соответствующего метаанализа, а распределение вероятностей является только описательным инструментом. [126]
Проблемы, возникающие из-за предвзятости повестки дня
Наиболее серьезная ошибка в метаанализе часто возникает, когда человек или люди, проводящие метаанализ, имеют экономические , социальные или политические цели, такие как принятие или отклонение законодательства . [127] Люди с такими целями могут быть более склонны злоупотреблять метаанализом из-за личной предвзятости . Например, исследователи, благоприятствующие целям автора, скорее всего, будут выбирать свои исследования , в то время как те, кто не благоприятствует, будут игнорироваться или помечаться как «не заслуживающие доверия». Кроме того, сами благоприятствующие авторы могут быть предвзятыми или получать плату за получение результатов, которые поддерживают их общие политические, социальные или экономические цели, такими способами, как выбор небольших благоприятных наборов данных и не включение более крупных неблагоприятных наборов данных. Влияние таких предубеждений на результаты метаанализа возможно, поскольку методология метаанализа весьма гибка. [128]
Исследование 2011 года, проведенное с целью раскрытия возможных конфликтов интересов в базовых исследовательских исследованиях, используемых для медицинских метаанализов, рассмотрело 29 метаанализов и обнаружило, что конфликты интересов в исследованиях, лежащих в основе метаанализов, редко раскрывались. 29 метаанализов включали 11 из журналов общей медицины, 15 из журналов специализированной медицины и три из базы данных систематических обзоров Кокрейна . 29 метаанализов рассмотрели в общей сложности 509 рандомизированных контролируемых испытаний (РКИ). Из них 318 РКИ сообщили об источниках финансирования, причем 219 (69%) получали финансирование от промышленности (т. е. один или несколько авторов имели финансовые связи с фармацевтической промышленностью). Из 509 РКИ 132 сообщили о раскрытии конфликта интересов авторов, причем 91 исследование (69%) раскрыло, что один или несколько авторов имели финансовые связи с промышленностью. Однако эта информация редко отражалась в метаанализах. Только два (7%) сообщили об источниках финансирования РКИ, и ни один не сообщил о связях автора РКИ с промышленностью. Авторы пришли к выводу, что «без признания COI из-за финансирования промышленностью или финансовых связей автора с промышленностью от РКИ, включенных в метаанализы, понимание и оценка читателями доказательств из метаанализа могут быть скомпрометированы». [129]
Например, в 1998 году федеральный судья США установил, что Агентство по охране окружающей среды США злоупотребило процессом метаанализа, чтобы подготовить исследование, в котором утверждалось о рисках возникновения рака у некурящих людей из-за окружающего табачного дыма (ETS), с целью повлиять на политиков, чтобы они приняли законы о запрете курения на рабочих местах. [130] [131] [132]
Сопоставимость и валидность включенных исследований
Метаанализ часто не может заменить адекватно проведенное первичное исследование, особенно в биологических науках. [133]
Неоднородность используемых методов может привести к ошибочным выводам. [134] Например, различия в формах вмешательства или когортах, которые считаются незначительными или неизвестными ученым, могут привести к существенно отличающимся результатам, включая результаты, которые искажают результаты метаанализа или не учитываются должным образом в его данных. И наоборот, результаты метаанализа могут также сделать определенные гипотезы или вмешательства нежизнеспособными и предвосхитить дальнейшие исследования или одобрения, несмотря на определенные изменения, такие как прерывистое введение, персонализированные критерии и комбинированные меры , что приводит к существенно отличающимся результатам, в том числе в случаях, когда они были успешно идентифицированы и применены в мелкомасштабных исследованиях, которые рассматривались в метаанализе. [ необходима цитата ] Стандартизация , воспроизведение экспериментов , открытые данные и открытые протоколы часто не могут смягчить такие проблемы, например, поскольку соответствующие факторы и критерии могут быть неизвестны или не быть зарегистрированы. [ необходима цитата ]
Ведутся дебаты о надлежащем балансе между тестированием с как можно меньшим количеством животных или людей и необходимостью получения надежных, достоверных результатов. Утверждается, что ненадежные исследования неэффективны и расточительны, и что исследования расточительны не только тогда, когда они останавливаются слишком поздно, но и когда они останавливаются слишком рано. В крупных клинических испытаниях иногда используются запланированные последовательные анализы, если есть значительные расходы или потенциальный вред, связанный с участниками тестирования. [135] В прикладной поведенческой науке были предложены «мегаисследования» для изучения эффективности многих различных вмешательств, разработанных в междисциплинарной манере отдельными командами. [136] В одном из таких исследований использовалась фитнес-цепочка для набора большого числа участников. Было высказано предположение, что поведенческие вмешательства часто трудно сравнивать [в метаанализах и обзорах], поскольку «разные ученые тестируют разные идеи вмешательств на разных выборках, используя разные результаты в разные временные интервалы», что приводит к отсутствию сопоставимости таких индивидуальных исследований, что ограничивает «их потенциал для информирования политики ». [136]
Слабые стандарты инклюзивности приводят к ошибочным выводам
Метаанализы в образовании часто недостаточно ограничительны в отношении методологического качества исследований, которые они включают. Например, исследования, включающие небольшие выборки или меры, сделанные исследователем, приводят к завышенным оценкам размера эффекта. [137] Однако эта проблема также беспокоит метаанализ клинических испытаний. Использование различных инструментов оценки качества (QAT) приводит к включению различных исследований и получению противоречивых оценок средних эффектов лечения. [138] [139]
Применение в современной науке
Современный статистический метаанализ делает больше, чем просто объединяет размеры эффекта набора исследований с использованием взвешенного среднего. Он может проверить, показывают ли результаты исследований больше вариации, чем вариация, которая ожидается из-за выборки разного количества участников исследования. Кроме того, характеристики исследования, такие как используемый инструмент измерения, выборка популяции или аспекты дизайна исследования, могут быть закодированы и использованы для уменьшения дисперсии оценщика (см. статистические модели выше). Таким образом, некоторые методологические недостатки в исследованиях могут быть исправлены статистически. Другие применения метааналитических методов включают разработку и проверку клинических моделей прогнозирования, где метаанализ может использоваться для объединения данных отдельных участников из разных исследовательских центров и для оценки обобщаемости модели, [140] [141] или даже для агрегации существующих моделей прогнозирования. [142]
Метаанализ может быть выполнен как с использованием односубъектного, так и группового дизайна исследования. [143] Это важно, поскольку многие исследования были выполнены с использованием односубъектного дизайна исследования. [144] Существуют значительные споры о наиболее подходящей метааналитической технике для односубъектного исследования. [145]
Метаанализ приводит к смещению акцента с отдельных исследований на множественные исследования. Он подчеркивает практическую важность размера эффекта вместо статистической значимости отдельных исследований. Этот сдвиг в мышлении получил название «метааналитическое мышление». Результаты метаанализа часто показываются на графике леса .
Результаты исследований объединяются с использованием различных подходов. Один подход, часто используемый в метаанализе в исследованиях здравоохранения, называется « метод обратной дисперсии ». Средний размер эффекта во всех исследованиях вычисляется как взвешенное среднее , при этом веса равны обратной дисперсии оценки эффекта каждого исследования. Более крупным исследованиям и исследованиям с меньшими случайными вариациями придается больший вес, чем более мелким исследованиям. Другие распространенные подходы включают метод Мантеля–Хензеля [146] и метод Пето . [147]
Картирование на основе семян (ранее знаковое дифференциальное картирование, SDM) — это статистический метод для метаанализа исследований различий в активности или структуре мозга, в которых используются методы нейровизуализации, такие как фМРТ, ВБМ или ПЭТ.
Различные высокопроизводительные методы, такие как микрочипы, использовались для понимания экспрессии генов . Профили экспрессии микроРНК использовались для идентификации дифференциально экспрессируемых микроРНК в определенном типе клеток или тканей или состояниях заболевания или для проверки эффекта лечения. Был проведен метаанализ таких профилей экспрессии для получения новых выводов и подтверждения известных результатов. [148]
Метаанализ исследований по секвенированию всего генома представляет собой привлекательное решение проблемы сбора больших выборок для обнаружения редких вариантов, связанных со сложными фенотипами. Были разработаны некоторые методы, позволяющие проводить функционально обоснованный метаанализ ассоциаций редких вариантов в когортах масштаба биобанка, используя эффективные подходы для хранения сводной статистики. [149]
Охватывающие метаанализы также могут использоваться для оценки сети эффектов. Это позволяет исследователям изучать закономерности в более полной панораме более точно оцененных результатов и делать выводы, которые учитывают более широкий контекст (например, как отношения личности и интеллекта варьируются в зависимости от семейства черт). [150]
В данной статье использован текст Дэниела С. Кинтаны, доступный по лицензии CC BY 4.0.
В данной статье использован текст Вольфганга Фихтбауэра, доступный по лицензии CC BY 3.0.
Ссылки
^ abc Shadish WR, Lecy JD (сентябрь 2015 г.). «Метааналитический большой взрыв». Research Synthesis Methods . 6 (3): 246–264. doi :10.1002/jrsm.1132. PMID 26212600. S2CID 5416879.
^ ab Glass GV (сентябрь 2015 г.). «Метаанализ в среднем возрасте: личная история». Research Synthesis Methods . 6 (3): 221–231. doi :10.1002/jrsm.1133. PMID 26355796. S2CID 30083129.
^ Glass GV (1976). «Первичный, вторичный и метаанализ исследований». Educational Researcher . 5 (10): 3–8. doi :10.3102/0013189X005010003. S2CID 3185455.
^ Хант, Мортон (1997). Как наука подводит итоги: история метаанализа (1-е изд.). Нью-Йорк, Нью-Йорк, Соединенные Штаты Америки: Фонд Рассела Сейджа.
^ «Отчет о статистике вакцинации против кишечной лихорадки». British Medical Journal . 2 (2288): 1243–1246. Ноябрь 1904 г. doi : 10.1136/bmj.2.2288.1243. PMC 2355479. PMID 20761760 .
^ Nordmann AJ, Kasenda B, Briel M (9 марта 2012 г.). «Метаанализы: что они могут и чего не могут». Swiss Medical Weekly . 142 : w13518. doi : 10.4414/smw.2012.13518 . PMID 22407741.
^ O'Rourke K (декабрь 2007 г.). «Историческая перспектива метаанализа: количественная работа с различными результатами исследований». Журнал Королевского медицинского общества . 100 (12): 579–582. doi :10.1177/0141076807100012020. PMC 2121629. PMID 18065712 .
^ Гизелли, Э. Э. (1955). Измерение профессиональной пригодности. Публикации Калифорнийского университета по психологии, 8, 101–216.
^ Гизелли, Эдвин Э. (1973). «Достоверность тестов на способности при отборе персонала». Психология персонала . 26 (4): 461–477. doi :10.1111/j.1744-6570.1973.tb01150.x. ISSN 0031-5826.
^ Йейтс, Ф.; Кохран, В. Г. (1938). «Анализ групп экспериментов». Журнал сельскохозяйственной науки . 28 (4): 556–580. doi :10.1017/S0021859600050978. ISSN 0021-8596. S2CID 86619593.
^ Смит, Мэри Л.; Гласс, Джин В. (1977). «Метаанализ исследований результатов психотерапии». American Psychologist . 32 (9): 752–760. doi :10.1037/0003-066X.32.9.752. ISSN 1935-990X. PMID 921048. S2CID 43326263.
^ Айзенк, Х. Дж. (1978). «Упражнение в мегаглупости». Американский психолог . 33 (5): 517. doi :10.1037/0003-066X.33.5.517.a. ISSN 1935-990X.
^ ab Sharpe, Donald; Poets, Sarena (2020). «Метаанализ как ответ на кризис репликации». Канадская психология / Psychologie Canadienne . 61 (4): 377–387. doi :10.1037/cap0000215. ISSN 1878-7304. S2CID 225384392.
^ Айзенк, Х. Дж. (1995). «Метаанализ или синтез лучших доказательств?». Журнал оценки в клинической практике . 1 (1): 29–36. doi :10.1111/j.1365-2753.1995.tb00005.x. ISSN 1356-1294. PMID 9238555.
^ Иоаннидис, Джон ПА (2016). «Массовое производство избыточных, вводящих в заблуждение и противоречивых систематических обзоров и метаанализов». The Milbank Quarterly . 94 (3): 485–514. doi :10.1111/1468-0009.12210. ISSN 0887-378X. PMC 5020151. PMID 27620683 .
^ Vandvik PO, Brandt L (июль 2020 г.). «Будущее серии экосистемы доказательств: экосистемы доказательств и системы обучения в области здравоохранения: зачем беспокоиться?». Журнал клинической эпидемиологии . 123 : 166–170. doi : 10.1016/j.jclinepi.2020.02.008. PMID 32145365. S2CID 212629387.
^ Картабеллотта А., Тилсон Дж. К. (июнь 2019 г.). «Экосистема доказательств не может процветать без эффективности генерации, синтеза и перевода знаний». Журнал клинической эпидемиологии . 110 : 90–95. doi : 10.1016/j.jclinepi.2019.01.008. PMID 30708174. S2CID 73415319.
^ Haddaway NR, Bannach-Brown A, Grainger MJ, Hamilton WK, Hennessy EA, Keenan C и др. (июнь 2022 г.). «Синтез доказательств и метаанализ на конференции R (ESMARConf): выравнивание игрового поля доступности и равноправия конференции». Систематические обзоры . 11 (1): 113. doi : 10.1186/s13643-022-01985-6 . PMC 9164457. PMID 35659294 .
^ Grames, Eliza M.; Stillman, Andrew N.; Tingley, Morgan W.; Elphick, Chris S. (2019). Freckleton, Robert (ред.). «Автоматизированный подход к определению поисковых терминов для систематических обзоров с использованием сетей совместного появления ключевых слов». Методы в экологии и эволюции . 10 (10): 1645–1654. Bibcode : 2019MEcEv..10.1645G. doi : 10.1111/2041-210X.13268 . ISSN 2041-210X.
^ Суд, Амит; Эрвин, Патрисия Дж.; Эбберт, Джон О. (2004). «Использование инструментов расширенного поиска в PubMed для извлечения цитат». Труды клиники Майо . 79 (10): 1295–1300. doi : 10.4065/79.10.1295 . PMID 15473412.
^ Винсент, Беатрис; Винсент, Морис; Феррейра, Карлос Хиль (1 марта 2006 г.). «Упрощение поиска в PubMed: обучение поиску медицинской литературы с помощью интерактивного решения проблем». Онколог . 11 (3): 243–251. doi : 10.1634/theoncologist.11-3-243 . ISSN 1083-7159. PMID 16549808.
^ abcde Quintana, Daniel S. (8 октября 2015 г.). «От предварительной регистрации до публикации: нетехнический учебник по проведению метаанализа для синтеза корреляционных данных». Frontiers in Psychology . 6 : 1549. doi : 10.3389/fpsyg.2015.01549 . ISSN 1664-1078. PMC 4597034. PMID 26500598 .
^ ab Bramer, Wichor M.; Giustini, Dean; de Jonge, Gerdien B.; Holland, Leslie; Bekhuis, Tanja (2016). «Дедупликация результатов поиска в базе данных для систематических обзоров в EndNote». Журнал медицинской библиотечной ассоциации . 104 (3): 240–243. doi :10.3163/1536-5050.104.3.014. ISSN 1536-5050. PMC 4915647. PMID 27366130 .
^ ab Хорсли, Таня; Дингуолл, Орви; Сэмпсон, Маргарет (10 августа 2011 г.). Группа обзора методологии Кокрейна (ред.). «Проверка списков ссылок для поиска дополнительных исследований для систематических обзоров». База данных систематических обзоров Кокрейна . 2011 (8): MR000026. doi : 10.1002 /14651858.MR000026.pub2. PMC 7388740. PMID 21833989.
^ Bramer, Wichor M.; De Jonge, Gerdien B.; Rethlefsen, Melissa L.; Mast, Frans; Kleijnen, Jos (4 октября 2018 г.). «Систематический подход к поиску: эффективный и полный метод разработки поиска литературы». Журнал медицинской библиотечной ассоциации . 106 (4): 531–541. doi :10.5195/jmla.2018.283. ISSN 1558-9439. PMC 6148622. PMID 30271302 .
^ Moher, David; Tetzlaff, Jennifer; Tricco, Andrea C; Sampson, Margaret; Altman, Douglas G (27 марта 2007 г.). Clarke, Mike (ред.). «Эпидемиология и характеристики систематических обзоров». PLOS Medicine . 4 (3): e78. doi : 10.1371/journal.pmed.0040078 . ISSN 1549-1676. PMC 1831728. PMID 17388659 .
^ Нгуен, Фи-Йен; Маккензи, Джоанн Э.; Гамильтон, Дэниел Г.; Мохер, Дэвид; Тагвелл, Питер; Фидлер, Фиона М.; Хаддавей, Нил Р.; Хиггинс, Джулиан ПТ; Канукула, Раджу; Карунанантан, Сатья; Максвелл, Лара Дж.; Макдональд, Стив; Накагава, Шиничи; Нунан, Дэвид; Уэлч, Вивиан А. (2023). «Точки зрения систематических рецензентов на обмен данными обзоров, аналитическим кодом и другими материалами: опрос». Кокрейновский синтез доказательств и методы . 1 (2). doi : 10.1002/cesm.12008 . ISSN 2832-9023.
^ Пейдж, Мэтью Дж.; Альтман, Дуглас Г.; Шамсир, Лариса; Маккензи, Джоан Э.; Ахмадзай, Надера; Вулф, Дайанна; Язди, Фатима; Катала-Лопес, Ферран; Трикко, Андреа К.; Мохер, Дэвид (2018). «Воспроизводимые исследовательские практики недостаточно используются в систематических обзорах биомедицинских вмешательств». Журнал клинической эпидемиологии . 94 : 8–18. doi :10.1016/j.jclinepi.2017.10.017. ПМИД 29113936.
^ Алоэ, Ариэль М. (2014). «Эмпирическое исследование размеров частичных эффектов в метаанализе корреляционных данных». Журнал общей психологии . 141 (1): 47–64. doi :10.1080/00221309.2013.853021. ISSN 0022-1309. PMID 24838020.
^ Tracz, Susan M.; Elmore, Patricia B.; Pohlmann, John T. (1992). «Корреляционный метаанализ: независимые и ненезависимые случаи». Educational and Psychological Measurement . 52 (4): 879–888. doi :10.1177/0013164492052004007. ISSN 0013-1644.
^ Крамер, Дункан (2003). «Поучительная история двух статистик: частичная корреляция и стандартизированная частичная регрессия». Журнал психологии . 137 (5): 507–511. doi : 10.1080/00223980309600632. ISSN 0022-3980. PMID 14629080. S2CID 37557674.
^ Гросс, Арнд; Ширм, Сибилла; Шольц, Маркус (2014). «Ycasd – инструмент для сбора и масштабирования данных из графических представлений». BMC Bioinformatics . 15 (1): 219. doi : 10.1186/1471-2105-15-219 . ISSN 1471-2105. PMC 4085079. PMID 24965054 .
^ Клише, Матье; Розенберг, Дэвид; Мадека, Друв; Йи, Конни (2017), Сеси, Микеланджело; Холлмен, Яакко; Тодоровски, Люпчо; Венс, Селин (ред.), «Scatteract: автоматизированное извлечение данных из диаграмм рассеяния», Машинное обучение и обнаружение знаний в базах данных , т. 10534, Cham: Springer International Publishing, стр. 135–150, arXiv : 1704.06687 , doi : 10.1007/978-3-319-71249-9_9, ISBN978-3-319-71248-2, S2CID 9543956 , получено 26 декабря 2023 г.
^ Моро, Дэвид; Гэмбл, Бо (2022). «Проведение метаанализа в эпоху открытой науки: инструменты, советы и практические рекомендации». Психологические методы . 27 (3): 426–432. doi :10.1037/met0000351. ISSN 1939-1463. PMID 32914999. S2CID 221619510.
^ ab МакГиннесс, Люк А.; Хиггинс, Джулиан ПТ (2021). «ВИЗУАЛИЗАЦИЯ РИСКА СМЕШЕНИЯ (robvis): пакет R и веб-приложение Shiny для визуализации оценок риска смещения». Методы синтеза исследований . 12 (1): 55–61. doi : 10.1002/jrsm.1411 . hdl : 1983/e59b578e-1534-43d9-a438-8bc27b363a9a . ISSN 1759-2879. PMID 32336025.
^ Сандерсон, С.; Татт, И. Д.; Хиггинс, Дж. П. (1 июня 2007 г.). «Инструменты оценки качества и восприимчивости к смещению в наблюдательных исследованиях в эпидемиологии: систематический обзор и аннотированная библиография». Международный журнал эпидемиологии . 36 (3): 666–676. doi : 10.1093/ije/dym018 . ISSN 0300-5771. PMID 17470488.
^ Haddaway, Neal R.; Macura, Biljana; Whaley, Paul; Pullin, Andrew S. (2018). "Стандарты отчетности ROSES для синтеза систематических доказательств: проформа, блок-схема и описательное резюме плана и проведения экологических систематических обзоров и систематических карт". Экологические доказательства . 7 (1). Bibcode : 2018EnvEv...7....7H. doi : 10.1186/s13750-018-0121-7 . ISSN 2047-2382.
^ Паез, Арсенио (2017). «Серая литература: важный ресурс в систематических обзорах». Журнал доказательной медицины . 10 (3): 233–240. doi :10.1111/jebm.12266. ISSN 1756-5383. PMID 28857505.
^ Конн, Вики С.; Валентайн, Джеффри К.; Купер, Харрис М.; Ранц, Мэрилин Дж. (2003). «Серая литература в метаанализах». Nursing Research . 52 (4): 256–261. doi :10.1097/00006199-200307000-00008. ISSN 0029-6562. PMID 12867783. S2CID 27109643.
^ Шерер, Роберта В.; Салданья, Ян Дж. (2019). «Как систематические рецензенты должны обрабатывать тезисы конференций? Взгляд с окопов». Систематические обзоры . 8 (1): 264. doi : 10.1186/s13643-019-1188-0 . ISSN 2046-4053. PMC 6836535. PMID 31699124 .
^ Хартлинг, Лиза; Фезерстоун, Робин; Нуспл, Меган; Шейв, Касси; Драйден, Донна М.; Вандермеер, Бен (2017). «Серая литература в систематических обзорах: поперечное исследование вклада неанглоязычных отчетов, неопубликованных исследований и диссертаций в результаты метаанализов в обзорах, релевантных детям». BMC Medical Research Methodology . 17 (1): 64. doi : 10.1186/s12874-017-0347-z . ISSN 1471-2288. PMC 5395863. PMID 28420349 .
^ Haddaway, NR; Woodcock, P.; Macura, B.; Collins, A. (2015). «Сделать обзоры литературы более надежными за счет применения уроков, извлеченных из систематических обзоров». Conservation Biology . 29 (6): 1596–1605. Bibcode : 2015ConBi..29.1596H. doi : 10.1111/cobi.12541. ISSN 0888-8892. JSTOR 24761072. PMID 26032263. S2CID 20624428.
^ Эггер, М.; Юни, П.; Бартлетт, К.; Холенштейн, Ф.; Стерн, Дж. (2003). «Насколько важны комплексный поиск литературы и оценка качества испытаний в систематических обзорах? Эмпирическое исследование». Оценка медицинских технологий . 7 (1): 1–82. doi : 10.3310/hta7010 . ISSN 1366-5278. PMID 12583822.
^ Лефевр, Кэрол; Гланвиль, Джули; Бриско, Саймон; Литтлвуд, Энн; Маршалл, Крис; Метцендорф, Мария-Инти; Ноэль-Сторр, Анна; Рейдер, Тамара; Шокранех, Фархад (23 сентября 2019 г.), Хиггинс, Джулиан ПТ; Томас, Джеймс; Чендлер, Жаклин; Кампстон, Миранда (ред.), «Поиск и выбор исследований», Cochrane Handbook for Systematic Reviews of Interventions (1-е изд.), Wiley, стр. 67–107, doi :10.1002/9781119536604.ch4, ISBN978-1-119-53662-8, S2CID 204603849 , получено 26 декабря 2023 г.
^ Маколи, Лора; Фам, Ба'; Тагвелл, Питер; Мохер, Дэвид (2000). «Влияет ли включение серой литературы на оценки эффективности вмешательства, сообщаемые в метаанализах?». The Lancet . 356 (9237): 1228–1231. doi :10.1016/S0140-6736(00)02786-0. PMID 11072941. S2CID 33777183.
^ Хоупвелл, Салли; Кларк, Майк (2005). «Рефераты, представленные на конференции Американского общества клинической онкологии: насколько полно представлены результаты испытаний?». Клинические испытания . 2 (3): 265–268. doi :10.1191/1740774505cn091oa. ISSN 1740-7745. PMID 16279150. S2CID 3601317.
^ Бхандари, Мохит; Деверо, П. Дж.; Гайатт, Гордон Х.; Кук, Дебора Дж.; Свионтовски, Марк Ф.; Спраг, Шейла; Шемич, Эмиль Х. (2002). «Наблюдательное исследование ортопедических рефератов и последующих полнотекстовых публикаций». Журнал костной и суставной хирургии — Американский том . 84 (4): 615–621. doi :10.2106/00004623-200204000-00017. ISSN 0021-9355. PMID 11940624. S2CID 8807106.
^ Тирни, Джейн Ф.; Фишер, Дэвид Дж.; Бердетт, Сара; Стюарт, Лесли А.; Пармар, Махеш КБ (31 января 2020 г.). Шапиро, Стивен Д. (ред.). «Сравнение подходов к совокупным и индивидуальным данным участников для метаанализа рандомизированных испытаний: наблюдательное исследование». PLOS Medicine . 17 (1): e1003019. doi : 10.1371/journal.pmed.1003019 . ISSN 1549-1676. PMC 6993967. PMID 32004320 .
^ Чанг, Бей-Хун; Хоглин, Дэвид К. (2017). «Метаанализ отношений шансов: современные передовые практики». Медицинская помощь . 55 (4): 328–335. doi :10.1097/MLR.00000000000000696. ISSN 0025-7079. PMC 5352535. PMID 28169977 .
^ Бакбергенулы, Ильяс; Хоаглин, Дэвид К.; Кулинская, Елена (2019). «Подводные камни использования отношения рисков в метаанализе». Research Synthesis Methods . 10 (3): 398–419. doi :10.1002/jrsm.1347. ISSN 1759-2879. PMC 6767076. PMID 30854785 .
^ Дебрэ Т.П., Мунс К.Г., ван Валкенхоф Г., Эфтимиу О., Хаммел Н., Гроенволд Р.Х., Рейтсма Дж.Б. (декабрь 2015 г.). «Метаанализ индивидуальных данных участников (IPD): обзор методологии». Методы синтеза исследований . 6 (4): 293–309. дои : 10.1002/jrsm.1160. ПМК 5042043 . ПМИД 26287812.
^ Debray TP, Moons KG, Abo-Zaid GM, Koffijberg H, Riley RD (2013). «Метаанализ данных отдельных участников для бинарного результата: одноэтапный или двухэтапный?». PLOS ONE . 8 (4): e60650. Bibcode : 2013PLoSO...860650D. doi : 10.1371/journal.pone.0060650 . PMC 3621872. PMID 23585842 .
^ Burke DL, Ensor J, Riley RD (февраль 2017 г.). «Метаанализ с использованием данных отдельных участников: одноэтапный и двухэтапный подходы и почему они могут различаться». Статистика в медицине . 36 (5): 855–875. doi :10.1002/sim.7141. PMC 5297998. PMID 27747915 .
^ Николакопулу, Адриани; Мавридис, Димитрис; Саланти, Джорджия (2014). «Как интерпретировать модели метаанализа: метаанализы с фиксированными и случайными эффектами». Психическое здоровье на основе фактических данных . 17 (2): 64. doi :10.1136/eb-2014-101794. ISSN 1362-0347. PMID 24778439.
^ Деккерс, Олаф М. (2018). «Метаанализ: основные характеристики, потенциалы и недоразумения». Исследования и практика тромбоза и гемостаза . 2 (4): 658–663. doi :10.1002/rth2.12153. PMC 6178740. PMID 30349883 .
^ Helfenstein U (март 2002 г.). «Данные и модели определяют предложения по лечению — иллюстрация из метаанализа». Postgraduate Medical Journal . 78 (917): 131–134. doi :10.1136/pmj.78.917.131. PMC 1742301 . PMID 11884693.
^ Деттори, Джозеф Р.; Норвелл, Дэниел К.; Чепмен, Йенс Р. (2022). «Модели с фиксированными и случайными эффектами для метаанализа: 3 момента для рассмотрения». Global Spine Journal . 12 (7): 1624–1626. doi :10.1177/21925682221110527. ISSN 2192-5682. PMC 9393987 . PMID 35723546.
^ Хеджес, Ларри В.; Вевеа, Джек Л. (1998). «Модели с фиксированными и случайными эффектами в метаанализе». Психологические методы . 3 (4): 486–504. doi :10.1037/1082-989X.3.4.486. ISSN 1939-1463. S2CID 119814256.
^ Райс, Кеннет; Хиггинс, Джулиан ПТ; Ламли, Томас (2018). «Переоценка метаанализа фиксированных эффектов». Журнал Королевского статистического общества. Серия A (Статистика в обществе) . 181 (1): 205–227. doi :10.1111/rssa.12275. ISSN 0964-1998. JSTOR 44682165.
^ abcd Фихтбауэр, Вольфганг (2010). «Проведение метаанализов в R с пакетом metafor». Журнал статистического программного обеспечения . 36 (3). doi : 10.18637/jss.v036.i03 . ISSN 1548-7660. S2CID 15798713.
^ Хольцмейстер, Феликс; Йоханнессон, Магнус; Бём, Роберт; Дребер, Анна; Хубер, Юрген; Кирхлер, Михаэль (6 августа 2024 г.). «Гетерогенность в оценках размера эффекта». Труды Национальной академии наук . 121 (32): e2403490121. doi :10.1073/pnas.2403490121. ISSN 0027-8424. PMC 11317577. PMID 39078672 .
^ Сенн С. (март 2007 г.). «Пытаясь быть точным в отношении неопределенности». Статистика в медицине . 26 (7): 1417–1430. doi : 10.1002/sim.2639 . PMID 16906552. S2CID 17764847.
^ ab Al Khalaf MM, Thalib L, Doi SA (февраль 2011 г.). «Объединение гетерогенных исследований с использованием модели случайных эффектов является ошибкой и приводит к неубедительным метаанализам». Journal of Clinical Epidemiology . 64 (2): 119–123. doi :10.1016/j.jclinepi.2010.01.009. PMID 20409685.
^ Brockwell SE, Gordon IR (март 2001 г.). «Сравнение статистических методов для метаанализа». Статистика в медицине . 20 (6): 825–840. doi :10.1002/sim.650. PMID 11252006. S2CID 16932514.
^ ab Noma H (декабрь 2011 г.). «Доверительные интервалы для метаанализа случайных эффектов на основе поправок типа Бартлетта». Статистика в медицине . 30 (28): 3304–3312. doi :10.1002/sim.4350. hdl : 2433/152046 . PMID 21964669. S2CID 6556986.
^ Brockwell SE, Gordon IR (ноябрь 2007 г.). «Простой метод вывода об общем эффекте в метаанализе». Статистика в медицине . 26 (25): 4531–4543. doi :10.1002/sim.2883. PMID 17397112. S2CID 887098.
^ Sidik K, Jonkman JN (ноябрь 2002 г.). «Простой доверительный интервал для метаанализа». Статистика в медицине . 21 (21): 3153–3159. doi :10.1002/sim.1262. PMID 12375296. S2CID 21384942.
^ Джексон Д., Боуден Дж. (январь 2009 г.). «Переоценка метода „квантильного приближения“ для метаанализа случайных эффектов». Статистика в медицине . 28 (2): 338–348. doi :10.1002/sim.3487. PMC 2991773. PMID 19016302 .
^ Poole C, Greenland S (сентябрь 1999 г.). «Метаанализ случайных эффектов не всегда консервативен». American Journal of Epidemiology . 150 (5): 469–475. doi : 10.1093/oxfordjournals.aje.a010035 . PMID 10472946.
^ Кристон Л (март 2013 г.). «Работа с клинической гетерогенностью в метаанализе. Предположения, методы, интерпретация». Международный журнал методов психиатрических исследований . 22 (1): 1–15. doi :10.1002/mpr.1377. PMC 6878481. PMID 23494781 .
^ ab "Руководство пользователя MetaXL" (PDF) . Получено 18 сентября 2018 г. .
^ Kontopantelis E, Reeves D (1 августа 2010 г.). «Metaan: метаанализ случайных эффектов». Stata Journal . 10 (3): 395–407. doi : 10.1177/1536867X1001000307 – через ResearchGate.
^ Field, Andy P.; Gillett, Raphael (2010). «Как провести метаанализ». British Journal of Mathematical and Statistical Psychology . 63 (3): 665–694. doi :10.1348/000711010X502733. PMID 20497626. S2CID 22688261.
^ Kontopantelis E, Springate DA, Reeves D (2013). Friede T (ред.). «Повторный анализ данных библиотеки Кокрейна: опасности ненаблюдаемой гетерогенности в метаанализах». PLOS ONE . 8 (7): e69930. Bibcode :2013PLoSO...869930K. doi : 10.1371/journal.pone.0069930 . PMC 3724681 . PMID 23922860.
^ Kontopantelis E, Reeves D (27 сентября 2013 г.). «Краткое руководство и команда построения лесного графика (ipdforest) для одноэтапного метаанализа». Stata Journal . 13 (3): 574–587. doi : 10.1177/1536867X1301300308 – через ResearchGate.
^ ab Doi SA, Thalib L (январь 2008 г.). «Модель качественных эффектов для метаанализа». Эпидемиология . 19 (1): 94–100. doi : 10.1097/EDE.0b013e31815c24e7 . PMID 18090860. S2CID 29723291.
^ Doi SA, Barendregt JJ, Mozurkewich EL (март 2011 г.). «Метаанализ гетерогенных клинических испытаний: эмпирический пример». Contemporary Clinical Trials . 32 (2): 288–298. doi :10.1016/j.cct.2010.12.006. PMID 21147265.
^ Doi SA, Barendregt JJ, Khan S, Thalib L, Williams GM (июль 2015 г.). «Сравнение моделирования методов качественных и случайных эффектов метаанализа». Эпидемиология . 26 (4): e42–e44. doi : 10.1097/EDE.00000000000000289 . PMID 25872162.
^ Doi SA, Barendregt JJ, Khan S, Thalib L, Williams GM (ноябрь 2015 г.). «Достижения в метаанализе гетерогенных клинических испытаний II: модель эффектов качества». Contemporary Clinical Trials . 45 (Pt A): 123–129. doi :10.1016/j.cct.2015.05.010. PMID 26003432.
^ ab "Страница программного обеспечения MetaXL". Epigear.com. 3 июня 2017 г. Получено 18 сентября 2018 г.
^ Рауз, Бенджамин; Чаймани, Анна; Ли, Тяньцзин (2017). «Сетевой метаанализ: введение для врачей». Internal and Emergency Medicine . 12 (1): 103–111. doi :10.1007/s11739-016-1583-7. ISSN 1828-0447. PMC 5247317. PMID 27913917 .
^ Филлипс, Марк Р.; Стил, Дэвид Х.; Вайкофф, Чарльз К.; Буссе, Джейсон В.; Баннуру, Равиндхара Р.; Табане, Лехана; Бхандари, Мохит; Чаудхари, Варун; для исследовательской группы Retina Evidence Trials InterNational Alliance (RETINA); Сивапрасад, Собха; Кайзер, Питер; Сарраф, Дэвид; Бакри, Софи Дж.; Гарг, Сунир Дж.; Сингх, Риши П. (2022). «Руководство для врачей по сетевому метаанализу». Eye . 36 (8): 1523–1526. doi :10.1038/s41433-022-01943-5. ISSN 0950-222X. PMC 9307840 . PMID 35145277.
^ Bucher HC, Guyatt GH, Griffith LE, Walter SD (июнь 1997 г.). «Результаты прямых и косвенных сравнений лечения в метаанализе рандомизированных контролируемых испытаний». Журнал клинической эпидемиологии . 50 (6): 683–691. doi :10.1016/s0895-4356(97)00049-8. PMID 9250266.
^ abcd ван Валкенхоф Г., Лу Г., де Брок Б., Хилледж Х., Адес А.Е., Велтон, штат Нью-Джерси (декабрь 2012 г.). «Автоматизация сетевого метаанализа». Методы синтеза исследований . 3 (4): 285–299. дои : 10.1002/jrsm.1054. PMID 26053422. S2CID 33613631.
^ Брукс СП, Гельман А (1998). "Общие методы мониторинга сходимости итеративных симуляций" (PDF) . Журнал вычислительной и графической статистики . 7 (4): 434–455. doi :10.1080/10618600.1998.10474787. S2CID 7300890.
^ Хек Д. В., Гронау К. Ф., Вагенмейкерс Э. Дж., Патил И. (17 марта 2021 г.). "metaBMA: усреднение байесовской модели для метаанализа случайных и фиксированных эффектов". CRAN . Получено 9 мая 2022 г. .
^ Bartoš F, Maier M, Wagenmakers EJ, Goosen J, Denwood M, Plummer M (20 апреля 2022 г.). "RoBMA: пакет R для надежных байесовских метаанализов" . Получено 9 мая 2022 г.
^ Gronau QF, Heck DW, Berkhout SW, Haaf JM, Wagenmakers EJ (июль 2021 г.). «Учебник по байесовскому метаанализу с усреднением по модели». Достижения в методах и практиках психологической науки . 4 (3). doi : 10.1177/25152459211031256 . hdl : 11245.1/ec2c07d1-5ff0-431b-b53a-10f9c5d9541d . ISSN 2515-2459. S2CID 237699937.
^ Bartoš F, Maier M, Quintana D, Wagenmakers EJ (16 октября 2020 г.). «Корректировка смещения публикации в JASP & R — модели отбора, PET-PEESE и надежный байесовский метаанализ». Достижения в области методов и практик в психологической науке . doi : 10.31234/osf.io/75bqn . hdl : 11245.1/5540e87c-0883-45e6-87de-48d2bf4c1e1d . S2CID 236826939.
^ ab Senn S, Gavini F, Magrez D, Scheen A (апрель 2013 г.). «Проблемы проведения сетевого метаанализа». Статистические методы в медицинских исследованиях . 22 (2): 169–189. doi :10.1177/0962280211432220. PMID 22218368. S2CID 10860031.
^ White IR (2011). «Многомерная метарегрессия случайных эффектов: обновления mvmeta». The Stata Journal . 11 (2): 255–270. doi : 10.1177/1536867X1101100206 .
^ Уиллис Б. Х., Хайд К. Дж. (май 2014 г.). «Оценка точности теста с использованием специализированного метаанализа — как данные, специфичные для конкретных условий, могут помочь в выборе исследования». Журнал клинической эпидемиологии . 67 (5): 538–546. doi : 10.1016/j.jclinepi.2013.10.016. PMID 24447592.
^ Willis BH, Hyde CJ (август 2015 г.). «Какова точность теста в популяции моей практики? Индивидуальный метаанализ дает правдоподобную оценку». Журнал клинической эпидемиологии . 68 (8): 847–854. doi :10.1016/j.jclinepi.2014.10.002. PMID 25479685. S2CID 205844216.
^ Чжан Х., Дэн Л., Шиффман М., Цинь Дж., Ю К. (2020). «Обобщенная модель интеграции для улучшения статистического вывода путем использования внешних сводных данных». Biometrika . 107 (3): 689–703. doi :10.1093/biomet/asaa014.
^ Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD и др. (октябрь 2011 г.). «Инструмент Cochrane Collaboration для оценки риска смещения в рандомизированных испытаниях». BMJ . 343 : d5928. doi :10.1136/bmj.d5928. PMC 3196245 . PMID 22008217.
^ Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB и др. (октябрь 2011 г.). «QUADAS-2: пересмотренный инструмент для оценки качества исследований диагностической точности». Annals of Internal Medicine . 155 (8): 529–536. doi : 10.7326/0003-4819-155-8-201110180-00009 . PMID 22007046.
^ Ройстон П., Пармар М.К., Сильвестр Р. (март 2004 г.). «Построение и проверка прогностической модели в нескольких исследованиях с применением при поверхностном раке мочевого пузыря». Статистика в медицине . 23 (6): 907–926. doi :10.1002/sim.1691. PMID 15027080. S2CID 23397142.
^ Willis BH, Riley RD (сентябрь 2017 г.). «Измерение статистической достоверности результатов сводного метаанализа и метарегрессии для использования в клинической практике». Статистика в медицине . 36 (21): 3283–3301. doi :10.1002/sim.7372. PMC 5575530. PMID 28620945 .
^ Riley RD, Ahmed I, Debray TP, Willis BH, Noordzij JP, Higgins JP, Deeks JJ (июнь 2015 г.). «Обобщение и проверка результатов точности тестов в нескольких исследованиях для использования в клинической практике». Статистика в медицине . 34 (13): 2081–2103. doi :10.1002/sim.6471. PMC 4973708. PMID 25800943.
^ LeLorier J, Grégoire G, Benhaddad A, Lapierre J, Derderian F (август 1997 г.). «Расхождения между метаанализами и последующими крупными рандомизированными контролируемыми испытаниями». The New England Journal of Medicine . 337 (8): 536–542. doi : 10.1056/NEJM199708213370806 . PMID 9262498.
^ ab Slavin RE (1986). «Синтез наилучших доказательств: альтернатива метааналитическим и традиционным обзорам». Educational Researcher . 15 (9): 5–9. doi :10.3102/0013189X015009005. S2CID 146457142.
^ Хантер Дж. Э., Шмидт Ф. Л., Джексон ГБ и др. (Американская психологическая ассоциация. Отделение промышленно-организационной психологии) (1982). Метаанализ: накопление результатов исследований в разных исследованиях . Беверли-Хиллз, Калифорния: Sage. ISBN978-0-8039-1864-1.
^ Glass GV, McGaw B, Smith ML (1981). Метаанализ в социальных исследованиях . Беверли-Хиллз, Калифорния: Sage Publications. ISBN978-0-8039-1633-3.
^ Вольф, Винцент; Кюнель, Энн; Текентруп, Ванесса; Кениг, Джулиан; Кремер, Нильс Б. (2021). «Влияет ли чрескожная стимуляция блуждающего нерва ушной раковины на вариабельность сердечного ритма, опосредованную блуждающим нервом? Живой и интерактивный байесовский метаанализ». Психофизиология . 58 (11): e13933. doi :10.1111/psyp.13933. ISSN 0048-5772. PMID 34473846.
^ Олбриттон, Дэвид; Гомес, Пабло; Анжеле, Бернхард; Васильев, Мартин; Переа, Мануэль (22 июля 2024 г.). «Вдохновение жизни в метааналитические методы». Журнал познания . 7 (1): 61. doi : 10.5334/joc.389 . ISSN 2514-4820. ПМЦ 11276543 . ПМИД 39072210.
^ Вагнер, Джон А. (3 сентября 2022 г.). «Влияние неопубликованных исследований на результаты недавних метаанализов: смещение публикаций, проблема ящика для файлов и последствия для кризиса репликации». Международный журнал методологии социальных исследований . 25 (5): 639–644. doi : 10.1080/13645579.2021.1922805. ISSN 1364-5579.
^ Поланин JR, Таннер-Смит EE, Хеннесси EA (2016). «Оценка разницы между опубликованными и неопубликованными размерами эффекта: метаобзор». Обзор образовательных исследований . 86 (1): 207–236. doi :10.3102/0034654315582067. ISSN 0034-6543. S2CID 145513046.
^ Насир Гаеми, С.; Ширзади, Аршия А.; Филковски, Меган (10 сентября 2008 г.). «Ошибка публикации и фармацевтическая промышленность: случай ламотриджина при биполярном расстройстве». Медицинский журнал Medscape . 10 (9): 211. ISSN 1934-1997. PMC 2580079. PMID 19008973 .
^ Мартин, Хосе Луис Р.; Перес, Виктор; Сакристан, Монтсе; Альварес, Энрик (2005). «Необходима ли серая литература для лучшего контроля предвзятости публикаций в психиатрии? Пример из трех метаанализов шизофрении». Европейская психиатрия . 20 (8): 550–553. doi :10.1016/j.eurpsy.2005.03.011. ISSN 0924-9338. PMID 15994063.
^ ab Rosenthal R (1979). «Проблема «картотечного ящика» и толерантность к нулевым результатам». Psychological Bulletin . 86 (3): 638–641. doi :10.1037/0033-2909.86.3.638. S2CID 36070395.
^ ab Vevea JL, Woods CM (декабрь 2005 г.). «Ошибка публикации в исследовательском синтезе: анализ чувствительности с использованием априорных весовых функций». Психологические методы . 10 (4): 428–443. doi :10.1037/1082-989X.10.4.428. PMID 16392998.
^ Хантер Дж. Э. , Шмидт Ф. Л. (1990). Методы метаанализа: исправление ошибок и смещений в результатах исследований . Ньюбери-Парк, Калифорния; Лондон; Нью-Дели: SAGE Publications .
^ Накагава, Шиничи; Лагиш, Малгожата; Дженнионс, Майкл Д.; Коричева, Джулия; Нобл, Дэниел ВА; Паркер, Тимоти Х.; Санчес-Тохар, Альфредо; Янг, Йефенг; О'Ди, Роуз Э. (2022). «Методы проверки предвзятости публикаций в экологических и эволюционных метаанализах». Методы в экологии и эволюции . 13 (1): 4–21. Bibcode : 2022MEcEv..13....4N. doi : 10.1111/2041-210X.13724. hdl : 1885/294436 . ISSN 2041-210X. S2CID 241159497.
^ Лайт Р. Дж., Пиллемер Д. Б. (1984). Подведение итогов: наука рецензирования исследований. Кембридж, Массачусетс: Издательство Гарвардского университета. ISBN978-0-674-85431-4.
^ Иоаннидис JP, Трикалинос TA (апрель 2007 г.). «Уместность тестов на асимметрию для публикационной ошибки в метаанализах: большой опрос». CMAJ . 176 (8): 1091–1096. doi :10.1503/cmaj.060410. PMC 1839799 . PMID 17420491.
^ Хеджес Л. В., Вевеа Дж. Л. (1996). «Оценка размера эффекта в условиях смещения публикации: свойства малой выборки и надежность модели выбора случайных эффектов». Журнал образовательной и поведенческой статистики . 21 (4): 299–332. doi : 10.3102/10769986021004299. ISSN 1076-9986. S2CID 123680599.
^ Ferguson CJ, Brannick MT (март 2012 г.). «Ошибки публикации в психологической науке: распространенность, методы выявления и контроля, а также последствия для использования метаанализов». Психологические методы . 17 (1): 120–128. doi :10.1037/a0024445. PMID 21787082.
^ Simmons JP, Nelson LD, Simonsohn U (ноябрь 2011 г.). «Ложноположительная психология: нераскрытая гибкость в сборе и анализе данных позволяет представлять что угодно как значимое». Psychological Science . 22 (11): 1359–1366. doi : 10.1177/0956797611417632 . PMID 22006061.
^ LeBel E, Peters K (2011). «Опасаясь будущего эмпирической психологии: доказательства Бема (2011) о пси как примере недостатков в практике модальных исследований» (PDF) . Review of General Psychology . 15 (4): 371–379. doi :10.1037/a0025172. S2CID 51686730. Архивировано из оригинала (PDF) 24 ноября 2012 г.
^ Шобер, Патрик; Боссерс, Себастьян М.; Шварте, Лотар А. (2018). «Статистическая значимость против клинической важности наблюдаемых размеров эффекта: что на самом деле представляют значения P и доверительные интервалы?». Анестезия и анальгезия . 126 (3): 1068–1072. doi :10.1213/ANE.0000000000002798. ISSN 0003-2999. PMC 5811238. PMID 29337724 .
^ Гейтс, Саймон; Илинг, Элизабет (2019). «Сообщение и интерпретация результатов клинических испытаний, в которых не утверждалось о различии в лечении: обзор четырех общих медицинских журналов». BMJ Open . 9 (9): e024785. doi :10.1136/bmjopen-2018-024785. ISSN 2044-6055. PMC 6738699. PMID 31501094 .
^ Hodges JS, Clayton MK (февраль 2011 г.). «Случайные эффекты старые и новые». стр. 1–23. CiteSeerX 10.1.1.225.2685 .{{cite web}}: Отсутствует или пусто |url=( помощь )
^ ab Hodges JS (2014). "Случайные эффекты старые и новые". Богато параметризованные линейные модели: аддитивные, временные ряды и пространственные модели с использованием случайных эффектов . Boca Raton: CRC Press. стр. 285–302. ISBN978-1-4398-6683-2.
^ «Исследования транс-медицины были сфальсифицированы». The Economist . ISSN 0013-0613 . Получено 28 сентября 2024 г.
^ Stegenga J (декабрь 2011 г.). «Является ли метаанализ платиновым стандартом доказательств?». Исследования по истории и философии биологических и биомедицинских наук . 42 (4): 497–507. doi :10.1016/j.shpsc.2011.07.003. PMID 22035723.
^ Roseman M, Milette K, Bero LA, Coyne JC, Lexchin J, Turner EH, Thombs BD (2011), «Сообщение о конфликтах интересов в метаанализах испытаний фармакологических методов лечения», Журнал Американской медицинской ассоциации , 305 (10): 1008–1017, doi : 10.1001/jama.2011.257, hdl : 11370/d4a95ee2-429f-45a4-a917-d794ee954797 , PMID 21386079, S2CID 11270323
^ Спинк, Пол (1999). «Борьба с табачным дымом в окружающей среде на рабочем месте». Environmental Law Review . 1 (4): 243–265. Bibcode : 1999EnvLR...1..243S. doi : 10.1177/146145299900100402. ISSN 1461-4529.
↑ Уилл, Джордж (30 июля 1998 г.). «Загрязненные антитабачным крестовым походом». Tampa Bay Times . Получено 28 сентября 2024 г.
^ Нельсон, Джон П.; Кеннеди, Питер Э. (2009). «Использование (и злоупотребление) метаанализа в экономике окружающей среды и природных ресурсов: оценка». Экономика окружающей среды и ресурсов . 42 (3): 345–377. Bibcode : 2009EnREc..42..345N. doi : 10.1007/s10640-008-9253-5. ISSN 0924-6460.
^ Munafò MR, Flint J (сентябрь 2004 г.). «Метаанализ исследований генетических ассоциаций». Trends in Genetics . 20 (9): 439–444. doi :10.1016/j.tig.2004.06.014. PMID 15313553.
^ Stone DL, Rosopa PJ (1 марта 2017 г.). «Преимущества и ограничения использования метаанализа в исследованиях управления человеческими ресурсами». Human Resource Management Review . 27 (1): 1–7. doi :10.1016/j.hrmr.2016.09.001. ISSN 1053-4822.
^ ab Милкман К.Л., Громет Д., Хо Х., Кей Дж.С., Ли Т.В., Пандилоски П. и др. (декабрь 2021 г.). «Мегаисследования повышают влияние прикладной поведенческой науки». Природа . 600 (7889): 478–483. Бибкод :2021Natur.600..478M. дои : 10.1038/s41586-021-04128-4. ПМЦ 8822539 . PMID 34880497. S2CID 245047340.
^ Cheung AC, Slavin RE (1 июня 2016 г.). «Как методологические особенности влияют на размеры эффекта в образовании». Educational Researcher . 45 (5): 283–292. doi :10.3102/0013189X16656615. ISSN 0013-189X. S2CID 148531062.
^ Jüni P, Witschi A, Bloch R, Egger M (сентябрь 1999 г.). «Опасности оценки качества клинических испытаний для метаанализа». JAMA . 282 (11): 1054–1060. doi : 10.1001/jama.282.11.1054 . PMID 10493204.
^ Armijo-Olivo S, Fuentes J, Ospina M, Saltaji H, Hartling L (сентябрь 2013 г.). «Несоответствие в элементах, включенных в инструменты, используемые в исследованиях общего здоровья и физиотерапии для оценки методологического качества рандомизированных контролируемых испытаний: описательный анализ». BMC Medical Research Methodology . 13 (1): 116. doi : 10.1186/1471-2288-13-116 . PMC 3848693. PMID 24044807 .
^ Debray TP, Riley RD, Rovers MM, Reitsma JB, Moons KG (октябрь 2015 г.). «Метаанализ данных индивидуальных участников (IPD) диагностических и прогностических модельных исследований: руководство по их использованию». PLOS Medicine . 12 (10): e1001886. doi : 10.1371/journal.pmed.1001886 . PMC 4603958 . PMID 26461078.
^ Debray TP, Moons KG, Ahmed I, Koffijberg H, Riley RD (август 2013 г.). «Структура для разработки, внедрения и оценки клинических моделей прогнозирования в метаанализе данных отдельных участников» (PDF) . Статистика в медицине . 32 (18): 3158–3180. doi :10.1002/sim.5732. PMID 23307585. S2CID 25308961.
^ Debray TP, Koffijberg H, Vergouwe Y, Moons KG, Steyerberg EW (октябрь 2012 г.). «Объединение опубликованных моделей прогнозирования с данными отдельных участников: сравнение различных подходов» (PDF) . Статистика в медицине . 31 (23): 2697–2712. doi :10.1002/sim.5412. PMID 22733546. S2CID 39439611.
^ Шадиш, Уильям Р. (2014). «Анализ и метаанализ однокейсовых проектов: введение». Журнал школьной психологии . 52 (2): 109–122. doi :10.1016/j.jsp.2013.11.009. PMID 24606971.
^ Зелински, Николь AM; Шадиш, Уильям (19 мая 2018 г.). «Демонстрация того, как проводить метаанализ, сочетающий в себе единичные проекты с межгрупповыми экспериментами: влияние принятия решений на сложное поведение, выполняемое людьми с ограниченными возможностями». Developmental Neurorehabilitation . 21 (4): 266–278. doi :10.3109/17518423.2015.1100690. ISSN 1751-8423. PMID 26809945. S2CID 20442353.
^ Ван ден Ноортгейт В., Онгена П. (2007). «Агрегирование результатов отдельных случаев». The Behavior Analyst Today . 8 (2): 196–209. doi :10.1037/h0100613.
^ Mantel N, Haenszel W (апрель 1959). «Статистические аспекты анализа данных ретроспективных исследований заболеваний». Журнал Национального института рака . 22 (4): 719–748. doi :10.1093/jnci/22.4.719. PMID 13655060. S2CID 17698270.
^ Deeks JJ, Higgins JP, Altman DG и др. (Cochrane Statistical Methods Group) (2021). «Глава 10: Анализ данных и проведение метаанализов: 10.4.2 Метод отношения шансов Пето». В Higgins J, Thomas J, Chandler J, Cumpston M, Li T, Page M, Welch V (ред.). Cochrane Handbook for Systematic Reviews of Interventions (версия 6.2 ред.). Cochrane Collaboration.
^ Bargaje R, Hariharan M, Scaria V, Pillai B (январь 2010 г.). «Консенсусные профили экспрессии miRNA, полученные из межплатформенной нормализации данных микрочипов». RNA . 16 (1): 16–25. doi :10.1261/rna.1688110. PMC 2802026 . PMID 19948767.