Мета-анализ

Метаанализ — это статистическое объединение результатов нескольких исследований, посвященных схожему исследовательскому вопросу. Важная часть этого метода включает вычисление объединенного размера эффекта по всем исследованиям. Таким образом, этот статистический подход включает извлечение размеров эффекта и мер дисперсии из различных исследований. ^[1] Метаанализы играют важную роль в поддержке заявок на исследовательские гранты, формировании руководств по лечению и влиянии на политику здравоохранения. Они также играют решающую роль в обобщении существующих исследований для руководства будущими исследованиями, тем самым закрепляя их роль в качестве фундаментальной методологии в метанауке .

Метаанализы часто, но не всегда, являются важными компонентами процедуры систематического обзора , см., например, PRISMA . ^[2] Метаанализ может проводиться в нескольких областях для оценки воздействия вмешательства, когда имеются множественные исследования, сообщающие данные, подходящие для измерения совокупного размера эффекта .

История

Термин «метаанализ» был придуман в 1976 году статистиком Джином Глассом , ^[3]^[4], который заявил, что «метаанализ относится к анализу анализов» . ^[5] Работа Гласса была направлена на описание агрегированных мер взаимосвязей и эффектов. ^[6] Хотя Глассу приписывают авторство первого современного метаанализа, статья, опубликованная в 1904 году статистиком Карлом Пирсоном в British Medical Journal^[7], сопоставила данные из нескольких исследований прививки от брюшного тифа и считается первым случаем использования метааналитического подхода для агрегирования результатов нескольких клинических исследований. ^[8]^[9] Можно найти множество других примеров ранних метаанализов, включая тестирование профессиональной пригодности, ^[10]^[11] и сельское хозяйство. ^[12]

Первая модель метаанализа была опубликована в 1978 году по эффективности результатов психотерапии Мэри Ли Смит и Джин Гласс . ^[4]^[13] После публикации их статьи возникла критика полезности и обоснованности метаанализа как инструмента для синтеза доказательств. Первым примером этого был Хан Айзенк , который в статье 1978 года в ответ на работу, проделанную Мэри Ли Смит и Джин Гласс, назвал метаанализ «упражнением в мегаглупости». ^[14]^[15] Позже Айзенк будет называть метаанализ «статистической алхимией». ^[16] Несмотря на эту критику, использование метаанализа только возросло с момента его современного введения. К 1991 году было опубликовано 334 метаанализа; ^[15] это число выросло до 9135 к 2014 году. ^[3]^[17]

Область метаанализа значительно расширилась с 1970-х годов и затрагивает множество дисциплин, включая психологию, медицину и экологию. ^[3] Кроме того, недавнее создание сообществ по синтезу доказательств увеличило перекрестное опыление идей, методов и создание программных инструментов между дисциплинами. ^[18]^[19]^[20]

Шаги метаанализа

Метаанализу обычно предшествует систематический обзор, поскольку он позволяет идентифицировать и критически оценить все соответствующие доказательства (тем самым ограничивая риск предвзятости в сводных оценках). Общие шаги тогда следующие: ^[21]

Формулировка вопроса исследования, например, с использованием модели PICO (Популяция, Вмешательство, Сравнение, Результат).
Поиск литературы
Отбор исследований («критерии включения»)
- На основе критериев качества, например, требования рандомизации и ослепления в клиническом исследовании
- Выборка конкретных исследований по четко определенной теме, например, лечение рака молочной железы.
- Решите, следует ли включать неопубликованные исследования, чтобы избежать предвзятости публикации (проблема ящика для документов)
Решите, какие зависимые переменные или сводные показатели разрешены. Например, при рассмотрении метаанализа опубликованных (агрегированных) данных:
- Различия (дискретные данные)
- Средние (непрерывные данные)
Выбор модели метаанализа, например, метаанализ с фиксированным эффектом или метаанализ со случайными эффектами.
Изучите источники неоднородности между исследованиями , например, с помощью анализа подгрупп или метарегрессии .

Официальные рекомендации по проведению и представлению результатов метаанализа содержатся в Кокрейновском справочнике.

Инструкции по составлению отчетов см. в заявлении «Предпочтительные элементы отчетности для систематических обзоров и метаанализов (PRISMA)». ^[22]

Поиск литературы

Одним из важнейших этапов метаанализа является сбор данных. Для эффективного поиска в базе данных необходимо определить соответствующие ключевые слова и пределы поиска. ^[23] Использование булевых операторов и пределов поиска может помочь в поиске литературы. ^[24]^[25] Доступно несколько баз данных (например, PubMed, Embase, PsychInfo), однако исследователь должен выбрать наиболее подходящие источники для своей области исследования. ^[26] Действительно, многие ученые используют дублирующиеся поисковые термины в двух или более базах данных, чтобы охватить несколько источников. Списки ссылок подходящих исследований также можно искать для подходящих исследований (т. е. снежный ком). Первоначальный поиск может вернуть большой объем исследований. Довольно часто аннотация или название рукописи показывают, что исследование не подходит для включения на основе заранее указанных критериев. Эти исследования можно отбросить. Однако, если окажется, что исследование может быть подходящим (или даже если есть некоторые сомнения), полную статью можно сохранить для более тщательного изучения. Списки ссылок подходящих статей также можно искать для любых соответствующих статей. Эти результаты поиска должны быть детализированы в диаграмме потока PRIMSA ^[27], которая детализирует поток информации на всех этапах обзора. Таким образом, важно отметить, сколько исследований было возвращено после использования указанных поисковых терминов и сколько из этих исследований было отклонено, и по какой причине. ^[26] Поисковые термины и стратегия должны быть достаточно конкретными, чтобы читатель мог воспроизвести поиск. Также следует указать диапазон дат исследований, а также дату (или период дат), когда был проведен поиск. ^[28]

Форма сбора данных предоставляет стандартизированные средства сбора данных из приемлемых исследований. Для метаанализа корреляционных данных информация о размере эффекта обычно собирается как статистика r Пирсона . Частичные корреляции часто сообщаются в исследованиях, однако они могут преувеличивать отношения по сравнению с корреляциями нулевого порядка. ^[29] Более того, частично исключенные переменные, вероятно, будут различаться от исследования к исследованию. Как следствие, многие метаанализы исключают частичные корреляции из своего анализа. ^[26] В качестве последнего средства можно использовать оцифровщики графиков для извлечения точек данных из диаграмм рассеяния (если они доступны) для расчета r Пирсона . ^[30]^[31] Также следует собирать данные, сообщающие важные характеристики исследования, которые могут смягчать эффекты, такие как средний возраст участников. ^[32] В эти формы также можно включить меру качества исследования для оценки качества доказательств из каждого исследования. ^[33] Существует более 80 инструментов для оценки качества и риска смещения в наблюдательных исследованиях, отражающих разнообразие исследовательских подходов в разных областях. ^[33]^[34]^[35] Эти инструменты обычно включают оценку того, как измерялись зависимые переменные, соответствующий выбор участников и соответствующий контроль за сопутствующими факторами. Другие меры качества, которые могут быть более релевантными для корреляционных исследований, включают размер выборки, психометрические свойства и отчетность о методах. ^[26]

Последнее соображение заключается в том, следует ли включать исследования из серой литературы, которая определяется как исследование, которое не было официально опубликовано. ^[36] Этот тип литературы включает в себя тезисы конференций, ^[37] диссертации, ^[38] и препринты. ^[39] Хотя включение серой литературы снижает риск предвзятости публикации, методологическое качество работы часто (но не всегда) ниже, чем у официально опубликованной работы. ^[40]^[41] Отчеты из трудов конференций, которые являются наиболее распространенным источником серой литературы, ^[42] плохо представлены ^[43], а данные в последующей публикации часто непоследовательны, при этом различия наблюдаются почти в 20% опубликованных исследований. ^[44]

Методы и предположения

Подходы

В целом, при проведении метаанализа можно выделить два типа доказательств: данные индивидуальных участников (IPD) и совокупные данные (AD). Совокупные данные могут быть прямыми или косвенными.

AD более доступен (например, из литературы) и обычно представляет собой сводные оценки, такие как отношение шансов или относительные риски. Это может быть напрямую синтезировано в концептуально схожих исследованиях с использованием нескольких подходов (см. ниже). С другой стороны, косвенные совокупные данные измеряют эффект двух методов лечения, каждый из которых сравнивался с аналогичной контрольной группой в метаанализе. Например, если лечение A и лечение B напрямую сравнивались с плацебо в отдельных метаанализах, мы можем использовать эти два объединенных результата, чтобы получить оценку эффектов A против B в косвенном сравнении как эффект A против плацебо минус эффект B против плацебо.

Доказательства IPD представляют собой необработанные данные, собранные исследовательскими центрами. Это различие вызвало необходимость в различных методах метаанализа, когда требуется синтез доказательств, и привело к разработке одноэтапных и двухэтапных методов. ^[45] В одноэтапных методах IPD из всех исследований моделируется одновременно с учетом кластеризации участников в рамках исследований. Двухэтапные методы сначала вычисляют сводную статистику для AD из каждого исследования, а затем вычисляют общую статистику как средневзвешенное значение статистики исследования. Сводя IPD к AD, двухэтапные методы также могут применяться, когда доступен IPD; это делает их привлекательным выбором при выполнении метаанализа. Хотя традиционно считается, что одноэтапные и двухэтапные методы дают схожие результаты, недавние исследования показали, что иногда они могут приводить к разным выводам. ^[46]^[47]

Статистические модели для агрегированных данных

Прямые доказательства: модели, включающие только эффекты исследования

Модель с фиксированным эффектом

Модель с фиксированными эффектами обеспечивает средневзвешенное значение ряда оценок исследований. Обратное значение дисперсии оценок обычно используется в качестве веса исследования, так что более крупные исследования, как правило, вносят больший вклад, чем более мелкие исследования, в средневзвешенное значение. Следовательно, когда исследования в рамках метаанализа доминируют в очень крупном исследовании, результаты более мелких исследований практически игнорируются. ^[48] Самое главное, что модель с фиксированными эффектами предполагает, что все включенные исследования изучают одну и ту же популяцию, используют одни и те же определения переменных и результатов и т. д. Это предположение обычно нереалистично, поскольку исследования часто подвержены нескольким источникам гетерогенности . [ ^49]

Модель случайных эффектов

Распространенной моделью, используемой для синтеза гетерогенных исследований, является модель случайных эффектов метаанализа. Это просто взвешенное среднее значение размеров эффекта группы исследований. Вес, который применяется в этом процессе взвешенного усреднения с метаанализом случайных эффектов, достигается в два этапа: ^[50]

Шаг 1: Взвешивание обратной дисперсии
Шаг 2: Освобождение от веса этой обратной дисперсии путем применения компонента дисперсии случайных эффектов (REVC), который просто выводится из степени изменчивости размеров эффектов базовых исследований.

Это означает, что чем больше эта изменчивость в размерах эффектов (иначе называемая гетерогенностью ), тем больше невзвешивание, и это может достичь точки, когда результат метаанализа случайных эффектов становится просто невзвешенным средним размером эффекта по всем исследованиям. В другом крайнем случае, когда все размеры эффектов схожи (или изменчивость не превышает ошибку выборки), REVC не применяется, и метаанализ случайных эффектов по умолчанию становится просто метаанализом фиксированных эффектов (только обратное взвешивание дисперсии).

Степень этого изменения зависит исключительно от двух факторов: ^[51]

Неоднородность точности
Неоднородность величины эффекта

Поскольку ни один из этих факторов автоматически не указывает на ошибочное более крупное исследование или более надежные более мелкие исследования, перераспределение весов в рамках этой модели не будет иметь отношения к тому, что эти исследования на самом деле могут предложить. Действительно, было продемонстрировано, что перераспределение весов происходит просто в одном направлении от более крупных к более мелким исследованиям по мере увеличения неоднородности до тех пор, пока в конечном итоге все исследования не будут иметь равный вес, и дальнейшее перераспределение станет невозможным. ^[51] Другая проблема с моделью случайных эффектов заключается в том, что наиболее часто используемые доверительные интервалы, как правило, не сохраняют свою вероятность покрытия выше указанного номинального уровня и, таким образом, существенно занижают статистическую погрешность и потенциально излишне уверены в своих выводах. ^[52]^[53] Было предложено несколько исправлений ^[54]^[55], но дебаты продолжаются. ^[53]^[56] Еще одна проблема заключается в том, что средний эффект лечения иногда может быть даже менее консервативным по сравнению с моделью фиксированного эффекта ^[57] и, следовательно, вводить в заблуждение на практике. Одно из предложенных интерпретационных исправлений заключается в создании интервала прогнозирования вокруг оценки случайных эффектов для отображения диапазона возможных эффектов на практике. ^[58] Однако предположение, лежащее в основе расчета такого интервала прогнозирования, заключается в том, что испытания считаются более или менее однородными образованиями, а включенные популяции пациентов и методы сравнительного лечения следует считать взаимозаменяемыми ^[59], а на практике это обычно недостижимо.

Существует много методов, используемых для оценки дисперсии между исследованиями, при этом оценка ограниченного максимального правдоподобия является наименее подверженной смещению и одной из наиболее часто используемых. ^[60] Существует несколько передовых итеративных методов для вычисления дисперсии между исследованиями, включая как методы максимального правдоподобия, так и методы ограниченного максимального правдоподобия, а модели случайных эффектов, использующие эти методы, можно запускать на нескольких программных платформах, включая Excel, ^[61] Stata, ^[62] SPSS, ^[63] и R. ^[64]

Большинство метаанализов включают от 2 до 4 исследований, и такая выборка чаще всего недостаточна для точной оценки гетерогенности . Таким образом, кажется, что в небольших метаанализах получается неверная нулевая оценка дисперсии между исследованиями, что приводит к ложному предположению об однородности. В целом, кажется, что гетерогенность постоянно недооценивается в метаанализах, и анализы чувствительности, в которых предполагаются высокие уровни гетерогенности, могут быть информативными. ^[65] Эти модели случайных эффектов и программные пакеты, упомянутые выше, относятся к метаанализам совокупности исследований, и исследователям, желающим провести метаанализ индивидуальных данных пациентов (IPD), необходимо учитывать подходы моделирования смешанных эффектов. ^[66] /

модель IVhet

Doi & Barendregt, работающие в сотрудничестве с Khan, Thalib и Williams (из Университета Квинсленда, Университета Южного Квинсленда и Университета Кувейта), создали альтернативу на основе квазиправдоподобия (IVhet) с обратной дисперсией для модели случайных эффектов (RE), подробности которой доступны в Интернете. ^[61] Это было включено в MetaXL версии 2.0, ^[67] бесплатную надстройку Microsoft Excel для метаанализа, разработанную Epigear International Pty Ltd, и опубликованную 5 апреля 2014 года. Авторы заявляют, что явным преимуществом этой модели является то, что она решает две основные проблемы модели случайных эффектов. Первое преимущество модели IVhet заключается в том, что покрытие остается на номинальном уровне (обычно 95%) для доверительного интервала в отличие от модели случайных эффектов, покрытие которой падает с ростом гетерогенности. ^[52]^[53] Второе преимущество заключается в том, что модель IVhet сохраняет обратные дисперсионные веса отдельных исследований, в отличие от модели RE, которая придает небольшим исследованиям больший вес (и, следовательно, более крупным исследованиям меньший) с ростом неоднородности. Когда неоднородность становится большой, индивидуальные веса исследований в модели RE становятся равными, и, таким образом, модель RE возвращает среднее арифметическое, а не средневзвешенное. Этот побочный эффект модели RE не возникает с моделью IVhet, которая, таким образом, отличается от оценки модели RE в двух аспектах: ^[61] Объединенные оценки будут благоприятствовать более крупным испытаниям (в отличие от штрафования более крупных испытаний в модели RE) и будут иметь доверительный интервал, который остается в пределах номинального покрытия в условиях неопределенности (неоднородности). Дои и Барендрегт предполагают, что, хотя модель RE предоставляет альтернативный метод объединения данных исследования, их результаты моделирования ^[68] демонстрируют, что использование более определенной вероятностной модели с несостоятельными предположениями, как в случае с моделью RE, не обязательно дает лучшие результаты. В последнем исследовании также сообщается, что модель IVhet решает проблемы, связанные с недооценкой статистической погрешности, плохим охватом доверительного интервала и увеличением MSE, наблюдаемыми в модели случайных эффектов, и авторы приходят к выводу, что исследователям следует впредь отказаться от использования модели случайных эффектов в метаанализе. Хотя их данные убедительны, последствия (с точки зрения величины ложноположительных результатов в базе данных Cochrane) огромны, и поэтому принятие этого вывода требует тщательного независимого подтверждения. Наличие бесплатного программного обеспечения (MetaXL) ^[67] , которое запускает модель IVhet (и все другие модели для сравнения), облегчает это для исследовательского сообщества.

Прямые доказательства: модели, включающие дополнительную информацию

Модель качественных эффектов

Первоначально модель эффектов качества представили Дои и Талиб. ^[69] Они ^[70] представили новый подход к корректировке изменчивости между исследованиями, включив вклад дисперсии из-за соответствующего компонента (качества) в дополнение к вкладу дисперсии из-за случайной ошибки, который используется в любой модели метаанализа фиксированных эффектов для генерации весов для каждого исследования. Сила метаанализа эффектов качества заключается в том, что он позволяет использовать имеющиеся методологические доказательства вместо субъективных случайных эффектов и тем самым помогает закрыть разрушительный разрыв, который образовался между методологией и статистикой в клинических исследованиях. Для этого вычисляется синтетическая дисперсия смещения на основе информации о качестве для корректировки весов обратной дисперсии, и вводится скорректированный по качеству вес i- го исследования. ^[69] Затем эти скорректированные веса используются в метаанализе. Другими словами, если исследование i хорошего качества, а другие исследования плохого качества, часть их скорректированных по качеству весов математически перераспределяется в исследование i, придавая ему больший вес по отношению к общему размеру эффекта. По мере того, как исследования становятся все более схожими по качеству, перераспределение становится все меньше и прекращается, когда все исследования становятся одинакового качества (в случае одинакового качества модель эффектов качества по умолчанию соответствует модели IVhet – см. предыдущий раздел). Недавняя оценка модели эффектов качества (с некоторыми обновлениями) показывает, что, несмотря на субъективность оценки качества, производительность (MSE и истинная дисперсия при моделировании) превосходит ту, которая достигается с помощью модели случайных эффектов. ^[71]^[72] Таким образом, эта модель заменяет несостоятельные интерпретации, которые изобилуют в литературе, и доступно программное обеспечение для дальнейшего изучения этого метода. ^[67]

Косвенные доказательства: методы сетевого метаанализа

Методы метаанализа косвенных сравнений (также называемые сетевыми метаанализами, в частности, когда одновременно оцениваются несколько видов лечения) обычно используют две основные методологии. Во-первых, это метод Бухера ^[73] , который представляет собой однократное или многократное сравнение замкнутого цикла из трех видов лечения, так что один из них является общим для двух исследований и образует узел, где цикл начинается и заканчивается. Поэтому для сравнения нескольких видов лечения необходимы множественные сравнения по два (циклы из трех видов лечения). Эта методология требует, чтобы испытания с более чем двумя группами имели только две выбранные группы, поскольку требуются независимые попарные сравнения. Альтернативная методология использует сложное статистическое моделирование для включения испытаний с несколькими группами и сравнений одновременно между всеми конкурирующими видами лечения. Они были выполнены с использованием байесовских методов, смешанных линейных моделей и подходов метарегрессии. ^{[ необходима цитата ]}

Байесовская структура

Определение модели метаанализа байесовской сети включает написание модели направленного ациклического графа (DAG) для программного обеспечения общего назначения Монте-Карло на основе цепей Маркова (MCMC), такого как WinBUGS. ^[74] Кроме того, для ряда параметров должны быть указаны априорные распределения, а данные должны быть предоставлены в определенном формате. ^[74] Вместе DAG, априорные распределения и данные образуют байесовскую иерархическую модель. Чтобы еще больше усложнить ситуацию, из-за природы оценки MCMC для ряда независимых цепей должны быть выбраны сверхдисперсные начальные значения, чтобы можно было оценить сходимость. ^[75] Недавно было разработано несколько пакетов программного обеспечения R для упрощения подгонки модели (например, metaBMA ^[76] и RoBMA ^[77] ) и даже реализовано в статистическом программном обеспечении с графическим пользовательским интерфейсом ( GUI ): JASP . Хотя сложность байесовского подхода ограничивает использование этой методологии, недавние учебные статьи пытаются повысить доступность методов. ^[78]^[79] Была предложена методология автоматизации этого метода ^[74], но она требует, чтобы были доступны данные о результатах на уровне группы, а это обычно недоступно. Иногда делаются большие заявления о присущей байесовской структуре способности обрабатывать сетевой метаанализ и ее большей гибкости. Однако этот выбор реализации структуры для вывода, байесовский или частотный, может быть менее важным, чем другие выборы относительно моделирования эффектов ^[80] (см. обсуждение моделей выше).

Частотная многомерная структура

С другой стороны, частотные многомерные методы включают приближения и предположения, которые не указаны явно или не проверены при применении методов (см. обсуждение моделей метаанализа выше). Например, пакет mvmeta для Stata позволяет проводить сетевой метаанализ в частотном фреймворке. ^[81] Однако, если в сети нет общего компаратора, то это должно быть обработано путем дополнения набора данных вымышленными плечами с высокой дисперсией, что не очень объективно и требует решения относительно того, что составляет достаточно высокую дисперсию. ^[74] Другая проблема заключается в использовании модели случайных эффектов как в этом частотном фреймворке, так и в байесовском фреймворке. Сенн советует аналитикам быть осторожными при интерпретации анализа «случайных эффектов», поскольку допускается только один случайный эффект, но можно предусмотреть много. ^[80] Сенн продолжает говорить, что довольно наивно, даже в случае, когда сравниваются только два метода лечения, предполагать, что анализ случайных эффектов учитывает всю неопределенность относительно того, как эффекты могут меняться от испытания к испытанию. Более новые модели метаанализа, такие как те, что обсуждались выше, безусловно, помогли бы облегчить эту ситуацию и были реализованы в следующей структуре.

Обобщенная структура парного моделирования

Подход, который был опробован с конца 1990-х годов, представляет собой реализацию множественного трехкомпонентного анализа замкнутого цикла. Это не было популярным, поскольку процесс быстро становится подавляющим по мере увеличения сложности сети. Развитие в этой области затем было прекращено в пользу байесовского и многомерного частотного методов, которые появились в качестве альтернатив. Совсем недавно автоматизация трехкомпонентного метода замкнутого цикла была разработана для сложных сетей некоторыми исследователями ^[61] как способ сделать эту методологию доступной для основного исследовательского сообщества. Это предложение ограничивает каждое испытание двумя вмешательствами, но также вводит обходной путь для испытаний с несколькими группами: другой фиксированный контрольный узел может быть выбран в разных запусках. Он также использует надежные методы метаанализа, так что многие из проблем, выделенных выше, избегаются. Требуются дальнейшие исследования вокруг этой структуры, чтобы определить, действительно ли она превосходит байесовскую или многомерную частотную структуру. Исследователи, желающие попробовать это, имеют доступ к этой структуре через бесплатное программное обеспечение. ^[67]

Специализированный метаанализ

Другая форма дополнительной информации исходит из предполагаемой настройки. Если целевая настройка для применения результатов метаанализа известна, то можно использовать данные из настройки для адаптации результатов, таким образом создавая «адаптированный метаанализ»., ^[82]^[83] Это использовалось в метаанализах точности теста, где эмпирические знания о положительном показателе теста и распространенности использовались для получения области в пространстве рабочей характеристики приемника (ROC), известной как «применимая область». Затем исследования выбираются для целевой настройки на основе сравнения с этой областью и агрегируются для получения сводной оценки, которая адаптирована к целевой настройке.

Агрегирование IPD и AD

Метаанализ также может применяться для объединения IPD и AD. Это удобно, когда исследователи, проводящие анализ, имеют собственные необработанные данные при сборе совокупных или сводных данных из литературы. Обобщенная интеграционная модель (GIM) ^[84] является обобщением метаанализа. Она позволяет, чтобы модель, подобранная на основе данных отдельных участников (IPD), отличалась от тех, которые использовались для вычисления совокупных данных (AD). GIM можно рассматривать как метод калибровки модели для интеграции информации с большей гибкостью.

Проверка результатов метаанализа

Оценка метаанализа представляет собой средневзвешенное значение по всем исследованиям, и когда есть неоднородность , это может привести к тому, что сводная оценка не будет репрезентативной для отдельных исследований. Качественная оценка первичных исследований с использованием установленных инструментов может выявить потенциальные смещения, ^[85]^[86], но не количественно определяет совокупное влияние этих смещений на сводную оценку. Хотя результат метаанализа можно сравнить с независимым перспективным первичным исследованием, такая внешняя проверка часто нецелесообразна. Это привело к разработке методов, которые используют форму перекрестной проверки с исключением одного , иногда называемую внутренней-внешней перекрестной проверкой (IOCV). ^[87] Здесь каждое из k включенных исследований по очереди опускается и сравнивается с суммарной оценкой, полученной путем агрегирования оставшихся k-1 исследований. Была разработана общая статистика проверки, Vn, основанная на IOCV, для измерения статистической достоверности результатов метаанализа. ^[88] Для точности теста и прогнозирования, особенно при наличии многомерных эффектов, были также предложены другие подходы, направленные на оценку ошибки прогнозирования. ^[89]

Вызовы

Метаанализ нескольких небольших исследований не всегда предсказывает результаты одного большого исследования. ^[90] Некоторые утверждают, что слабость метода заключается в том, что источники смещения не контролируются методом: хороший метаанализ не может исправить плохой дизайн или смещение в исходных исследованиях. ^[91] Это означало бы, что только методологически обоснованные исследования должны быть включены в метаанализ, практика, называемая «лучшим синтезом доказательств». ^[91] Другие метааналитики включали бы более слабые исследования и добавляли бы предикторную переменную на уровне исследования, которая отражает методологическое качество исследований, чтобы изучить влияние качества исследования на размер эффекта. ^[92] Однако другие утверждали, что лучший подход — сохранить информацию о дисперсии в выборке исследования, забрасывая как можно более широкую сеть, и что методологические критерии отбора вносят нежелательную субъективность, сводя на нет цель подхода. ^[93] Совсем недавно, под влиянием стремления к открытым практикам в науке, были разработаны инструменты для разработки «краудсорсинговых» живых метаанализов, которые обновляются сообществами ученых ^[94]^[95] в надежде сделать все субъективные выборы более явными.

Предвзятость публикации: проблема ящика для документов

Еще одна потенциальная ловушка — опора на доступный корпус опубликованных исследований, что может привести к преувеличенным результатам из-за предвзятости публикации , поскольку исследования, которые показывают отрицательные или незначительные результаты, с меньшей вероятностью будут опубликованы. ^[96] Например, известно, что фармацевтические компании скрывают отрицательные исследования, а исследователи могли пропустить неопубликованные исследования, такие как диссертационные исследования или тезисы конференций, которые не были опубликованы. Это нелегко решить, поскольку невозможно узнать, сколько исследований остались незарегистрированными. ^[97]

Эта проблема ящика для файлов (характеризующаяся тем, что отрицательные или незначительные результаты спрятаны в шкафу) может привести к предвзятому распределению размеров эффекта, тем самым создавая серьезную ошибку базовой ставки , в которой значимость опубликованных исследований переоценивается, поскольку другие исследования либо не были представлены для публикации, либо были отклонены. Это следует серьезно учитывать при интерпретации результатов метаанализа. ^[97]^[98]

Распределение размеров эффекта можно визуализировать с помощью воронкообразной диаграммы , которая (в наиболее распространенной версии) представляет собой диаграмму рассеяния стандартной ошибки в зависимости от размера эффекта. ^[99] Она использует тот факт, что меньшие исследования (следовательно, большие стандартные ошибки) имеют больший разброс величины эффекта (будучи менее точными), в то время как более крупные исследования имеют меньший разброс и образуют кончик воронки. Если многие отрицательные исследования не были опубликованы, оставшиеся положительные исследования приводят к воронкообразной диаграмме, в которой основание скошено в одну сторону (асимметрия воронкообразной диаграммы). Напротив, когда нет смещения публикации, эффект меньших исследований не имеет причин быть скошенным в одну сторону, и поэтому получается симметричная воронкообразная диаграмма. Это также означает, что если нет смещения публикации, не будет никакой связи между стандартной ошибкой и размером эффекта. ^[100] Отрицательная или положительная связь между стандартной ошибкой и размером эффекта будет означать, что меньшие исследования, которые обнаружили эффекты только в одном направлении, с большей вероятностью будут опубликованы и/или представлены для публикации.

Помимо визуальной воронкообразной диаграммы, также были предложены статистические методы обнаружения публикационной предвзятости. ^[101] Они являются спорными, поскольку обычно имеют низкую мощность для обнаружения предвзятости, но также могут давать ложноположительные результаты при некоторых обстоятельствах. ^[102] Например, небольшие эффекты исследования (предвзятые меньшие исследования), в которых существуют методологические различия между меньшими и большими исследованиями, могут вызывать асимметрию в размерах эффекта, которая напоминает публикационную предвзятость. Однако небольшие эффекты исследования могут быть столь же проблематичны для интерпретации метаанализов, и авторам метаанализа необходимо исследовать потенциальные источники предвзятости. ^[103]

Проблема предвзятости публикации не является тривиальной, поскольку предполагается, что 25% метаанализов в психологических науках могли страдать от предвзятости публикации. ^[104] Однако низкая мощность существующих тестов и проблемы с визуальным представлением воронкообразного графика остаются проблемой, и оценки предвзятости публикации могут оставаться ниже, чем есть на самом деле.

Большинство обсуждений предвзятости публикации сосредоточены на журнальных практиках, благоприятствующих публикации статистически значимых результатов. Однако сомнительные исследовательские практики, такие как переработка статистических моделей до тех пор, пока не будет достигнута значимость, также могут благоприятствовать статистически значимым результатам в поддержку гипотез исследователей. ^[105]^[106]

Проблемы, связанные с исследованиями, не сообщающими о статистически значимых эффектах

Исследования часто не сообщают об эффектах, когда они не достигают статистической значимости. ^[107] Например, они могут просто сказать, что группы не показали статистически значимых различий, не сообщая никакой другой информации (например, статистику или p-значение). ^[108] Исключение этих исследований привело бы к ситуации, аналогичной публикационной ошибке, но их включение (предполагая нулевые эффекты) также привело бы к смещению метаанализа.

Проблемы, связанные со статистическим подходом

Другие недостатки заключаются в том, что не было определено, является ли наиболее статистически точным методом объединения результатов фиксированная, IVhet, случайная или модель с эффектом качества, хотя критика в адрес модели случайных эффектов усиливается из-за восприятия того, что новые случайные эффекты (используемые в метаанализе) по сути являются формальными устройствами для облегчения сглаживания или сжатия, а прогнозирование может быть невозможным или нецелесообразным. [ ^109] Основная проблема подхода случайных эффектов заключается в том, что он использует классическую статистическую идею создания «компромиссной оценки», которая делает веса близкими к естественно взвешенной оценке, если неоднородность между исследованиями велика, но близкими к обратной взвешенной оценке дисперсии, если неоднородность между исследованиями мала. Однако то, что было проигнорировано, — это различие между моделью, которую мы выбираем для анализа данного набора данных, и механизмом, с помощью которого данные появились . ^[110] Случайный эффект может присутствовать в любой из этих ролей, но эти две роли совершенно различны. Нет никаких оснований полагать, что модель анализа и механизм генерации данных (модель) похожи по форме, но многие подобласти статистики выработали привычку предполагать, для теории и моделирования, что механизм генерации данных (модель) идентичен модели анализа, которую мы выбираем (или хотели бы, чтобы выбрали другие). Как предполагаемый механизм для получения данных, модель случайного эффекта для метаанализа глупа, и более уместно думать об этой модели как о поверхностном описании и чем-то, что мы выбираем в качестве аналитического инструмента – но этот выбор для метаанализа может не сработать, потому что эффекты исследования являются фиксированной характеристикой соответствующего метаанализа, а распределение вероятностей является только описательным инструментом. ^[110]

Проблемы, возникающие из-за предвзятости повестки дня

Наиболее серьезная ошибка в метаанализе часто возникает, когда человек или люди, проводящие метаанализ, имеют экономические , социальные или политические цели, такие как принятие или отклонение законодательства . Люди с такими целями могут быть более склонны злоупотреблять метаанализом из-за личной предвзятости . Например, исследователи, благоприятствующие целям автора, скорее всего, будут выбирать свои исследования , в то время как те, кто не благоприятствует, будут игнорироваться или помечаться как «не заслуживающие доверия». Кроме того, сами благоприятствующие авторы могут быть предвзятыми или получать плату за получение результатов, которые поддерживают их общие политические, социальные или экономические цели, такими способами, как выбор небольших благоприятных наборов данных и не включение более крупных неблагоприятных наборов данных. Влияние таких предубеждений на результаты метаанализа возможно, поскольку методология метаанализа весьма гибка. ^[111]

Исследование 2011 года, проведенное с целью раскрытия возможных конфликтов интересов в базовых исследовательских исследованиях, используемых для медицинских метаанализов, рассмотрело 29 метаанализов и обнаружило, что конфликты интересов в исследованиях, лежащих в основе метаанализов, редко раскрывались. 29 метаанализов включали 11 из журналов общей медицины, 15 из журналов специализированной медицины и три из базы данных систематических обзоров Кокрейна . 29 метаанализов рассмотрели в общей сложности 509 рандомизированных контролируемых испытаний (РКИ). Из них 318 РКИ сообщили об источниках финансирования, причем 219 (69%) получали финансирование от промышленности (т. е. один или несколько авторов имели финансовые связи с фармацевтической промышленностью). Из 509 РКИ 132 сообщили о раскрытии конфликта интересов авторов, причем 91 исследование (69%) раскрыло, что один или несколько авторов имели финансовые связи с промышленностью. Однако эта информация редко отражалась в метаанализах. Только два (7%) сообщили об источниках финансирования РКИ, и ни один не сообщил о связях автора РКИ с промышленностью. Авторы пришли к выводу, что «без признания COI из-за финансирования промышленностью или финансовых связей автора с промышленностью из РКИ, включенных в метаанализы, понимание и оценка читателями доказательств из метаанализа могут быть скомпрометированы». ^[112]

Например, в 1998 году федеральный судья США установил, что Агентство по охране окружающей среды США злоупотребило процессом метаанализа, чтобы провести исследование, утверждающее о рисках рака для некурящих из-за окружающего табачного дыма (ETS) с намерением повлиять на политиков, чтобы они приняли законы о запрете курения на рабочих местах. Судья установил, что:

Выбор исследований EPA вызывает беспокойство. Во-первых, в протоколе есть доказательства, подтверждающие обвинение в том, что EPA «выбирало» свои данные. Без критериев объединения исследований в метаанализ суд не может определить, было ли исключение исследований, которые могли бы опровергнуть априорную гипотезу EPA, совпадением или преднамеренным. Во-вторых, исключение EPA почти половины доступных исследований напрямую противоречит заявленной цели EPA по анализу эпидемиологических исследований и противоречит Руководству EPA по оценке риска. См. ETS Risk Assessment на стр. 4-29 («Эти данные также следует изучить в интересах взвешивания всех имеющихся доказательств , как рекомендовано в руководящих принципах оценки канцерогенного риска Агентства по охране окружающей среды (US EPA, 1986a) (выделено мной)). В-третьих, избирательное использование данных Агентством по охране окружающей среды противоречит Закону об исследованиях радона. В Законе говорится, что программа Агентства по охране окружающей среды должна «собирать данные и информацию по всем аспектам качества воздуха в помещениях» (Закон об исследованиях радона § 403(a)(1)) (выделено мной). ^[113]

В результате злоупотреблений суд отменил Главы 1–6 и Приложения к документу Агентства по охране окружающей среды «Влияние пассивного курения на здоровье органов дыхания: рак легких и другие заболевания». ^[113]

Сопоставимость и достоверность включенных исследований

Метаанализ часто не может заменить адекватно проведенное первичное исследование. ^[114]

Неоднородность используемых методов может привести к ошибочным выводам. ^[115] Например, различия в формах вмешательства или когортах, которые считаются незначительными или неизвестными ученым, могут привести к существенно отличающимся результатам, включая результаты, которые искажают результаты метаанализа или не учитываются должным образом в его данных. И наоборот, результаты метаанализа могут также сделать определенные гипотезы или вмешательства нежизнеспособными и предвосхитить дальнейшие исследования или одобрения, несмотря на определенные изменения, такие как прерывистое введение, персонализированные критерии и комбинированные меры , что приводит к существенно отличающимся результатам, в том числе в случаях, когда они были успешно идентифицированы и применены в мелкомасштабных исследованиях, которые рассматривались в метаанализе. ^{[ необходима цитата ]} Стандартизация , воспроизведение экспериментов , открытые данные и открытые протоколы часто не могут смягчить такие проблемы, например, поскольку соответствующие факторы и критерии могут быть неизвестны или не быть зарегистрированы. ^{[ необходима цитата ]}

Ведутся дебаты о надлежащем балансе между тестированием с как можно меньшим количеством животных или людей и необходимостью получения надежных, достоверных результатов. Утверждается, что ненадежные исследования неэффективны и расточительны, и что исследования расточительны не только тогда, когда они останавливаются слишком поздно, но и когда они останавливаются слишком рано. В крупных клинических испытаниях иногда используются запланированные последовательные анализы, если есть значительные расходы или потенциальный вред, связанный с участниками тестирования. ^[116] В прикладной поведенческой науке были предложены «мегаисследования» для изучения эффективности многих различных вмешательств, разработанных в междисциплинарной манере отдельными командами. ^[117] В одном из таких исследований использовалась фитнес-цепочка для набора большого числа участников. Было высказано предположение, что поведенческие вмешательства часто трудно сравнивать [в метаанализах и обзорах], поскольку «разные ученые тестируют разные идеи вмешательств на разных выборках, используя разные результаты в разные временные интервалы», что приводит к отсутствию сопоставимости таких индивидуальных исследований, что ограничивает «их потенциал для информирования политики ». ^[117]

Слабые стандарты инклюзивности приводят к вводящим в заблуждение выводам

Метаанализы в образовании часто недостаточно ограничительны в отношении методологического качества исследований, которые они включают. Например, исследования, включающие небольшие выборки или сделанные исследователем измерения, приводят к завышенным оценкам размера эффекта. ^[118] Однако эта проблема также беспокоит метаанализ клинических испытаний. Использование различных инструментов оценки качества (QAT) приводит к включению различных исследований и получению противоречивых оценок средних эффектов лечения. ^[119]^[120]

Применение в современной науке

Современный статистический метаанализ делает больше, чем просто объединяет размеры эффекта набора исследований с использованием взвешенного среднего. Он может проверить, показывают ли результаты исследований больше вариации, чем вариация, которая ожидается из-за выборки разного количества участников исследования. Кроме того, характеристики исследования, такие как используемый инструмент измерения, выборка популяции или аспекты дизайна исследования, могут быть закодированы и использованы для уменьшения дисперсии оценщика (см. статистические модели выше). Таким образом, некоторые методологические недостатки в исследованиях могут быть исправлены статистически. Другие применения метааналитических методов включают разработку и проверку клинических моделей прогнозирования, где метаанализ может использоваться для объединения данных отдельных участников из разных исследовательских центров и для оценки обобщаемости модели, ^[121]^[122] или даже для агрегации существующих моделей прогнозирования. ^[123]

Метаанализ может быть выполнен как с использованием односубъектного, так и группового дизайна исследования. ^[124] Это важно, поскольку многие исследования были выполнены с использованием односубъектного дизайна исследования. ^[125] Существуют значительные споры о наиболее подходящей метааналитической технике для односубъектного исследования. ^[126]

Метаанализ приводит к смещению акцента с отдельных исследований на множественные исследования. Он подчеркивает практическую важность размера эффекта вместо статистической значимости отдельных исследований. Этот сдвиг в мышлении получил название «метааналитическое мышление». Результаты метаанализа часто показываются на графике леса .

Результаты исследований объединяются с использованием различных подходов. Один подход, часто используемый в метаанализе в исследованиях здравоохранения, называется « метод обратной дисперсии ». Средний размер эффекта во всех исследованиях вычисляется как взвешенное среднее , при этом веса равны обратной дисперсии оценки эффекта каждого исследования. Более крупным исследованиям и исследованиям с меньшими случайными вариациями придается больший вес, чем более мелким исследованиям. Другие распространенные подходы включают метод Мантеля–Хензеля ^[127] и метод Пето . ^[128]

Картирование на основе семян (ранее знаковое дифференциальное картирование, SDM) — это статистический метод для метаанализа исследований различий в активности или структуре мозга, в которых используются методы нейровизуализации, такие как фМРТ, ВБМ или ПЭТ.

Различные высокопроизводительные методы, такие как микрочипы, использовались для понимания экспрессии генов . Профили экспрессии микроРНК использовались для идентификации дифференциально экспрессируемых микроРНК в определенном типе клеток или тканей или болезненных состояниях или для проверки эффекта лечения. Метаанализ таких профилей экспрессии был проведен для получения новых выводов и подтверждения известных результатов. ^[129]

Метаанализ исследований по секвенированию всего генома представляет собой привлекательное решение проблемы сбора больших выборок для обнаружения редких вариантов, связанных со сложными фенотипами. Были разработаны некоторые методы, позволяющие проводить функционально обоснованный метаанализ ассоциаций редких вариантов в когортах масштаба биобанка, используя эффективные подходы для хранения сводной статистики. ^[130]

Охватывающие метаанализы также могут использоваться для оценки сети эффектов. Это позволяет исследователям изучать закономерности в более полной панораме более точно оцененных результатов и делать выводы, которые учитывают более широкий контекст (например, как отношения личности и интеллекта варьируются в зависимости от семейства черт). ^[131]

Смотрите также

Источники

В данной статье использован текст Дэниела С. Кинтаны, доступный по лицензии CC BY 4.0.

Ссылки

^ Балдуцци, Сара; Рюккер, Герта; Шварцер, Гвидо (ноябрь 2019 г.). «Как выполнить метаанализ с помощью R: практическое руководство». Психическое здоровье на основе фактических данных . 22 (4): 153–160. doi :10.1136/ebmental-2019-300117. ISSN 1468-960X. PMC 10231495. PMID 31563865 .
^ Page, Matthew J.; McKenzie, Joanne E.; Bossuyt, Patrick M.; Boutron, Isabelle; Hoffmann, Tammy C.; Mulrow, Cynthia D.; Shamseer, Larissa; Tetzlaff, Jennifer M.; Akl, Elie A.; Brennan, Sue E.; Chou, Roger; Glanville, Julie; Grimshaw, Jeremy M.; Hróbjartsson, Asbjørn; Lalu, Manoj M. (29 марта 2021 г.). «Заявление PRISMA 2020: обновленное руководство по отчетности систематических обзоров». Systematic Reviews . 10 (1): 89. doi : 10.1186/s13643-021-01626-4 . ISSN 2046-4053. PMC 8008539. PMID 33781348 .
^ abc Shadish WR, Lecy JD (сентябрь 2015 г.). «Метааналитический большой взрыв». Research Synthesis Methods . 6 (3): 246–264. doi :10.1002/jrsm.1132. PMID 26212600. S2CID 5416879.
^ ab Glass GV (сентябрь 2015 г.). «Метаанализ в среднем возрасте: личная история». Research Synthesis Methods . 6 (3): 221–231. doi :10.1002/jrsm.1133. PMID 26355796. S2CID 30083129.
^ Glass GV (1976). «Первичный, вторичный и метаанализ исследований». Educational Researcher . 5 (10): 3–8. doi :10.3102/0013189X005010003. S2CID 3185455.
^ Хант, Мортон (1997). Как наука подводит итоги: история метаанализа (1-е изд.). Нью-Йорк, Нью-Йорк, Соединенные Штаты Америки: Фонд Рассела Сейджа.
^ «Отчет о статистике вакцинации против кишечной лихорадки». British Medical Journal . 2 (2288): 1243–1246. Ноябрь 1904 г. doi : 10.1136/bmj.2.2288.1243. PMC 2355479. PMID 20761760 .
^ Nordmann AJ, Kasenda B, Briel M (9 марта 2012 г.). «Метаанализы: что они могут и чего не могут». Swiss Medical Weekly . 142 : w13518. doi : 10.4414/smw.2012.13518 . PMID 22407741.
^ O'Rourke K (декабрь 2007 г.). «Историческая перспектива метаанализа: количественная работа с различными результатами исследований». Журнал Королевского медицинского общества . 100 (12): 579–582. doi :10.1177/0141076807100012020. PMC 2121629. PMID 18065712 .
^ Гизелли, Э. Э. (1955). Измерение профессиональной пригодности. Публикации Калифорнийского университета по психологии, 8, 101–216.
^ Гизелли, Эдвин Э. (1973). «Достоверность тестов на способности при отборе персонала». Психология персонала . 26 (4): 461–477. doi :10.1111/j.1744-6570.1973.tb01150.x. ISSN 0031-5826.
^ Йейтс, Ф.; Кохран, В. Г. (1938). «Анализ групп экспериментов». Журнал сельскохозяйственной науки . 28 (4): 556–580. doi :10.1017/S0021859600050978. ISSN 0021-8596. S2CID 86619593.
^ Смит, Мэри Л.; Гласс, Джин В. (1977). «Метаанализ исследований результатов психотерапии». American Psychologist . 32 (9): 752–760. doi :10.1037/0003-066X.32.9.752. ISSN 1935-990X. PMID 921048. S2CID 43326263.
^ Айзенк, Х. Дж. (1978). «Упражнение в мегаглупости». Американский психолог . 33 (5): 517. doi :10.1037/0003-066X.33.5.517.a. ISSN 1935-990X.
^ ab Sharpe, Donald; Poets, Sarena (2020). «Метаанализ как ответ на кризис репликации». Канадская психология / Psychologie Canadienne . 61 (4): 377–387. doi :10.1037/cap0000215. ISSN 1878-7304. S2CID 225384392.
^ Айзенк, Х. Дж. (1995). «Метаанализ или синтез лучших доказательств?». Журнал оценки в клинической практике . 1 (1): 29–36. doi :10.1111/j.1365-2753.1995.tb00005.x. ISSN 1356-1294. PMID 9238555.
^ Иоаннидис, Джон ПА (2016). «Массовое производство избыточных, вводящих в заблуждение и противоречивых систематических обзоров и метаанализов». The Milbank Quarterly . 94 (3): 485–514. doi :10.1111/1468-0009.12210. ISSN 0887-378X. PMC 5020151. PMID 27620683 .
^ Vandvik PO, Brandt L (июль 2020 г.). «Будущее серии экосистемы доказательств: экосистемы доказательств и системы обучения в области здравоохранения: зачем беспокоиться?». Журнал клинической эпидемиологии . 123 : 166–170. doi : 10.1016/j.jclinepi.2020.02.008. PMID 32145365. S2CID 212629387.
^ Картабеллотта А., Тилсон Дж. К. (июнь 2019 г.). «Экосистема доказательств не может процветать без эффективности генерации, синтеза и перевода знаний». Журнал клинической эпидемиологии . 110 : 90–95. doi : 10.1016/j.jclinepi.2019.01.008. PMID 30708174. S2CID 73415319.
^ Haddaway NR, Bannach-Brown A, Grainger MJ, Hamilton WK, Hennessy EA, Keenan C и др. (июнь 2022 г.). «Синтез доказательств и метаанализ на конференции R (ESMARConf): выравнивание игрового поля доступности и равноправия конференции». Систематические обзоры . 11 (1): 113. doi : 10.1186/s13643-022-01985-6 . PMC 9164457. PMID 35659294 .
^ Ортис, Андрес Фелипе Эррера; Камачо, Эдуард Кадавид; Рохас, Хулиан Кубильос; Камачо, Татьяна Кадавид; Гевара, Стефани Зои; Куэнка, Нури Татьяна Ринкон; Пердомо, Андрес Васкес; Эрасо, Валерия Дель Кастильо; Мало, Рубен Хиральдо (2021). «Практическое руководство по проведению систематического обзора литературы и метаанализа». Принципы и практика клинических исследований . 7 (4): 47–57. дои : 10.21801/ppcrj.2021.74.6 . ISSN 2378-1890.
^ "Заявление PRISMA". Prisma-statement.org. 2 февраля 2012 г. Архивировано из оригинала 27 июля 2011 г. Получено 2 февраля 2012 г.
^ Grames, Eliza M.; Stillman, Andrew N.; Tingley, Morgan W.; Elphick, Chris S. (2019). Freckleton, Robert (ред.). «Автоматизированный подход к определению поисковых терминов для систематических обзоров с использованием сетей совместного появления ключевых слов». Методы в экологии и эволюции . 10 (10): 1645–1654. Bibcode : 2019MEcEv..10.1645G. doi : 10.1111/2041-210X.13268 . ISSN 2041-210X.
^ Суд, Амит; Эрвин, Патрисия Дж.; Эбберт, Джон О. (2004). «Использование инструментов расширенного поиска в PubMed для извлечения цитат». Труды клиники Майо . 79 (10): 1295–1300. doi : 10.4065/79.10.1295 . PMID 15473412.
^ Винсент, Беатрис; Винсент, Морис; Феррейра, Карлос Хиль (1 марта 2006 г.). «Упрощение поиска в PubMed: обучение поиску медицинской литературы с помощью интерактивного решения проблем». Онколог . 11 (3): 243–251. doi : 10.1634/theoncologist.11-3-243 . ISSN 1083-7159. PMID 16549808.
^ abcd Quintana, Daniel S. (8 октября 2015 г.). «От предварительной регистрации до публикации: нетехнический учебник по проведению метаанализа для синтеза корреляционных данных». Frontiers in Psychology . 6 : 1549. doi : 10.3389/fpsyg.2015.01549 . ISSN 1664-1078. PMC 4597034. PMID 26500598 .
^ Moher, David; Tetzlaff, Jennifer; Tricco, Andrea C; Sampson, Margaret; Altman, Douglas G (27 марта 2007 г.). Clarke, Mike (ред.). «Эпидемиология и характеристики систематических обзоров». PLOS Medicine . 4 (3): e78. doi : 10.1371/journal.pmed.0040078 . ISSN 1549-1676. PMC 1831728. PMID 17388659 .
^ Нгуен, Фи-Йен; Маккензи, Джоанн Э.; Гамильтон, Дэниел Г.; Мохер, Дэвид; Тагвелл, Питер; Фидлер, Фиона М.; Хаддавей, Нил Р.; Хиггинс, Джулиан ПТ; Канукула, Раджу; Карунанантан, Сатья; Максвелл, Лара Дж.; Макдональд, Стив; Накагава, Шиничи; Нунан, Дэвид; Уэлч, Вивиан А. (2023). «Точки зрения систематических рецензентов на обмен данными обзоров, аналитическим кодом и другими материалами: опрос». Кокрейновский синтез доказательств и методы . 1 (2). doi : 10.1002/cesm.12008 . ISSN 2832-9023.
^ Крамер, Дункан (2003). «Поучительная история двух статистик: частичная корреляция и стандартизированная частичная регрессия». Журнал психологии . 137 (5): 507–511. doi : 10.1080/00223980309600632. ISSN 0022-3980. PMID 14629080. S2CID 37557674.
^ Гросс, Арнд; Ширм, Сибилла; Шольц, Маркус (2014). «Ycasd – инструмент для сбора и масштабирования данных из графических представлений». BMC Bioinformatics . 15 (1): 219. doi : 10.1186/1471-2105-15-219 . ISSN 1471-2105. PMC 4085079. PMID 24965054 .
^ Клише, Матье; Розенберг, Дэвид; Мадека, Друв; Йи, Конни (2017), Сеси, Микеланджело; Холлмен, Яакко; Тодоровски, Люпчо; Венс, Селин (ред.), «Scatteract: автоматизированное извлечение данных из диаграмм рассеяния», Машинное обучение и обнаружение знаний в базах данных , т. 10534, Cham: Springer International Publishing, стр. 135–150, arXiv : 1704.06687 , doi : 10.1007/978-3-319-71249-9_9, ISBN 978-3-319-71248-2, S2CID 9543956 , получено 26 декабря 2023 г.
^ Моро, Дэвид; Гэмбл, Бо (2022). «Проведение метаанализа в эпоху открытой науки: инструменты, советы и практические рекомендации». Психологические методы . 27 (3): 426–432. doi :10.1037/met0000351. ISSN 1939-1463. PMID 32914999. S2CID 221619510.
^ ab МакГиннесс, Люк А.; Хиггинс, Джулиан ПТ (2021). «ВИЗУАЛИЗАЦИЯ РИСКА СМЕШЕНИЯ (robvis): пакет R и веб-приложение Shiny для визуализации оценок риска смещения». Методы синтеза исследований . 12 (1): 55–61. doi : 10.1002/jrsm.1411 . hdl : 1983/e59b578e-1534-43d9-a438-8bc27b363a9a . ISSN 1759-2879. PMID 32336025.
^ Сандерсон, С.; Татт, И. Д.; Хиггинс, Дж. П. (1 июня 2007 г.). «Инструменты оценки качества и восприимчивости к смещению в наблюдательных исследованиях в эпидемиологии: систематический обзор и аннотированная библиография». Международный журнал эпидемиологии . 36 (3): 666–676. doi : 10.1093/ije/dym018 . ISSN 0300-5771. PMID 17470488.
^ Haddaway, Neal R.; Macura, Biljana; Whaley, Paul; Pullin, Andrew S. (2018). "Стандарты отчетности ROSES для синтеза систематических доказательств: проформа, блок-схема и описательное резюме плана и проведения экологических систематических обзоров и систематических карт". Экологические доказательства . 7 (1). Bibcode : 2018EnvEv...7....7H. doi : 10.1186/s13750-018-0121-7 . ISSN 2047-2382.
^ Конн, Вики С.; Валентайн, Джеффри К.; Купер, Харрис М.; Ранц, Мэрилин Дж. (2003). «Серая литература в метаанализах». Nursing Research . 52 (4): 256–261. doi :10.1097/00006199-200307000-00008. ISSN 0029-6562. PMID 12867783. S2CID 27109643.
^ Шерер, Роберта В.; Салданья, Ян Дж. (2019). «Как систематические рецензенты должны обрабатывать тезисы конференций? Взгляд с окопов». Систематические обзоры . 8 (1): 264. doi : 10.1186/s13643-019-1188-0 . ISSN 2046-4053. PMC 6836535. PMID 31699124 .
^ Хартлинг, Лиза; Фезерстоун, Робин; Нуспл, Меган; Шейв, Касси; Драйден, Донна М.; Вандермеер, Бен (2017). «Серая литература в систематических обзорах: поперечное исследование вклада неанглоязычных отчетов, неопубликованных исследований и диссертаций в результаты метаанализов в обзорах, релевантных детям». BMC Medical Research Methodology . 17 (1): 64. doi : 10.1186/s12874-017-0347-z . ISSN 1471-2288. PMC 5395863. PMID 28420349 .
^ Haddaway, NR; Woodcock, P.; Macura, B.; Collins, A. (2015). «Сделать обзоры литературы более надежными за счет применения уроков, извлеченных из систематических обзоров». Conservation Biology . 29 (6): 1596–1605. Bibcode : 2015ConBi..29.1596H. doi : 10.1111/cobi.12541. ISSN 0888-8892. JSTOR 24761072. PMID 26032263. S2CID 20624428.
^ Эггер, М.; Юни, П.; Бартлетт, К.; Холенштейн, Ф.; Стерн, Дж. (2003). «Насколько важны комплексный поиск литературы и оценка качества испытаний в систематических обзорах? Эмпирическое исследование». Оценка технологий здравоохранения . 7 (1): 1–82. doi : 10.3310/hta7010 . ISSN 1366-5278. PMID 12583822.
^ Лефевр, Кэрол; Гланвиль, Джули; Бриско, Саймон; Литтлвуд, Энн; Маршалл, Крис; Метцендорф, Мария-Инти; Ноэль-Сторр, Анна; Рейдер, Тамара; Шокранех, Фархад (23 сентября 2019 г.), Хиггинс, Джулиан ПТ; Томас, Джеймс; Чендлер, Жаклин; Кампстон, Миранда (ред.), «Поиск и выбор исследований», Cochrane Handbook for Systematic Reviews of Interventions (1-е изд.), Wiley, стр. 67–107, doi :10.1002/9781119536604.ch4, ISBN 978-1-119-53662-8, S2CID 204603849 , получено 26 декабря 2023 г.
^ Маколи, Лора; Фам, Ба; Тагвелл, Питер; Мохер, Дэвид (2000). «Влияет ли включение серой литературы на оценки эффективности вмешательства, сообщаемые в метаанализах?». The Lancet . 356 (9237): 1228–1231. doi :10.1016/S0140-6736(00)02786-0. PMID 11072941. S2CID 33777183.
^ Хоупвелл, Салли; Кларк, Майк (2005). «Рефераты, представленные на конференции Американского общества клинической онкологии: насколько полно представлены результаты испытаний?». Клинические испытания . 2 (3): 265–268. doi :10.1191/1740774505cn091oa. ISSN 1740-7745. PMID 16279150. S2CID 3601317.
^ Бхандари, Мохит; Деверо, П. Дж.; Гайатт, Гордон Х.; Кук, Дебора Дж.; Свионтовски, Марк Ф.; Спраг, Шейла; Шемич, Эмиль Х. (2002). «Наблюдательное исследование ортопедических рефератов и последующих полнотекстовых публикаций». Журнал костной и суставной хирургии — Американский том . 84 (4): 615–621. doi :10.2106/00004623-200204000-00017. ISSN 0021-9355. PMID 11940624. S2CID 8807106.
^ Debray TP, Moons KG, van Valkenhoef G, Efthimiou O, Hummel N, Groenwold RH, Reitsma JB (декабрь 2015 г.). «Get real in Individual Participant Data (IPD) Meta-Analysis: a review of the methodology». Research Synthesis Methods . 6 (4): 293–309. doi :10.1002/jrsm.1160. PMC 5042043. PMID 26287812 .
^ Debray TP, Moons KG, Abo-Zaid GM, Koffijberg H, Riley RD (2013). «Метаанализ данных отдельных участников для бинарного результата: одноэтапный или двухэтапный?». PLOS ONE . 8 (4): e60650. Bibcode : 2013PLoSO...860650D. doi : 10.1371/journal.pone.0060650 . PMC 3621872. PMID 23585842 .
^ Burke DL, Ensor J, Riley RD (февраль 2017 г.). «Метаанализ с использованием данных отдельных участников: одноэтапный и двухэтапный подходы и почему они могут различаться». Статистика в медицине . 36 (5): 855–875. doi :10.1002/sim.7141. PMC 5297998. PMID 27747915 .
^ Helfenstein U (март 2002 г.). «Данные и модели определяют предложения по лечению — иллюстрация из метаанализа». Postgraduate Medical Journal . 78 (917): 131–134. doi :10.1136/pmj.78.917.131. PMC 1742301 . PMID 11884693.
^ Хеджес, Ларри В.; Вевеа, Джек Л. (1998). «Модели с фиксированными и случайными эффектами в метаанализе». Психологические методы . 3 (4): 486–504. doi :10.1037/1082-989X.3.4.486. ISSN 1939-1463. S2CID 119814256.
^ Сенн С. (март 2007 г.). «Пытаясь быть точным в отношении неопределенности». Статистика в медицине . 26 (7): 1417–1430. doi : 10.1002/sim.2639 . PMID 16906552. S2CID 17764847.
^ ab Al Khalaf MM, Thalib L, Doi SA (февраль 2011 г.). «Объединение гетерогенных исследований с использованием модели случайных эффектов является ошибкой и приводит к неубедительным метаанализам». Журнал клинической эпидемиологии . 64 (2): 119–123. doi :10.1016/j.jclinepi.2010.01.009. PMID 20409685.
^ ab Brockwell SE, Gordon IR (март 2001 г.). «Сравнение статистических методов для метаанализа». Статистика в медицине . 20 (6): 825–840. doi :10.1002/sim.650. PMID 11252006. S2CID 16932514.
^ abc Noma H (декабрь 2011 г.). «Доверительные интервалы для метаанализа случайных эффектов на основе поправок типа Бартлетта». Статистика в медицине . 30 (28): 3304–3312. doi : 10.1002/sim.4350. hdl : 2433/152046 . PMID 21964669. S2CID 6556986.
^ Brockwell SE, Gordon IR (ноябрь 2007 г.). «Простой метод вывода об общем эффекте в метаанализе». Статистика в медицине . 26 (25): 4531–4543. doi :10.1002/sim.2883. PMID 17397112. S2CID 887098.
^ Sidik K, Jonkman JN (ноябрь 2002 г.). «Простой доверительный интервал для метаанализа». Статистика в медицине . 21 (21): 3153–3159. doi :10.1002/sim.1262. PMID 12375296. S2CID 21384942.
^ Джексон Д., Боуден Дж. (январь 2009 г.). «Переоценка метода „квантильного приближения“ для метаанализа случайных эффектов». Статистика в медицине . 28 (2): 338–348. doi :10.1002/sim.3487. PMC 2991773. PMID 19016302 .
^ Poole C, Greenland S (сентябрь 1999 г.). «Метаанализ случайных эффектов не всегда консервативен». American Journal of Epidemiology . 150 (5): 469–475. doi : 10.1093/oxfordjournals.aje.a010035 . PMID 10472946.
^ Райли РД, Хиггинс ДжП, Дикс ДжДж (февраль 2011 г.). «Интерпретация метаанализов случайных эффектов». BMJ . 342 : d549. doi :10.1136/bmj.d549. PMID 21310794. S2CID 32994689.
^ Кристон Л (март 2013 г.). «Работа с клинической гетерогенностью в метаанализе. Предположения, методы, интерпретация». Международный журнал методов психиатрических исследований . 22 (1): 1–15. doi :10.1002/mpr.1377. PMC 6878481. PMID 23494781 .
^ Ланган, Дин; Хиггинс, Джулиан ПТ; Джексон, Дэн; Боуден, Джек; Вероники, Арети Ангелики; Контопантелис, Евангелос; Фихтбауэр, Вольфганг; Симмондс, Марк (2019). «Сравнение оценок дисперсии гетерогенности в метаанализах смоделированных случайных эффектов». Research Synthesis Methods . 10 (1): 83–98. doi : 10.1002/jrsm.1316 . hdl : 1983/c911791c-c687-4f12-bc0b-ffdbe42ca874 . ISSN 1759-2879. PMID 30067315. S2CID 51890354.
^ abcd "MetaXL User Guide" (PDF) . Получено 18 сентября 2018 г. .
^ Kontopantelis E, Reeves D (1 августа 2010 г.). «Metaan: метаанализ случайных эффектов». Stata Journal . 10 (3): 395–407. doi : 10.1177/1536867X1001000307 – через ResearchGate.
^ Field, Andy P.; Gillett, Raphael (2010). «Как провести метаанализ». British Journal of Mathematical and Statistical Psychology . 63 (3): 665–694. doi :10.1348/000711010X502733. PMID 20497626. S2CID 22688261.
^ Фихтбауэр, Вольфганг (2010). «Проведение метаанализа в R с пакетом metafor». Журнал статистического программного обеспечения . 36 (3). doi : 10.18637/jss.v036.i03 . ISSN 1548-7660. S2CID 15798713.
^ Kontopantelis E, Springate DA, Reeves D (2013). Friede T (ред.). «Повторный анализ данных библиотеки Кокрейна: опасности ненаблюдаемой гетерогенности в метаанализах». PLOS ONE . 8 (7): e69930. Bibcode :2013PLoSO...869930K. doi : 10.1371/journal.pone.0069930 . PMC 3724681 . PMID 23922860.
^ Kontopantelis E, Reeves D (27 сентября 2013 г.). «Краткое руководство и команда построения лесного графика (ipdforest) для одноэтапного метаанализа». Stata Journal . 13 (3): 574–587. doi : 10.1177/1536867X1301300308 – через ResearchGate.
^ abcd "Страница программного обеспечения MetaXL". Epigear.com. 3 июня 2017 г. Получено 18 сентября 2018 г.
^ Doi SA, Barendregt JJ, Khan S, Thalib L, Williams GM (ноябрь 2015 г.). «Достижения в метаанализе гетерогенных клинических испытаний I: модель гетерогенности обратной дисперсии». Contemporary Clinical Trials . 45 (Pt A): 130–138. doi :10.1016/j.cct.2015.05.009. hdl : 1885/17083 . PMID 26003435. S2CID 10792959.
^ ab Doi SA, Thalib L (январь 2008 г.). «Модель качественных эффектов для метаанализа». Эпидемиология . 19 (1): 94–100. doi : 10.1097/EDE.0b013e31815c24e7 . PMID 18090860. S2CID 29723291.
^ Doi SA, Barendregt JJ, Mozurkewich EL (март 2011 г.). «Метаанализ гетерогенных клинических испытаний: эмпирический пример». Contemporary Clinical Trials . 32 (2): 288–298. doi :10.1016/j.cct.2010.12.006. PMID 21147265.
^ Doi SA, Barendregt JJ, Khan S, Thalib L, Williams GM (июль 2015 г.). «Сравнение моделирования методов качественных и случайных эффектов метаанализа». Эпидемиология . 26 (4): e42–e44. doi : 10.1097/EDE.00000000000000289 . PMID 25872162.
^ Doi SA, Barendregt JJ, Khan S, Thalib L, Williams GM (ноябрь 2015 г.). «Достижения в метаанализе гетерогенных клинических испытаний II: модель эффектов качества». Contemporary Clinical Trials . 45 (Pt A): 123–129. doi :10.1016/j.cct.2015.05.010. PMID 26003432.
^ Bucher HC, Guyatt GH, Griffith LE, Walter SD (июнь 1997 г.). «Результаты прямых и косвенных сравнений лечения в метаанализе рандомизированных контролируемых испытаний». Журнал клинической эпидемиологии . 50 (6): 683–691. doi :10.1016/s0895-4356(97)00049-8. PMID 9250266.
^ abcd ван Валкенхоф Г., Лу Г., де Брок Б., Хилледж Х., Адес А.Е., Велтон, штат Нью-Джерси (декабрь 2012 г.). «Автоматизация сетевого метаанализа». Методы синтеза исследований . 3 (4): 285–299. дои : 10.1002/jrsm.1054. PMID 26053422. S2CID 33613631.
^ Брукс СП, Гельман А (1998). "Общие методы мониторинга сходимости итеративных симуляций" (PDF) . Журнал вычислительной и графической статистики . 7 (4): 434–455. doi :10.1080/10618600.1998.10474787. S2CID 7300890.
^ Хек Д. В., Гронау К. Ф., Вагенмейкерс Э. Дж., Патил И. (17 марта 2021 г.). "metaBMA: усреднение байесовской модели для метаанализа случайных и фиксированных эффектов". CRAN . Получено 9 мая 2022 г.
^ Bartoš F, Maier M, Wagenmakers EJ, Goosen J, Denwood M, Plummer M (20 апреля 2022 г.). "RoBMA: пакет R для надежных байесовских метаанализов" . Получено 9 мая 2022 г.
^ Gronau QF, Heck DW, Berkhout SW, Haaf JM, Wagenmakers EJ (июль 2021 г.). «Учебник по байесовскому метаанализу с усредненной моделью». Достижения в методах и практиках психологической науки . 4 (3). doi : 10.1177/25152459211031256 . hdl : 11245.1/ec2c07d1-5ff0-431b-b53a-10f9c5d9541d . ISSN 2515-2459. S2CID 237699937.
^ Bartoš F, Maier M, Quintana D, Wagenmakers EJ (16 октября 2020 г.). «Корректировка смещения публикации в JASP & R — модели отбора, PET-PEESE и надежный байесовский метаанализ». Достижения в области методов и практик в психологической науке . doi : 10.31234/osf.io/75bqn . hdl : 11245.1/5540e87c-0883-45e6-87de-48d2bf4c1e1d . S2CID 236826939.
^ ab Senn S, Gavini F, Magrez D, Scheen A (апрель 2013 г.). «Проблемы проведения сетевого метаанализа». Статистические методы в медицинских исследованиях . 22 (2): 169–189. doi :10.1177/0962280211432220. PMID 22218368. S2CID 10860031.
^ White IR (2011). «Многомерная метарегрессия случайных эффектов: обновления mvmeta». The Stata Journal . 11 (2): 255–270. doi : 10.1177/1536867X1101100206 .
^ Уиллис Б. Х., Хайд К. Дж. (май 2014 г.). «Оценка точности теста с использованием специализированного метаанализа — как данные, специфичные для конкретных условий, могут помочь в выборе исследования». Журнал клинической эпидемиологии . 67 (5): 538–546. doi : 10.1016/j.jclinepi.2013.10.016. PMID 24447592.
^ Willis BH, Hyde CJ (август 2015 г.). «Какова точность теста в популяции моей практики? Индивидуальный метаанализ дает правдоподобную оценку». Журнал клинической эпидемиологии . 68 (8): 847–854. doi :10.1016/j.jclinepi.2014.10.002. PMID 25479685. S2CID 205844216.
^ Чжан Х., Дэн Л., Шиффман М., Цинь Дж., Ю К. (2020). «Обобщенная модель интеграции для улучшения статистического вывода путем использования внешних сводных данных». Biometrika . 107 (3): 689–703. doi :10.1093/biomet/asaa014.
^ Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD и др. (октябрь 2011 г.). «Инструмент Cochrane Collaboration для оценки риска смещения в рандомизированных испытаниях». BMJ . 343 : d5928. doi :10.1136/bmj.d5928. PMC 3196245 . PMID 22008217.
^ Whiting PF, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB и др. (октябрь 2011 г.). «QUADAS-2: пересмотренный инструмент для оценки качества исследований диагностической точности». Annals of Internal Medicine . 155 (8): 529–536. doi : 10.7326/0003-4819-155-8-201110180-00009 . PMID 22007046.
^ Ройстон П., Пармар М.К., Сильвестр Р. (март 2004 г.). «Построение и проверка прогностической модели в нескольких исследованиях с применением при поверхностном раке мочевого пузыря». Статистика в медицине . 23 (6): 907–926. doi :10.1002/sim.1691. PMID 15027080. S2CID 23397142.
^ Willis BH, Riley RD (сентябрь 2017 г.). «Измерение статистической достоверности результатов сводного метаанализа и метарегрессии для использования в клинической практике». Статистика в медицине . 36 (21): 3283–3301. doi :10.1002/sim.7372. PMC 5575530. PMID 28620945 .
^ Riley RD, Ahmed I, Debray TP, Willis BH, Noordzij JP, Higgins JP, Deeks JJ (июнь 2015 г.). «Обобщение и проверка результатов точности тестов в нескольких исследованиях для использования в клинической практике». Статистика в медицине . 34 (13): 2081–2103. doi :10.1002/sim.6471. PMC 4973708. PMID 25800943.
^ LeLorier J, Grégoire G, Benhaddad A, Lapierre J, Derderian F (август 1997 г.). «Расхождения между метаанализами и последующими крупными рандомизированными контролируемыми испытаниями». The New England Journal of Medicine . 337 (8): 536–542. doi : 10.1056/NEJM199708213370806 . PMID 9262498.
^ ab Slavin RE (1986). «Синтез наилучших доказательств: альтернатива метааналитическим и традиционным обзорам». Educational Researcher . 15 (9): 5–9. doi :10.3102/0013189X015009005. S2CID 146457142.
^ Хантер Дж. Э., Шмидт Ф. Л., Джексон ГБ и др. (Американская психологическая ассоциация. Отделение промышленно-организационной психологии) (1982). Метаанализ: накопление результатов исследований в разных исследованиях . Беверли-Хиллз, Калифорния: Sage. ISBN 978-0-8039-1864-1.
^ Glass GV, McGaw B, Smith ML (1981). Метаанализ в социальных исследованиях . Беверли-Хиллз, Калифорния: Sage Publications. ISBN 978-0-8039-1633-3.
^ Вольф, Винцент; Кюнель, Энн; Текентруп, Ванесса; Кениг, Джулиан; Кремер, Нильс Б. (2021). «Влияет ли чрескожная стимуляция блуждающего нерва ушной раковины на вариабельность сердечного ритма, опосредованную блуждающим нервом? Живой и интерактивный байесовский метаанализ». Психофизиология . 58 (11): e13933. doi :10.1111/psyp.13933. ISSN 0048-5772. PMID 34473846.
^ Олбриттон, Дэвид; Гомес, Пабло; Анхеле, Бернхард; Василев, Мартин; Переа, Мануэль (22 июля 2024 г.). «Вдохнув жизнь в метааналитические методы». Журнал познания . 7 (1): 61. doi : 10.5334/joc.389 . ISSN 2514-4820. PMC 11276543. PMID 39072210 .
^ Поланин JR, Таннер-Смит EE, Хеннесси EA (2016). «Оценка разницы между опубликованными и неопубликованными размерами эффекта: метаобзор». Обзор образовательных исследований . 86 (1): 207–236. doi :10.3102/0034654315582067. ISSN 0034-6543. S2CID 145513046.
^ ab Rosenthal R (1979). «Проблема «картотечного ящика» и толерантность к нулевым результатам». Psychological Bulletin . 86 (3): 638–641. doi :10.1037/0033-2909.86.3.638. S2CID 36070395.
^ Хантер Дж. Э. , Шмидт Ф. Л. (1990). Методы метаанализа: исправление ошибок и смещений в результатах исследований . Ньюбери-Парк, Калифорния; Лондон; Нью-Дели: SAGE Publications .
^ Накагава, Шиничи; Лагиш, Малгожата; Дженнионс, Майкл Д.; Коричева, Джулия; Нобл, Дэниел ВА; Паркер, Тимоти Х.; Санчес-Тохар, Альфредо; Янг, Йефенг; О'Ди, Роуз Э. (2022). «Методы проверки предвзятости публикаций в экологических и эволюционных метаанализах». Методы в экологии и эволюции . 13 (1): 4–21. Bibcode : 2022MEcEv..13....4N. doi : 10.1111/2041-210X.13724. hdl : 1885/294436 . ISSN 2041-210X. S2CID 241159497.
^ Лайт Р. Дж., Пиллемер Д. Б. (1984). Подведение итогов: наука рецензирования исследований. Кембридж, Массачусетс: Издательство Гарвардского университета. ISBN 978-0-674-85431-4.
^ Vevea JL, Woods CM (декабрь 2005 г.). «Ошибка публикации в исследовательском синтезе: анализ чувствительности с использованием априорных весовых функций». Психологические методы . 10 (4): 428–443. doi :10.1037/1082-989X.10.4.428. PMID 16392998.
^ Иоаннидис JP, Трикалинос TA (апрель 2007 г.). «Уместность тестов на асимметрию для публикационной ошибки в метаанализах: большой опрос». CMAJ . 176 (8): 1091–1096. doi :10.1503/cmaj.060410. PMC 1839799 . PMID 17420491.
^ Хеджес Л. В., Вевеа Дж. Л. (1996). «Оценка размера эффекта в условиях смещения публикации: свойства малой выборки и надежность модели выбора случайных эффектов». Журнал образовательной и поведенческой статистики . 21 (4): 299–332. doi : 10.3102/10769986021004299. ISSN 1076-9986. S2CID 123680599.
^ Ferguson CJ, Brannick MT (март 2012 г.). «Ошибки публикации в психологической науке: распространенность, методы выявления и контроля, а также последствия для использования метаанализов». Психологические методы . 17 (1): 120–128. doi :10.1037/a0024445. PMID 21787082.
^ Simmons JP, Nelson LD, Simonsohn U (ноябрь 2011 г.). «Ложноположительная психология: нераскрытая гибкость в сборе и анализе данных позволяет представлять что угодно как значимое». Psychological Science . 22 (11): 1359–1366. doi : 10.1177/0956797611417632 . PMID 22006061.
^ LeBel E, Peters K (2011). «Опасаясь будущего эмпирической психологии: доказательства Бема (2011) psi как примера недостатков в практике модальных исследований» (PDF) . Review of General Psychology . 15 (4): 371–379. doi :10.1037/a0025172. S2CID 51686730. Архивировано из оригинала (PDF) 24 ноября 2012 г.
^ Шобер, Патрик; Боссерс, Себастьян М.; Шварте, Лотар А. (2018). «Статистическая значимость против клинической важности наблюдаемых размеров эффекта: что на самом деле представляют значения P и доверительные интервалы?». Анестезия и анальгезия . 126 (3): 1068–1072. doi :10.1213/ANE.0000000000002798. ISSN 0003-2999. PMC 5811238. PMID 29337724 .
^ Гейтс, Саймон; Илинг, Элизабет (2019). «Сообщение и интерпретация результатов клинических испытаний, в которых не утверждалось о различии в лечении: обзор четырех общих медицинских журналов». BMJ Open . 9 (9): e024785. doi :10.1136/bmjopen-2018-024785. ISSN 2044-6055. PMC 6738699. PMID 31501094 .
^ Hodges JS, Clayton MK (февраль 2011 г.). «Случайные эффекты старые и новые». стр. 1–23. CiteSeerX 10.1.1.225.2685 . {{cite web}}: Отсутствует или пусто |url=( помощь )
^ ab Hodges JS (2014). "Случайные эффекты старые и новые". Богато параметризованные линейные модели: аддитивные, временные ряды и пространственные модели с использованием случайных эффектов . Boca Raton: CRC Press. стр. 285–302. ISBN 978-1-4398-6683-2.
^ Stegenga J (декабрь 2011 г.). «Является ли метаанализ платиновым стандартом доказательств?». Исследования по истории и философии биологических и биомедицинских наук . 42 (4): 497–507. doi :10.1016/j.shpsc.2011.07.003. PMID 22035723.
^ Roseman M, Milette K, Bero LA, Coyne JC, Lexchin J, Turner EH, Thombs BD (2011), «Сообщение о конфликтах интересов в метаанализах испытаний фармакологических методов лечения», Журнал Американской медицинской ассоциации , 305 (10): 1008–1017, doi : 10.1001/jama.2011.257, hdl : 11370/d4a95ee2-429f-45a4-a917-d794ee954797 , PMID 21386079, S2CID 11270323
^ ab "The Osteen Decision". Окружной суд Соединенных Штатов по Среднему округу Северной Каролины. 17 июля 1998 г. Получено 18 марта 2017 г.
^ Munafò MR, Flint J (сентябрь 2004 г.). «Метаанализ исследований генетических ассоциаций». Trends in Genetics . 20 (9): 439–444. doi :10.1016/j.tig.2004.06.014. PMID 15313553.
^ Stone DL, Rosopa PJ (1 марта 2017 г.). «Преимущества и ограничения использования метаанализа в исследованиях управления человеческими ресурсами». Human Resource Management Review . 27 (1): 1–7. doi :10.1016/j.hrmr.2016.09.001. ISSN 1053-4822.
^ Button KS, Ioannidis JP, Mokrysz C, Nosek BA, Flint J, Robinson ES, Munafò MR (май 2013 г.). «Отказ питания: почему малый размер выборки подрывает надежность нейронауки». Nature Reviews. Neuroscience . 14 (5): 365–376. doi : 10.1038/nrn3475 . PMID 23571845. S2CID 455476.
^ ab Milkman KL, Gromet D, Ho H, Kay JS, Lee TW, Pandiloski P и др. (декабрь 2021 г.). «Мегаисследования улучшают влияние прикладной поведенческой науки». Nature . 600 (7889): 478–483. Bibcode :2021Natur.600..478M. doi :10.1038/s41586-021-04128-4. PMC 8822539 . PMID 34880497. S2CID 245047340.
^ Cheung AC, Slavin RE (1 июня 2016 г.). «Как методологические особенности влияют на размеры эффекта в образовании». Educational Researcher . 45 (5): 283–292. doi :10.3102/0013189X16656615. ISSN 0013-189X. S2CID 148531062.
^ Jüni P, Witschi A, Bloch R, Egger M (сентябрь 1999 г.). «Опасности оценки качества клинических испытаний для метаанализа». JAMA . 282 (11): 1054–1060. doi : 10.1001/jama.282.11.1054 . PMID 10493204.
^ Armijo-Olivo S, Fuentes J, Ospina M, Saltaji H, Hartling L (сентябрь 2013 г.). «Несоответствие в элементах, включенных в инструменты, используемые в исследованиях общего здоровья и физиотерапии для оценки методологического качества рандомизированных контролируемых испытаний: описательный анализ». BMC Medical Research Methodology . 13 (1): 116. doi : 10.1186/1471-2288-13-116 . PMC 3848693. PMID 24044807 .
^ Debray TP, Riley RD, Rovers MM, Reitsma JB, Moons KG (октябрь 2015 г.). «Метаанализ данных индивидуальных участников (IPD) диагностических и прогностических исследований моделирования: руководство по их использованию». PLOS Medicine . 12 (10): e1001886. doi : 10.1371/journal.pmed.1001886 . PMC 4603958 . PMID 26461078.
^ Debray TP, Moons KG, Ahmed I, Koffijberg H, Riley RD (август 2013 г.). «Структура для разработки, внедрения и оценки клинических моделей прогнозирования в метаанализе данных отдельных участников» (PDF) . Статистика в медицине . 32 (18): 3158–3180. doi :10.1002/sim.5732. PMID 23307585. S2CID 25308961.
^ Debray TP, Koffijberg H, Vergouwe Y, Moons KG, Steyerberg EW (октябрь 2012 г.). «Объединение опубликованных моделей прогнозирования с данными отдельных участников: сравнение различных подходов» (PDF) . Статистика в медицине . 31 (23): 2697–2712. doi :10.1002/sim.5412. PMID 22733546. S2CID 39439611.
^ Шадиш, Уильям Р. (2014). «Анализ и метаанализ однокейсовых проектов: введение». Журнал школьной психологии . 52 (2): 109–122. doi :10.1016/j.jsp.2013.11.009. PMID 24606971.
^ Зелински, Николь AM; Шадиш, Уильям (19 мая 2018 г.). «Демонстрация того, как проводить метаанализ, который сочетает в себе единичные проекты с межгрупповыми экспериментами: влияние принятия решений на сложное поведение, выполняемое людьми с ограниченными возможностями». Developmental Neurorehabilitation . 21 (4): 266–278. doi :10.3109/17518423.2015.1100690. ISSN 1751-8423. PMID 26809945. S2CID 20442353.
^ Ван ден Ноортгейт В., Онгена П. (2007). «Агрегирование результатов отдельных случаев». The Behavior Analyst Today . 8 (2): 196–209. doi :10.1037/h0100613.
^ Mantel N, Haenszel W (апрель 1959). «Статистические аспекты анализа данных ретроспективных исследований заболеваний». Журнал Национального института рака . 22 (4): 719–748. doi :10.1093/jnci/22.4.719. PMID 13655060. S2CID 17698270.
^ Deeks JJ, Higgins JP, Altman DG и др. (Cochrane Statistical Methods Group) (2021). «Глава 10: Анализ данных и проведение метаанализов: 10.4.2 Метод отношения шансов Пето». В Higgins J, Thomas J, Chandler J, Cumpston M, Li T, Page M, Welch V (ред.). Cochrane Handbook for Systematic Reviews of Interventions (версия 6.2 ред.). Cochrane Collaboration.
^ Bargaje R, Hariharan M, Scaria V, Pillai B (январь 2010 г.). «Консенсусные профили экспрессии miRNA, полученные из межплатформенной нормализации данных микрочипов». RNA . 16 (1): 16–25. doi :10.1261/rna.1688110. PMC 2802026 . PMID 19948767.
^ Ли, Сихао; Быстрее, Корбин; Чжоу, Хуфэн; Гейнор, Шейла М.; Лю, Яову; Чен, Хан; Сельварадж, Маргарет Сунита; Сан, Райан; Дей, Рунак; Арнетт, Донна К.; Белак, Лоуренс Ф.; Бис, Джошуа К.; Бланджеро, Джон; Бурвинкль, Эрик; Боуден, Дональд В.; Броуди, Дженнифер А.; Кейд, Брайан Э.; Корреа, Адольфо; Капплс, Л. Адриенн; Карран, Джоан Э.; де Врис, Поль С.; Дуггирала, Равиндранат; Фридман, Барри И.; Геринг, Харальд Х.Х.; Го, Сюцин; Хесслер, Джеффри; Кальяни, Рита Р.; Куперберг, Чарльз; Крал, Брайан Г.; Ланге, Лесли А.; Маничайкул, Ани; Мартин, Лиза В.; МакГарви, Стивен Т.; Митчелл, Брэкстон Д.; Монтассер, Мэй Э.; Моррисон, Аланна С.; Насери, Тейк; О'Коннелл, Джеффри Р. .; Палмер, Николетт Д.; Пейсер, Патрисия А.; Псати, Брюс М.; Раффилд, Лора М.; Редлайн, Сьюзен; Райнер, Александр П.; Реупена, Муагутутиа Сефуива; Райс, Кеннет М.; Рич , Стивен С.; Ситлани, Колин М.; Смит, Дженнифер А.; Тейлор, Кент Д.; Васан, Рамачандран С.; Виллер, Кристен Дж.; Уилсон, Джеймс Г.; Янек, Лиза Р.; Чжао, Вэй ; Консорциум NHLBI Trans-Omics for Precision Medicine (TOPMed); Рабочая группа по липидам TOPMed; Роттер, Джером И.; Натараджан, Прадип; Пелозо, Джина М.; Ли, Цзылин; Линь, Сихун (январь 2023 г.). «Мощный, масштабируемый и Ресурсоэффективный метаанализ ассоциаций редких вариантов в крупных исследованиях по секвенированию всего генома". Nature Genetics . 55 (1): 154–164. doi :10.1038/s41588-022-01225-6. PMC 10084891 . PMID 36564505. S2CID 255084231 .
^ Станек, Кевин С.; Унес, Дениз С. (2023). Of Anchors & Sails: Personality-ability character constellations. Миннеаполис, Миннесота, США: University of Minnesota Libraries Publishing. стр. Главы 4–7. doi : 10.24926/9781946135988. ISBN 978-1-946135-98-8. S2CID 265335858.

Дальнейшее чтение

Cornell JE, Mulrow CD (1999). «Метаанализ». В Mellenbergh GJ (ред.). Методология исследований в области естественных, поведенческих и социальных наук . Лондон: SAGE. стр. 285–323. ISBN 978-0-7619-5883-3.
Эллис PD (2010). Основное руководство по размерам эффектов: введение в статистическую мощность, метаанализ и интерпретацию результатов исследований . Кембридж: Cambridge University Press. ISBN 978-0-521-14246-5.
Sutton AJ, Jones DR, Abrams KR, Sheldon TA, Song F (2000). Методы метаанализа в медицинских исследованиях . Лондон: John Wiley. ISBN 978-0-471-49066-1.
Wilson DB, Lipsey MW (2001). Практический метаанализ . Thousand Oaks: Sage publications. ISBN 978-0-7619-2168-4.
Купер Х, Хеджес Л.В., ред. (1994). Справочник по исследовательскому синтезу . Нью-Йорк: Фонд Рассела Сейджа. ISBN 978-0-87154-226-7.
Бонетт Д.Г. (декабрь 2010 г.). «Методы метаанализа с переменными коэффициентами для надежности альфа». Психологические методы . 15 (4): 368–385. doi :10.1037/a0020142. PMID 20853952. S2CID 207710319.
Бонетт Д.Г., Прайс Р.М. (ноябрь 2014 г.). «Методы метаанализа различий в рисках». Британский журнал математической и статистической психологии . 67 (3): 371–387. doi :10.1111/bmsp.12024. PMID 23962020.
Бонетт Д.Г. (сентябрь 2008 г.). «Метааналитическая интервальная оценка для двумерных корреляций». Психологические методы . 13 (3): 173–181. doi :10.1037/a0012868. PMID 18778150. S2CID 5690835.
Бонетт Д.Г. (сентябрь 2009 г.). «Метааналитическая интервальная оценка для стандартизированных и нестандартизированных средних разностей». Психологические методы . 14 (3): 225–238. doi :10.1037/a0016619. PMID 19719359.
Бонетт Д.Г., Прайс Р.М. (сентябрь 2015 г.). «Методы метаанализа с переменными коэффициентами для отношений шансов и отношений риска». Психологические методы . 20 (3): 394–406. doi :10.1037/met0000032. PMID 25751513.
Bonett DG (ноябрь 2020 г.). «Точечно-бисериальная корреляция: оценка интервала, проверка гипотез, метаанализ и определение размера выборки». Британский журнал математической и статистической психологии . 73 (Suppl 1): 113–144. doi :10.1111/bmsp.12189. PMID 31565811. S2CID 203607297.
Normand SL (февраль 1999). «Метаанализ: формулирование, оценка, объединение и отчетность». Статистика в медицине . 18 (3): 321–359. doi :10.1002/(SICI)1097-0258(19990215)18:3<321::AID-SIM28>3.0.CO;2-P. PMID 10070677.
Owen AB (декабрь 2009 г.). «Повторный обзор метаанализа Карла Пирсона» (PDF) . The Annals of Statistics . 37 (6B): 3867–2892. arXiv : 0911.3531 . doi :10.1214/09-AOS697. S2CID 7632667. Архивировано из оригинала (PDF) 26 июля 2011 г.
Слау, Тара; Тайсон, Скотт А. (2022). «Внешняя валидность и метаанализ». Американский журнал политических наук . doi:10.1111/ajps.12742. ISSN 0092-5853.
Thompson SG, Pocock SJ (ноябрь 1991 г.). «Можно ли доверять метаанализам?» (PDF) . Lancet . 338 (8775): 1127–1130. doi :10.1016/0140-6736(91)91975-Z. PMID 1682553. S2CID 29743240. Архивировано из оригинала (PDF) 22 ноября 2011 г. . Получено 17 июня 2011 г. .. Рассматривает две противоположные точки зрения: предоставляет ли метаанализ «объективные, количественные методы для объединения доказательств из отдельных, но схожих исследований» или просто «статистические приемы, которые делают неоправданные предположения, производя упрощенные обобщения из комплекса разрозненных исследований»?
О'Рурк К (2007). "Просто история из объединения информации: исследование и синтез того, что, возможно, является общим в клинических наблюдениях или исследованиях с помощью правдоподобия" (PDF) . Оксфорд: Оксфордский университет, кафедра статистики. Архивировано из оригинала (PDF) 2 ноября 2011 г.Содержит технические справочные материалы и подробности по статье «Исторический взгляд на метаанализ», цитируемой в ссылках.