Рандомизированное контролируемое исследование (или рандомизированное контролируемое исследование ; [2] РКИ ) — это форма научного эксперимента, используемая для контроля факторов, не находящихся под прямым экспериментальным контролем. Примерами РКИ являются клинические исследования , в которых сравниваются эффекты лекарств, хирургических методов, медицинских приборов , диагностических процедур , диет или других видов лечения. [3] [4]
Участники, которые регистрируются в РКИ, отличаются друг от друга известными и неизвестными способами, которые могут влиять на результаты исследования, но которые нельзя контролировать напрямую. Случайным образом распределяя участников среди сравниваемых методов лечения, РКИ обеспечивает статистический контроль над этими влияниями. При условии, что оно хорошо разработано, проведено должным образом и включает достаточное количество участников, РКИ может достичь достаточного контроля над этими мешающими факторами , чтобы предоставить полезное сравнение изучаемых методов лечения.
Определение и примеры
РКИ в клинических исследованиях обычно сравнивают предлагаемое новое лечение с существующим стандартом лечения ; затем их называют «экспериментальным» и «контрольным» лечением соответственно. Когда такое общепринятое лечение недоступно, в контрольной группе может использоваться плацебо , чтобы участники не знали о назначенном им лечении. Этот принцип ослепления в идеале также распространяется как можно шире на другие стороны, включая исследователей, техников, аналитиков данных и оценщиков. Эффективное ослепление экспериментально изолирует физиологические эффекты лечения от различных психологических источников предвзятости . [ необходима цитата ]
Случайность в назначении участников на лечение снижает смещение отбора и смещение распределения, уравновешивая как известные, так и неизвестные прогностические факторы при назначении лечения. [5] Ослепление снижает другие формы смещений экспериментатора и субъекта .
Хорошо ослепленное РКИ считается золотым стандартом для клинических испытаний. Слепые РКИ обычно используются для проверки эффективности медицинских вмешательств и могут дополнительно предоставлять информацию о побочных эффектах, таких как лекарственные реакции . Рандомизированное контролируемое испытание может предоставить убедительные доказательства того, что исследуемое лечение оказывает влияние на здоровье человека. [6]
Термины «РКИ» и «рандомизированное исследование» иногда используются как синонимы, но последний термин не упоминает контрольные группы и, следовательно, может описывать исследования, в которых сравниваются несколько групп лечения друг с другом при отсутствии контрольной группы. [7] Аналогичным образом, аббревиатура иногда расширяется до «рандомизированного клинического исследования» или «рандомизированного сравнительного исследования», что приводит к двусмысленности в научной литературе . [8] [9] Не все РКИ являются рандомизированными контролируемыми исследованиями (а некоторые из них никогда не могли бы ими быть, как в случаях, когда использование контролей было бы непрактичным или неэтичным). Термин рандомизированное контролируемое клиническое исследование является альтернативным термином, используемым в клинических исследованиях; [10] однако РКИ также используются в других областях исследований, включая многие социальные науки.
История
Первое зарегистрированное клиническое испытание было проведено Джеймсом Линдом в 1747 году для выявления метода лечения цинги . [11] Первый слепой эксперимент был проведен Французской королевской комиссией по животному магнетизму в 1784 году для изучения утверждений о месмеризме . Раннее эссе, пропагандирующее ослепление исследователей, было написано Клодом Бернаром во второй половине 19-го века. [ неопределенно ] Бернар рекомендовал, чтобы наблюдатель эксперимента не знал о проверяемой гипотезе. Это предложение резко контрастировало с распространенным отношением эпохи Просвещения , что научное наблюдение может быть объективно обоснованным только тогда, когда оно проводится хорошо образованным, информированным ученым. [12] Первое исследование, в котором был зарегистрирован ослепленный исследователь, было опубликовано в 1907 году У. Х. Р. Риверсом и Х. Н. Уэббером для изучения эффектов кофеина. [13]
В начале 20 века рандомизированные эксперименты появились в сельском хозяйстве благодаря Ежи Нейману [21] и Рональду А. Фишеру . Экспериментальные исследования Фишера и его труды популяризировали рандомизированные эксперименты. [22]
Первое опубликованное рандомизированное контролируемое исследование в медицине появилось в статье 1948 года под названием « Лечение стрептомицином туберкулеза легких », в которой описывалось исследование Медицинского исследовательского совета . [23] [24] [25] Одним из авторов этой статьи был Остин Брэдфорд Хилл , которого считают создателем современного рандомизированного контролируемого исследования. [26]
На дизайн испытаний также оказали влияние крупномасштабные испытания ISIS по лечению сердечного приступа , которые проводились в 1980-х годах. [27]
К концу 20 века РКИ были признаны стандартным методом «рациональной терапии» в медицине. [28] По состоянию на 2004 год в библиотеке Кокрейна находилось более 150 000 РКИ . [26] Чтобы улучшить представление результатов РКИ в медицинской литературе, международная группа ученых и редакторов опубликовала в 1996, 2001 и 2010 годах «Сводные стандарты отчетности об испытаниях» (CONSORT), которые стали широко принятыми. [1] [5] Рандомизация — это процесс распределения участников испытания по группам лечения или контроля с использованием элемента случайности для определения распределения с целью снижения смещения.
Этика
Хотя принцип клинического равновесия («истинная неопределенность в экспертном медицинском сообществе... относительно предпочтительного лечения»), общий для клинических испытаний [29], был применен к РКИ, этика РКИ имеет особые соображения. Во-первых, утверждалось, что само по себе равновесие недостаточно для оправдания РКИ. [30] Во-вторых, «коллективное равновесие» может конфликтовать с отсутствием личного равновесия (например, личной убежденности в том, что вмешательство эффективно). [31] Наконец, дизайн Зелена , который использовался для некоторых РКИ, рандомизирует субъектов до того, как они дадут информированное согласие, что может быть этичным для РКИ скрининга и выбранных методов лечения, но, вероятно, неэтично «для большинства терапевтических испытаний». [32] [33]
Хотя субъекты почти всегда дают информированное согласие на свое участие в РКИ, исследования, проведенные с 1982 года, задокументировали, что субъекты РКИ могут быть уверены, что получат лечение, которое лучше всего подходит им лично; то есть они не понимают разницы между исследованием и лечением. [34] [35] Необходимы дальнейшие исследования для определения распространенности и путей решения этой « терапевтической ошибки ». [35]
Различия в методах РКИ также могут создавать культурные эффекты, которые не были хорошо изучены. [36] Например, пациенты с неизлечимыми заболеваниями могут присоединиться к испытаниям в надежде на излечение, даже если лечение вряд ли будет успешным.
Пробная регистрация
В 2004 году Международный комитет редакторов медицинских журналов (ICMJE) объявил, что все испытания, регистрация которых началась после 1 июля 2005 года, должны быть зарегистрированы до рассмотрения возможности публикации в одном из 12 журналов-членов комитета. [37] Однако регистрация испытаний может произойти поздно или не произойти вообще. [38] [39]
Медицинские журналы медленно адаптируют политику, требующую обязательной регистрации клинических испытаний в качестве предварительного условия для публикации. [40]
Классификации
По дизайну исследования
Один из способов классификации РКИ — по дизайну исследования . От наиболее до наименее распространенных в медицинской литературе, основные категории дизайнов РКИ-исследований следующие: [41]
Параллельная группа – каждый участник случайным образом распределяется по группам, и все участники группы получают (или не получают) вмешательство. [42] [43]
Кроссовер – со временем каждый участник получает (или не получает) вмешательство в случайной последовательности. [44] [45]
Кластер – ранее существовавшие группы участников (например, деревни, школы) выбираются случайным образом для получения (или не получения) вмешательства. [46] [47]
Факториальный – каждый участник случайным образом распределяется в группу, которая получает определенную комбинацию вмешательств или невмешательств (например, группа 1 получает витамин X и витамин Y, группа 2 получает витамин X и плацебо Y, группа 3 получает плацебо X и витамин Y, а группа 4 получает плацебо X и плацебо Y).
Анализ 616 РКИ, проиндексированных в PubMed в декабре 2006 года, показал, что 78% из них были параллельными групповыми испытаниями, 16% — перекрестными, 2% — разделенными, 2% — кластерными и 2% — факторными. [41]
По интересующему результату (эффективность против результативности)
РКИ можно классифицировать как «объяснительные» или «прагматические». [48] Объяснительные РКИ проверяют эффективность в условиях исследования с тщательно отобранными участниками и в строго контролируемых условиях. [48] Напротив, прагматические РКИ (пРКИ) проверяют эффективность в повседневной практике с относительно не отобранными участниками и в гибких условиях; таким образом, прагматические РКИ могут «информировать решения о практике». [48]
По гипотезе (превосходство против неполноценности против эквивалентности)
Другая классификация РКИ подразделяет их на «испытания превосходства», «испытания не меньшей эффективности» и «испытания эквивалентности», которые различаются по методологии и отчетности. [49] Большинство РКИ являются испытаниями превосходства, в которых предполагается, что одно вмешательство превосходит другое статистически значимым образом. [49] Некоторые РКИ являются испытаниями не меньшей эффективности, «чтобы определить, не хуже ли новое лечение, чем референтное лечение». [49] Другие РКИ являются испытаниями эквивалентности, в которых гипотеза заключается в том, что два вмешательства неотличимы друг от друга. [49]
Рандомизация
Преимущества правильной рандомизации в РКИ включают в себя: [50]
«Это способствует сокрытию (маскировке) характера лечения от исследователей, участников и оценщиков».
«Это позволяет использовать теорию вероятности для выражения вероятности того, что любая разница в результатах между группами лечения просто указывает на случайность».
Существует два процесса, вовлеченных в рандомизацию пациентов для различных вмешательств. Первый — это выбор процедуры рандомизации для генерации непредсказуемой последовательности распределений; это может быть простое случайное распределение пациентов в любую из групп с равной вероятностью, может быть «ограниченным» или может быть «адаптивным». Вторая и более практическая проблема — это сокрытие распределения , которое относится к строгим мерам предосторожности, принимаемым для обеспечения того, чтобы групповое распределение пациентов не было раскрыто до окончательного распределения их по соответствующим группам. Неслучайные «систематические» методы группового распределения, такие как чередование субъектов между одной группой и другой, могут вызвать «безграничные возможности заражения» и могут привести к нарушению сокрытия распределения. [51]
Однако эмпирические доказательства того, что адекватная рандомизация изменяет результаты по сравнению с неадекватной рандомизацией, обнаружить трудно. [52]
Процедуры
Распределение лечения представляет собой желаемую долю пациентов в каждой группе лечения.
Идеальная процедура рандомизации должна достигать следующих целей: [53]
Максимизируйте статистическую мощность , особенно в анализах подгрупп . Как правило, равные размеры групп максимизируют статистическую мощность, однако неравные размеры групп могут быть более мощными для некоторых анализов (например, множественные сравнения плацебо с несколькими дозами с использованием процедуры Даннетта [54] ), и иногда желательны по неаналитическим причинам (например, пациенты могут быть более мотивированы к регистрации, если есть более высокий шанс получить тестовое лечение, или регулирующие органы могут потребовать минимальное количество пациентов, подвергающихся лечению). [55]
Минимизируйте смещение отбора. Это может произойти, если исследователи могут сознательно или бессознательно отдавать предпочтение пациентам между группами лечения. Хорошая процедура рандомизации будет непредсказуемой, так что исследователи не смогут угадать назначение группы следующего субъекта на основе предыдущих назначений лечения. Риск смещения отбора наиболее высок, когда предыдущие назначения лечения известны (как в неслепых исследованиях) или могут быть угаданы (возможно, если препарат имеет отличительные побочные эффекты).
Минимизируйте смещение распределения (или смешение). Это может произойти, когда ковариаты , которые влияют на результат, неравномерно распределены между группами лечения, и эффект лечения смешивается с эффектом ковариатов (т. е. «случайное смещение» [50] [56] ). Если процедура рандомизации вызывает дисбаланс в ковариатах, связанных с результатом в разных группах, оценки эффекта могут быть смещены , если не скорректированы с учетом ковариатов (которые могут быть неизмеренными и, следовательно, не поддающимися корректировке).
Однако ни одна процедура рандомизации не отвечает этим целям во всех обстоятельствах, поэтому исследователи должны выбирать процедуру для конкретного исследования, исходя из ее преимуществ и недостатков.
Простой
Это широко используемая и интуитивно понятная процедура, похожая на «повторное честное подбрасывание монеты». [50] Также известная как «полная» или «неограниченная» рандомизация, она устойчива как к выборочным, так и к случайным смещениям. Однако ее главным недостатком является возможность несбалансированных размеров групп в небольших РКИ. Поэтому она рекомендуется только для РКИ с более чем 200 субъектами. [57]
Ограниченный
Для балансировки размеров групп в небольших РКИ рекомендуется использовать некоторую форму «ограниченной» рандомизации . [57] Основные типы ограниченной рандомизации, используемые в РКИ:
Рандомизация с переставленными блоками или блочная рандомизация: указываются «размер блока» и «коэффициент распределения» (количество субъектов в одной группе по сравнению с другой группой), и субъекты распределяются случайным образом внутри каждого блока. [51] Например, размер блока 6 и коэффициент распределения 2:1 приведут к случайному распределению 4 субъектов в одну группу и 2 в другую. Этот тип рандомизации можно объединить со « стратифицированной рандомизацией », например, по центру в многоцентровом исследовании , чтобы «обеспечить хороший баланс характеристик участников в каждой группе». [5] Особым случаем рандомизации с переставленными блоками является случайное распределение , при котором вся выборка рассматривается как один блок. [51] Основным недостатком рандомизации с переставленными блоками является то, что даже если размеры блоков большие и случайным образом изменяются, процедура может привести к смещению отбора. [53] Другим недостатком является то, что «правильный» анализ данных из рандомизированных с переставленными блоками РКИ требует стратификации по блокам. [57]
Методы адаптивной рандомизации с предвзятой монетой (из которых рандомизация с помощью урн является наиболее широко известным типом): В этих относительно редких методах вероятность отнесения к группе уменьшается, если группа представлена слишком много, и увеличивается, если группа представлена недостаточно. [51] Считается, что эти методы в меньшей степени подвержены смещению отбора, чем рандомизация с переставленными блоками. [57]
Адаптивный
В РКИ использовались по крайней мере два типа процедур «адаптивной» рандомизации, но гораздо реже, чем простая или ограниченная рандомизация:
Ковариатно-адаптивная рандомизация, одним из типов которой является минимизация : вероятность отнесения к группе варьируется, чтобы минимизировать «ковариатный дисбаланс». [57] Сообщается, что у минимизации есть «сторонники и противники» [51], поскольку только распределение группы первого субъекта действительно выбирается случайным образом, метод не обязательно устраняет смещение из-за неизвестных факторов. [5]
Адаптивная к ответу рандомизация, также известная как адаптивная к результату рандомизация: вероятность попадания в группу увеличивается, если ответы предыдущих пациентов в группе были благоприятными. [57] Хотя были высказаны аргументы в пользу того, что этот подход более этичный, чем другие типы рандомизации, когда вероятность того, что лечение будет эффективным или неэффективным, увеличивается в ходе РКИ, специалисты по этике еще не изучали этот подход подробно. [58]
Сокрытие распределения
«Сокрытие распределения» (определяемое как «процедура защиты процесса рандомизации, чтобы назначаемое лечение не было известно до того, как пациент будет включен в исследование») играет важную роль в РКИ. [59] На практике клиническим исследователям в РКИ часто бывает трудно сохранять беспристрастность. Существует множество историй о том, как исследователи выставляют запечатанные конверты на свет или обыскивают офисы, чтобы определить групповые назначения, чтобы диктовать назначение своего следующего пациента. [51] Такая практика вносит смещение отбора и факторы, искажающие результаты исследования (и то, и другое должно быть сведено к минимуму путем рандомизации), что может искажать результаты исследования. [51] Адекватное сокрытие распределения должно лишить пациентов и исследователей возможности узнать распределение лечения, как только исследование уже началось, так и после его завершения. Побочные эффекты или нежелательные явления, связанные с лечением, могут быть достаточно конкретными, чтобы раскрыть распределение исследователям или пациентам, тем самым внося смещение или влияя на любые субъективные параметры, собранные исследователями или запрошенные у субъектов. [ требуется ссылка ]
Некоторые стандартные методы обеспечения сокрытия распределения включают последовательно пронумерованные, непрозрачные, запечатанные конверты (SNOSE); последовательно пронумерованные контейнеры; рандомизацию под контролем аптеки; и центральную рандомизацию. [51] Рекомендуется, чтобы методы сокрытия распределения были включены в протокол РКИ , и чтобы методы сокрытия распределения были подробно описаны в публикации результатов РКИ; однако исследование 2005 года определило, что большинство РКИ имеют неясное сокрытие распределения в своих протоколах, в своих публикациях или и там, и там. [60] С другой стороны, исследование 2008 года 146 метаанализов пришло к выводу, что результаты РКИ с неадекватным или неясным сокрытием распределения имели тенденцию быть смещенными в сторону полезных эффектов, только если результаты РКИ были субъективными , а не объективными . [61]
Размер выборки
Количество единиц лечения (субъектов или групп субъектов), назначенных в контрольную и лечебную группы, влияет на надежность РКИ. Если эффект лечения невелик, количество единиц лечения в любой группе может быть недостаточным для отклонения нулевой гипотезы в соответствующем статистическом тесте . Неспособность отклонить нулевую гипотезу будет означать, что лечение не показывает статистически значимого эффекта на леченных в данном тесте. Но по мере увеличения размера выборки то же самое РКИ может продемонстрировать значительный эффект лечения, даже если этот эффект невелик. [62]
Ослепление
РКИ могут быть ослеплены (также называются «замаскированными») «процедурами, которые не позволяют участникам исследования, лицам, осуществляющим уход, или оценщикам результатов узнать, какое вмешательство было получено». [61] В отличие от сокрытия распределения, ослепление иногда нецелесообразно или невозможно осуществить в РКИ; например, если РКИ включает лечение, в котором необходимо активное участие пациента (например, физиотерапия ), участники не могут быть ослеплены относительно вмешательства. [ необходима цитата ]
Традиционно слепые РКИ классифицировались как «просто слепые», «двойные слепые» или «тройные слепые»; однако в 2001 и 2006 годах два исследования показали, что эти термины имеют разное значение для разных людей. [63] [64] В заявлении CONSORT 2010 года указано, что авторы и редакторы не должны использовать термины «просто слепые», «двойные слепые» и «тройные слепые»; вместо этого в отчетах о слепых РКИ следует обсуждать «Если проводилось, кто был ослеплен после назначения на вмешательства (например, участники, поставщики услуг, те, кто оценивал результаты) и как». [5]
РКИ без ослепления называются «неслепыми», [65] «открытыми», [66] или (если вмешательство представляет собой лекарство) « открытыми ». [67] В 2008 году исследование пришло к выводу, что результаты неслепых РКИ, как правило, были смещены в сторону полезных эффектов только в том случае, если результаты РКИ были субъективными, а не объективными; [61] например, в РКИ лечения рассеянного склероза неслепые неврологи (но не ослепленные неврологи) считали, что лечение было полезным. [68] В прагматичных РКИ, хотя участники и поставщики часто не ослеплены, «все еще желательно и часто возможно скрыть информацию от оценщика или получить объективный источник данных для оценки результатов». [48]
Анализ данных
Типы статистических методов, используемых в РКИ, зависят от характеристик данных и включают в себя:
Независимо от используемых статистических методов, при анализе данных РКИ следует учитывать следующие важные факторы:
Следует ли прекратить РКИ на ранней стадии из-за промежуточных результатов. Например, РКИ могут быть прекращены на ранней стадии, если вмешательство приводит к «большей, чем ожидалось, пользе или вреду», или если «исследователи не находят доказательств существенной разницы между экспериментальными и контрольными вмешательствами». [5]
Заявление CONSORT 2010 представляет собой «минимальный набор рекомендаций, основанный на фактических данных, для отчетности по РКИ». [73] Контрольный список CONSORT 2010 содержит 25 пунктов (многие с подпунктами), посвященных «индивидуально рандомизированным, двухгрупповым, параллельным испытаниям», которые являются наиболее распространенным типом РКИ. [1]
Заявление Consort 2010: Расширение кластерных рандомизированных испытаний [74]
Заявление Consort 2010: Немедикаментозные методы лечения [75] [76]
«Отчетность о суррогатных конечных точках в отчетах о рандомизированных контролируемых испытаниях (CONSORT-Surrogate): контрольный список расширения с пояснениями и уточнениями» [77]
Относительная важность и наблюдательные исследования
Два исследования, опубликованные в The New England Journal of Medicine в 2000 году, показали, что наблюдательные исследования и РКИ в целом дали схожие результаты. [78] [79] Авторы результатов 2000 года подвергли сомнению убеждение, что «наблюдательные исследования не должны использоваться для определения доказательной медицинской помощи» и что результаты РКИ являются «доказательствами наивысшего класса». [78] [79] Однако исследование 2001 года, опубликованное в Journal of the American Medical Association, пришло к выводу, что «расхождения, выходящие за рамки случайности, действительно имеют место, и различия в предполагаемой величине эффекта лечения очень распространены» между наблюдательными исследованиями и РКИ. [80] Согласно обзору Cochrane 2014 года (обновленному в 2024 году), существует мало доказательств существенных различий в эффектах между наблюдательными исследованиями и рандомизированными контролируемыми испытаниями. [81] Для оценки различий необходимо учитывать и другие факторы, помимо дизайна, такие как гетерогенность, популяция, вмешательство или компаратор. [81]
Два других направления рассуждений ставят под сомнение вклад РКИ в научные знания, выходящий за рамки других типов исследований:
Если ранжировать проекты исследований по их потенциалу для новых открытий, то отдельные свидетельства [ сломанный якорь ] будут наверху списка, за ними следуют наблюдательные исследования, а затем — рандомизированные контролируемые испытания. [82]
Рандомизированные контролируемые испытания могут быть ненужными для методов лечения, которые оказывают драматические и быстрые эффекты по сравнению с ожидаемым стабильным или прогрессивно ухудшающимся естественным течением заболевания, подлежащего лечению. [83] [84] Одним из примеров является комбинированная химиотерапия, включающая цисплатин при метастатическом раке яичек , которая увеличила частоту излечения с 5% до 60% в нерандомизированном исследовании 1977 года. [84] [85]
Интерпретация статистических результатов
Как и все статистические методы, РКИ подвержены статистическим ошибкам как типа I («ложноположительные»), так и типа II («ложноотрицательные») . Что касается ошибок типа I, типичный РКИ будет использовать 0,05 (т. е. 1 из 20) в качестве вероятности того, что РКИ ложно обнаружит, что два одинаково эффективных метода лечения существенно различаются. [86] Что касается ошибок типа II, несмотря на публикацию статьи 1978 года, в которой отмечалось, что размеры выборки многих «отрицательных» РКИ были слишком малы, чтобы сделать окончательные выводы об отрицательных результатах, [87] к 2005–2006 годам значительная часть РКИ все еще имела неточные или не полностью сообщенные расчеты размера выборки. [88]
Рецензирование
Экспертная оценка результатов является важной частью научного метода . Рецензенты изучают результаты исследования на предмет потенциальных проблем с дизайном, которые могут привести к ненадежным результатам (например, путем создания систематической ошибки ), оценивают исследование в контексте связанных исследований и других доказательств и оценивают, можно ли обоснованно считать, что исследование доказало свои выводы. Чтобы подчеркнуть необходимость экспертной оценки и опасность чрезмерного обобщения выводов, два медицинских исследователя из Бостона провели рандомизированное контролируемое исследование, в котором они случайным образом назначали либо парашют, либо пустой рюкзак 23 добровольцам, которые прыгали либо с биплана, либо с вертолета. Исследование смогло точно сообщить, что парашюты не снижают травматизм по сравнению с пустыми рюкзаками. Ключевым контекстом, который ограничивал общую применимость этого вывода, было то, что самолеты были припаркованы на земле, а участники прыгнули всего на два фута. [89]
Преимущества
РКИ считаются наиболее надежной формой научных доказательств в иерархии доказательств , влияющих на политику и практику здравоохранения, поскольку РКИ уменьшают ложную причинность и предвзятость. Результаты РКИ могут быть объединены в систематические обзоры , которые все чаще используются при проведении практики, основанной на доказательствах . Вот несколько примеров того, как научные организации рассматривают РКИ или систематические обзоры РКИ как доказательства наивысшего качества:
В 1998 году Национальный совет по здравоохранению и медицинским исследованиям Австралии обозначил доказательства «уровня I» как «полученные в результате систематического обзора всех соответствующих рандомизированных контролируемых испытаний», а доказательства «уровня II» — как «полученные в результате по крайней мере одного надлежащим образом спланированного рандомизированного контролируемого испытания». [90]
Начиная с 2001 года, при разработке рекомендаций по клинической практике Целевая группа профилактических служб США рассматривала как дизайн исследования, так и его внутреннюю валидность в качестве показателей его качества. [91] Она признала «доказательства, полученные по крайней мере из одного надлежащим образом рандомизированного контролируемого исследования» с хорошей внутренней валидностью (т. е. рейтингом «I-хорошо») как доказательства наивысшего качества, доступные ей. [91]
Рабочая группа GRADE пришла к выводу в 2008 году, что «рандомизированные испытания без существенных ограничений представляют собой высококачественные доказательства» [92] .
Для вопросов, связанных с «терапией/профилактикой, этиологией/вредом», Оксфордский центр доказательной медицины в 2011 году определил доказательства «уровня 1a» как систематический обзор РКИ, которые согласуются друг с другом, а доказательства «уровня 1b» как «отдельные РКИ (с узким доверительным интервалом )». [93]
Известные РКИ с неожиданными результатами, способствовавшие изменениям в клинической практике, включают:
После одобрения Управления по контролю за продуктами и лекарствами США (FDA ) антиаритмические препараты флекаинид и энкаинид появились на рынке в 1986 и 1987 годах соответственно. [94] Нерандомизированные исследования, касающиеся этих препаратов, были охарактеризованы как «яркие», [95] и их продажи возросли до общего количества приблизительно 165 000 рецептов в месяц в начале 1989 года. [94] Однако в том же году предварительный отчет рандомизированного контролируемого исследования пришел к выводу, что эти два препарата увеличивают смертность. [96] Затем продажи препаратов снизились. [94]
До 2002 года, основываясь на наблюдательных исследованиях, врачи обычно назначали заместительную гормональную терапию женщинам в постменопаузе для профилактики инфаркта миокарда . [95] Однако в 2002 и 2004 годах опубликованные РКИ Инициативы по охране здоровья женщин утверждали, что у женщин, принимающих заместительную гормональную терапию эстрогеном и прогестином, наблюдался более высокий уровень инфаркта миокарда, чем у женщин, принимающих плацебо, и что заместительная гормональная терапия только эстрогеном не приводила к снижению заболеваемости ишемической болезнью сердца. [71] [97] Возможные объяснения расхождений между наблюдательными исследованиями и РКИ включают различия в методологии, в используемых гормональных схемах и в изучаемых популяциях. [98] [99] Использование заместительной гормональной терапии снизилось после публикации РКИ. [100]
Недостатки
Во многих работах обсуждаются недостатки РКИ. [83] [101] [102] Среди наиболее часто упоминаемых недостатков:
Проведение РКИ занимает несколько лет, прежде чем его результаты будут опубликованы; таким образом, данные остаются недоступными для медицинского сообщества в течение долгих лет и могут быть менее актуальными на момент публикации. [104]
Поддерживать РКИ в течение многих лет или десятилетий, которые были бы идеальными для оценки некоторых вмешательств, — это затратно. [83] [102]
Вмешательства, направленные на предотвращение событий, которые происходят редко (например, синдром внезапной детской смерти ) и нетипичных неблагоприятных исходов (например, редкий побочный эффект препарата), потребуют проведения РКИ с чрезвычайно большими размерами выборки и, следовательно, могут быть наилучшим образом оценены с помощью наблюдательных исследований. [83]
Исследование 2011 года, проведенное с целью раскрытия возможных конфликтов интересов в базовых исследовательских работах, используемых для медицинских метаанализов, рассмотрело 29 метаанализов и обнаружило, что конфликты интересов в исследованиях, лежащих в основе метаанализов, редко раскрывались. 29 метаанализов включали 11 из журналов общей медицины, 15 из журналов специализированной медицины и 3 из базы данных систематических обзоров Кокрейна . 29 метаанализов рассмотрели совокупность 509 рандомизированных контролируемых испытаний (РКИ). Из них 318 РКИ сообщили об источниках финансирования, причем 219 (69%) финансировались промышленностью. 132 из 509 РКИ сообщили о раскрытии конфликта интересов авторов, при этом 91 исследование (69%) раскрыло финансовые связи промышленности с одним или несколькими авторами. Однако эта информация редко отражалась в метаанализах. Только два (7%) сообщили об источниках финансирования РКИ, и ни один не сообщил о связях автора РКИ с промышленностью. Авторы пришли к выводу, что «без признания COI из-за финансирования промышленностью или финансовых связей автора с промышленностью от РКИ, включенных в метаанализы, понимание и оценка читателями доказательств из метаанализа могут быть скомпрометированы». [105]
Некоторые РКИ полностью или частично финансируются отраслью здравоохранения (например, фармацевтической промышленностью ), а не правительством, некоммерческими организациями или другими источниками. Систематический обзор, опубликованный в 2003 году, обнаружил четыре статьи 1986–2002 годов, сравнивающие спонсируемые промышленностью и не спонсируемые промышленностью РКИ, и во всех статьях была корреляция спонсорства промышленностью и положительного результата исследования. [106] Исследование 2004 года РКИ 1999–2001 годов, опубликованных в ведущих медицинских и хирургических журналах, определило, что финансируемые промышленностью РКИ «с большей вероятностью связаны со статистически значимыми проотраслевыми результатами». [107] Эти результаты были отражены в испытаниях в хирургии, где, хотя финансирование промышленностью не влияло на частоту прекращения испытаний, оно, однако, было связано с более низкими шансами публикации для завершенных испытаний. [108] Одной из возможных причин проотраслевых результатов в финансируемых промышленностью опубликованных РКИ является смещение публикации . [107] Другие авторы ссылались на различные цели академических и спонсируемых промышленностью исследований как на факторы, способствующие разнице. Коммерческие спонсоры могут быть больше сосредоточены на проведении испытаний лекарств, которые уже показали себя многообещающими на ранних стадиях испытаний, и на воспроизведении предыдущих положительных результатов для выполнения нормативных требований для одобрения лекарств. [109]
Этика
Если разрабатывается подрывная инновация в медицинской технологии, может быть сложно проверить ее этически в РКИ, если станет «очевидно», что у контрольных субъектов результаты хуже — либо из-за другого предшествующего тестирования, либо в начальной фазе самого РКИ. С этической точки зрения может возникнуть необходимость преждевременно прервать РКИ, а получение этического одобрения (и согласия пациента) на то, чтобы не допустить инновации к контрольной группе в будущих РКИ, может оказаться невозможным. [ необходима цитата ]
Исторические контрольные испытания (HCT) используют данные предыдущих РКИ для уменьшения размера выборки; однако эти подходы являются спорными в научном сообществе и должны применяться с осторожностью. [110]
В области социальных наук
Из-за недавнего появления РКИ в социальных науках, использование РКИ в социальных науках является спорным вопросом. Некоторые авторы с медицинским или медицинским образованием утверждают, что существующие исследования в ряде дисциплин социальных наук не имеют строгости и должны быть улучшены путем более широкого использования рандомизированных контролируемых испытаний. [111]
Транспортная наука
Исследователи в области транспортной науки утверждают, что государственные расходы на такие программы, как планы школьных поездок, не могут быть оправданы, если их эффективность не будет продемонстрирована рандомизированными контролируемыми испытаниями. [112] Грэхем-Роу и коллеги [113] рассмотрели 77 оценок транспортных вмешательств, найденных в литературе, классифицируя их по 5 «уровням качества». Они пришли к выводу, что большинство исследований были низкого качества, и выступили за использование рандомизированных контролируемых испытаний везде, где это возможно, в будущих транспортных исследованиях.
Доктор Стив Мелиа [114] не согласился с этими выводами, утверждая, что заявления о преимуществах РКИ в установлении причинно-следственной связи и избежании предвзятости были преувеличены. Он предложил следующие восемь критериев для использования РКИ в контекстах, где вмешательства должны изменить поведение человека, чтобы быть эффективными:
Вмешательство:
Не применялся ко всем членам уникальной группы людей (например, к населению всей страны, ко всем сотрудникам уникальной организации и т. д.)
Применяется в контексте или обстановке, аналогичной той, которая применяется к контрольной группе.
Может быть изолирован от других видов деятельности, и цель исследования — оценить этот изолированный эффект.
Имеет короткий промежуток времени между реализацией и достижением эффекта
И причинно-следственные механизмы:
Либо известны исследователям, либо все возможные альтернативы могут быть проверены.
Не задействуйте существенные механизмы обратной связи между группой вмешательства и внешней средой.
Иметь стабильную и предсказуемую связь с экзогенными факторами
Действовал бы так же, если бы контрольная группа и группа вмешательства поменялись местами
Криминология
Обзор 2005 года обнаружил 83 рандомизированных эксперимента в криминологии, опубликованных в 1982–2004 годах, по сравнению с всего 35, опубликованными в 1957–1981 годах. [115] Авторы классифицировали найденные ими исследования по пяти категориям: «полицейская деятельность», «профилактика», «исправительные меры», «суд» и «сообщество». [115] Сосредоточившись только на программах поведенческих правонарушений, Холлин (2008) утверждал, что РКИ может быть трудно реализовать (например, если РКИ требует «вынесения приговоров, которые случайным образом распределяют правонарушителей по программам»), и поэтому эксперименты с квазиэкспериментальным дизайном все еще необходимы. [116]
Образование
РКИ использовались для оценки ряда образовательных вмешательств. В период с 1980 по 2016 год было опубликовано более 1000 отчетов о РКИ. [117] Например, исследование 2009 года рандомизировало 260 классов учителей начальной школы, чтобы получить или не получить программу поведенческого скрининга, вмешательства в классе и обучения родителей, а затем измерило поведенческие и академические результаты их учеников. [118] Другое исследование 2009 года рандомизировало классы для 678 детей первого класса, чтобы получить вмешательство, ориентированное на класс, вмешательство, ориентированное на родителей, или не получить никакого вмешательства, а затем отследило их академические результаты до 19 лет. [119]
Критика
Обзор 10 наиболее цитируемых рандомизированных контролируемых испытаний 2018 года отметил плохое распределение фоновых признаков, трудности со ослеплением и обсудил другие предположения и предубеждения, присущие рандомизированным контролируемым испытаниям. К ним относятся «уникальное смещение оценки периода времени», «предположение о том, что фоновые признаки остаются постоянными», «ограничение средних эффектов лечения», «ограничение простого лечения на индивидуальном уровне», «предположение о том, что все предварительные условия полностью выполнены», «ограничение количественной переменной» и «ограничение только плацебо или только традиционного лечения». [120]
^ abc Schulz KF, Altman DG, Moher D, et al. (CONSORT Group) (март 2010 г.). "Заявление CONSORT 2010: обновленные рекомендации по отчетности о рандомизированных испытаниях в параллельных группах". BMJ . 340 : c332. doi :10.1136/bmj.c332. PMC 2844940 . PMID 20332509.
^ Chalmers TC, Smith H, Blackburn B, et al. (Май 1981). «Метод оценки качества рандомизированного контролируемого испытания». Controlled Clinical Trials . 2 (1): 31–49. doi :10.1016/0197-2456(81)90056-8. PMID 7261638.
^ «Что такое клинические испытания и исследования?». Национальный институт старения, Национальные институты здравоохранения США. 22 марта 2023 г. Получено 9 марта 2024 г.
^ «Каковы различные типы клинических исследований?». Управление по контролю за продуктами и лекарствами США. 4 января 2018 г. Получено 9 марта 2024 г.
^ abcdefghi Moher D, Hopewell S, Schulz KF и др. (март 2010 г.). «CONSORT 2010: объяснение и разработка: обновленные рекомендации по отчетности о параллельных групповых рандомизированных испытаниях». BMJ . 340 : c869. doi :10.1136/bmj.c869. PMC 2844943 . PMID 20332511.
^ Ханнан EL (июнь 2008 г.). «Рандомизированные клинические испытания и наблюдательные исследования: рекомендации по оценке соответствующих сильных сторон и ограничений». JACC. Кардиоваскулярные вмешательства . 1 (3): 211–217. doi : 10.1016/j.jcin.2008.01.008 . PMID 19463302.
^ Ранджит Г. (2005). «Депрессия, вызванная интерфероном-альфа: когда рандомизированное исследование не является рандомизированным контролируемым исследованием». Психотерапия и психосоматика . 74 (6): 387, ответ автора 387-387, ответ автора 388. doi : 10.1159/000087787. PMID 16244516. S2CID 143644933.
^ Peto R, Pike MC, Armitage P, et al. (декабрь 1976 г.). «Разработка и анализ рандомизированных клинических испытаний, требующих длительного наблюдения за каждым пациентом. I. Введение и разработка». British Journal of Cancer . 34 (6): 585–612. doi :10.1038/bjc.1976.220. PMC 2025229. PMID 795448 .
^ Peto R, Pike MC, Armitage P, et al. (Январь 1977). «Разработка и анализ рандомизированных клинических испытаний, требующих длительного наблюдения за каждым пациентом. II. Анализ и примеры». British Journal of Cancer . 35 (1): 1–39. doi :10.1038/bjc.1977.1. PMC 2025310. PMID 831755.
^ Wollert KC, Meyer GP, Lotz J, et al. (2004). «Внутрикоронарный аутологичный перенос клеток костного мозга после инфаркта миокарда: рандомизированное контролируемое клиническое исследование BOOST». Lancet . 364 (9429): 141–148. doi :10.1016/S0140-6736(04)16626-9. PMID 15246726. S2CID 24361586.
^ Dunn PM (январь 1997 г.). «Джеймс Линд (1716-94) из Эдинбурга и лечение цинги». Архивы детских болезней. Издание для плода и новорожденных . 76 (1): F64–F65. doi :10.1136/fn.76.1.f64. PMC 1720613. PMID 9059193 .
^ Daston L (2005). «Научная ошибка и этика веры». Социальные исследования . 72 (1): 18. doi :10.1353/sor.2005.0016. S2CID 141036212.
^ Rivers WH, Webber HN (август 1907). «Действие кофеина на способность к мышечной работе». Журнал физиологии . 36 (1): 33–47. doi :10.1113/jphysiol.1907.sp001215. PMC 1533733. PMID 16992882 .
^ Пирс CS , Джастров J (1885). «О малых различиях в ощущениях». Мемуары Национальной академии наук . 3 : 73–83.http://psychclassics.yorku.ca/Peirce/small-diffs.htm
↑ Hacking I (сентябрь 1988 г.). «Телепатия: истоки рандомизации в экспериментальном проектировании». Isis . Специальный выпуск об артефактах и экспериментах. 79 (3): 427–451. doi :10.1086/354775. JSTOR 234674. MR 1013489. S2CID 52201011.
^ Stigler SM (ноябрь 1992 г.). «Исторический взгляд на статистические концепции в психологии и образовательных исследованиях». American Journal of Education . 101 (1): 60–70. doi :10.1086/444032. S2CID 143685203.
^ Dehue T (декабрь 1997 г.). «Обман, эффективность и случайные группы. Психология и постепенное возникновение дизайна случайных групп» (PDF) . Isis; международный обзор, посвященный истории науки и ее культурным влияниям . 88 (4): 653–673. doi :10.1086/383850. PMID 9519574. S2CID 23526321.
^ Вудворт RS, ТорндайкEL (1901). «Влияние улучшения одной умственной функции на эффективность других функций (I)» (PDF) . Psychological Review . 8 (3): 247.
^ Coover JE, Angell F (1907). «Эффект специальной тренировки в общей практике». Американский журнал психологии . 18 (3): 328–340. doi :10.2307/1412596. ISSN 0002-9556.
^ Dehue T (2000). «От испытаний с обманом к контрольным реагентам: введение контрольной группы около столетия назад» (PDF) . American Psychologist . 55 (2): 264–268. doi :10.1037/0003-066X.55.2.264. ISSN 1935-990X. Архивировано из оригинала 12 июля 2024 г.
^ Нейман, Ежи. 1923 [1990]. «О применении теории вероятностей к сельскохозяйственным экспериментам. Эссе о принципах. Раздел 9». Статистическая наука 5 (4): 465–472. Перевод Дороты М. Домбровской и Теренса П. Спида.
↑
По словам Дениса Конниффа:
Рональд А. Фишер «интересовался применением и популяризацией статистических методов, и его ранняя книга «Статистические методы для научных работников» , опубликованная в 1925 году, выдержала множество изданий, мотивировала и повлияла на практическое использование статистики во многих областях исследований. Его «Планирование экспериментов» (1935) [продвигал] статистические методы и их применение. В этой книге он делал акцент на примерах и на том, как систематически планировать эксперименты со статистической точки зрения. Математическое обоснование описанных методов не подчеркивалось, и, действительно, доказательства часто были едва намечены или вообще опущены..., факт, который побудил Х. Б. Манна заполнить пробелы строгой математической обработкой в его известном трактате «Манн» (1949)».
Коннифф Д. (1990–1991). «РА Фишер и развитие статистики — взгляд в год его столетия». Журнал Ирландского общества статистических и социальных исследований . Том XXVI, № 3. Дублин: Ирландское общество статистических и социальных исследований . стр. 87. hdl :2262/2764. ISSN 0081-4776.
Манн Х. Б. (1949). Анализ и планирование экспериментов: Дисперсионный анализ и планы дисперсионного анализа . Нью-Йорк: Dover Publications. MR 0032177.
^ Комитет по испытаниям стрептомицина в туберкулезе (октябрь 1948 г.). « Лечение СТРЕПТОМИЦИНОМ туберкулеза легких». British Medical Journal . 2 (4582): 769–782. doi :10.1136/bmj.2.4582.769. PMC 2091872. PMID 18890300.
^ Браун Д. (1998-11-02). «Знаменательное исследование сделало исследования устойчивыми к предвзятости». Washington Post .
^ Shikata S, Nakayama T, Noguchi Y и др. (ноябрь 2006 г.). «Сравнение эффектов в рандомизированных контролируемых испытаниях с наблюдательными исследованиями в пищеварительной хирургии». Annals of Surgery . 244 (5): 668–676. doi :10.1097/01.sla.0000225356.04304.bc. PMC 1856609. PMID 17060757 .
^ ab Stolberg HO, Norman G, Trop I (декабрь 2004 г.). «Рандомизированные контролируемые исследования». AJR. American Journal of Roentgenology . 183 (6): 1539–1544. doi :10.2214/ajr.183.6.01831539. PMID 15547188. S2CID 5376391.
↑ Ferry G (2 ноября 2020 г.). «Некролог Питера Слея». The Guardian . Получено 3 ноября 2020 г.
^ Meldrum ML (август 2000 г.). «Краткая история рандомизированного контролируемого исследования. От апельсинов и лимонов до золотого стандарта». Hematology/Oncology Clinics of North America . 14 (4): 745–60, vii. doi :10.1016/S0889-8588(05)70309-9. PMID 10949771.
^ Freedman B (июль 1987). «Equipoise и этика клинических исследований». The New England Journal of Medicine . 317 (3): 141–145. doi :10.1056/NEJM198707163170304. PMID 3600702.
^ Гиффорд Ф. (апрель 1995 г.). «Сообщество-равновесие и этика рандомизированных клинических испытаний». Биоэтика . 9 (2): 127–148. doi :10.1111/j.1467-8519.1995.tb00306.x. PMID 11653056.
^ Edwards SJ, Lilford RJ, Hewison J (октябрь 1998 г.). «Этика рандомизированных контролируемых испытаний с точки зрения пациентов, общественности и специалистов здравоохранения». BMJ . 317 (7167): 1209–1212. doi :10.1136/bmj.317.7167.1209. PMC 1114158 . PMID 9794861.
^ Зелен М (май 1979). «Новый дизайн рандомизированных клинических испытаний». The New England Journal of Medicine . 300 (22): 1242–1245. doi :10.1056/NEJM197905313002203. PMID 431682.
^ Torgerson DJ, Roland M (февраль 1998). «Что такое дизайн Зелена?». BMJ . 316 (7131): 606. doi :10.1136/bmj.316.7131.606. PMC 1112637. PMID 9518917 .
^ Аппельбаум PS, Рот LH, Лидз C (1982). «Терапевтическое заблуждение: информированное согласие в психиатрических исследованиях». Международный журнал права и психиатрии . 5 (3–4): 319–329. doi :10.1016/0160-2527(82)90026-7. PMID 6135666.
^ ab Henderson GE, Churchill LR, Davis AM и др. (ноябрь 2007 г.). «Клинические испытания и медицинская помощь: определение терапевтического заблуждения». PLOS Medicine . 4 (11): e324. doi : 10.1371/journal.pmed.0040324 . PMC 2082641. PMID 18044980 .
^ Jain SL (2010). «Эффект смертности: подсчет умерших в исследовании рака» (PDF) . Public Culture . 21 (1): 89–117. doi :10.1215/08992363-2009-017. S2CID 143641293. Архивировано из оригинала (PDF) 2020-02-20.
^ De Angelis C, Drazen JM, Frizelle FA и др. (сентябрь 2004 г.). «Регистрация клинических испытаний: заявление Международного комитета редакторов медицинских журналов». The New England Journal of Medicine . 351 (12): 1250–1251. doi : 10.1056/NEJMe048225 . PMID 15356289.
^ Law MR, Kawasumi Y, Morgan SG (декабрь 2011 г.). «Несмотря на закон, на ClinicalTrials.gov вовремя публикуются менее одного из восьми завершенных исследований лекарственных препаратов и биологических препаратов». Health Affairs . 30 (12): 2338–2345. doi : 10.1377/hlthaff.2011.0172 . PMID 22147862.
^ Матье С., Бутрон И., Мохер Д. и др. (сентябрь 2009 г.). «Сравнение зарегистрированных и опубликованных первичных результатов рандомизированных контролируемых испытаний». JAMA . 302 (9): 977–984. doi : 10.1001/jama.2009.1242 . PMID 19724045.
^ Bhaumik S, Biswas T (март 2013 г.). «Редакционная политика индийских журналов, индексированных MEDLINE, в отношении регистрации клинических испытаний». Indian Pediatrics . 50 (3): 339–340. doi :10.1007/s13312-013-0092-2. PMID 23680610. S2CID 40317464.
^ ab Hopewell S, Dutton S, Yu LM и др. (март 2010 г.). «Качество отчетов о рандомизированных испытаниях в 2000 и 2006 гг.: сравнительное исследование статей, проиндексированных в PubMed». BMJ . 340 : c723. doi :10.1136/bmj.c723. PMC 2844941 . PMID 20332510.
^ Kaiser J, Niesen W, Probst P, et al. (Июнь 2019). «Дренаж брюшной полости против отсутствия дренажа после дистальной панкреатэктомии: протокол исследования для рандомизированного контролируемого исследования». Испытания . 20 (1): 332. doi : 10.1186/s13063-019-3442-0 . PMC 6555976 . PMID 31174583.
^ Farag SM, Mohammed MO, El-Sobky TA и др. (март 2020 г.). «Инъекция ботулинического токсина А при лечении спастичности верхних конечностей у детей с церебральным параличом: систематический обзор рандомизированных контролируемых испытаний». Обзоры JBJS . 8 (3): e0119. doi : 10.2106/JBJS.RVW.19.00119 . PMC 7161716. PMID 32224633 .
^ Джонс Б., Кенвард МГ (2003). Дизайн и анализ перекрестных испытаний (второе издание). Лондон: Chapman and Hall.
^ Vonesh EF, Chinchilli VG (1997). «Crossover Experiments». Линейные и нелинейные модели для анализа повторных измерений . Лондон: Chapman and Hall. С. 111–202.
^ Gall S, Adams L, Joubert N и др. (8 ноября 2018 г.). «Влияние 20-недельного вмешательства в физическую активность на избирательное внимание и успеваемость у детей, живущих в неблагополучных районах: кластерное рандомизированное контролируемое исследование». PLOS ONE . 13 (11): e0206908. Bibcode :2018PLoSO..1306908G. doi : 10.1371/journal.pone.0206908 . PMC 6224098 . PMID 30408073.
^ Гладстоун М.Дж., Чандна Дж., Кандавасвика Г. и др. (март 2019 г.). «Независимые и комбинированные эффекты улучшенной воды, санитарии и гигиены (WASH) и улучшенного прикорма на раннее неврологическое развитие среди детей, рожденных от ВИЧ-отрицательных матерей в сельской местности Зимбабве: подисследование кластерно-рандомизированного исследования». PLOS Medicine . 16 (3): e1002766. doi : 10.1371/journal.pmed.1002766 . PMC 6428259 . PMID 30897095.
^ abcd Zwarenstein M, Treweek S, Gagnier JJ, et al. (Ноябрь 2008 г.). «Улучшение отчетности о прагматических испытаниях: расширение заявления CONSORT». BMJ . 337 : a2390. doi :10.1136/bmj.a2390. PMC 3266844 . PMID 19001484.
^ abcd Piaggio G, Elbourne DR, Altman DG, et al. (март 2006 г.). «Сообщение о рандомизированных испытаниях не меньшей эффективности и эквивалентности: расширение заявления CONSORT» (PDF) . JAMA . 295 (10): 1152–1160. doi :10.1001/jama.295.10.1152. PMID 16522836.
^ abc Schulz KF, Grimes DA (февраль 2002 г.). «Создание последовательностей распределения в рандомизированных испытаниях: случайность, а не выбор». Lancet . 359 (9305): 515–519. doi :10.1016/S0140-6736(02)07683-3. PMID 11853818. S2CID 291300.[ мертвая ссылка ]
^ abcdefgh Шульц КФ, Граймс ДА (февраль 2002 г.). «Сокрытие распределения в рандомизированных испытаниях: защита от расшифровки» (PDF) . Lancet . 359 (9306): 614–618. doi :10.1016/S0140-6736(02)07750-4. PMID 11867132. S2CID 12902486. Архивировано из оригинала (PDF) 11 сентября 2012 г.
^ Howick J, Mebius A (декабрь 2014 г.). «В поисках оправдания парадокса непредсказуемости». Trials . 15 : 480. doi : 10.1186/1745-6215-15-480 . PMC 4295227. PMID 25490908 .
^ ab Lachin JM (декабрь 1988 г.). «Статистические свойства рандомизации в клинических испытаниях». Контролируемые клинические испытания . 9 (4): 289–311. doi :10.1016/0197-2456(88)90045-1. PMID 3060315.
^ Розенбергер Дж. "STAT 503 - Планирование экспериментов". Университет штата Пенсильвания . Получено 24 сентября 2012 г.
^ Avins AL (декабрь 1998 г.). «Может ли неравное быть более справедливым? Этика, распределение субъектов и рандомизированные клинические испытания». Журнал медицинской этики . 24 (6): 401–408. doi :10.1136/jme.24.6.401. PMC 479141. PMID 9873981 .
^ Buyse ME (декабрь 1989 г.). «Анализ результатов клинических испытаний: некоторые комментарии по анализам подгрупп». Controlled Clinical Trials . 10 (4 Suppl): 187S–194S. doi :10.1016/0197-2456(89)90057-3. PMID 2605967.
^ abcdef Lachin JM, Matts JP, Wei LJ (декабрь 1988 г.). «Рандомизация в клинических испытаниях: выводы и рекомендации». Controlled Clinical Trials . 9 (4): 365–374. doi :10.1016/0197-2456(88)90049-9. hdl : 2027.42/27041 . PMID 3203526.
^ Розенбергер В. Ф., Лачин Дж. М. (декабрь 1993 г.). «Использование адаптивных к ответу дизайнов в клинических испытаниях». Контролируемые клинические испытания . 14 (6): 471–484. doi :10.1016/0197-2456(93)90028-C. PMID 8119063.
^ Forder PM, Gebski VJ, Keech AC (январь 2005 г.). «Сокрытие распределения и ослепление: когда невежество — это блаженство». Медицинский журнал Австралии . 182 (2): 87–89. doi :10.5694/j.1326-5377.2005.tb06584.x. PMID 15651970. S2CID 202149.
^ Pildal J, Chan AW, Hróbjartsson A, et al. (Май 2005). «Сравнение описаний сокрытия распределения в протоколах испытаний и опубликованных отчетах: когортное исследование». BMJ . 330 (7499): 1049. doi :10.1136/bmj.38414.422650.8F. PMC 557221 . PMID 15817527.
^ abc Wood L, Egger M, Gluud LL и др. (март 2008 г.). «Эмпирические доказательства смещения в оценках эффекта лечения в контролируемых испытаниях с различными вмешательствами и результатами: метаэпидемиологическое исследование». BMJ . 336 (7644): 601–605. doi :10.1136/bmj.39465.451748.AD. PMC 2267990 . PMID 18316340.
^ Гленнерстер Р., Кудзай Т. (2013). ""Глава 6"". Проведение рандомизированных оценок: практическое руководство . Принстон: Princeton University Press. doi :10.2307/j.ctt4cgd52. ISBN 978-0-691-15924-9. JSTOR j.ctt4cgd52.
^ Devereaux PJ, Manns BJ, Ghali WA и др. (апрель 2001 г.). «Врачебные интерпретации и определения терминологии ослепления в рандомизированных контролируемых испытаниях в учебниках». JAMA . 285 (15): 2000–2003. doi : 10.1001/jama.285.15.2000 . PMID 11308438.
^ Haahr MT, Hróbjartsson A (2006). «Кто ослеплен в рандомизированных клинических испытаниях? Исследование 200 испытаний и опрос авторов». Клинические испытания . 3 (4): 360–365. doi :10.1177/1740774506069153. PMID 17060210. S2CID 23818514.
^ Marson AG, Al-Kharusi AM, Alwaidh M и др. (март 2007 г.). «Исследование эффективности вальпроата, ламотриджина или топирамата при генерализованной и неклассифицируемой эпилепсии, проведенное SANAD: рандомизированное контролируемое исследование без слепого доступа». Lancet . 369 (9566): 1016–1026. doi :10.1016/S0140-6736(07)60461-9. PMC 2039891 . PMID 17382828.
^ Chan R, Hemeryck L, O'Regan M и др. (май 1995 г.). «Пероральные и внутривенные антибиотики при внебольничной инфекции нижних дыхательных путей в больнице общего профиля: открытое рандомизированное контролируемое исследование». BMJ . 310 (6991): 1360–1362. doi :10.1136/bmj.310.6991.1360. PMC 2549744 . PMID 7787537.
^ Fukase K, Kato M, Kikuchi S, et al. (август 2008 г.). «Влияние эрадикации Helicobacter pylori на заболеваемость метахронной карциномой желудка после эндоскопической резекции раннего рака желудка: открытое рандомизированное контролируемое исследование». Lancet . 372 (9636): 392–397. doi :10.1016/S0140-6736(08)61159-9. hdl : 2115/34681 . PMID 18675689. S2CID 13741892.
^ Noseworthy JH , Ebers GC, Vandervoort MK и др. (январь 1994 г.). «Влияние ослепления на результаты рандомизированного плацебо-контролируемого клинического исследования рассеянного склероза». Neurology . 44 (1): 16–20. doi :10.1212/wnl.44.1.16. PMID 8290055. S2CID 2663997. Архивировано из оригинала 2005-05-10 . Получено 2010-03-25 .
^ Manns MP, McHutchison JG, Gordon SC, et al. (сентябрь 2001 г.). «Пегинтерферон альфа-2b плюс рибавирин в сравнении с интерфероном альфа-2b плюс рибавирин для начального лечения хронического гепатита C: рандомизированное исследование». Lancet . 358 (9286): 958–965. doi :10.1016/S0140-6736(01)06102-5. PMID 11583749. S2CID 14583372.
^ Schwartz GG, Olsson AG, Ezekowitz MD, et al. (апрель 2001 г.). «Влияние аторвастатина на ранние рецидивирующие ишемические события при острых коронарных синдромах: исследование MIRACL: рандомизированное контролируемое исследование». JAMA . 285 (13): 1711–1718. doi : 10.1001/jama.285.13.1711 . PMID 11277825.
^ ab Rossouw JE, Anderson GL, Prentice RL и др. (июль 2002 г.). «Риски и преимущества эстрогена плюс прогестин у здоровых женщин в постменопаузе: основные результаты рандомизированного контролируемого исследования Инициативы по охране здоровья женщин». JAMA . 288 (3): 321–333. doi : 10.1001/jama.288.3.321 . PMID 12117397. S2CID 20149703.
^ Холлис С., Кэмпбелл Ф. (сентябрь 1999 г.). «Что подразумевается под анализом намерения лечить? Обзор опубликованных рандомизированных контролируемых испытаний». BMJ . 319 (7211): 670–674. doi :10.1136/bmj.319.7211.670. PMC 28218 . PMID 10480822.
^ Группа CONSORT. "Добро пожаловать на сайт заявления CONSORT". Архивировано из оригинала 2019-05-09 . Получено 2010-03-29 .
^ Кэмпбелл МК, Пьяджио Г, Элбурн ДР и др. (сентябрь 2012 г.). «Заявление Consort 2010: расширение кластерных рандомизированных испытаний». BMJ . 345 : e5661. doi : 10.1136/bmj.e5661 . hdl : 2164/2742 . PMID 22951546.
^ Boutron I, Moher D, Altman DG, et al. (Февраль 2008). «Расширение заявления CONSORT на рандомизированные испытания нефармакологического лечения: объяснение и разработка». Annals of Internal Medicine . 148 (4): 295–309. doi : 10.7326/0003-4819-148-4-200802190-00008 . PMID 18283207.
^ Бутрон И, Мохер Д, Альтман ДГ и др. (февраль 2008 г.). «Методы и процессы группы CONSORT: пример расширения для испытаний, оценивающих нефармакологические методы лечения». Annals of Internal Medicine . 148 (4): W60–W66. doi : 10.7326/0003-4819-148-4-200802190-00008-w1 . PMID 18283201.
^ Manyara AM, Davies P, Stewart D и др. (Июль 2024 г.). «Сообщение о суррогатных конечных точках в отчетах о рандомизированных контролируемых испытаниях (CONSORT-Surrogate): контрольный список расширения с пояснениями и уточнениями». BMJ . 386 : e078524. doi : 10.1136/bmj-2023-078524 . PMC 11231881 . PMID 38981645.
^ ab Benson K, Hartz AJ (июнь 2000 г.). «Сравнение наблюдательных исследований и рандомизированных контролируемых испытаний». The New England Journal of Medicine . 342 (25): 1878–1886. doi : 10.1056/NEJM200006223422506 . PMID 10861324.
^ ab Concato J, Shah N, Horwitz RI (июнь 2000 г.). «Рандомизированные контролируемые испытания, наблюдательные исследования и иерархия исследовательских дизайнов». The New England Journal of Medicine . 342 (25): 1887–1892. doi :10.1056/NEJM200006223422507. PMC 1557642. PMID 10861325 .
^ Ioannidis JP, Haidich AB, Pappa M, et al. (август 2001 г.). «Сравнение доказательств эффектов лечения в рандомизированных и нерандомизированных исследованиях». JAMA . 286 (7): 821–830. CiteSeerX 10.1.1.590.2854 . doi :10.1001/jama.286.7.821. PMID 11497536.
^ ab Toews I, Anglemyer A, Nyirenda JL и др. (2024-01-04). "Результаты медицинского обслуживания, оцененные с помощью наблюдательных исследований, в сравнении с результатами, оцененными в рандомизированных исследованиях: метаэпидемиологическое исследование". База данных систематических обзоров Cochrane . 1 (1): MR000034. doi :10.1002/14651858.MR000034.pub3. ISSN 1469-493X. PMC 10765475. PMID 38174786.
^ Vandenbroucke JP (март 2008 г.). «Наблюдательные исследования, рандомизированные испытания и два взгляда на медицинскую науку». PLOS Medicine . 5 (3): e67. doi : 10.1371/journal.pmed.0050067 . PMC 2265762. PMID 18336067 .
^ abcd Black N (май 1996). «Почему нам нужны наблюдательные исследования для оценки эффективности здравоохранения». BMJ . 312 (7040): 1215–1218. doi :10.1136/bmj.312.7040.1215. PMC 2350940 . PMID 8634569.
^ ab Glasziou P, Chalmers I, Rawlins M и др. (февраль 2007 г.). «Когда рандомизированные испытания не нужны? Выбор сигнала из шума». BMJ . 334 (7589): 349–351. doi :10.1136/bmj.39070.527986.68. PMC 1800999 . PMID 17303884.
^ Einhorn LH (апрель 2002 г.). «Лечение метастатического рака яичек». Труды Национальной академии наук Соединенных Штатов Америки . 99 (7): 4592–4595. doi : 10.1073/pnas.072067999 . PMC 123692. PMID 11904381 .
^ Freiman JA, Chalmers TC, Smith H, et al. (сентябрь 1978 г.). «Важность бета, ошибки типа II и размера выборки в разработке и интерпретации рандомизированного контрольного испытания. Обзор 71 «отрицательного» испытания». The New England Journal of Medicine . 299 (13): 690–694. doi :10.1056/NEJM197809282991304. PMID 355881.
^ Charles P, Giraudeau B, Dechartres A и др. (май 2009 г.). «Сообщение о расчете размера выборки в рандомизированных контролируемых испытаниях: обзор». BMJ . 338 : b1732. doi : 10.1136/bmj.b1732 . PMC 2680945 . PMID 19435763.
^ Harris R (22 декабря 2018 г.). «Исследователи показывают, что парашюты не работают, но есть одна загвоздка». NPR . Архивировано из оригинала 17 января 2024 г.
^ Национальный совет по здравоохранению и медицинским исследованиям (1998-11-16). Руководство по разработке, внедрению и оценке клинических практических рекомендаций (PDF) . Канберра: Содружество Австралии. стр. 56. ISBN978-1-86496-048-8. Архивировано из оригинала (PDF) 2017-10-14 . Получено 2010-03-28 .
^ ab Harris RP, Helfand M, Woolf SH, et al. (Methods Work Group; Third US Preventive Services Task Force) (апрель 2001 г.). «Текущие методы US Preventive Services Task Force: a review of the process». American Journal of Preventive Medicine . 20 (3 Suppl): 21–35. doi :10.1016/S0749-3797(01)00261-6. PMID 11306229.
^ Гайатт GH, Оксман AD, Кунц R, и др. (Рабочая группа GRADE) (май 2008 г.). «Что такое «качество доказательств» и почему оно важно для врачей?». BMJ . 336 (7651): 995–998. doi :10.1136/bmj.39490.551019.BE. PMC 2364804 . PMID 18456631.
^ abc Anderson JL, Pratt CM, Waldo AL и др. (январь 1997 г.). «Влияние одобрения Управлением по контролю за продуктами питания и лекарственными средствами флекаинида и энкаинида на смертность от ишемической болезни сердца: проверка «смертельной медицины»». Американский журнал кардиологии . 79 (1): 43–47. doi :10.1016/S0002-9149(96)00673-X. PMID 9024734.
^ ab Rubin R (2006-10-16). «В медицине доказательства могут быть запутанными — врачи, заваленные исследованиями, пытаются разобраться, что работает, а что нет». USA Today . Получено 2010-03-22 .
^ Исследователи испытания подавления аритмии сердца (CAST) (август 1989 г.). «Предварительный отчет: влияние энкаинида и флекаинида на смертность в рандомизированном испытании подавления аритмии после инфаркта миокарда». The New England Journal of Medicine . 321 (6): 406–412. doi :10.1056/NEJM198908103210629. PMID 2473403.
^ Anderson GL, Limacher M, Assaf AR и др. (апрель 2004 г.). «Эффекты конъюгированного конского эстрогена у женщин в постменопаузе с гистерэктомией: рандомизированное контролируемое исследование Инициативы по охране здоровья женщин». JAMA . 291 (14): 1701–1712. doi : 10.1001/jama.291.14.1701 . PMID 15082697.
^ Grodstein F, Clarkson TB, Manson JE (февраль 2003 г.). «Понимание расходящихся данных о постменопаузальной гормональной терапии». The New England Journal of Medicine . 348 (7): 645–650. doi :10.1056/NEJMsb022365. PMID 12584376.
^ Vandenbroucke JP (апрель 2009 г.). «Противоречие в отношении ЗГТ: наблюдательные исследования и РКИ совпадают». Lancet . 373 (9671): 1233–1235. doi :10.1016/S0140-6736(09)60708-X. PMID 19362661. S2CID 44991220.
^ Hsu A, Card A, Lin SX и др. (декабрь 2009 г.). «Изменения в использовании заместительной гормональной терапии в постменопаузе среди женщин с высоким сердечно-сосудистым риском». American Journal of Public Health . 99 (12): 2184–2187. doi :10.2105/AJPH.2009.159889. PMC 2775780 . PMID 19833984.
^ Белл SH, Пек LR (2012). «Препятствия и ограничения социальных экспериментов: 15 ложных тревог». Серия статей Abt Thought Leadership Paper .
^ abc Sanson-Fisher RW, Bonevski B, Green LW и др. (август 2007 г.). «Ограничения рандомизированного контролируемого исследования при оценке популяционных вмешательств в здравоохранение». American Journal of Preventive Medicine . 33 (2): 155–161. doi :10.1016/j.amepre.2007.04.007. PMID 17673104.
^ ab Johnston SC, Rootenberg JD, Katrak S, et al. (апрель 2006 г.). «Влияние программы клинических испытаний Национального института здравоохранения США на общественное здравоохранение и расходы». Lancet . 367 (9519): 1319–1327. doi :10.1016/S0140-6736(06)68578-4. PMID 16631910. S2CID 41035177.
^ ab Yitschaky O, Yitschaky M, Zadik Y (май 2011 г.). «Отчет о судебном разбирательстве: клянетесь ли вы, доктор, говорить правду, всю правду и ничего, кроме правды?». Journal of Medical Case Reports . 5 (1): 179. doi : 10.1186/1752-1947-5-179 . PMC 3113995. PMID 21569508 .
^ «Насколько хорошо метаанализы раскрывают конфликты интересов в базовых исследованиях | Сотрудничество Кокрейна». Cochrane.org. Архивировано из оригинала 2014-12-16 . Получено 2011-08-19 .
^ Bekelman JE, Li Y, Gross CP (2003). «Масштаб и влияние финансовых конфликтов интересов в биомедицинских исследованиях: систематический обзор». JAMA . 289 (4): 454–465. doi :10.1001/jama.289.4.454. PMID 12533125.
^ ab Bhandari M, Busse JW, Jackowski D, et al. (Февраль 2004). «Связь между финансированием промышленности и статистически значимыми проотраслевыми результатами в медицинских и хирургических рандомизированных испытаниях». CMAJ . 170 (4): 477–480. PMC 332713 . PMID 14970094.
^ Chapman SJ, Shelton B, Mahmood H, et al. (декабрь 2014 г.). «Прекращение и непубликация хирургических рандомизированных контролируемых исследований: наблюдательное исследование». BMJ . 349 : g6870. doi :10.1136/bmj.g6870. PMC 4260649 . PMID 25491195.
^ Ridker PM, Torres J (май 2006 г.). «Сообщенные результаты крупных сердечно-сосудистых клинических испытаний, финансируемых коммерческими и некоммерческими организациями: 2000–2005 гг.». JAMA . 295 (19): 2270–2274. doi : 10.1001/jama.295.19.2270 . PMID 16705108.
^ Zhang S, Cao J, Ahn C (август 2010 г.). «Расчет размера выборки в испытаниях с использованием исторического контроля». Клинические испытания . 7 (4): 343–353. doi :10.1177/1740774510373629. PMC 3085081. PMID 20573638 .
^ Deaton A, Cartwright N (август 2018 г.). «Понимание и непонимание рандомизированных контролируемых испытаний». Социальные науки и медицина . Рандомизированные контролируемые испытания и политика, основанная на доказательствах: междисциплинарный диалог. 210 : 2–21. doi :10.1016/j.socscimed.2017.12.005. PMC 6019115 . PMID 29331519.
^ Роуленд Д., ДиГуисеппи К., Гросс М. и др. (январь 2003 г.). «Рандомизированное контролируемое исследование рекомендаций по поездкам в школу в зависимости от местоположения». Архивы детских болезней . 88 (1): 8–11. doi :10.1136/adc.88.1.8. PMC 1719287. PMID 12495948 .
^ Грэм-Роу Э., Скиппон С., Гарднер Б. и др. (2011). «Можем ли мы сократить использование автомобилей и, если да, то как? Обзор имеющихся доказательств». Исследования в области транспорта, часть A: политика и практика . 44 (5): 401–418. Bibcode : 2011TRPA...45..401G. doi : 10.1016/j.tra.2011.02.001.
^ Мелия С. (2011). «Предлагают ли рандомизированные контрольные испытания решение проблемы «низкокачественных» транспортных исследований?». Транспортные исследования, часть A. Бристоль: Университет Западной Англии.
^ ab Farrington DP, Welsh BC (2005). «Рандомизированные эксперименты в криминологии: чему мы научились за последние два десятилетия?». Журнал экспериментальной криминологии . 1 (1): 9–38. doi :10.1007/s11292-004-6460-0. S2CID 145758503.
^ Холлин CR (2008). «Оценка программ преступного поведения: только ли рандомизация блестит?». Криминология и уголовное правосудие . 8 (1): 89–106. doi :10.1177/1748895807085871. S2CID 141222135.
^ Коннолли П., Кинан С., Урбанска К. (2018-07-09). «Испытания практики, основанной на доказательствах, в образовании: систематический обзор рандомизированных контролируемых испытаний в исследованиях образования 1980–2016». Educational Research . 60 (3): 276–291. doi : 10.1080/00131881.2018.1493353 . ISSN 0013-1881.
^ Walker HM, Seeley JR, Small J, et al. (2009). «Рандомизированное контролируемое исследование раннего вмешательства «Первый шаг к успеху». Демонстрация результатов эффективности программы в разнообразном городском школьном округе». Журнал эмоциональных и поведенческих расстройств . 17 (4): 197–212. doi :10.1177/1063426609341645. S2CID 144571336.
^ Брэдшоу CP, Змуда JH, Келлам SG и др. (ноябрь 2009 г.). «Продольное влияние двух универсальных профилактических вмешательств в первом классе на образовательные результаты в старшей школе». Журнал педагогической психологии . 101 (4): 926–937. doi :10.1037/a0016586. PMC 3678772. PMID 23766545 .
^ Krauss A (июнь 2018 г.). «Почему все рандомизированные контролируемые испытания дают предвзятые результаты». Annals of Medicine . 50 (4): 312–322. doi : 10.1080/07853890.2018.1453233 . PMID 29616838.
Дальнейшее чтение
Бланд М. (19 марта 2008 г.). «Справочник программного обеспечения и услуг рандомизации». Йоркский университет .
Эванс И, Торнтон Х, Чалмерс И (2010). Тестирование методов лечения: лучшие исследования для лучшего здравоохранения (PDF) . Лондон: Pinter & Martin. ISBN 978-1-905177-35-6. Архивировано из оригинала (PDF) 2010-12-25.
Gelband H (1983). Влияние рандомизированных клинических испытаний на политику здравоохранения и медицинскую практику: справочный документ (PDF) . Вашингтон, округ Колумбия: Конгресс США, Управление по оценке технологий. OTA-BP-H-22. Архивировано из оригинала (PDF) 2016-03-03.
«Заявление REFLECT (Руководство по отчетности для рандомизированных контролируемых исследований в области безопасности животноводства и пищевых продуктов)».
Wathen JK, Cook JD (12 июля 2006 г.). «Мощность и смещение в адаптивно рандомизированных клинических испытаниях» (PDF) . Онкологический центр им. М. Д. Андерсона, Техасский университет .