В инженерии , науке и статистике репликация — это процесс повторения исследования или эксперимента в тех же или аналогичных условиях для подтверждения исходного утверждения, что имеет решающее значение для подтверждения точности результатов, а также для выявления и исправления недостатков исходного эксперимента. [1] ASTM в стандарте E1847 определяет репликацию как «... повторение набора всех комбинаций обработки, которые должны сравниваться в эксперименте. Каждое из повторений называется репликацией » .
Для полного факторного дизайна реплики — это несколько экспериментальных запусков с теми же уровнями факторов. Вы можете реплицировать комбинации уровней факторов, группы комбинаций уровней факторов или даже целые планы. Например, рассмотрим сценарий с тремя факторами, каждый из которых имеет два уровня, и эксперимент, который проверяет каждую возможную комбинацию этих уровней (полный факторный дизайн). Одна полная репликация этого дизайна будет включать 8 запусков (2^3). Дизайн может быть выполнен один раз или с несколькими репликами. [2]
В статистике существует два основных типа репликации. Во-первых, есть тип, называемый «точной репликацией» (также называемый «прямой репликацией»), который включает повторение исследования как можно ближе к оригиналу, чтобы увидеть, можно ли точно воспроизвести исходные результаты. [3] Например, повторение исследования влияния определенной диеты на потерю веса с использованием того же плана диеты и методов измерения. Второй тип репликации называется «концептуальной репликацией». Он включает проверку той же теории, что и исходное исследование, но с другими условиями. [3] Например, проверка влияния той же диеты на уровень сахара в крови вместо потери веса с использованием других методов измерения.
Важны как точные (прямые) репликации, так и концептуальные репликации. Прямые репликации помогают подтвердить точность результатов в условиях, которые были изначально протестированы. С другой стороны, концептуальные репликации проверяют обоснованность теории, лежащей в основе этих результатов, и изучают различные условия, при которых эти результаты остаются верными. По сути, концептуальная репликация дает представление о том, насколько обобщаемы результаты. [4]
Репликация — это не то же самое, что и повторные измерения одного и того же элемента. Как повторные, так и повторные измерения включают в себя множественные наблюдения, проводимые на тех же уровнях экспериментальных факторов. Однако повторные измерения собираются в течение одной экспериментальной сессии, в то время как повторные измерения собираются в разных экспериментальных сессиях. [2] Репликация в статистике оценивает согласованность результатов эксперимента в разных испытаниях для обеспечения внешней валидности, в то время как повторение измеряет точность и внутреннюю согласованность в рамках одних и тех же или похожих экспериментов. [5]
Пример повторов: тестирование влияния нового препарата на артериальное давление в отдельных группах в разные дни.
Пример повторов: многократное измерение артериального давления в одной группе в течение одного сеанса.
В исследованиях по репликации в области статистики для оценки надежности результатов исследования используются несколько ключевых методов и концепций. Вот некоторые из основных статистических методов и концепций, используемых в репликации:
P-значения : P-значение является мерой вероятности того, что наблюдаемые данные возникли бы случайно, если бы нулевая гипотеза была верна. В исследованиях по репликации p-значения помогают нам определить, могут ли результаты быть последовательно воспроизведены. Низкое p-значение в исследовании по репликации указывает на то, что результаты, вероятно, не являются следствием случайности. [6] Например, если исследование обнаружило статистически значимое влияние тестового условия на результат, а репликация также обнаружила статистически значимые эффекты, это говорит о том, что исходные результаты, вероятно, воспроизводимы.
Доверительные интервалы : Доверительные интервалы предоставляют диапазон значений, в пределах которого, вероятно, будет находиться истинный размер эффекта. В исследованиях по репликации сравнение доверительных интервалов исходного исследования и репликации может указать, являются ли результаты согласованными. [6] Например, если исходное исследование сообщает об эффекте лечения с 95% доверительным интервалом [5, 10], а исследование по репликации обнаруживает аналогичный эффект с доверительным интервалом [6, 11], это перекрытие указывает на согласованные результаты в обоих исследованиях.
В качестве примера рассмотрим непрерывный процесс, который производит элементы. Затем партии элементов обрабатываются или обрабатываются. Наконец, проводятся испытания или измерения. Для получения десяти тестовых значений может быть доступно несколько вариантов. Вот некоторые возможности:
Каждый вариант потребует разных методов анализа данных и приведет к разным выводам.
{{citation}}
: CS1 maint: местоположение ( ссылка )