Полевые эксперименты — это эксперименты, проводимые вне лабораторных условий.
Они случайным образом назначают субъектов (или другие единицы выборки) либо в группы лечения, либо в контрольные группы для проверки утверждений о причинно-следственных связях. Случайное назначение помогает установить сопоставимость группы лечения и контроля, так что любые различия между ними, которые возникают после применения лечения, правдоподобно отражают влияние лечения, а не уже существующие различия между группами. Отличительными характеристиками полевых экспериментов является то, что они проводятся в реальных условиях и часто ненавязчиво и контролируют не только пул субъектов, но и выбор и открытость, как определено такими лидерами, как Джон А. Лист . Это отличается от лабораторных экспериментов, которые усиливают научный контроль путем проверки гипотезы в искусственных и строго контролируемых условиях лаборатории. Полевые эксперименты также имеют некоторые контекстуальные отличия от естественных экспериментов и квазиэкспериментов. [1] В то время как естественные эксперименты полагаются на внешнюю силу (например, правительство, некоммерческая организация и т. д.), контролирующую назначение и реализацию рандомизации лечения, полевые эксперименты требуют от исследователей сохранения контроля над рандомизацией и реализацией. Квазиэксперименты происходят, когда методы лечения применяются как бы случайным образом (например, избирательные округа Конгресса США, где кандидаты побеждают с небольшим перевесом, [2] погодные условия, стихийные бедствия и т. д.).
Полевые эксперименты охватывают широкий спектр экспериментальных проектов, каждый из которых имеет разную степень общности. Некоторые критерии общности (например, подлинность методов лечения, участников, контекстов и показателей результатов) относятся к контекстуальным сходствам между субъектами экспериментальной выборки и остальной частью населения. Они все чаще используются в социальных науках для изучения эффектов политических вмешательств в таких областях, как здравоохранение, образование, преступность, социальное обеспечение и политика.
При случайном назначении результаты полевых экспериментов отражают реальный мир, поскольку субъекты распределяются по группам на основе недетерминированных вероятностей. [3] Два других основных предположения лежат в основе способности исследователя собирать непредвзятые потенциальные результаты: исключаемость и невмешательство. [4] [5] Предположение об исключаемости предполагает, что единственным соответствующим причинным фактором является получение лечения. Асимметрия в назначении, применении или измерении групп лечения и контрольных групп нарушает это предположение. Предположение о невмешательстве или предположение о стабильной единице лечения (SUTVA) указывает на то, что ценность результата зависит только от того, назначено ли субъекту лечение, а не от того, назначены ли другие субъекты лечению. Когда эти три основных предположения выполняются, исследователи с большей вероятностью предоставят непредвзятые оценки с помощью полевых экспериментов.
После разработки полевого эксперимента и сбора данных исследователи могут использовать статистические тесты вывода для определения размера и силы эффекта вмешательства на субъектов. Полевые эксперименты позволяют исследователям собирать различные объемы и типы данных. Например, исследователь может разработать эксперимент, который использует пред- и пост-испытательную информацию в соответствующем методе статистического вывода, чтобы увидеть, влияет ли вмешательство на изменения результатов на уровне субъекта.
Полевые эксперименты предлагают исследователям способ проверки теорий и ответов на вопросы с более высокой внешней валидностью , поскольку они имитируют реальные события. [6] Некоторые исследователи утверждают, что полевые эксперименты являются лучшей защитой от потенциальной предвзятости и предвзятых оценок . Кроме того, полевые эксперименты могут выступать в качестве эталонов для сравнения наблюдательных данных с экспериментальными результатами. Использование полевых экспериментов в качестве эталонов может помочь определить уровни предвзятости в наблюдательных исследованиях, и, поскольку исследователи часто разрабатывают гипотезу из априорного суждения, эталоны могут помочь повысить достоверность исследования. [7] Хотя некоторые утверждают, что ковариационная корректировка или планы сопоставления могут работать так же хорошо для устранения предвзятости, полевые эксперименты могут повысить определенность [8], вытесняя опущенную переменную предвзятость, поскольку они лучше распределяют наблюдаемые и ненаблюдаемые факторы. [9]
Исследователи могут использовать методы машинного обучения для моделирования, переоценки и обобщения экспериментальных данных. [10] Это увеличивает скорость и эффективность сбора экспериментальных результатов и снижает затраты на реализацию эксперимента. Другой передовой метод в полевых экспериментах — использование дизайна многорукого бандита , [11] включая аналогичные адаптивные дизайны для экспериментов с переменными результатами и переменными обработками с течением времени. [12]
Существуют ограничения и аргументы против использования полевых экспериментов вместо других исследовательских проектов (например, лабораторных экспериментов, экспериментов по обследованию, наблюдательных исследований и т. д.). Учитывая, что полевые эксперименты обязательно проводятся в определенных географических и политических условиях, возникает обеспокоенность по поводу экстраполяции результатов для формулирования общей теории относительно интересующей популяции. Однако исследователи начали находить стратегии для эффективного обобщения причинных эффектов за пределами выборки путем сравнения среды, в которой находилась обработанная популяция, и внешней популяции, получения доступа к информации из выборки большего размера, а также учета и моделирования неоднородности эффектов лечения в пределах выборки. [13] Другие использовали методы блокирования ковариатов для обобщения популяций полевых экспериментов на внешние популяции. [14]
Проблемы несоответствия, влияющие на полевые эксперименты (как одностороннее, так и двустороннее несоответствие) [15] [16], могут возникнуть, когда субъекты, назначенные в определенную группу, никогда не получают назначенного им вмешательства. Другие проблемы сбора данных включают истощение (когда субъекты, которые проходят лечение, не предоставляют данные о результатах), что при определенных условиях будет искажать собранные данные. Эти проблемы могут привести к неточному анализу данных; однако исследователи, которые используют полевые эксперименты, могут использовать статистические методы для расчета полезной информации, даже когда возникают эти трудности. [16]
Использование полевых экспериментов также может привести к проблемам интерференции [17] между субъектами. Когда субъект или группа, подвергавшаяся лечению, влияет на результаты необработанной группы (через такие условия, как перемещение, общение, заражение и т. д.), необработанные группы могут не иметь результата, который является истинным результатом необработанной группы. Подмножество интерференции — это эффект перелива, который происходит, когда лечение обработанных групп влияет на соседние необработанные группы.
Полевые эксперименты могут быть дорогими, отнимающими много времени на проведение, сложными для воспроизведения и полными этических ловушек. Субъекты или группы населения могут подорвать процесс внедрения, если есть ощущение несправедливости в выборе лечения (например, в экспериментах с « отрицательным подоходным налогом » сообщества могут лоббировать получение сообществом денежного перевода, чтобы назначение не было чисто случайным). Существуют ограничения на сбор форм согласия от всех субъектов. Товарищи, управляющие вмешательствами или собирающие данные, могут загрязнить схему рандомизации. Таким образом, полученные данные могут быть более разнообразными: большее стандартное отклонение , меньшая точность и правильность и т. д. Это приводит к использованию больших размеров выборки для полевых испытаний. Однако другие утверждают, что, даже если воспроизводимость затруднена, если результаты эксперимента важны, то существует большая вероятность того, что эксперимент будет воспроизведен. Кроме того, полевые эксперименты могут использовать дизайн « ступенчатого клина », который в конечном итоге предоставит всей выборке доступ к вмешательству в различные временные графики. [18] Исследователи также могут разработать слепой полевой эксперимент, чтобы исключить возможность манипуляции.
История экспериментов в лаборатории и на местах оставила долгосрочные следы в физических, естественных и биологических науках. Современное использование полевых экспериментов уходит корнями в 1700-е годы, когда Джеймс Линд использовал контролируемый полевой эксперимент для определения лечения цинги . [19]
Другие категориальные примеры наук, использующих полевые эксперименты, включают: