Эксперимент — это процедура , проводимая для подтверждения или опровержения гипотезы или определения эффективности или вероятности чего-либо ранее не испытанного. Эксперименты дают представление о причинно-следственной связи , демонстрируя, какой результат возникает при манипулировании определенным фактором. Эксперименты сильно различаются по цели и масштабу, но всегда опираются на повторяемую процедуру и логический анализ результатов. Существуют также естественные экспериментальные исследования .
Ребенок может проводить базовые эксперименты, чтобы понять, как вещи падают на землю, в то время как группам ученых могут потребоваться годы систематических исследований, чтобы продвинуться в понимании явления. Эксперименты и другие виды практической деятельности очень важны для обучения студентов в классе естественных наук. Эксперименты могут повысить результаты тестов и помочь ученику стать более вовлеченным и заинтересованным в изучаемом материале, особенно при использовании в течение долгого времени. [1] Эксперименты могут варьироваться от личных и неформальных естественных сравнений (например, дегустация ряда шоколадных конфет, чтобы найти любимый) до строго контролируемых (например, тесты, требующие сложной аппаратуры, контролируемой многими учеными, которые надеются обнаружить информацию о субатомных частицах). Использование экспериментов значительно различается в естественных и гуманитарных науках.
Эксперименты обычно включают элементы управления , которые предназначены для минимизации эффектов переменных, отличных от единственной независимой переменной . Это повышает надежность результатов, часто посредством сравнения между контрольными измерениями и другими измерениями. Научный контроль является частью научного метода . В идеале все переменные в эксперименте контролируются (учтены контрольными измерениями), и ни одна не является неконтролируемой. В таком эксперименте, если все элементы управления работают так, как ожидалось, можно сделать вывод, что эксперимент работает так, как предполагалось, и что результаты обусловлены эффектом тестируемых переменных.
В научном методе эксперимент — это эмпирическая процедура, которая разрешает споры между конкурирующими моделями или гипотезами . [2] [3] Исследователи также используют эксперименты для проверки существующих теорий или новых гипотез, чтобы подтвердить или опровергнуть их. [3] [4]
Эксперимент обычно проверяет гипотезу , которая является ожиданием относительно того, как работает определенный процесс или явление. Однако эксперимент может также быть направлен на ответ на вопрос «что если», без определенного ожидания относительно того, что эксперимент покажет, или на подтверждение предыдущих результатов. Если эксперимент проводится тщательно, результаты обычно либо подтверждают, либо опровергают гипотезу. Согласно некоторым философиям науки , эксперимент никогда не может «доказать» гипотезу, он может только добавить поддержку. С другой стороны, эксперимент, который предоставляет контрпример, может опровергнуть теорию или гипотезу, но теорию всегда можно спасти с помощью соответствующих специальных модификаций за счет простоты.
Эксперимент также должен контролировать возможные факторы смешения — любые факторы, которые могут повлиять на точность или повторяемость эксперимента или на возможность интерпретировать результаты. Обычно смешение устраняется посредством научного контроля и/или, в рандомизированных экспериментах , посредством случайного назначения .
В инженерии и физических науках эксперименты являются основным компонентом научного метода. Они используются для проверки теорий и гипотез о том, как физические процессы работают в определенных условиях (например, может ли определенный инженерный процесс производить желаемое химическое соединение). Обычно эксперименты в этих областях сосредоточены на воспроизведении идентичных процедур в надежде получить идентичные результаты в каждой репликации. Случайное назначение встречается редко.
В медицине и социальных науках распространенность экспериментальных исследований сильно различается в разных дисциплинах. Однако при использовании эксперименты обычно следуют форме клинического испытания , где экспериментальные единицы (обычно отдельные люди) случайным образом назначаются для лечения или контрольного состояния, где оценивается один или несколько результатов. [5] В отличие от норм в физических науках, основное внимание обычно уделяется среднему эффекту лечения (разнице в результатах между группами лечения и контроля) или другой тестовой статистике, полученной в ходе эксперимента. [6] Отдельное исследование, как правило, не включает повторений эксперимента, но отдельные исследования могут быть объединены посредством систематического обзора и метаанализа .
Существуют различные различия в экспериментальной практике в каждой из отраслей науки . Например, сельскохозяйственные исследования часто используют рандомизированные эксперименты (например, для проверки сравнительной эффективности различных удобрений), в то время как экспериментальная экономика часто включает экспериментальные проверки теоретических моделей человеческого поведения, не полагаясь на случайное распределение людей по условиям лечения и контроля.
Один из первых методических подходов к экспериментам в современном смысле виден в работах арабского математика и ученого Ибн аль-Хайсама . Он проводил свои эксперименты в области оптики — возвращаясь к оптическим и математическим проблемам в работах Птолемея — контролируя свои эксперименты за счет таких факторов, как самокритичность, опора на видимые результаты экспериментов, а также критичность в терминах более ранних результатов. Он был одним из первых ученых, использовавших индуктивно-экспериментальный метод для достижения результатов. [7] В своей «Книге оптики» он описывает принципиально новый подход к знаниям и исследованиям в экспериментальном смысле:
То есть, мы должны возобновить исследование его принципов и предпосылок, начав наше исследование с осмотра существующих вещей и обзора условий видимых объектов. Мы должны различать свойства частностей и собирать индукцией то, что относится к глазу, когда происходит зрение, и то, что обнаруживается в способе ощущения как единообразное, неизменное, явное и не подлежащее сомнению. После чего мы должны постепенно и упорядоченно подниматься в нашем исследовании и рассуждениях, критикуя предпосылки и проявляя осторожность в отношении выводов — наша цель во всем, что мы подвергаем осмотру и обзору, заключается в том, чтобы использовать справедливость, не следовать предрассудкам и заботиться во всем, что мы судим и критикуем, чтобы мы искали истину, а не поддавались влиянию мнения. Таким образом, мы можем в конечном итоге прийти к истине, которая радует сердце, и постепенно и осторожно достичь конца, в котором появляется уверенность; в то время как посредством критики и осторожности мы можем ухватить истину, которая рассеивает разногласия и разрешает сомнительные вопросы. При всем том мы не свободны от той человеческой мутности, которая есть в природе человека; но мы должны делать все возможное с тем, что имеем от человеческой силы. От Бога мы черпаем поддержку во всем. [8]
Согласно его объяснению, необходимо строго контролируемое выполнение теста с чувствительностью к субъективности и восприимчивости результатов, обусловленных природой человека. Кроме того, необходим критический взгляд на результаты и выводы более ранних ученых:
Таким образом, долг человека, который изучает труды ученых, если его цель — познание истины, сделать себя врагом всего, что он читает, и, применяя свой ум к ядру и периферии его содержания, атаковать его со всех сторон. Он должен также подозревать себя, когда он выполняет свое критическое исследование его, так, чтобы он мог избежать впадения либо в предубеждение, либо в снисходительность. [9]
Таким образом, сравнение более ранних результатов с экспериментальными результатами необходимо для объективного эксперимента — видимые результаты важнее. В конце концов, это может означать, что экспериментальный исследователь должен найти в себе достаточно смелости, чтобы отказаться от традиционных мнений или результатов, особенно если эти результаты не экспериментальные, а являются результатом логического/ментального вывода. В этом процессе критического рассмотрения сам человек не должен забывать, что он склонен к субъективным мнениям — через «предрассудки» и «снисходительность» — и, таким образом, должен быть критически настроен по отношению к своему собственному способу построения гипотез. [ необходима цитата ]
Фрэнсис Бэкон (1561–1626), английский философ и ученый, работавший в 17 веке, стал влиятельным сторонником экспериментальной науки в английском ренессансе . Он не соглашался с методом ответа на научные вопросы дедукцией — подобно Ибн аль-Хайтаму — и описывал его следующим образом: «Сначала определив вопрос согласно своей воле, человек затем прибегает к опыту и, подчиняя его своим местам, водит его, как пленника в процессии». [10] Бэкон хотел метод, который опирался бы на повторяемые наблюдения или эксперименты. Примечательно, что он первым упорядочил научный метод, как мы его понимаем сегодня.
Остается простой опыт; который, если его принимать таким, какой он есть, называется случайностью, если его искать, экспериментом. Истинный метод опыта сначала зажигает свечу [гипотезу], а затем посредством свечи показывает путь [организует и разграничивает эксперимент]; начиная, как он это делает, с опыта, должным образом упорядоченного и усвоенного, не небрежного или беспорядочного, и из него выводя аксиомы [теории], а из установленных аксиом снова новые эксперименты. [11] : 101
В последующие столетия люди, применявшие научный метод в различных областях, добились важных успехов и открытий. Например, Галилео Галилей (1564–1642) точно измерил время и экспериментировал, чтобы сделать точные измерения и выводы о скорости падающего тела. Антуан Лавуазье (1743–1794), французский химик, использовал эксперимент для описания новых областей, таких как горение и биохимия , а также для разработки теории сохранения массы (материи). [12] Луи Пастер (1822–1895) использовал научный метод, чтобы опровергнуть господствующую теорию самозарождения и разработать микробную теорию болезней . [13] Из-за важности контроля потенциально искажающих переменных, использование хорошо спланированных лабораторных экспериментов является предпочтительным, когда это возможно.
Значительный прогресс в разработке и анализе экспериментов произошел в начале XX века благодаря вкладу таких статистиков, как Рональд Фишер (1890–1962), Ежи Нейман (1894–1981), Оскар Кемпторн (1919–2000), Гертруда Мэри Кокс (1900–1978) и Уильям Джеммелл Кокран (1909–1980) и других.
Эксперименты можно классифицировать по ряду параметров в зависимости от профессиональных норм и стандартов в различных областях исследований.
В некоторых дисциплинах (например, психологии или политологии ) «истинный эксперимент» — это метод социального исследования, в котором есть два вида переменных . Независимая переменная управляется экспериментатором, а зависимая переменная измеряется. Значимой характеристикой истинного эксперимента является то, что он случайным образом распределяет субъектов, чтобы нейтрализовать предвзятость экспериментатора , и гарантирует, на протяжении большого количества итераций эксперимента, что он контролирует все сопутствующие факторы. [14]
В зависимости от дисциплины эксперименты могут проводиться для достижения различных, но не взаимоисключающих целей: [15] проверка теорий, поиск и документирование явлений, разработка теорий или консультирование политиков. Эти цели также по-разному соотносятся с проблемами валидности .
Контролируемый эксперимент часто сравнивает результаты, полученные от экспериментальных образцов, с контрольными образцами, которые практически идентичны экспериментальному образцу, за исключением одного аспекта, эффект которого проверяется ( независимая переменная ). Хорошим примером может служить испытание препарата. Образец или группа, получающая препарат, будет экспериментальной группой ( группой лечения ); а тот, кто получает плацебо или обычное лечение, будет контрольной группой. Во многих лабораторных экспериментах хорошей практикой является наличие нескольких повторных образцов для проводимого теста и наличие как положительного, так и отрицательного контроля . Результаты повторных образцов часто можно усреднить, или, если один из повторов явно не соответствует результатам других образцов, его можно отбросить как результат экспериментальной ошибки (какой-то шаг процедуры тестирования мог быть ошибочно пропущен для этого образца). Чаще всего тесты проводятся в двух или трех экземплярах. Положительный контроль — это процедура, похожая на фактический экспериментальный тест, но из предыдущего опыта известно, что он дает положительный результат. Известно, что отрицательный контроль дает отрицательный результат. Положительный контроль подтверждает, что основные условия эксперимента смогли дать положительный результат, даже если ни один из фактических экспериментальных образцов не дал положительного результата. Отрицательный контроль демонстрирует базовый результат, полученный, когда тест не дает измеримого положительного результата. Чаще всего значение отрицательного контроля рассматривается как «фоновое» значение, которое вычитается из результатов тестового образца. Иногда положительный контроль занимает квадрант стандартной кривой .
Примером, который часто используется в учебных лабораториях, является контролируемый анализ белка . Студентам может быть предоставлен образец жидкости, содержащий неизвестное (студенту) количество белка. Их работа заключается в том, чтобы правильно провести контролируемый эксперимент, в котором они определяют концентрацию белка в образце жидкости (обычно называемом «неизвестным образцом»). Учебная лаборатория будет оснащена стандартным раствором белка с известной концентрацией белка. Студенты могут сделать несколько положительных контрольных образцов, содержащих различные разбавления стандарта белка. Отрицательные контрольные образцы будут содержать все реагенты для анализа белка, но не белок. В этом примере все образцы выполняются в двух экземплярах. Анализ представляет собой колориметрический анализ , в котором спектрофотометр может измерять количество белка в образцах, обнаруживая окрашенный комплекс, образованный взаимодействием молекул белка и молекул добавленного красителя. На иллюстрации результаты для разбавленных тестовых образцов можно сравнить с результатами стандартной кривой (синяя линия на иллюстрации), чтобы оценить количество белка в неизвестном образце.
Контролируемые эксперименты могут проводиться, когда сложно точно контролировать все условия в эксперименте. В этом случае эксперимент начинается с создания двух или более групп образцов, которые вероятностно эквивалентны, что означает, что измерения признаков должны быть схожими среди групп и что группы должны реагировать одинаково, если им дается одинаковое лечение. Эта эквивалентность определяется статистическими методами, которые учитывают количество вариаций между особями и количество особей в каждой группе. В таких областях, как микробиология и химия , где очень мало вариаций между особями, а размер группы легко исчисляется миллионами, эти статистические методы часто обходят стороной, и предполагается, что простое разделение раствора на равные части даст идентичные группы образцов.
После того, как сформированы эквивалентные группы, экспериментатор пытается обращаться с ними одинаково, за исключением одной переменной , которую он или она хочет изолировать. Эксперименты на людях требуют специальных мер предосторожности против внешних переменных, таких как эффект плацебо . Такие эксперименты, как правило, являются двойными слепыми , что означает, что ни доброволец, ни исследователь не знают, какие люди находятся в контрольной или экспериментальной группе, пока не будут собраны все данные. Это гарантирует, что любые эффекты на добровольца обусловлены самим лечением, а не являются реакцией на знание того, что его лечат.
В экспериментах на людях исследователи могут давать субъекту (человеку) стимул , на который субъект реагирует. Целью эксперимента является измерение реакции на стимул с помощью тестового метода .
При планировании экспериментов применяются два или более «лечения» для оценки разницы между средними ответами для лечений. Например, эксперимент по выпечке хлеба может оценить разницу в ответах, связанных с количественными переменными, такими как соотношение воды и муки, и с качественными переменными, такими как штаммы дрожжей. Экспериментирование — это шаг в научном методе , который помогает людям выбирать между двумя или более конкурирующими объяснениями — или гипотезами . Эти гипотезы предлагают причины для объяснения явления или предсказания результатов действия. Примером может служить гипотеза о том, что «если я отпущу этот мяч, он упадет на пол»: это предположение затем можно проверить, проведя эксперимент по отпусканию мяча и наблюдая за результатами. Формально гипотеза сравнивается с ее противоположной или нулевой гипотезой («если я отпущу этот мяч, он не упадет на пол»). Нулевая гипотеза заключается в том, что нет объяснения или предсказательной силы явления посредством рассуждений, которые исследуются. После того, как гипотезы определены, можно провести эксперимент и проанализировать результаты для подтверждения, опровержения или определения точности гипотез.
Можно также спланировать эксперименты для оценки побочных эффектов на близлежащие необработанные объекты.
Термин «эксперимент» обычно подразумевает контролируемый эксперимент, но иногда контролируемые эксперименты чрезмерно сложны, невозможны, неэтичны или незаконны. В этом случае исследователи прибегают к естественным экспериментам или квазиэкспериментам . [16] Естественные эксперименты полагаются исключительно на наблюдения за переменными изучаемой системы , а не на манипулирование только одной или несколькими переменными, как это происходит в контролируемых экспериментах. Насколько это возможно, они пытаются собрать данные для системы таким образом, чтобы можно было определить вклад всех переменных, и где эффекты изменения определенных переменных остаются приблизительно постоянными, так что можно было бы различить эффекты других переменных. Степень, в которой это возможно, зависит от наблюдаемой корреляции между объясняющими переменными в наблюдаемых данных. Когда эти переменные не очень хорошо коррелируют, естественные эксперименты могут приближаться по мощности к контролируемым экспериментам. Однако обычно между этими переменными есть некоторая корреляция, что снижает надежность естественных экспериментов по сравнению с тем, что можно было бы заключить, если бы был проведен контролируемый эксперимент. Кроме того, поскольку естественные эксперименты обычно проводятся в неконтролируемых условиях, переменные из необнаруженных источников не измеряются и не поддерживаются постоянными, и это может приводить к иллюзорным корреляциям в изучаемых переменных.
Многие исследования в различных научных дисциплинах, включая экономику , географию человека , археологию , социологию , культурную антропологию , геологию , палеонтологию , экологию , метеорологию и астрономию , опираются на квазиэксперименты. Например, в астрономии совершенно очевидно невозможно при проверке гипотезы «Звезды — это сколлапсировавшие облака водорода» начать с гигантского облака водорода, а затем провести эксперимент, ожидая несколько миллиардов лет, пока оно не сформирует звезду. Однако, наблюдая различные облака водорода в различных состояниях коллапса и другие следствия гипотезы (например, наличие различных спектральных излучений от света звезд), мы можем собрать данные, необходимые для поддержки гипотезы. Ранним примером такого типа эксперимента была первая проверка в 17 веке того, что свет не перемещается с места на место мгновенно, а вместо этого имеет измеримую скорость. Наблюдения за появлением лун Юпитера немного задерживались, когда Юпитер находился дальше от Земли, в отличие от того, когда Юпитер был ближе к Земле; и это явление было использовано для демонстрации того, что разница во времени появления лун согласуется с измеримой скоростью. [17]
Полевые эксперименты так названы, чтобы отличать их от лабораторных экспериментов, которые обеспечивают научный контроль путем проверки гипотезы в искусственной и строго контролируемой обстановке лаборатории. Часто используемые в социальных науках, и особенно в экономическом анализе образования и вмешательств в здравоохранение, полевые эксперименты имеют то преимущество, что результаты наблюдаются в естественной обстановке, а не в искусственной лабораторной среде. По этой причине полевые эксперименты иногда рассматриваются как имеющие более высокую внешнюю валидность , чем лабораторные эксперименты. Однако, как и естественные эксперименты, полевые эксперименты страдают от возможности заражения: экспериментальные условия можно контролировать с большей точностью и определенностью в лаборатории. Тем не менее, некоторые явления (например, явка избирателей на выборах) нелегко изучить в лаборатории.
Наблюдательное исследование используется, когда непрактично, неэтично, невыгодно (или иным образом неэффективно) вписывать физическую или социальную систему в лабораторные условия, полностью контролировать факторы, вызывающие затруднения, или применять случайное распределение. Его также можно использовать, когда факторы, вызывающие затруднения, либо ограничены, либо известны достаточно хорошо, чтобы анализировать данные в их свете (хотя это может быть редкостью, когда изучаются социальные явления). Чтобы наблюдательная наука была валидной, экспериментатор должен знать и учитывать факторы, вызывающие затруднения . В этих ситуациях наблюдательные исследования имеют ценность, поскольку они часто предлагают гипотезы, которые можно проверить с помощью рандомизированных экспериментов или путем сбора новых данных.
Однако по сути наблюдательные исследования не являются экспериментами. По определению, наблюдательные исследования не имеют манипуляций, необходимых для экспериментов Бэкона . Кроме того, наблюдательные исследования (например, в биологических или социальных системах) часто включают переменные, которые трудно количественно оценить или контролировать. Наблюдательные исследования ограничены, поскольку им не хватает статистических свойств рандомизированных экспериментов. В рандомизированном эксперименте метод рандомизации, указанный в экспериментальном протоколе, направляет статистический анализ, который обычно также указывается экспериментальным протоколом. [18] Без статистической модели, которая отражает объективную рандомизацию, статистический анализ опирается на субъективную модель. [18] Выводы из субъективных моделей ненадежны в теории и на практике. [19] Фактически, есть несколько случаев, когда тщательно проведенные наблюдательные исследования постоянно дают неверные результаты, то есть когда результаты наблюдательных исследований непоследовательны и также отличаются от результатов экспериментов. Например, эпидемиологические исследования рака толстой кишки постоянно показывают полезные корреляции с потреблением брокколи, в то время как эксперименты не обнаруживают никакой пользы. [20]
Особой проблемой наблюдательных исследований с участием людей является большая сложность в достижении справедливых сравнений между видами лечения (или воздействиями), поскольку такие исследования склонны к смещению отбора , а группы, получающие разные виды лечения (воздействия), могут сильно различаться в зависимости от их ковариатов (возраст, рост, вес, лекарства, физические упражнения, статус питания, этническая принадлежность, семейный анамнез и т. д.). Напротив, рандомизация подразумевает, что для каждого ковариата среднее значение для каждой группы, как ожидается, будет одинаковым. Для любого рандомизированного исследования, конечно, ожидается некоторое отклонение от среднего значения, но рандомизация гарантирует, что экспериментальные группы будут иметь близкие средние значения из-за центральной предельной теоремы и неравенства Маркова . При неадекватной рандомизации или малом размере выборки систематическое изменение ковариатов между группами лечения (или группами воздействия) затрудняет отделение эффекта лечения (воздействия) от эффектов других ковариатов, большинство из которых не были измерены. Математические модели, используемые для анализа таких данных, должны учитывать каждую отдельную ковариату (если она измеряется), и результаты не имеют смысла, если ковариата не рандомизирована и не включена в модель.
Чтобы избежать условий, которые делают эксперимент гораздо менее полезным, врачи, проводящие медицинские испытания — например, для одобрения Управления по контролю за продуктами и лекарствами США — количественно и рандомизируют ковариаты, которые могут быть идентифицированы. Исследователи пытаются уменьшить смещения наблюдательных исследований с помощью методов сопоставления , таких как сопоставление баллов склонности , которые требуют больших популяций субъектов и обширной информации о ковариатах. Однако сопоставление баллов склонности больше не рекомендуется как метод, поскольку оно может увеличить, а не уменьшить смещение. [21] Результаты также количественно оцениваются, когда это возможно (плотность костей, количество некоторых клеток или веществ в крови, физическая сила или выносливость и т. д.), а не основываются на мнении субъекта или профессионального наблюдателя. Таким образом, дизайн наблюдательного исследования может сделать результаты более объективными и, следовательно, более убедительными.
Поместив распределение независимой переменной(ых) под контроль исследователя, эксперимент — особенно когда он включает людей в качестве испытуемых — вводит потенциальные этические соображения, такие как баланс пользы и вреда, справедливое распределение вмешательств (например, лечения заболевания) и информированное согласие . Например, в психологии или здравоохранении неэтично предоставлять пациентам некачественное лечение. Поэтому этические наблюдательные комиссии должны останавливать клинические испытания и другие эксперименты, если только не считается, что новое лечение предлагает преимущества, столь же хорошие, как и текущая передовая практика. [22] Также, как правило, неэтично (и часто незаконно) проводить рандомизированные эксперименты по воздействию некачественного или вредного лечения, например, воздействию приема мышьяка на здоровье человека. Чтобы понять воздействие таких воздействий, ученые иногда используют наблюдательные исследования, чтобы понять воздействие этих факторов.
Даже когда экспериментальные исследования напрямую не вовлекают людей в качестве субъектов, они все равно могут представлять этические проблемы. Например, эксперименты с ядерной бомбой, проведенные Манхэттенским проектом, подразумевали использование ядерных реакций для нанесения вреда людям, хотя эксперименты напрямую не вовлекали людей в качестве субъектов. [ оспаривается – обсудить ]