stringtranslate.com

Воспроизводимость

Воспроизводимость , тесно связанная с воспроизводимостью и повторяемостью , является основным принципом, лежащим в основе научного метода . Для того, чтобы результаты исследования были воспроизводимыми, это означает, что результаты, полученные в ходе эксперимента или наблюдательного исследования или в статистическом анализе набора данных , должны быть достигнуты снова с высокой степенью надежности при воспроизведении исследования. Существуют различные виды репликации [1], но обычно в исследованиях по репликации участвуют разные исследователи, использующие одну и ту же методологию. Только после одной или нескольких таких успешных репликаций результат должен быть признан научным знанием.

В более узком смысле воспроизводимость определяется в вычислительных науках как имеющая следующее качество: результаты должны быть документированы путем предоставления всех данных и кода таким образом, чтобы вычисления можно было выполнить повторно с идентичными результатами.

В последние десятилетия растет обеспокоенность тем, что многие опубликованные научные результаты не проходят проверку на воспроизводимость, что приводит к кризису воспроизводимости или репликации .

История

Воздушный насос Бойля был, по меркам XVII века, сложным и дорогим научным аппаратом, что затрудняло воспроизводимость результатов.

Первым, кто подчеркнул важность воспроизводимости в науке, был англо-ирландский химик Роберт Бойль , живший в Англии в XVII веке. Воздушный насос Бойля был разработан для создания и изучения вакуума , что в то время было очень спорной концепцией. Действительно, выдающиеся философы, такие как Рене Декарт и Томас Гоббс, отрицали саму возможность существования вакуума. Историки науки Стивен Шейпин и Саймон Шеффер в своей книге 1985 года «Левиафан и воздушный насос » описывают спор между Бойлем и Гоббсом, якобы о природе вакуума, как по сути спор о том, как следует получать полезные знания. Бойль, пионер экспериментального метода , утверждал, что основы знания должны быть составлены из экспериментально полученных фактов, которые могут быть сделаны правдоподобными для научного сообщества благодаря их воспроизводимости. Бойль утверждал, что, повторяя один и тот же эксперимент снова и снова, появится уверенность в факте.

Воздушный насос, который в 17 веке был сложным и дорогим в изготовлении аппаратом, также привел к одному из первых задокументированных споров о воспроизводимости конкретного научного явления . В 1660-х годах голландский ученый Христиан Гюйгенс построил свой собственный воздушный насос в Амстердаме , первый вне прямого руководства Бойля и его помощника в то время Роберта Гука . Гюйгенс сообщил об эффекте, который он назвал «аномальной суспензией», при котором вода, казалось, левитировала в стеклянной банке внутри его воздушного насоса (на самом деле подвешенной над воздушным пузырем), но Бойль и Гук не смогли воспроизвести это явление в своих собственных насосах. Как описывают Шапин и Шеффер, «стало ясно, что если явление не будет воспроизведено в Англии с помощью одного из двух имеющихся насосов, то никто в Англии не примет заявления Гюйгенса или его компетентность в работе с насосом». Гюйгенс был наконец приглашен в Англию в 1663 году, и под его личным руководством Гук смог воспроизвести аномальную суспензию воды. После этого Гюйгенс был избран иностранным членом Королевского общества . Однако Шейпин и Шеффер также отмечают, что «достижение репликации зависело от случайных актов суждения. Нельзя написать формулу, говорящую, когда репликация была достигнута или не была достигнута». [2]

Философ науки Карл Поппер кратко отметил в своей знаменитой книге 1934 года «Логика научного открытия» , что «невоспроизводимые единичные случаи не имеют значения для науки». [3] Статистик Рональд Фишер писал в своей книге 1935 года « Планирование экспериментов » , которая заложила основы современной научной практики проверки гипотез и статистической значимости , что «мы можем сказать, что явление экспериментально доказуемо, когда мы знаем, как провести эксперимент, который редко не даст нам статистически значимых результатов». [4] Такие утверждения выражают распространенную в современной науке догму о том, что воспроизводимость является необходимым условием (хотя и не обязательно достаточным ) для установления научного факта, а на практике — для установления научного авторитета в любой области знания. Однако, как отметили выше Шапин и Шеффер, эта догма не сформулирована количественно, например, в отношении статистической значимости, и поэтому явно не установлено, сколько раз факт должен быть воспроизведен, чтобы считаться воспроизводимым.

Терминология

Воспроизводимость и повторяемость — это родственные термины, в широком смысле являющиеся синонимами воспроизводимости (например, среди широкой общественности), но их часто полезно различать в более точных смыслах, как указано ниже.

Два основных шага естественным образом различаются в связи с воспроизводимостью экспериментальных или наблюдательных исследований: когда в попытке достичь этого получают новые данные, часто используется термин «воспроизводимость» , и новое исследование является репликацией или копией исходного. Получая те же результаты при повторном анализе набора данных исходного исследования с использованием тех же процедур, многие авторы используют термин «воспроизводимость» в узком, техническом смысле, исходя из его использования в вычислительных исследованиях. Повторяемость связана с повторением эксперимента в рамках того же исследования теми же исследователями. Воспроизводимость в первоначальном, широком смысле признается только в том случае, если репликация, выполненная независимой исследовательской группой, оказалась успешной.

Термины «воспроизводимость» и «воспроизводимость» иногда появляются даже в научной литературе с противоположным значением [5] [6] , поскольку различные области исследований придерживаются собственных определений для одних и тех же терминов.

Меры воспроизводимости и повторяемости

В химии термины воспроизводимость и повторяемость используются в определенном количественном значении. [7] В межлабораторных экспериментах концентрация или другое количество химического вещества измеряется повторно в разных лабораториях для оценки изменчивости измерений. Затем стандартное отклонение разницы между двумя значениями, полученными в одной и той же лаборатории, называется повторяемостью. Стандартное отклонение разницы между двумя измерениями из разных лабораторий называется воспроизводимостью. [ 8 ] Эти меры связаны с более общей концепцией компонентов дисперсии в метрологии .

Воспроизводимое исследование

Воспроизводимый метод исследования

Термин «воспроизводимое исследование» относится к идее, что научные результаты должны быть задокументированы таким образом, чтобы их вывод был полностью прозрачным. Это требует подробного описания методов, используемых для получения данных [9] [10], и обеспечения легкого доступа к полному набору данных и коду для расчета результатов. [11] [12] [13] [14] [15] [16] Это существенная часть открытой науки .

Чтобы сделать любой исследовательский проект воспроизводимым в вычислительном отношении, общая практика подразумевает, что все данные и файлы должны быть четко разделены, помечены и задокументированы. Все операции должны быть полностью документированы и автоматизированы, насколько это возможно, избегая ручного вмешательства, где это осуществимо. Рабочий процесс должен быть разработан как последовательность более мелких шагов, которые объединяются так, чтобы промежуточные результаты одного шага напрямую служили входами для следующего шага. Следует использовать контроль версий, поскольку он позволяет легко просматривать историю проекта и позволяет документировать и отслеживать изменения прозрачным образом.

Базовый рабочий процесс для воспроизводимых исследований включает сбор данных, обработку данных и анализ данных. Сбор данных в первую очередь состоит из получения первичных данных из первичного источника, такого как опросы, полевые наблюдения, экспериментальные исследования или получение данных из существующего источника. Обработка данных включает обработку и просмотр необработанных данных, собранных на первом этапе, и включает ввод данных, манипулирование данными и фильтрацию и может быть выполнена с использованием программного обеспечения. Данные должны быть оцифрованы и подготовлены для анализа данных. Данные могут быть проанализированы с использованием программного обеспечения для интерпретации или визуализации статистики или данных для получения желаемых результатов исследования, таких как количественные результаты, включая рисунки и таблицы. Использование программного обеспечения и автоматизации повышает воспроизводимость методов исследования. [17]

Существуют системы, облегчающие такое документирование, например, язык R Markdown [18] или блокнот Jupyter . [19] [20] [21] Open Science Framework предоставляет платформу и полезные инструменты для поддержки воспроизводимых исследований.

Воспроизводимые исследования на практике

Психология столкнулась с возобновлением внутренних опасений по поводу невоспроизводимых результатов (см. статью о кризисе воспроизводимости для эмпирических результатов по показателям успешности репликаций). Исследователи показали в исследовании 2006 года, что из 141 автора публикации эмпирических статей Американской психологической ассоциации (APA) 103 (73%) не ответили своими данными в течение шестимесячного периода. [22] В последующем исследовании, опубликованном в 2015 году, было обнаружено, что 246 из 394 связавшихся авторов статей в журналах APA не поделились своими данными по запросу (62%). [23] В статье 2012 года было предложено, чтобы исследователи публиковали данные вместе со своими работами, и набор данных был выпущен вместе с демонстрацией. [24] В 2017 году статья, опубликованная в Scientific Data, предположила, что этого может быть недостаточно и что весь контекст анализа должен быть раскрыт. [25]

В экономике были высказаны опасения относительно достоверности и надежности опубликованных исследований. В других науках воспроизводимость считается фундаментальной и часто является предпосылкой для публикации исследований, однако в экономических науках она не рассматривается как приоритет первостепенной важности. Большинство рецензируемых экономических журналов не принимают никаких существенных мер для обеспечения воспроизводимости опубликованных результатов, однако ведущие экономические журналы переходят к принятию обязательных архивов данных и кодов. [26] У исследователей мало или нет стимулов делиться своими данными, и авторам пришлось бы нести расходы на компиляцию данных в повторно используемые формы. Экономические исследования часто не воспроизводимы, поскольку только часть журналов имеют адекватную политику раскрытия данных для наборов данных и программного кода, и даже если они это делают, авторы часто не соблюдают ее или она не обеспечивается издателем. Исследование 599 статей, опубликованных в 37 рецензируемых журналах, показало, что хотя некоторые журналы достигли значительных показателей соответствия, значительная часть выполнила их лишь частично или не выполнила вообще. На уровне статей средний показатель соответствия составил 47,5%; а на уровне журналов средний показатель соответствия составил 38%, варьируясь от 13% до 99%. [27]

Исследование 2018 года, опубликованное в журнале PLOS ONE, показало, что 14,4% выборки исследователей статистики общественного здравоохранения поделились своими данными или кодом, или и тем, и другим. [28]

В медицинской литературе уже много лет существуют инициативы по улучшению отчетности и, следовательно, воспроизводимости, начиная с инициативы CONSORT , которая теперь является частью более широкой инициативы EQUATOR Network . Эта группа недавно обратила внимание на то, как улучшение отчетности может сократить отходы в исследованиях, [29] особенно биомедицинских исследованиях.

Воспроизводимые исследования являются ключом к новым открытиям в фармакологии . За открытием фазы I последуют воспроизведения фазы II по мере того, как лекарство развивается в сторону коммерческого производства. За последние десятилетия успешность фазы II упала с 28% до 18%. Исследование 2011 года показало, что 65% медицинских исследований были непоследовательными при повторном тестировании, и только 6% были полностью воспроизводимыми. [30]

Примечательные невоспроизводимые результаты

Хидэё Ногучи прославился тем, что правильно определил бактериальный агент сифилиса , но также утверждал, что он мог культивировать этот агент в своей лаборатории. Никто другой не смог получить этот последний результат. [31]

В марте 1989 года химики из Университета Юты Стэнли Понс и Мартин Флейшманн сообщили о производстве избыточного тепла, которое можно было объяснить только ядерным процессом (« холодный синтез »). Отчет был поразительным, учитывая простоту оборудования: по сути, это была электролитическая ячейка, содержащая тяжелую воду и палладиевый катод , который быстро поглощал дейтерий , полученный в ходе электролиза. Средства массовой информации широко освещали эксперименты, и это было на первых полосах многих газет по всему миру (см. наука на пресс-конференции ). В течение следующих нескольких месяцев другие пытались повторить эксперимент, но безуспешно. [32]

Никола Тесла еще в 1899 году утверждал, что использовал ток высокой частоты для зажигания газонаполненных ламп на расстоянии более 25 миль (40 км) без использования проводов . В 1904 году он построил башню Уорденклифф на Лонг-Айленде, чтобы продемонстрировать способы отправки и получения энергии без соединительных проводов. Установка так и не была полностью введена в эксплуатацию и не была достроена из-за экономических проблем, поэтому никаких попыток воспроизвести его первый результат так и не было предпринято. [33]

Другие примеры, в которых противоречивые доказательства опровергают первоначальное утверждение:

Смотрите также

Ссылки

  1. ^ Цанг, Эрик В.К.; Кван, Кай-ман (1999). «Репликация и развитие теории в организационной науке: критический реалистический взгляд». Academy of Management Review . 24 (4): 759–780. doi :10.5465/amr.1999.2553252. ISSN  0363-7425.
  2. Стивен Шейпин и Саймон Шаффер , «Левиафан и воздушный насос» , Princeton University Press, Принстон, Нью-Джерси (1985).
  3. ^ Эта цитата взята из перевода на английский язык книги Карла Поппера « Логика научного открытия» , Routledge, Лондон, 1992, стр. 66.
  4. ^ Рональд Фишер , Планирование экспериментов , (1971) [1935](9-е изд.), Macmillan, стр. 14.
  5. ^ Барба, Лорена А. (2018). «Терминологии для воспроизводимых исследований». arXiv : 1802.03311 [cs.DL].
  6. ^ Либерман, Марк. «Воспроизводимость против воспроизводимости — или все наоборот?» . Получено 15 октября 2020 г.
  7. ^ "IUPAC - воспроизводимость (R05305)". Международный союз теоретической и прикладной химии . doi : 10.1351/goldbook.R05305 . Получено 2022-03-04 .
  8. ^ Подкомитет E11.20 по оценке методов испытаний и контролю качества (2014). «Стандартная практика использования терминов «точность» и «смещение» в методах испытаний ASTM». ASTM International. ASTM E177.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )(требуется подписка)
  9. ^ Кинг, Гэри (1995). «Репликация, репликация». PS: Политическая наука и политика . 28 (3): 444–452. doi :10.2307/420301. ISSN  1049-0965. JSTOR  420301. S2CID  250480339.
  10. ^ Кюне, Мартин; Лиер, Андреас В. (2009). «Улучшение традиционного управления информацией в естественных науках». Data Science Journal . 8 (1): 18–27. doi : 10.2481/dsj.8.18 .
  11. ^ Фомель, Сергей; Клербоут, Джон (2009). «Введение приглашенных редакторов: воспроизводимые исследования». Вычислительная техника в науке и технике . 11 (1): 5–7. Bibcode : 2009CSE....11a...5F. doi : 10.1109/MCSE.2009.14.
  12. ^ Бакхайт, Джонатан Б.; Донохо, Дэвид Л. (май 1995 г.). WaveLab и воспроизводимые исследования (PDF) (отчет). Калифорния, США: Стэнфордский университет , Департамент статистики. Технический отчет № 474. Архивировано (PDF) из оригинала 2015-01-09 . Получено 5 января 2015 г.
  13. ^ «Круглый стол Йельской школы права по обмену данными и ядрами: «Воспроизводимые исследования»". Вычислительная техника в науке и технике . 12 (5): 8–12. 2010. doi :10.1109/MCSE.2010.113.
  14. ^ Марвик, Бен (2016). «Вычислительная воспроизводимость в археологических исследованиях: основные принципы и пример их внедрения». Журнал археологического метода и теории . 24 (2): 424–450. doi :10.1007/s10816-015-9272-9. S2CID  43958561.
  15. ^ Гудман, Стивен Н.; Фанелли, Даниэле; Иоаннидис, Джон ПА (1 июня 2016 г.). «Что означает воспроизводимость исследований?». Science Translational Medicine . 8 (341): 341ps12. doi : 10.1126/scitranslmed.aaf5027 . PMID  27252173.
  16. ^ Harris JK; Johnson KJ; Combs TB; Carothers BJ; Luke DA; Wang X (2019). «Три изменения, которые могут внести ученые общественного здравоохранения, чтобы помочь создать культуру воспроизводимых исследований». Public Health Rep. Public Health Reports . 134 (2): 109–111. doi : 10.1177/0033354918821076. ISSN  0033-3549. OCLC  7991854250. PMC 6410469. PMID  30657732. 
  17. ^ Китцес, Джастин; Турек, Дэниел; Дениз, Фатма (2018). Практика воспроизводимых исследовательских примеров и уроки из наук с интенсивным использованием данных. Окленд, Калифорния: Издательство Калифорнийского университета. С. 19–30. ISBN 9780520294745. JSTOR  10.1525/j.ctv1wxsc7.
  18. ^ Марвик, Бен; Бёттигер, Карл; Маллен, Линкольн (29 сентября 2017 г.). «Упаковка аналитических данных для воспроизводимой работы с использованием R (и друзей)». The American Statistician . 72 : 80–88. doi :10.1080/00031305.2017.1375986. S2CID  125412832.
  19. ^ Kluyver, Thomas; Ragan-Kelley, Benjamin; Perez, Fernando; Granger, Brian; Bussonnier, Matthias; Frederic, Jonathan; Kelley, Kyle; Hamrick, Jessica; Grout, Jason; Corlay, Sylvain (2016). "Jupyter Notebooks–a publishing format for reproducible computingal workflows" (PDF) . В Loizides, F; Schmidt, B (ред.). Positioning and Power in Academic Publishing: Players, Agents and Agendas . 20th International Conference on Electronic Publishing. IOS Press. стр. 87–90. doi :10.3233/978-1-61499-649-1-87. Архивировано (PDF) из оригинала 10.01.2018.
  20. ^ Бег, Мариджан; Така, Джульетта; Клюйвер, Томас; Коновалов, Александр; Раган-Келли, Мин; Тьери, Николас М.; Фангор, Ханс (1 марта 2021 г.). «Использование Jupyter для воспроизводимых научных рабочих процессов». Computing in Science & Engineering . 23 (2): 36–46. arXiv : 2102.09562 . Bibcode : 2021CSE....23b..36B. doi : 10.1109/MCSE.2021.3052101. S2CID  231979203.
  21. ^ Granger, Brian E.; Perez, Fernando (1 марта 2021 г.). «Jupyter: Thinking and Storytelling With Code and Data». Computing in Science & Engineering . 23 (2): 7–14. Bibcode : 2021CSE....23b...7G. doi : 10.1109/MCSE.2021.3059263 . S2CID  232413965.
  22. ^ Wicherts, JM; Borsboom, D.; Kats, J.; Molenaar, D. (2006). «Недостаточная доступность данных психологических исследований для повторного анализа». American Psychologist . 61 (7): 726–728. doi :10.1037/0003-066X.61.7.726. PMID  17032082.
  23. ^ Vanpaemel, W.; Vermorgen, M.; Deriemaecker, L.; Storms, G. (2015). «Теряем ли мы хороший кризис? Доступность данных психологических исследований после шторма». Collabra . 1 (1): 1–5. doi : 10.1525/collabra.13 .
  24. ^ Wicherts, JM; Bakker, M. (2012). «Опубликуйте (свои данные) или (дайте данным) погибнуть! Почему бы не опубликовать и свои данные?». Intelligence . 40 (2): 73–76. doi :10.1016/j.intell.2012.01.004.
  25. ^ Паскье, Томас; Лау, Мэтью К.; Трисович, Ана; Буз, Эмери Р.; Кутюрье, Бен; Кросас, Мерсе; Эллисон, Аарон М.; Гибсон, Валери; Джонс, Крис Р.; Зельцер, Марго (5 сентября 2017 г.). «Если бы эти данные могли говорить». Научные данные . 4 (1): 170114. Бибкод : 2017NatSD...470114P. дои : 10.1038/sdata.2017.114. ПМЦ 5584398 . ПМИД  28872630. 
  26. ^ Маккалоу, Брюс (март 2009 г.). «Экономические журналы открытого доступа и рынок воспроизводимых экономических исследований». Экономический анализ и политика . 39 (1): 117–126. doi :10.1016/S0313-5926(09)50047-1.
  27. ^ Влеминк, Свен; Подкраяц, Феликс (10.12.2017). «Журналы по экономическим наукам: на словах лишняя поддержка воспроизводимых исследований?». IASSIST Quarterly . 41 (1–4): 16. doi : 10.29173/iq6. hdl : 11108/359 . S2CID  96499437.
  28. ^ Харрис, Дженин К.; Джонсон, Кимберли Дж.; Карозерс, Бобби Дж.; Комбс, Тодд Б.; Люк, Дуглас А.; Ван, Сяоянь (2018). «Использование воспроизводимых исследовательских практик в общественном здравоохранении: опрос аналитиков общественного здравоохранения». PLOS ONE . 13 (9): e0202447. Bibcode : 2018PLoSO..1302447H. doi : 10.1371/journal.pone.0202447 . ISSN 1932-6203  . OCLC  7891624396. PMC 6135378. PMID  30208041. 
  29. ^ "Research Waste/EQUATOR Conference | Research Waste". researchwaste.net . Архивировано из оригинала 29 октября 2016 г.
  30. ^ Prinz, F.; Schlange, T.; Asadullah, K. (2011). «Хотите верьте, хотите нет: насколько мы можем полагаться на опубликованные данные о потенциальных мишенях для лекарств?». Nature Reviews Drug Discovery . 10 (9): 712. doi : 10.1038/nrd3439-c1 . PMID  21892149.
  31. ^ Tan, SY; Furubayashi, J (2014). «Хидейо Ногучи (1876-1928): выдающийся бактериолог». Singapore Medical Journal . 55 (10): 550–551. doi :10.11622/smedj.2014140. ISSN  0037-5675. PMC 4293967. PMID 25631898  . 
  32. ^ Браун, Малкольм (3 мая 1989 г.). «Физики опровергают утверждение о новом виде синтеза». New York Times . Получено 3 февраля 2017 г.
  33. ^ Чейни, Маргарет (1999), Тесла, повелитель молний , ​​Нью-Йорк: Barnes & Noble Books, ISBN 0-7607-1005-8 , стр. 107.; «Не имея возможности преодолеть свои финансовые трудности, он был вынужден закрыть лабораторию в 1905 году». 
  34. Доминус, Сьюзен (18 октября 2017 г.). «Когда пришла революция для Эми Кадди». New York Times Magazine .

Дальнейшее чтение

Внешние ссылки