Обмен данными — это практика предоставления другим исследователям данных, используемых для научных исследований. Многие финансирующие агентства, учреждения и издательские площадки имеют политику в отношении обмена данными, поскольку прозрачность и открытость многими считаются частью научного метода . [1]
Ряд финансирующих агентств и научных журналов требуют от авторов рецензируемых статей делиться любой дополнительной информацией ( необработанными данными , статистическими методами или исходным кодом ), необходимой для понимания, разработки или воспроизведения опубликованных исследований. Значительная часть научных исследований не подпадает под требования по обмену данными, и многие из этих политик имеют либеральные исключения. При отсутствии каких-либо обязательных требований обмен данными осуществляется по усмотрению самих ученых. Кроме того, в определенных ситуациях правительства [2] и учреждения запрещают или строго ограничивают обмен данными для защиты интересов собственности, национальной безопасности и конфиденциальности субъекта/пациента/жертвы. Обмен данными также может быть ограничен для защиты учреждений и ученых от использования данных в политических целях.
Данные и методы могут быть запрошены у автора спустя годы после публикации. Чтобы поощрять обмен данными [3] и предотвращать потерю или повреждение данных, ряд финансирующих агентств и журналов установили политику архивирования данных . Доступ к публично архивированным данным является недавним событием в истории науки, которое стало возможным благодаря технологическим достижениям в области коммуникаций и информационных технологий . Чтобы в полной мере воспользоваться преимуществами современной быстрой связи, может потребоваться консенсусное соглашение о критериях, лежащих в основе взаимного признания соответствующих вкладов. Модели, признанные для улучшения своевременного обмена данными для более эффективного реагирования на угрозы возникновения инфекционных заболеваний, включают механизм обмена данными, введенный инициативой GISAID . [4] [5]
Несмотря на политику в отношении обмена данными и архивирования, сокрытие данных все еще происходит. Авторы могут не архивировать данные или архивировать только часть данных. Само по себе отсутствие архивирования данных не является сокрытием данных. Когда исследователь запрашивает дополнительную информацию, автор иногда отказывается ее предоставить. [6] Когда авторы таким образом скрывают данные, они рискуют потерять доверие научного сообщества. [7] Исследование 2022 года выявило около 3500 научных работ, которые содержали утверждения о том, что данные доступны, но при запросе и дальнейшем поиске данных было обнаружено, что они недоступны для 94% работ. [8]
Обмен данными может также означать обмен личной информацией на платформе социальных сетей.
9 августа 2007 года президент Буш подписал Закон о КОМПЕТЕНЦИЯХ Америки (или Закон о создании возможностей для значимого продвижения передового опыта в области технологий, образования и науки в Америке), требующий от гражданских федеральных агентств предоставления руководящих принципов, политик и процедур для содействия и оптимизации открытого обмена данными и исследованиями между агентствами, общественностью и политиками. См. раздел 1009. [9]
«Заявление о политике предоставления грантов Национальных институтов здравоохранения (NIH) определяет «данные» как «записанную информацию, независимо от формы или носителя, на котором она может быть записана, и включает в себя сочинения, фильмы, звукозаписи, иллюстрированные репродукции, рисунки, проекты или другие графические изображения, руководства по процедурам, формы, диаграммы, схемы рабочих процессов, описания оборудования, файлы данных, программы обработки данных или компьютерные программы (программное обеспечение), статистические записи и другие исследовательские данные».
— Совет по правительственным связям [10]
В заключительном заявлении NIH об обмене исследовательскими данными говорится:
«NIH подтверждает свою поддержку концепции обмена данными. Мы считаем, что обмен данными необходим для ускоренного перевода результатов исследований в знания, продукты и процедуры для улучшения здоровья человека. NIH одобряет обмен окончательными данными исследований для достижения этих и других важных научных целей. NIH ожидает и поддерживает своевременную публикацию и обмен окончательными данными исследований, поддерживаемых NIH, для использования другими исследователями. «NIH признает, что исследователи, которые собирают данные, имеют законный интерес в получении выгоды от своих вложений времени и усилий. Поэтому мы пересмотрели наше определение «своевременной публикации и обмена», чтобы они осуществлялись не позднее принятия к публикации основных результатов из окончательного набора данных. NIH по-прежнему ожидает, что первоначальные исследователи могут получить выгоду от первого и последующего использования, но не от длительного исключительного использования».
— «Окончательное заявление NIH об обмене данными исследований». [11]
36. Обмен результатами, данными и другими исследовательскими продуктами
a. NSF … ожидает, что исследователи поделятся с другими исследователями, не более чем за дополнительную плату и в течение разумного времени, данными, образцами, физическими коллекциями и другими вспомогательными материалами, созданными или собранными в ходе работы. Он также поощряет лауреатов делиться программным обеспечением и изобретениями или иным образом действовать, чтобы сделать инновации, которые они воплощают, широко полезными и применимыми.
б. Корректировки и, при необходимости, исключения могут быть разрешены для защиты прав отдельных лиц и субъектов, действительности результатов или целостности коллекций или для удовлетворения законных интересов исследователей.
— «Национальный научный фонд: Общие условия грантов (GC-1)», 1 апреля 2001 г. (стр. 17).
Обвинения в неправомерном поведении в медицинских исследованиях влекут за собой серьезные последствия. Министерство здравоохранения и социальных служб США создало офис для надзора за расследованиями обвинений в неправомерном поведении, включая сокрытие данных. На веб-сайте определена миссия:
«Управление по добросовестности исследований (ORI) содействует добросовестности в биомедицинских и поведенческих исследованиях, поддерживаемых Службой общественного здравоохранения США (PHS) примерно в 4000 учреждений по всему миру. ORI контролирует институциональные расследования нарушений в исследованиях и содействует ответственному проведению исследований (RCR) посредством образовательных, профилактических и регулирующих мероприятий».
— Управление по обеспечению добросовестности исследований.
Некоторые исследовательские организации особенно сильны в отношении обмена данными. WaveLab Стэнфордского университета придерживается философии воспроизводимых исследований и раскрытия всех алгоритмов и исходного кода, необходимых для воспроизведения исследования. В статье под названием «WaveLab и воспроизводимые исследования» авторы описывают некоторые проблемы, с которыми они столкнулись при попытке воспроизвести собственное исследование спустя некоторое время. Во многих случаях это было настолько сложно, что они отказались от попыток. Именно этот опыт убедил их в важности раскрытия исходного кода. [12] Философия описывается следующим образом:
Data Observation Network for Earth ( DataONE ) и Data Conservancy [15] — это проекты, поддерживаемые Национальным научным фондом для поощрения и облегчения обмена данными между учеными-исследователями и лучшей поддержки метаанализа . В области наук об окружающей среде исследовательское сообщество признает, что крупные научные достижения, включающие интеграцию знаний в различных областях, потребуют от исследователей преодоления не только технологических барьеров для обмена данными, но и исторически укоренившихся институциональных и социологических барьеров. [16] Доктор Ричард Дж. Ходс, директор Национального института старения, заявил: «старая модель, в которой исследователи ревностно охраняли свои данные, больше не применима». [17]
Alliance for Taxpayer Access — это группа организаций, которые поддерживают открытый доступ к спонсируемым правительством исследованиям. Группа опубликовала «Заявление о принципах», в котором объясняется, почему они считают, что открытый доступ важен. [18] Они также перечисляют ряд международных политик публичного доступа. [19] Это касается не более, чем своевременной передачи важной информации для эффективного реагирования на чрезвычайные ситуации в области здравоохранения. [20] Хотя архивы общественного достояния использовались для хранения данных, в основном после официальной публикации, они не смогли способствовать быстрому обмену данными во время чрезвычайных ситуаций в области здравоохранения, среди которых вспышки лихорадки Эбола [21] и Зика [22] [23] . Требуются более четко определенные принципы для признания интересов тех, кто генерирует данные, при этом разрешая свободный, беспрепятственный доступ и использование данных (до публикации) для исследований и практического применения, например, те, которые приняты Инициативой GISAID для противодействия возникающим угрозам гриппа. [24] [25]
Утаивание данных стало настолько обычным явлением в генетике , что исследователи из Массачусетской больницы общего профиля опубликовали статью в журнале на эту тему. Исследование показало, что «поскольку им было отказано в доступе к данным, 28% генетиков сообщили, что они не смогли подтвердить опубликованные исследования». [26]
В исследовании 2006 года было отмечено, что из 141 автора публикации эмпирических статей Американской психологической ассоциации (APA) 103 (73%) не предоставили свои данные в течение 6 месяцев. [27] В последующем исследовании, опубликованном в 2015 году, было обнаружено, что 246 из 394 авторов статей в журналах APA, с которыми связались, не предоставили свои данные по запросу (62%). [28]
Исследование 2018 года сообщило об изучении случайной выборки из 48 статей, опубликованных в период с февраля по май 2017 года в журнале Journal of Archaeological Science , в котором были обнаружены общедоступные необработанные данные для 18 статей (53%), причем данные о составе и датировке были наиболее часто обмениваемыми типами. Это же исследование также отправило электронные письма авторам статей об экспериментах с каменными артефактами, опубликованными в 2009 и 2015 годах, с просьбой предоставить данные, относящиеся к публикациям. Они связались с авторами 23 статей и получили 15 ответов, что привело к 70%-ному уровню ответов. Они получили пять ответов, которые включали файлы данных, что дало общий уровень обмена 20%. [29]
Исследование ученых, проходящих обучение, показало, что многие из них уже сталкивались с сокрытием данных. [30] Это исследование породило опасения, что будущее поколение ученых не будет придерживаться устоявшихся практик.
Требования к обмену данными чаще устанавливаются учреждениями, финансирующими агентствами и издательскими площадками в медицинских и биологических науках, чем в физических науках. Требования сильно различаются относительно того, должны ли вообще передаваться данные, с кем они должны передаваться и кто должен нести расходы на обмен данными.
Такие финансирующие организации, как NIH и NSF, как правило, требуют более широкого обмена данными, но даже эти требования, как правило, учитывают проблемы конфиденциальности пациентов, расходы, понесенные при обмене данными, и законность запроса. [31] Частные интересы и государственные учреждения, имеющие интересы национальной безопасности (оборона и правоохранительные органы), часто препятствуют обмену данными и методами посредством соглашений о неразглашении.
Обмен данными создает особые проблемы в инициативах по мониторингу с участием , например, когда лесные сообщества собирают данные о местных социальных и экологических условиях. В этом случае подход, основанный на правах, к разработке протоколов обмена данными может основываться на принципах свободного, предварительного и осознанного согласия и отдавать приоритет защите прав тех, кто создал данные, и/или тех, кого потенциально затрагивает обмен данными. [32]
Комитет по вопросам трансграничного потока научных данных, Национальный исследовательский совет (1997). Bits of Power: Issues in Global Access to Scientific Data. Вашингтон, округ Колумбия: National Academy Press. doi : 10.17226/5504. ISBN 978-0-309-05635-9.— обсуждает международный обмен данными в области естественных наук.