stringtranslate.com

Обмен данными

Решение о том, следует ли делиться данными и каким образом, часто принимается исследователями.

Обмен данными — это практика предоставления другим исследователям данных, используемых для научных исследований. Многие финансирующие агентства, учреждения и издательские площадки имеют политику в отношении обмена данными, поскольку прозрачность и открытость многими считаются частью научного метода . [1]

Ряд финансирующих агентств и научных журналов требуют от авторов рецензируемых статей делиться любой дополнительной информацией ( необработанными данными , статистическими методами или исходным кодом ), необходимой для понимания, разработки или воспроизведения опубликованных исследований. Значительная часть научных исследований не подпадает под требования по обмену данными, и многие из этих политик имеют либеральные исключения. При отсутствии каких-либо обязательных требований обмен данными осуществляется по усмотрению самих ученых. Кроме того, в определенных ситуациях правительства [2] и учреждения запрещают или строго ограничивают обмен данными для защиты интересов собственности, национальной безопасности и конфиденциальности субъекта/пациента/жертвы. Обмен данными также может быть ограничен для защиты учреждений и ученых от использования данных в политических целях.

Данные и методы могут быть запрошены у автора спустя годы после публикации. Чтобы поощрять обмен данными [3] и предотвращать потерю или повреждение данных, ряд финансирующих агентств и журналов установили политику архивирования данных . Доступ к публично архивированным данным является недавним событием в истории науки, которое стало возможным благодаря технологическим достижениям в области коммуникаций и информационных технологий . Чтобы в полной мере воспользоваться преимуществами современной быстрой связи, может потребоваться консенсусное соглашение о критериях, лежащих в основе взаимного признания соответствующих вкладов. Модели, признанные для улучшения своевременного обмена данными для более эффективного реагирования на угрозы возникновения инфекционных заболеваний, включают механизм обмена данными, введенный инициативой GISAID . [4] [5]

Несмотря на политику в отношении обмена данными и архивирования, сокрытие данных все еще происходит. Авторы могут не архивировать данные или архивировать только часть данных. Само по себе отсутствие архивирования данных не является сокрытием данных. Когда исследователь запрашивает дополнительную информацию, автор иногда отказывается ее предоставить. [6] Когда авторы таким образом скрывают данные, они рискуют потерять доверие научного сообщества. [7] Исследование 2022 года выявило около 3500 научных работ, которые содержали утверждения о том, что данные доступны, но при запросе и дальнейшем поиске данных было обнаружено, что они недоступны для 94% работ. [8]

Обмен данными может также означать обмен личной информацией на платформе социальных сетей.

Политика правительства США

Федеральный закон

9 августа 2007 года президент Буш подписал Закон о КОМПЕТЕНЦИЯХ Америки (или Закон о создании возможностей для значимого продвижения передового опыта в области технологий, образования и науки в Америке), требующий от гражданских федеральных агентств предоставления руководящих принципов, политик и процедур для содействия и оптимизации открытого обмена данными и исследованиями между агентствами, общественностью и политиками. См. раздел 1009. [9]

Политика обмена данными NIH

«Заявление о политике предоставления грантов Национальных институтов здравоохранения (NIH) определяет «данные» как «записанную информацию, независимо от формы или носителя, на котором она может быть записана, и включает в себя сочинения, фильмы, звукозаписи, иллюстрированные репродукции, рисунки, проекты или другие графические изображения, руководства по процедурам, формы, диаграммы, схемы рабочих процессов, описания оборудования, файлы данных, программы обработки данных или компьютерные программы (программное обеспечение), статистические записи и другие исследовательские данные».

—  Совет по правительственным связям [10]

В заключительном заявлении NIH об обмене исследовательскими данными говорится:

«NIH подтверждает свою поддержку концепции обмена данными. Мы считаем, что обмен данными необходим для ускоренного перевода результатов исследований в знания, продукты и процедуры для улучшения здоровья человека. NIH одобряет обмен окончательными данными исследований для достижения этих и других важных научных целей. NIH ожидает и поддерживает своевременную публикацию и обмен окончательными данными исследований, поддерживаемых NIH, для использования другими исследователями. «NIH признает, что исследователи, которые собирают данные, имеют законный интерес в получении выгоды от своих вложений времени и усилий. Поэтому мы пересмотрели наше определение «своевременной публикации и обмена», чтобы они осуществлялись не позднее принятия к публикации основных результатов из окончательного набора данных. NIH по-прежнему ожидает, что первоначальные исследователи могут получить выгоду от первого и последующего использования, но не от длительного исключительного использования».

—  «Окончательное заявление NIH об обмене данными исследований». [11]

Политика NSF из общих условий гранта

36. Обмен результатами, данными и другими исследовательскими продуктами

a. NSF … ожидает, что исследователи поделятся с другими исследователями, не более чем за дополнительную плату и в течение разумного времени, данными, образцами, физическими коллекциями и другими вспомогательными материалами, созданными или собранными в ходе работы. Он также поощряет лауреатов делиться программным обеспечением и изобретениями или иным образом действовать, чтобы сделать инновации, которые они воплощают, широко полезными и применимыми.

б. Корректировки и, при необходимости, исключения могут быть разрешены для защиты прав отдельных лиц и субъектов, действительности результатов или целостности коллекций или для удовлетворения законных интересов исследователей.

—  «Национальный научный фонд: Общие условия грантов (GC-1)», 1 апреля 2001 г. (стр. 17).

Офис добросовестности исследований

Обвинения в неправомерном поведении в медицинских исследованиях влекут за собой серьезные последствия. Министерство здравоохранения и социальных служб США создало офис для надзора за расследованиями обвинений в неправомерном поведении, включая сокрытие данных. На веб-сайте определена миссия:

«Управление по добросовестности исследований (ORI) содействует добросовестности в биомедицинских и поведенческих исследованиях, поддерживаемых Службой общественного здравоохранения США (PHS) примерно в 4000 учреждений по всему миру. ORI контролирует институциональные расследования нарушений в исследованиях и содействует ответственному проведению исследований (RCR) посредством образовательных, профилактических и регулирующих мероприятий».

—  Управление по обеспечению добросовестности исследований.

Идеалы в обмене данными

Некоторые исследовательские организации особенно сильны в отношении обмена данными. WaveLab Стэнфордского университета придерживается философии воспроизводимых исследований и раскрытия всех алгоритмов и исходного кода, необходимых для воспроизведения исследования. В статье под названием «WaveLab и воспроизводимые исследования» авторы описывают некоторые проблемы, с которыми они столкнулись при попытке воспроизвести собственное исследование спустя некоторое время. Во многих случаях это было настолько сложно, что они отказались от попыток. Именно этот опыт убедил их в важности раскрытия исходного кода. [12] Философия описывается следующим образом:

Идея такова: статья о вычислительной науке в научном издании не является самой стипендией, это просто реклама стипендии. Фактическая стипендия — это полная среда разработки программного обеспечения и полный набор инструкций, которые генерируют цифры. [13] [14]

Data Observation Network for Earth ( DataONE ) и Data Conservancy [15] — это проекты, поддерживаемые Национальным научным фондом для поощрения и облегчения обмена данными между учеными-исследователями и лучшей поддержки метаанализа . В области наук об окружающей среде исследовательское сообщество признает, что крупные научные достижения, включающие интеграцию знаний в различных областях, потребуют от исследователей преодоления не только технологических барьеров для обмена данными, но и исторически укоренившихся институциональных и социологических барьеров. [16] Доктор Ричард Дж. Ходс, директор Национального института старения, заявил: «старая модель, в которой исследователи ревностно охраняли свои данные, больше не применима». [17]

Alliance for Taxpayer Access — это группа организаций, которые поддерживают открытый доступ к спонсируемым правительством исследованиям. Группа опубликовала «Заявление о принципах», в котором объясняется, почему они считают, что открытый доступ важен. [18] Они также перечисляют ряд международных политик публичного доступа. [19] Это касается не более, чем своевременной передачи важной информации для эффективного реагирования на чрезвычайные ситуации в области здравоохранения. [20] Хотя архивы общественного достояния использовались для хранения данных, в основном после официальной публикации, они не смогли способствовать быстрому обмену данными во время чрезвычайных ситуаций в области здравоохранения, среди которых вспышки лихорадки Эбола [21] и Зика [22] [23] . Требуются более четко определенные принципы для признания интересов тех, кто генерирует данные, при этом разрешая свободный, беспрепятственный доступ и использование данных (до публикации) для исследований и практического применения, например, те, которые приняты Инициативой GISAID для противодействия возникающим угрозам гриппа. [24] [25]

Международная политика

Проблемы обмена данными в академической среде

Генетика

Утаивание данных стало настолько обычным явлением в генетике , что исследователи из Массачусетской больницы общего профиля опубликовали статью в журнале на эту тему. Исследование показало, что «поскольку им было отказано в доступе к данным, 28% генетиков сообщили, что они не смогли подтвердить опубликованные исследования». [26]

Психология

В исследовании 2006 года было отмечено, что из 141 автора публикации эмпирических статей Американской психологической ассоциации (APA) 103 (73%) не предоставили свои данные в течение 6 месяцев. [27] В последующем исследовании, опубликованном в 2015 году, было обнаружено, что 246 из 394 авторов статей в журналах APA, с которыми связались, не предоставили свои данные по запросу (62%). [28]

Археология

Исследование 2018 года сообщило об изучении случайной выборки из 48 статей, опубликованных в период с февраля по май 2017 года в журнале Journal of Archaeological Science , в котором были обнаружены общедоступные необработанные данные для 18 статей (53%), причем данные о составе и датировке были наиболее часто обмениваемыми типами. Это же исследование также отправило электронные письма авторам статей об экспериментах с каменными артефактами, опубликованными в 2009 и 2015 годах, с просьбой предоставить данные, относящиеся к публикациям. Они связались с авторами 23 статей и получили 15 ответов, что привело к 70%-ному уровню ответов. Они получили пять ответов, которые включали файлы данных, что дало общий уровень обмена 20%. [29]

Ученые в процессе обучения

Исследование ученых, проходящих обучение, показало, что многие из них уже сталкивались с сокрытием данных. [30] Это исследование породило опасения, что будущее поколение ученых не будет придерживаться устоявшихся практик.

Различные подходы в разных областях

Требования к обмену данными чаще устанавливаются учреждениями, финансирующими агентствами и издательскими площадками в медицинских и биологических науках, чем в физических науках. Требования сильно различаются относительно того, должны ли вообще передаваться данные, с кем они должны передаваться и кто должен нести расходы на обмен данными.

Такие финансирующие организации, как NIH и NSF, как правило, требуют более широкого обмена данными, но даже эти требования, как правило, учитывают проблемы конфиденциальности пациентов, расходы, понесенные при обмене данными, и законность запроса. [31] Частные интересы и государственные учреждения, имеющие интересы национальной безопасности (оборона и правоохранительные органы), часто препятствуют обмену данными и методами посредством соглашений о неразглашении.

Обмен данными создает особые проблемы в инициативах по мониторингу с участием , например, когда лесные сообщества собирают данные о местных социальных и экологических условиях. В этом случае подход, основанный на правах, к разработке протоколов обмена данными может основываться на принципах свободного, предварительного и осознанного согласия и отдавать приоритет защите прав тех, кто создал данные, и/или тех, кого потенциально затрагивает обмен данными. [32]

Смотрите также

Ссылки

  1. ^ «Глобальная эпидемия здравоохранения — это бомба замедленного действия, но вирусные базы данных могут и помогают спасать жизни». HuffPost UK . 12 января 2017 г. Получено 06.09.2017 .
  2. ^ "Выстрел прозрачности". The Economist . 2006-08-10. ISSN  0013-0613 . Получено 2017-09-06 .
  3. ^ "Как поощрять правильное поведение". Nature . 416 (6876): 1. 2002. Bibcode :2002Natur.416R...1.. doi : 10.1038/416001b . PMID  11882850.
  4. ^ Макколи, Джон У. (23.02.2017). «Вирусы: модель для ускорения реагирования на эпидемии». Nature . 542 (7642): 414. Bibcode :2017Natur.542..414M. doi : 10.1038/542414b . PMID  28230113.
  5. ^ «Никаких бесплатных обедов, министры здравоохранения G20 обнаружили на первой встрече». Intellectual Property Watch . 2017-05-20 . Получено 06.09.2017 .
  6. ^ Savage CJ, Vickers AJ (2009). "Эмпирическое исследование обмена данными авторами, публикующимися в журналах PLoS". PLOS ONE . 4 (9): e7078. Bibcode : 2009PLoSO...4.7078S. doi : 10.1371/journal.pone.0007078 . PMC 2739314. PMID  19763261 . 
  7. ^ «Публикация и открытость», глава из книги «Как стать ученым: ответственное поведение в исследованиях», Национальная академия наук.
  8. ^ Gabelica, Mirko; Bojčić, Ružica; Puljak, Livia (май 2022 г.). «Многие исследователи не соблюдали свое опубликованное заявление о совместном использовании данных: исследование со смешанными методами». Journal of Clinical Epidemiology . 150 : 33–41. doi :10.1016/j.jclinepi.2022.05.019. PMID  35654271. S2CID  249213574.
  9. ^ "Акт "Америка COMPETES"
  10. ^ «Доступ к исследовательским данным и их сохранение. Архивировано 26 мая 2007 г. в Wayback Machine : права и обязанности», стр. 5. Совет по правительственным связям, март 2006 г.
  11. ^ «Политика обмена данными NIH».
  12. ^ WaveLab и воспроизводимые исследования Джонатана Б. Бакхейта и Дэвида Л. Донохо
  13. ^ Сайт WaveLab850
  14. ^ Риммер, Мэтью (01.09.2005). «Japonica Rice: интеллектуальная собственность, научные публикации и обмен данными». Prometheus . 23 (3): 325–347. doi :10.1080/08109020500235180. ISSN  0810-9028. S2CID  153908749.
  15. ^ «Data Conservancy | Data Conservancy занимается разработкой институциональных решений для задач сбора, сохранения и повторного использования данных».
  16. ^ Райхман О.Дж.; Джонс МБ; Шильдхауэр депутат (2011). «Вызовы и возможности открытых данных в экологии». Наука . 331 (6018): 703–705. Бибкод : 2011Sci...331..703R. дои : 10.1126/science.1197962. PMID  21311007. S2CID  22686503.
  17. ^ Колата, Джина (3 апреля 2011 г.). «Обширное исследование генов дает представление о болезни Альцгеймера (опубликовано в 2011 г.)». The New York Times . Архивировано из оригинала 2021-06-09.
  18. ^ Сайт Альянса за доступ налогоплательщиков
  19. ^ "Всемирный импульс для общественного доступа к финансируемым государством исследованиям". Архивировано из оригинала 2007-09-27 . Получено 2007-09-07 .
  20. ^ Шу, Юэлун; Макколи, Джон (2017). «GISAID: Глобальная инициатива по обмену всеми данными о гриппе – от видения к реальности». Eurosurveillance . 22 (13). doi :10.2807/1560-7917.es.2017.22.13.30494. PMC 5388101. PMID 28382917  . 
  21. ^ Йозвиак, Натан Л.; Шаффнер, Стивен Ф.; Сабети, Пардис К. (2015-02-26). «Обмен данными: сделать исследования вспышек открытыми». Nature . 518 (7540): 477–479. Bibcode :2015Natur.518..477Y. doi : 10.1038/518477a . PMID  25719649.
  22. ^ "Когда исследования сходят с рельсов". The Hindu . Получено 2017-09-06 .
  23. ^ "Преимущества совместного использования". Nature . 530 (7589): 129. 2016-02-11. Bibcode :2016Natur.530Q.129.. doi : 10.1038/530129a . PMID  26863943.
  24. ^ Эльбе, Стефан; Бакленд-Мерретт, Джемма (01.01.2017). «Данные, болезнь и дипломатия: инновационный вклад GISAID в глобальное здравоохранение». Global Challenges . 1 (1): 33–46. Bibcode : 2017GloCh...1...33E. doi : 10.1002/gch2.1018. ISSN  2056-6646. PMC 6607375. PMID 31565258  . 
  25. ^ "CDC спешат создать вакцину от новейшего штамма птичьего гриппа в Китае". Bloomberg.com . 2013-04-10 . Получено 2017-09-06 .
  26. ^ Кэмпбелл Э.Г., Кларридж Б.Р., Гокхале М. и др. (2002). «Утаивание данных в академической генетике: доказательства из национального опроса». JAMA . 287 (4): 473–80. doi :10.1001/jama.287.4.473. PMID  11798369.
  27. ^ Wicherts, JM; Borsboom, D.; Kats, J.; Molenaar, D. (2006). «Недостаточная доступность данных психологических исследований для повторного анализа». American Psychologist . 61 (7): 726–728. doi :10.1037/0003-066X.61.7.726. PMID  17032082.
  28. ^ Vanpaemel, W.; Vermorgen, M.; Deriemaecker, L.; Storms, G. (2015). «Теряем ли мы хороший кризис? Доступность данных психологических исследований после шторма» (PDF) . Collabra . 1 (1): 1–5. doi : 10.1525/collabra.13 .
  29. ^ Марвик, Бен; Бирч, Сюзанна Э. Пилаар (5 апреля 2018 г.). «Стандарт научного цитирования археологических данных как стимул к обмену данными». Advances in Archaeological Practice . 6 (2): 125–143. doi : 10.1017/aap.2018.3 .
  30. ^ Vogeli C, Yucel R, Bendavid E и др. (февраль 2006 г.). «Утаивание данных и следующее поколение ученых: результаты национального опроса». Acad Med . 81 (2): 128–36. doi : 10.1097/00001888-200602000-00007 . PMID  16436573.
  31. ^ "Политика и руководство по реализации совместного использования данных NIH". grants.nih.gov . Получено 09.04.2021 .
  32. ^ D Sabogal. 2015. Обмен данными в мониторинге лесов на уровне общин: уроки Гайаны. Глобальная программа Canopy. http://forestcompass.org/how/resources/data-sharing-community-based-forest-monitoring-lessons-guyana

Литература

Комитет по вопросам трансграничного потока научных данных, Национальный исследовательский совет (1997). Bits of Power: Issues in Global Access to Scientific Data. Вашингтон, округ Колумбия: National Academy Press. doi : 10.17226/5504. ISBN 978-0-309-05635-9.— обсуждает международный обмен данными в области естественных наук.

Внешние ссылки