stringtranslate.com

План управления данными

План управления данными или DMP — это формальный документ, в котором описывается, как следует обращаться с данными как во время исследовательского проекта, так и после его завершения. [1] Цель плана управления данными — рассмотреть многие аспекты управления данными , создания метаданных , сохранения данных и анализа до начала проекта; [2] это может привести к тому, что данные будут хорошо управляться в настоящее время, [ нужна ссылка ] и подготовлены к сохранению в будущем. [2]

Первоначально DMP использовались в 1966 году для управления сбором и анализом данных в авиационных и инженерных проектах, а в 1970-х и 1980-х годах распространились на инженерные и научные дисциплины. Вплоть до начала 2000-х годов DMP использовались «для проектов большой технической сложности, а также для ограниченного сбора и обработки данных в середине исследования». [3] В 2000-х годах и позднее электронные исследования и экономическая политика способствовали развитию и внедрению DMP. [3]

Важность

Утверждается, что подготовка плана управления данными до их сбора гарантирует, что данные будут в правильном формате, хорошо организованы и лучше аннотированы. [4] Возможно, это может сэкономить время в долгосрочной перспективе, поскольку нет необходимости реорганизовывать, переформатировать или пытаться запомнить детали данных. Утверждается также, что это повысит эффективность исследований, поскольку и сборщик данных, и другие исследователи смогут понимать и использовать хорошо аннотированные данные в будущем. Одним из компонентов плана управления данными является архивирование и сохранение данных. Заранее приняв решение об архиве, сборщик данных может форматировать данные во время сбора, чтобы упростить их последующую отправку в базу данных. Если данные сохраняются, они более актуальны, поскольку могут быть повторно использованы другими исследователями. Это также позволяет сборщику данных направлять запросы данных в базу данных, а не адресовать запросы индивидуально. Частым аргументом в пользу сохранения является то, что сохраненные данные потенциально могут привести к новым, неожиданным открытиям и предотвращают дублирование уже проведенных научных исследований. Архивирование данных также обеспечивает страховку от потери сборщиком данных.

В 2010-х годах [3] финансирующим агентствам все чаще требовались планы управления данными в рамках процесса подачи заявок и оценки, [5] несмотря на малое количество или отсутствие доказательств их эффективности. [3]

Основные компоненты

«Не существует общего и четкого списка тем, которые должны быть охвачены в DMP для исследовательского проекта» [6] , и исследователи часто предоставлены сами себе относительно того, как заполнять DMP. [2]

Информация о данных и формате данных

Содержание и формат метаданных

Метаданные — это контекстные детали, включая любую информацию, важную для использования данных. Сюда могут входить описания временных и пространственных деталей, инструментов, параметров, единиц измерения, файлов и т. д. Метаданные обычно называют «данными о данных». [10] Вопросы, подлежащие рассмотрению, включают:

Политики доступа, совместного использования и повторного использования

Долгосрочное хранение и управление данными

Бюджет

Затраты на управление и сохранение данных могут быть значительными в зависимости от характера проекта. Заранее прогнозируя затраты, исследователи гарантируют, что данные будут правильно управляться и архивироваться. Возможные расходы, которые следует учитывать:

План управления данными должен включать порядок оплаты этих расходов.

План управления данными NSF

Все заявки на гранты, подаваемые в Национальный научный фонд (NSF), должны включать План управления данными объемом не более двух страниц. [11] Это дополнение (не часть 15-страничного предложения) и должно описывать, как предложение будет соответствовать политике Руководства по присуждению и администрированию (см. ниже). Оно может включать в себя следующее:

  1. Типы данных
  2. Стандарты, которые будут использоваться для формата и содержания данных и метаданных
  3. Политики доступа и совместного использования
  4. Политика и положения для повторного использования
  5. Планы архивирования данных

Краткое изложение политики приведено в Руководстве по премированию и администрированию NSF, раздел 4 (Распространение и обмен результатами исследований): [12]

  1. Оперативно опубликовать с соответствующим авторством
  2. Делитесь данными, образцами, физическими коллекциями и вспомогательными материалами с другими в разумные сроки.
  3. Делитесь программным обеспечением и изобретениями
  4. Следователи могут сохранять свои законные права на свою интеллектуальную собственность, но им все равно придется предоставлять свои результаты, данные и коллекции другим лицам.
  5. Политика будет реализовываться через
    1. Обзор предложения
    2. Переговоры и условия награждения
    3. Поддержка/стимулы

План управления данными ESRC

С 1995 года Совет по экономическим и социальным исследованиям Великобритании (ESRC) придерживается политики в отношении данных исследований. Текущая политика ESRC в отношении данных исследований гласит, что данные исследований, созданные в результате исследований, финансируемых ESRC, должны быть открыто доступны научному сообществу в максимально возможной степени посредством долгосрочного хранения и высококачественного управления данными. [13]

ESRC требует наличия плана управления данными для всех заявок на получение грантов на исследования, в которых создаются новые данные. Такие планы предназначены для продвижения структурированного подхода к управлению данными на протяжении всего жизненного цикла данных, что приводит к повышению качества данных, готовых к архивированию для совместного использования и повторного использования. Служба данных Великобритании , ведущая служба данных ESRC, предоставляет практические рекомендации по планированию управления исследовательскими данными, подходящие для исследователей социальных наук в Великобритании и во всем мире. [14] [15]

ESRC имеет давнее соглашение с Архивом данных Великобритании , расположенным в Университете Эссекса , в качестве места хранения исследовательских данных, при этом обладатели наград обязаны предоставлять данные, полученные в результате их исследовательских грантов, через Службу данных Великобритании. [16] Архив позволяет повторно использовать данные, сохраняя данные и делая их доступными для исследовательских и преподавательских сообществ.

Преимущества

В литературе выделяются три основные темы с точки зрения преимуществ ПРМ: профессиональные выгоды, экономические выгоды и институциональные выгоды. [3] Утверждалось, что DMP могут стать катализатором для исследователей в повышении их грамотности в области данных и практики управления данными, часто при помощи библиотеки. [3]

На практике

Однако на практике ПУД часто не достигают заявленных целей. Обзор политики DMP, проведенный в 2012 году спонсорами исследований, показал, что в политике отсутствовали некоторые элементы из списка критериев DMP, составленного Центром цифрового курирования . [17] Исследователи поделились текстом DMP. [18] DMP часто рассматривается как «административное мероприятие, а не неотъемлемая часть» исследовательского процесса, [19] и было признано, что DMP не гарантирует хорошую практику управления данными . [20] Большинству спонсоров не требуется DMP после присуждения грантов, тем самым лишая заинтересованные стороны мощного инструмента, которым может быть активный DMP. Лучшей практикой было бы «требовать поддержания плана управления данными после выдачи гранта и во время активной фазы исследования». [6] В настоящее время планы обмена данными более важны для спонсоров, чем планы управления данными. [6]

Смотрите также

Рекомендации

  1. ^ «План управления данными». Библиотека Университета Вирджинии . Архивировано из оригинала 9 ноября 2012 года.
  2. ^ abc Бернетт, Маргарет; Уильямс, Сара; Имкер, Хайди (16 сентября 2016 г.). «От плана к действию: успешная реализация плана управления данными в многопрофильном проекте». Журнал электронного научного библиотечного дела . 5 (1): e1101. дои : 10.7191/jeslib.2016.1101 .
  3. ^ abcdef Смейл, Николас; Ансворт, Кэтрин; Денайер, Гарет; Барр, Дэниел (17 октября 2018 г.). «История, пропаганда и эффективность планов управления данными». bioRxiv : 443499. doi : 10.1101/443499. S2CID  91931719.
  4. ^ «Зачем управлять своими данными и делиться ими? - Управление данными» . библиотеки.mit.edu .
  5. ^ «Часто задаваемые вопросы (FAQ) по управлению данными и обмену ими» . Архивировано из оригинала 11 июля 2017 г. Проверено 6 апреля 2018 г.
  6. ^ abc Уильямс, Мэри; Бэгвелл, Жаклин; Нам Зозус, Мередит (июль 2017 г.). «Планы управления данными: недостающая перспектива». Журнал биомедицинской информатики . 71 : 130–142. дои : 10.1016/j.jbi.2017.05.004. ПМК 6697079 . ПМИД  28499952. 
  7. ^ «Элементы плана управления данными». www.icpsr.umich.edu . Проверено 30 сентября 2015 г.
  8. ^ «Архивная копия» (PDF) . библиотеки.mit.edu . Архивировано из оригинала (PDF) 4 мая 2018 года . Проверено 12 января 2022 г.{{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  9. ^ Оружие, Раф. «Инструменты для контроля версий исследовательских данных» (PDF) . Университет Антверпена .
  10. ^ Миченер, В.К. и Дж.В. Брант. 2000. Экологические данные: проектирование, управление и обработка . Блэквелл Сайенс, 180 стр.
  11. ^ "GPG Глава II". www.nsf.gov .
  12. ^ «Распространение и обмен результатами исследований - NSF - Национальный научный фонд» . www.nsf.gov .
  13. ^ Политика ESRC в отношении данных исследований, 2010 г.
  14. ^ Подготовка данных и управление ими: Руководство Службы данных Великобритании.
  15. ^ «Управление данными исследований и обмен ими - SAGE Publications Inc». www.sagepub.com . Архивировано из оригинала 7 апреля 2014 г. Проверено 1 апреля 2014 г.
  16. ^ «Архив данных Великобритании - КТО МОЖЕТ ДЕПОЗИРОВАТЬ?». www.data-archive.ac.uk .
  17. ^ Дитрих, Дайан; Адамус, Триша; Майнер, Элисон; Стейнхарт, Гейл (2012). «Демистификация требований спонсоров исследований к управлению данными». Проблемы научно-технического библиотечного дела . 70 (70). дои : 10.5062/F44M92G2.
  18. ^ Пархэм, Сьюзан Уэллс; Доти, Крис (октябрь 2012 г.). «Анализ контента NSF DMP: что говорят исследователи?». Бюллетень Американского общества информатики и технологий . 39 (1): 37–38. дои : 10.1002/bult.2012.1720390113. hdl : 1853/44391 .
  19. ^ Микса, Томаш; Симмс, Стефани; Митчен, Дэниел; Джонс, Сара (28 марта 2019 г.). «Десять принципов машинных планов управления данными». PLOS Вычислительная биология . 15 (3): e1006750. Бибкод : 2019PLSCB..15E6750M. дои : 10.1371/journal.pcbi.1006750 . ПМК 6438441 . PMID  30921316. S2CID  85563774. 
  20. ^ Донелли, Мартин (2012). «Планы и планирование управления данными». В Прайоре, Грэм (ред.). Управление данными исследований . Лондон: Издательство Facet. стр. 83–104. ISBN 9781856048910.

дальнейшее чтение

Прайор, Грэм (2014). Предоставление услуг по управлению исследовательскими данными . Издательство Фасет. ISBN 9781856049337.

Внешние ссылки