stringtranslate.com

План управления данными

План управления данными или DMP — это формальный документ, в котором описывается, как следует обращаться с данными как во время исследовательского проекта, так и после его завершения. [1] Целью плана управления данными является рассмотрение множества аспектов управления данными , создания метаданных , сохранения данных и анализа до начала проекта; [2] это может привести к тому, что данные будут хорошо управляться в настоящем, [ нужна ссылка ] и будут подготовлены к сохранению в будущем. [2]

DMP изначально использовались в 1966 году для управления сбором и анализом данных авиационных и инженерных проектов, а в 1970-х и 1980-х годах были распространены на инженерные и научные дисциплины. До начала 2000-х годов DMP использовались «для проектов большой технической сложности и для ограниченных целей сбора и обработки данных в середине исследования». [3] В 2000-х годах и позже электронные исследования и экономическая политика стимулировали разработку и внедрение DMP. [3]

Важность

Подготовка плана управления данными до сбора данных, как утверждается, гарантирует, что данные находятся в правильном формате, хорошо организованы и лучше аннотированы. [4] Это, возможно, может сэкономить время в долгосрочной перспективе, поскольку нет необходимости реорганизовывать, переформатировать или пытаться запомнить подробности о данных. Также утверждается, что это повышает эффективность исследований, поскольку и сборщик данных, и другие исследователи могут понимать и использовать хорошо аннотированные данные в будущем. Одним из компонентов плана управления данными является архивирование и сохранение данных. Принимая решение об архиве заранее, сборщик данных может форматировать данные во время сбора, чтобы упростить их будущую отправку в базу данных. Если данные сохраняются, они более актуальны, поскольку их могут повторно использовать другие исследователи. Это также позволяет сборщику данных направлять запросы на данные в базу данных, а не рассматривать запросы по отдельности. Частый аргумент в пользу сохранения заключается в том, что сохраненные данные могут привести к новым, непредвиденным открытиям, и они предотвращают дублирование уже проведенных научных исследований. Архивирование данных также обеспечивает страховку от потери данных сборщиком.

В 2010-х годах [3] финансирующие организации все чаще требовали планы управления данными как часть процесса предложения и оценки, [5] несмотря на отсутствие или скудность доказательств их эффективности. [3]

Основные компоненты

«Не существует общего и окончательного списка тем, которые должны быть охвачены в DMP для исследовательского проекта» [6], и исследователи часто предоставлены сами себе в вопросе заполнения DMP. [2]

Информация о данных и формате данных

Содержание и формат метаданных

Метаданные — это контекстные детали, включая любую информацию, важную для использования данных. Это может включать описания временных и пространственных деталей, инструментов, параметров, единиц, файлов и т. д. Метаданные обычно называют «данными о данных». [10] Вопросы, которые следует рассмотреть, включают:

Политики доступа, распространения и повторного использования

Долгосрочное хранение и управление данными

Бюджет

Расходы на управление данными и сохранение могут быть значительными в зависимости от характера проекта. Прогнозируя расходы заранее, исследователи обеспечивают, что данные будут надлежащим образом управляться и архивироваться. Возможные расходы, которые следует учитывать,

План управления данными должен включать порядок оплаты этих расходов.

План управления данными NSF

Все заявки на гранты, поданные в Национальный научный фонд (NSF), должны включать План управления данными, который занимает не более двух страниц. [11] Это дополнение (не часть 15-страничного предложения) и должно описывать, как предложение будет соответствовать политике Руководства по наградам и администрированию (см. ниже). Оно может включать следующее:

  1. Типы данных
  2. Стандарты, которые будут использоваться для формата и содержания данных и метаданных
  3. Политики доступа и обмена
  4. Политики и положения по повторному использованию
  5. Планы архивации данных

Политика, изложенная в Руководстве по наградам и администрированию NSF, Раздел 4 (Распространение и обмен результатами исследований): [12]

  1. Незамедлительно опубликовать с соответствующим указанием авторства
  2. Обменивайтесь данными, образцами, физическими коллекциями и вспомогательными материалами с другими в разумные сроки.
  3. Делитесь программным обеспечением и изобретениями
  4. Исследователи могут сохранять свои законные права на интеллектуальную собственность, но им все равно придется предоставлять свои результаты, данные и коллекции другим лицам.
  5. Политики будут реализованы посредством
    1. Рассмотрение предложения
    2. Переговоры и условия присуждения премии
    3. Поддержка/стимулы

План управления данными ESRC

С 1995 года Совет по экономическим и социальным исследованиям Великобритании (ESRC) имеет политику в отношении исследовательских данных. Текущая политика в отношении исследовательских данных ESRC гласит, что исследовательские данные, созданные в результате исследований, финансируемых ESRC, должны быть максимально доступны научному сообществу посредством долгосрочного хранения и высококачественного управления данными. [13]

ESRC требует план управления данными для всех заявок на получение исследовательских наград, где создаются новые данные. Такие планы разработаны для продвижения структурированного подхода к управлению данными на протяжении всего жизненного цикла данных, что приводит к получению более качественных данных, готовых к архивации для совместного использования и повторного использования. Служба данных Великобритании , флагманская служба данных ESRC, предоставляет практические рекомендации по планированию управления данными исследований, подходящие для исследователей социальных наук в Великобритании и по всему миру. [14] [15]

ESRC имеет давнее соглашение с Архивом данных Великобритании , расположенным в Университете Эссекса , как местом хранения исследовательских данных, при этом обладатели грантов обязаны предоставлять данные, полученные в результате их исследовательских грантов, через Службу данных Великобритании. [16] Архив позволяет повторно использовать данные, сохраняя данные и делая их доступными для исследовательских и преподавательских сообществ.

Преимущества

В литературе выделены три основные темы, касающиеся преимуществ DMP: профессиональные преимущества, экономические преимущества и институциональные преимущества. [3] Утверждается, что DMP могут стать катализатором для исследователей, чтобы улучшить их грамотность в области данных и практики управления данными, часто с помощью библиотеки. [3]

На практике

Однако на практике DMP часто не достигают своих заявленных целей. Обзор политик DMP, проведенный в 2012 году спонсорами исследований, показал, что в политиках отсутствуют несколько элементов из списка критериев Digital Curation Centre для DMP. [17] Исследователи поделились текстом DMP. [18] DMP часто рассматриваются как «административное упражнение, а не неотъемлемая часть» исследовательского процесса, [19] и было признано, что DMP не гарантируют надлежащие практики управления данными . [20] Большинство спонсоров не требуют DMP после присуждения грантов, тем самым лишая заинтересованных сторон мощного инструмента, которым может быть активный DMP. Лучшей практикой было бы «требовать поддержания плана управления данными после присуждения и во время активной фазы исследования». [6] В настоящее время планы обмена данными для спонсоров важнее планов управления данными. [6]

Смотрите также

Ссылки

  1. ^ "План управления данными". Библиотека Вирджинского университета . Архивировано из оригинала 9 ноября 2012 г.
  2. ^ abc Бернетт, Маргарет; Уильямс, Сара; Имкер, Хайди (16 сентября 2016 г.). «От плана к действию: успешная реализация плана управления данными в многопрофильном проекте». Журнал электронного научного библиотековедения . 5 (1): e1101. doi : 10.7191/jeslib.2016.1101 .
  3. ^ abcdef Смейл, Николас; Ансворт, Кэтрин; Деньер, Гарет; Барр, Дэниел (17 октября 2018 г.). «История, пропаганда и эффективность планов управления данными». bioRxiv : 443499. doi :10.1101/443499. S2CID  91931719.
  4. ^ «Зачем управлять данными и делиться ими? — Управление данными». libraries.mit.edu .
  5. ^ "Управление данными и обмен часто задаваемыми вопросами (FAQs)". Архивировано из оригинала 2017-07-11 . Получено 2018-04-06 .
  6. ^ abc Уильямс, Мэри; Багвелл, Жаклин; Нам Зозус, Мередит (июль 2017 г.). «Планы управления данными: упущенная перспектива». Журнал биомедицинской информатики . 71 : 130–142. doi : 10.1016/j.jbi.2017.05.004. PMC 6697079. PMID  28499952 . 
  7. ^ "Элементы плана управления данными". www.icpsr.umich.edu . Получено 2015-09-30 .
  8. ^ "Архивная копия" (PDF) . libraries.mit.edu . Архивировано из оригинала (PDF) 4 мая 2018 г. . Получено 12 января 2022 г. .{{cite web}}: CS1 maint: архивная копия как заголовок ( ссылка )
  9. ^ Ганс, Раф. "Инструменты для контроля версий исследовательских данных" (PDF) . Университет Антверпена .
  10. ^ Миченер, В. К. и Дж. В. Брант. 2000. Экологические данные: проектирование, управление и обработка . Blackwell Science, 180 стр.
  11. ^ "GPG Глава II". www.nsf.gov .
  12. ^ «Распространение и обмен результатами исследований — NSF — Национальный научный фонд». www.nsf.gov .
  13. ^ Политика ESRC в отношении исследовательских данных 2010 г.
  14. ^ Подготовка и управление данными: Руководство от Службы данных Великобритании
  15. ^ "Управление и обмен исследовательскими данными - SAGE Publications Inc". www.sagepub.com . Архивировано из оригинала 2014-04-07 . Получено 2014-04-01 .
  16. ^ «Архив данных Великобритании — КТО МОЖЕТ РАЗМЕЩАТЬ ДАННЫЕ?». www.data-archive.ac.uk .
  17. ^ Дитрих, Дайан; Адамус, Триша; Майнер, Элисон; Стейнхарт, Гейл (2012). «Демистификация требований к управлению данными спонсоров исследований». Вопросы библиотечного дела в области науки и техники . 70 (70). doi :10.5062/F44M92G2.
  18. ^ Пархэм, Сьюзан Уэллс; Доти, Крис (октябрь 2012 г.). «Анализ контента NSF DMP: что говорят исследователи?». Бюллетень Американского общества информационной науки и технологий . 39 (1): 37–38. doi :10.1002/bult.2012.1720390113. hdl : 1853/44391 .
  19. ^ Микса, Томаш; Симмс, Стефани; Митчен, Дэниел; Джонс, Сара (28 марта 2019 г.). «Десять принципов планов управления данными, реализуемых машинами». PLOS Computational Biology . 15 (3): e1006750. Bibcode : 2019PLSCB..15E6750M. doi : 10.1371/journal.pcbi.1006750 . PMC 6438441. PMID  30921316. S2CID  85563774 . 
  20. ^ Донелли, Мартин (2012). «Планы управления данными и планирование». В Прайор, Грэм (ред.). Управление исследовательскими данными . Лондон: Facet Publishing. С. 83–104. ISBN 9781856048910.

Дальнейшее чтение

Прайор, Грэм (2014). Предоставление услуг по управлению исследовательскими данными . Facet Publishing. ISBN 9781856049337.

Внешние ссылки