План управления данными или DMP — это формальный документ, в котором описывается, как следует обращаться с данными как во время исследовательского проекта, так и после его завершения. [1] Цель плана управления данными — рассмотреть многие аспекты управления данными , создания метаданных , сохранения данных и анализа до начала проекта; [2] это может привести к тому, что данные будут хорошо управляться в настоящее время, [ нужна ссылка ] и подготовлены к сохранению в будущем. [2]
Первоначально DMP использовались в 1966 году для управления сбором и анализом данных в авиационных и инженерных проектах, а в 1970-х и 1980-х годах распространились на инженерные и научные дисциплины. Вплоть до начала 2000-х годов DMP использовались «для проектов большой технической сложности, а также для ограниченного сбора и обработки данных в середине исследования». [3] В 2000-х годах и позднее электронные исследования и экономическая политика способствовали развитию и внедрению DMP. [3]
Важность
Утверждается, что подготовка плана управления данными до их сбора гарантирует, что данные будут в правильном формате, хорошо организованы и лучше аннотированы. [4] Возможно, это может сэкономить время в долгосрочной перспективе, поскольку нет необходимости реорганизовывать, переформатировать или пытаться запомнить детали данных. Утверждается также, что это повысит эффективность исследований, поскольку и сборщик данных, и другие исследователи смогут понимать и использовать хорошо аннотированные данные в будущем. Одним из компонентов плана управления данными является архивирование и сохранение данных. Заранее приняв решение об архиве, сборщик данных может форматировать данные во время сбора, чтобы упростить их последующую отправку в базу данных. Если данные сохраняются, они более актуальны, поскольку могут быть повторно использованы другими исследователями. Это также позволяет сборщику данных направлять запросы данных в базу данных, а не адресовать запросы индивидуально. Частым аргументом в пользу сохранения является то, что сохраненные данные потенциально могут привести к новым, неожиданным открытиям и предотвращают дублирование уже проведенных научных исследований. Архивирование данных также обеспечивает страховку от потери сборщиком данных.
В 2010-х годах [3] финансирующим агентствам все чаще требовались планы управления данными в рамках процесса подачи заявок и оценки, [5] несмотря на малое количество или отсутствие доказательств их эффективности. [3]
Основные компоненты
«Не существует общего и четкого списка тем, которые должны быть охвачены в DMP для исследовательского проекта» [6] , и исследователи часто предоставлены сами себе относительно того, как заполнять DMP. [2]
Информация о данных и формате данных
- Описание данных, которые будут получены в рамках проекта. [7] Сюда могут входить (но не ограничиваться) данные, которые:
- Как будут получены данные? Когда и где они будут приобретены?
- Как будут обрабатываться данные после сбора? Включите информацию о
- Форматы файлов, которые будут использоваться, обоснуйте эти форматы и опишите используемые соглашения об именах. [8]
- Меры по обеспечению качества и контролю качества, которые будут приняты во время сбора, анализа и обработки проб.
- Если используются существующие данные, каково их происхождение? Как собранные данные будут сочетаться с существующими данными? Какова связь между собранными данными и существующими данными?
- Как будут управляться данные в краткосрочной перспективе? Учтите следующее:
- Контроль версий файлов [9]
- Резервное копирование данных и продуктов данных
- Безопасность и защита данных и продуктов данных
- Кто будет отвечать за управление
Содержание и формат метаданных
Метаданные — это контекстные детали, включая любую информацию, важную для использования данных. Сюда могут входить описания временных и пространственных деталей, инструментов, параметров, единиц измерения, файлов и т. д. Метаданные обычно называют «данными о данных». [10] Вопросы, подлежащие рассмотрению, включают:
- Насколько подробными должны быть метаданные, чтобы данные были значимыми?
- Как будут создаваться и/или фиксироваться метаданные? Примеры включают лабораторные ноутбуки , портативные устройства GPS, автоматически сохраняемые файлы на приборах и т. д.
- Какой формат будет использоваться для метаданных? Какие стандарты метаданных обычно используются в соответствующей научной дисциплине? Выбор формата должен быть обоснован.
Политики доступа, совместного использования и повторного использования
- Опишите любые обязательства, существующие в отношении обмена собранными данными. Они могут включать обязательства финансирующих агентств, учреждений, других профессиональных организаций, а также юридические требования.
- Включите информацию о том, как данные будут передаваться, в том числе, когда данные будут доступны, как долго данные будут доступны, как можно получить доступ, а также любые права, которые сборщик данных оставляет за собой для использования данных.
- Решите любые этические проблемы или проблемы конфиденциальности при обмене данными.
- Решение вопросов интеллектуальной собственности и авторских прав . Кому принадлежат авторские права? Какова институциональная политика, политика издателей и/или финансирующих агентств в отношении интеллектуальной собственности? Существуют ли эмбарго по политическим, коммерческим или патентным причинам?
- Опишите предполагаемое будущее использование/пользователей данных.
- Укажите, как данные должны цитироваться другими. Как будет решаться проблема постоянного цитирования? Например, если данные будут помещены в общедоступный архив, будет ли набору данных присвоен идентификатор цифрового объекта (DOI)?
Долгосрочное хранение и управление данными
- Исследователи должны определить подходящий архив для долгосрочного хранения своих данных. Идентифицировав архив на раннем этапе проекта, данные можно отформатировать, преобразовать и задокументировать соответствующим образом в соответствии с требованиями архива. Исследователи должны проконсультироваться с коллегами и профессиональными сообществами в своей области, чтобы определить наиболее подходящую базу данных, и включить резервный архив в свой план управления данными на случай, если их первый вариант перестанет существовать.
- На раннем этапе проекта основной исследователь должен определить, какие данные будут сохранены в архиве. Обычно желательно сохранять данные в самой необработанной форме, хотя производные данные и продукты также могут быть сохранены.
- Физическое лицо должно быть указано в качестве основного контактного лица для архивированных данных и обеспечивать актуальность контактной информации на случай запросов на данные или информацию о данных.
Бюджет
Затраты на управление и сохранение данных могут быть значительными в зависимости от характера проекта. Заранее прогнозируя затраты, исследователи гарантируют, что данные будут правильно управляться и архивироваться. Возможные расходы, которые следует учитывать:
- Время персонала на подготовку, управление, документирование и сохранение данных
- Аппаратное и/или программное обеспечение, необходимое для управления данными, резервного копирования, безопасности, документирования и сохранения.
- Затраты, связанные с отправкой данных в архив
План управления данными должен включать порядок оплаты этих расходов.
План управления данными NSF
Все заявки на гранты, подаваемые в Национальный научный фонд (NSF), должны включать План управления данными объемом не более двух страниц. [11] Это дополнение (не часть 15-страничного предложения) и должно описывать, как предложение будет соответствовать политике Руководства по присуждению и администрированию (см. ниже). Оно может включать в себя следующее:
- Типы данных
- Стандарты, которые будут использоваться для формата и содержания данных и метаданных
- Политики доступа и совместного использования
- Политика и положения для повторного использования
- Планы архивирования данных
Краткое изложение политики приведено в Руководстве по премированию и администрированию NSF, раздел 4 (Распространение и обмен результатами исследований): [12]
- Оперативно опубликовать с соответствующим авторством
- Делитесь данными, образцами, физическими коллекциями и вспомогательными материалами с другими в разумные сроки.
- Делитесь программным обеспечением и изобретениями
- Следователи могут сохранять свои законные права на свою интеллектуальную собственность, но им все равно придется предоставлять свои результаты, данные и коллекции другим лицам.
- Политика будет реализовываться через
- Обзор предложения
- Переговоры и условия награждения
- Поддержка/стимулы
План управления данными ESRC
С 1995 года Совет по экономическим и социальным исследованиям Великобритании (ESRC) придерживается политики в отношении данных исследований. Текущая политика ESRC в отношении данных исследований гласит, что данные исследований, созданные в результате исследований, финансируемых ESRC, должны быть открыто доступны научному сообществу в максимально возможной степени посредством долгосрочного хранения и высококачественного управления данными. [13]
ESRC требует наличия плана управления данными для всех заявок на получение грантов на исследования, в которых создаются новые данные. Такие планы предназначены для продвижения структурированного подхода к управлению данными на протяжении всего жизненного цикла данных, что приводит к повышению качества данных, готовых к архивированию для совместного использования и повторного использования. Служба данных Великобритании , ведущая служба данных ESRC, предоставляет практические рекомендации по планированию управления исследовательскими данными, подходящие для исследователей социальных наук в Великобритании и во всем мире. [14] [15]
ESRC имеет давнее соглашение с Архивом данных Великобритании , расположенным в Университете Эссекса , в качестве места хранения исследовательских данных, при этом обладатели наград обязаны предоставлять данные, полученные в результате их исследовательских грантов, через Службу данных Великобритании. [16] Архив позволяет повторно использовать данные, сохраняя данные и делая их доступными для исследовательских и преподавательских сообществ.
Преимущества
В литературе выделяются три основные темы с точки зрения преимуществ ПРМ: профессиональные выгоды, экономические выгоды и институциональные выгоды. [3] Утверждалось, что DMP могут стать катализатором для исследователей в повышении их грамотности в области данных и практики управления данными, часто при помощи библиотеки. [3]
На практике
Однако на практике ПУД часто не достигают заявленных целей. Обзор политики DMP, проведенный в 2012 году спонсорами исследований, показал, что в политике отсутствовали некоторые элементы из списка критериев DMP, составленного Центром цифрового курирования . [17] Исследователи поделились текстом DMP. [18] DMP часто рассматривается как «административное мероприятие, а не неотъемлемая часть» исследовательского процесса, [19] и было признано, что DMP не гарантирует хорошую практику управления данными . [20] Большинству спонсоров не требуется DMP после присуждения грантов, тем самым лишая заинтересованные стороны мощного инструмента, которым может быть активный DMP. Лучшей практикой было бы «требовать поддержания плана управления данными после выдачи гранта и во время активной фазы исследования». [6] В настоящее время планы обмена данными более важны для спонсоров, чем планы управления данными. [6]
Смотрите также
Рекомендации
- ^ «План управления данными». Библиотека Университета Вирджинии . Архивировано из оригинала 9 ноября 2012 года.
- ^ abc Бернетт, Маргарет; Уильямс, Сара; Имкер, Хайди (16 сентября 2016 г.). «От плана к действию: успешная реализация плана управления данными в многопрофильном проекте». Журнал электронного научного библиотечного дела . 5 (1): e1101. дои : 10.7191/jeslib.2016.1101 .
- ^ abcdef Смейл, Николас; Ансворт, Кэтрин; Денайер, Гарет; Барр, Дэниел (17 октября 2018 г.). «История, пропаганда и эффективность планов управления данными». bioRxiv : 443499. doi : 10.1101/443499. S2CID 91931719.
- ^ «Зачем управлять своими данными и делиться ими? - Управление данными» . библиотеки.mit.edu .
- ^ «Часто задаваемые вопросы (FAQ) по управлению данными и обмену ими» . Архивировано из оригинала 11 июля 2017 г. Проверено 6 апреля 2018 г.
- ^ abc Уильямс, Мэри; Бэгвелл, Жаклин; Нам Зозус, Мередит (июль 2017 г.). «Планы управления данными: недостающая перспектива». Журнал биомедицинской информатики . 71 : 130–142. дои : 10.1016/j.jbi.2017.05.004. ПМК 6697079 . ПМИД 28499952.
- ^ «Элементы плана управления данными». www.icpsr.umich.edu . Проверено 30 сентября 2015 г.
- ^ «Архивная копия» (PDF) . библиотеки.mit.edu . Архивировано из оригинала (PDF) 4 мая 2018 года . Проверено 12 января 2022 г.
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка ) - ^ Оружие, Раф. «Инструменты для контроля версий исследовательских данных» (PDF) . Университет Антверпена .
- ^ Миченер, В.К. и Дж.В. Брант. 2000. Экологические данные: проектирование, управление и обработка . Блэквелл Сайенс, 180 стр.
- ^ "GPG Глава II". www.nsf.gov .
- ^ «Распространение и обмен результатами исследований - NSF - Национальный научный фонд» . www.nsf.gov .
- ^ Политика ESRC в отношении данных исследований, 2010 г.
- ^ Подготовка данных и управление ими: Руководство Службы данных Великобритании.
- ^ «Управление данными исследований и обмен ими - SAGE Publications Inc». www.sagepub.com . Архивировано из оригинала 7 апреля 2014 г. Проверено 1 апреля 2014 г.
- ^ «Архив данных Великобритании - КТО МОЖЕТ ДЕПОЗИРОВАТЬ?». www.data-archive.ac.uk .
- ^ Дитрих, Дайан; Адамус, Триша; Майнер, Элисон; Стейнхарт, Гейл (2012). «Демистификация требований спонсоров исследований к управлению данными». Проблемы научно-технического библиотечного дела . 70 (70). дои : 10.5062/F44M92G2.
- ^ Пархэм, Сьюзан Уэллс; Доти, Крис (октябрь 2012 г.). «Анализ контента NSF DMP: что говорят исследователи?». Бюллетень Американского общества информатики и технологий . 39 (1): 37–38. дои : 10.1002/bult.2012.1720390113. hdl : 1853/44391 .
- ^ Микса, Томаш; Симмс, Стефани; Митчен, Дэниел; Джонс, Сара (28 марта 2019 г.). «Десять принципов машинных планов управления данными». PLOS Вычислительная биология . 15 (3): e1006750. Бибкод : 2019PLSCB..15E6750M. дои : 10.1371/journal.pcbi.1006750 . ПМК 6438441 . PMID 30921316. S2CID 85563774.
- ^ Донелли, Мартин (2012). «Планы и планирование управления данными». В Прайоре, Грэм (ред.). Управление данными исследований . Лондон: Издательство Facet. стр. 83–104. ISBN 9781856048910.
дальнейшее чтение
Прайор, Грэм (2014). Предоставление услуг по управлению исследовательскими данными . Издательство Фасет. ISBN 9781856049337.
Внешние ссылки
- Мастер управления данными: создавайте интеллектуальные планы управления данными для FAIR Open Science
- DataONE
- DMPonline
- Цифровой Кураторский Центр
- Руководство по подаче грантовых заявок NSF
- Блог LTER: Как написать план управления данными
- Служба данных Великобритании: подготовка и управление данными: руководство и инструменты для исследователей социальных наук
- Plan de Gestión de Datos PaGoDa: Инструментарий DMP Консорциума университетов Мадридского региона и UNED по библиотечному сотрудничеству (Мадроньо, Испания)