Планирование. План управления данными

Содержание

На предварительном этапе исследования часто требуется создать план управления и обмена данными. План управления данными (DMP) — это формальный документ, в котором описывается, что вы будете делать с вашими данными во время, и после окончания исследовательского проекта. Большинство исследователей собирают данные, имея в виду тот или иной план, но он часто недостаточно документирован и не полностью продуман. Многие проблемы управления данными можно легко решить или полностью избежать, если планировать заранее.

Библиотекарь, используя различные инструменты и шаблоны, может помочь исследователям составить план управления данными.

Можно использовать, например, DMPTool. При составлении плана, описываются детали проекта, составляется аннотация проекта, добавляются соавторы. Дается краткое описание данных, включая любые существующие данные или сторонние источники, которые будут использоваться, в каждом случае отмечая их содержание, тип и охват. Описывается и обосновывается выбор формата, рассматривается влияние формата и объемов данных с точки зрения хранения, резервного копирования и доступа. Отмечается также есть ли какие-либо существующие данные, которые можно использовать повторно.

Далее стоит отметить, как будут собираться/создаваться данные и какие стандарты данных сообщества (если таковые имеются) будут использоваться; как данные будут организованы в ходе проекта, будет ли, например, соглашения об именах, контроль версий и как будет организована структура папок; как будет контролироваться и документироваться последовательность и качество сбора данных. Это может включать такие процессы, как калибровка, повторные образцы или измерения, стандартизированный сбор или запись данных, проверка ввода данных, экспертная оценка данных или представление с использованием контролируемых словарей.

Следует описать, какая документация и метаданные будут сопровождать данные, чтобы помочь пользователям понять и повторно использовать их. Это должно, по крайней мере, включать базовую информацию, которая поможет людям найти данные, в том числе, кто создал или внес свой вклад в данные, их название, дату создания и при каких условиях к ним можно получить доступ.

Документация может также включать подробную информацию об используемой методологии, аналитическую и процедурную информацию, определения переменных, словари, единицы измерения, любые сделанные предположения, а также формат и тип файла данных. Какие стандарты метаданных будут использоваться и почему.

Необходимо описать этику и соблюдение правовых форм. Этические проблемы влияют на то, как хранятся данные, кто может их видеть/использовать и как долго они хранятся. Решение этических проблем может включать: анонимизацию данных; направление в ведомственные или институциональные комитеты по этике; официальные соглашения о согласии. Необходимо показать осведомленность о любых проблемах и подготовить соответствующие планы. Если проводится исследование с участием людей, необходимо отметить, что запрашивается согласие на обмен и повторное использование данных.

Следует указать, кому будут принадлежать авторские права и права интеллектуальной собственности на любые данные, которые будут собираться или создаваться, а также лицензию(и) на их использование и повторное использование. Необходимо рассмотреть соответствующую политику спонсора, учреждения, ведомства или группы в отношении авторского права или прав интеллектуальной собственности, а также разрешения на повторное использование сторонних данных и любые ограничения, необходимых для обмена данными.

Необходимо указать, как данные будут храниться и как часто будут выполняться резервные копии данных и в какие места, сколько копий будет создаваться. Для хранения предпочтительно использовать надежное управляемое хранилище, например репозитории. Следует отметить, кто будет отвечать за резервное копирование и восстановление и как будут восстановлены данные в случае непредвиденных обстоятельств. Необходимо указать все соответствующие меры безопасности.

При составлении плана необходимо решить, как данные могут быть повторно использованы, например, для проверки результатов исследования, проведения новых исследований или для обучения, какие данные хранить и как долго. Это может быть основано на любых обязательствах по сохранению определенных данных, потенциальной ценности повторного использования, экономически целесообразности сохранения и любых дополнительных усилиях, необходимых для подготовки данных к совместному использованию и сохранению данных. Стоит учесть любые дополнительные усилия, необходимые для подготовки данных к совместному использованию и сохранению, например, изменение форматов файлов.

Также стоит определить, как наборы данных, имеющие долгосрочную ценность, будут сохраняться и контролироваться после окончания срока действия гранта. Нужно наметить планы по подготовке и документированию данных для совместного использования и архивирования. 

Далее необходимо определить, как будет происходить обмен данными, где, как и кому должны быть доступны данные, имеющие признанную долгосрочную ценность. Методы, используемые для обмена данными, будут зависеть от ряда факторов, таких как тип, размер, сложность и конфиденциальность данных. Стоит описать любые ожидаемые трудности в обмене данными, имеющими признанную долгосрочную ценность, а также причины и возможные меры по их преодолению. Ограничения могут быть связаны, например, с конфиденциальностью, отсутствием соглашений о согласии или правами интеллектуальной собственности.

Стоит описать роли и обязанности для всех видов деятельности, например, сбора данных, создания метаданных, качества данных, хранения и резервного копирования, архивирования данных и совместного использования данных, а также, кто будет нести ответственность за обеспечение соблюдения соответствующей политики. По возможности следует указывать имена отдельных лиц.

В заключение необходимо тщательно рассмотреть любые ресурсы, необходимые для реализации плана, например, программное обеспечение, оборудование, технические знания и т. д. Если необходимы выделенные ресурсы, они должны быть обрисованы и обоснованы.

Далее описываются ожидаемые результаты исследования, их тип (набор данных, изображения, интерактивный ресурс и т.п.), предполагаемые репозитории, стандарты метаданных и начальный уровень доступа к данным. В завершении необходимо установить видимость плана (частный, организационный, общедоступный), и зарегистрировать его для получения идентификатора DMP

Созданный план можно опубликовать, и он станет доступным в библиотеке планов DMPTool. Планы совместного использования приносят пользу другим пользователям инструмента DMP и способствуют открытым исследованиям.