В библиотечном и архивном деле сохранение цифровой информации представляет собой формальный процесс, гарантирующий, что цифровая информация, имеющая непреходящую ценность , останется доступной и пригодной для использования в долгосрочной перспективе. [1] Он включает планирование, распределение ресурсов и применение методов и технологий сохранения , [2] и сочетает в себе политику, стратегии и действия для обеспечения доступа к переформатированному и « рожденному цифровым » контенту, независимо от проблем, связанных с сбоями средств массовой информации и технологическими проблемами. изменять. Целью цифрового сохранения является точное воспроизведение аутентифицированного контента с течением времени. [3]
Секция сохранения и переформатирования Ассоциации библиотечных коллекций и технических услуг Американской библиотечной ассоциации определила цифровую сохранность как комбинацию «политики, стратегий и действий, которые обеспечивают доступ к цифровому контенту с течением времени». [4] Согласно глоссарию библиотекарей Harrod's , цифровое сохранение — это метод сохранения цифровых материалов в живых, чтобы они оставались пригодными для использования, поскольку технологические достижения приводят к тому, что оригинальные спецификации аппаратного и программного обеспечения устаревают. [5]
Потребность в цифровом сохранении в основном возникает из-за относительно короткого срока службы цифровых носителей. Широко используемые жесткие диски могут стать непригодными для использования через несколько лет по ряду причин, таких как повреждение двигателей шпинделя и флэш-памяти (находится на твердотельных накопителях , телефонах, USB-накопителях и картах памяти, таких как SD, microSD и CompactFlash ) . ) может начать терять данные примерно через год после последнего использования, в зависимости от температуры его хранения и количества данных, записанных на него за время его эксплуатации. [ нужна цитация ] В настоящее время доступны архивные носители на основе дисков, но они рассчитаны только на 50 лет и представляют собой запатентованный формат, продаваемый только двумя японскими компаниями, Sony и Panasonic. M-DISC — это формат на основе DVD, который утверждает, что сохраняет данные в течение 1000 лет, но для записи на него требуются специальные приводы оптических дисков, а для чтения содержащихся в нем данных требуются все более необычные приводы оптических дисков , кроме того, компания, стоящая за этим форматом, обанкротилась. Данные, хранящиеся на лентах LTO, требуют периодической миграции, поскольку старые ленты не могут быть прочитаны новыми ленточными накопителями LTO. RAID- массивы можно использовать для защиты от сбоя отдельных жестких дисков, однако необходимо соблюдать осторожность, чтобы не перепутать диски одного массива с дисками другого.
Архивная оценка (или, альтернативно, отбор [6] ) относится к процессу идентификации записей и других материалов, подлежащих сохранению, путем определения их постоянной ценности. При принятии такого решения обычно учитывается несколько факторов. [7] Это сложный и ответственный процесс, поскольку оставшиеся отобранные записи будут формировать понимание исследователями этого массива записей или фондов . Оценка обозначена как A4.2 в модели Chain of Preservation (COP) [8] , созданной проектом InterPARES 2. [9] Архивная оценка — это не то же самое, что денежная оценка, которая определяет справедливую рыночную стоимость .
Архивная оценка может проводиться однократно или на различных этапах комплектования и обработки . Макрооценка, [10] функциональный анализ записей на высоком уровне, может выполняться даже до того, как записи будут получены, чтобы определить, какие записи необходимо получить. Более детальная итеративная оценка может выполняться во время обработки записей.
Оценка проводится по всем архивным материалам, а не только цифровым. Было высказано предположение, что в цифровом контексте было бы желательно сохранять больше записей, чем традиционно сохраняется после оценки аналоговых записей, в первую очередь из-за сочетания снижающейся стоимости хранения и доступности сложных инструментов обнаружения, которые будут позволяют исследователям находить ценность в записях с низкой плотностью информации. [11] [12] В аналоговом контексте эти записи могли быть удалены или сохранена только репрезентативная выборка. Однако выбор, оценка и приоритезация материалов должны быть тщательно продуманы с учетом способности организации ответственно управлять совокупностью этих материалов.
Часто библиотекам и, в меньшей степени, архивам предлагаются одни и те же материалы в нескольких различных цифровых или аналоговых форматах. Они предпочитают выбирать тот формат, который, по их мнению, имеет наибольший потенциал для долгосрочного сохранения контента. Библиотека Конгресса разработала набор рекомендуемых форматов для долгосрочного хранения. [13] Их можно было бы использовать, например, если бы Библиотеке предлагались авторские права на хранение непосредственно от издателя.
При сохранении цифровых данных и управлении коллекциями обнаружение и идентификация объектов осуществляется за счет использования присвоенных идентификаторов и точных описательных метаданных. Идентификатор — это уникальная метка, которая используется для ссылки на объект или запись и обычно проявляется в виде числа или строки цифр и букв . В качестве важнейшего элемента метаданных , который должен быть включен в запись или реестр базы данных, он используется в тандеме с другими описательными метаданными для дифференциации объектов и их различных экземпляров. [14]
Описательные метаданные относятся к информации о содержании объекта, такой как название, создатель, тема, дата и т. д. [14] Определение элементов, используемых для описания объекта, облегчается использованием схемы метаданных. Обширные описательные метаданные о цифровом объекте помогают минимизировать риски того, что цифровой объект станет недоступным. [15]
Другим распространенным типом идентификации файла является имя файла . Реализация протокола именования файлов необходима для обеспечения согласованности и эффективного обнаружения и извлечения объектов в коллекции и особенно применима при оцифровке аналоговых носителей. Использование соглашения об именовании файлов, такого как имя файла 8.3 или стандартное именование Warez , обеспечит совместимость с другими системами и облегчит миграцию данных, а также выбор между описательным (содержащим описательные слова и числа) и неописательным (часто генерируемыми случайным образом числами). имена файлов обычно определяются размером и объемом данной коллекции. [16] Однако имена файлов не подходят для семантической идентификации, поскольку они являются непостоянными метками для определенного места в системе и могут быть изменены, не затрагивая битовый профиль цифрового файла.
Краеугольный камень сохранения цифровых данных, « целостность данных », означает гарантию того, что данные являются «полными и неизмененными во всех существенных отношениях»; программа, разработанная для поддержания целостности, направлена на то, чтобы «гарантировать, что данные записываются точно так, как предполагалось, а при последующем извлечении гарантировать, что данные такие же, какими они были при первоначальной записи». [17]
Следует избегать непреднамеренных изменений данных и применять ответственные стратегии для обнаружения непреднамеренных изменений и принятия соответствующих мер реагирования. Однако усилия по сохранению цифровых данных могут потребовать внесения изменений в контент или метаданные посредством ответственно разработанных процедур и хорошо документированной политики. Организации или частные лица могут выбрать сохранение оригинальных, проверенных версий контента и/или модифицированных версий с соответствующими метаданными для сохранения. Практика обеспечения целостности данных также применима к измененным версиям, поскольку их состояние сбора должно поддерживаться и быть устойчивым к непреднамеренным изменениям.
Целостность записи можно сохранить за счет сохранения на уровне битов, проверки целостности и записи полного контрольного журнала всех действий по сохранению, выполненных с записью. Эти стратегии могут обеспечить защиту от несанкционированного или случайного изменения. [18]
Фиксированность файла — это свойство цифрового файла быть фиксированным или неизмененным. Проверка целостности файла — это процесс проверки того, что файл не изменился или не был изменен по сравнению с предыдущим состоянием. [19] Эти усилия часто достигаются за счет создания, проверки и управления контрольными суммами .
Хотя контрольные суммы являются основным механизмом мониторинга исправности на уровне отдельного файла, важным дополнительным фактором мониторинга исправности является посещаемость файлов. В то время как контрольные суммы определяют, был ли файл изменен, посещаемость файла определяет, был ли файл в назначенной коллекции вновь создан, удален или перемещен. Отслеживание посещаемости файлов и составление отчетов о них является фундаментальным компонентом управления цифровыми коллекциями и их фиксации.
Характеристика цифровых материалов — это идентификация и описание того, что представляет собой файл, а также его определяющих технических характеристик [20] , часто фиксируемых техническими метаданными, в которых фиксируются его технические атрибуты, такие как среда создания или производственная среда. [21]
Цифровая устойчивость включает в себя ряд проблем и проблем, которые способствуют долговечности цифровой информации. [22] В отличие от традиционных, временных стратегий и более постоянных решений, цифровая устойчивость предполагает более активный и непрерывный процесс. Цифровая устойчивость меньше концентрируется на решениях и технологиях, а больше на создании инфраструктуры и гибкого подхода с акцентом на функциональную совместимость , постоянное обслуживание и постоянное развитие. [23] Цифровая устойчивость включает в себя деятельность в настоящем, которая облегчит доступ и доступность в будущем. [24] [25] Постоянное обслуживание, необходимое для сохранения цифровых данных, аналогично успешному многовековому общественному содержанию Уффингтонской Белой Лошади (по словам Стюарта М. Шибера) или Великого храма Исэ (по словам Джеффри Шнаппа ). [26] [27]
Визуализация означает постоянную возможность использовать цифровой объект и получать к нему доступ, сохраняя при этом присущие ему важные свойства. [28]
Устаревание физических носителей может произойти, когда для доступа к цифровому контенту требуются внешние зависимости, которые больше не производятся, не обслуживаются и не поддерживаются. Внешние зависимости могут относиться к аппаратному обеспечению, программному обеспечению или физическим носителям. Например, лента DLT использовалась для резервного копирования и сохранения данных, но больше не используется.
Устаревание формата файла может произойти, когда принятие новых форматов кодирования заменяет использование существующих форматов или когда соответствующие инструменты представления больше не доступны. [29]
Хотя использование форматов файлов будет различаться в зависимости от возможностей архивных учреждений, в данной области документально подтверждено, что выбранные форматы файлов должны быть «открытыми, стандартными, непатентованными и устоявшимися», чтобы обеспечить долгосрочное архивное использование. [30] Факторы, которые следует учитывать при выборе устойчивых форматов файлов, включают раскрытие, принятие, прозрачность, самодокументацию, внешние зависимости, влияние патентов и механизмы технической защиты. [31] Другие соображения по выбору устойчивых форматов файлов включают «долговечность и зрелость формата, адаптацию в соответствующих профессиональных сообществах, встроенные информационные стандарты и долгосрочную доступность любого необходимого программного обеспечения для просмотра». [30] Например, Архивы Смитсоновского института считают несжатые файлы TIFF «хорошим форматом сохранения цифровых и оцифрованных неподвижных изображений из-за его зрелости, широкой адаптации в различных сообществах и тщательной документации». [30]
Форматы, принадлежащие одному поставщику программного обеспечения, с большей вероятностью пострадают от устаревания формата. Хорошо используемые стандарты, такие как Unicode и JPEG, в будущем, скорее всего, станут читабельными.
Значимые свойства относятся к «основным атрибутам цифрового объекта, которые влияют на его внешний вид, поведение, качество и удобство использования» и которые «должны сохраняться с течением времени, чтобы цифровой объект оставался доступным и значимым». [32]
«Правильное понимание важных свойств цифровых объектов имеет решающее значение для разработки передовых подходов к сохранению цифровых объектов. Оно помогает оценке и отбору, процессам, в которых делается выбор относительно того, какие важные свойства цифровых объектов заслуживают сохранения; это помогает развитию сохранности. метаданные, оценка различных стратегий сохранения и информация для будущей работы по разработке общих стандартов для всего сообщества, занимающегося сохранением». [33]
Независимо от того, аналоговые или цифровые, архивы стремятся сохранять записи как достоверное представление того, что было первоначально получено. Подлинность определяется как «...достоверность записи как записи; т.е. качество записи, которое является тем, чем она претендует быть, и не подвержено фальсификации или повреждению». [34] Подлинность не следует путать с точностью; [35] неточная запись может быть получена в архиве и сохранена ее подлинность. Содержание и смысл этой неточной записи останутся неизменными.
Сочетание политик, процедур безопасности и документации может использоваться для обеспечения и предоставления доказательств того, что значение записей не было изменено во время хранения в архивах.
Усилия по сохранению цифровых данных в основном направлены на то, чтобы обеспечить возможность принятия решений в будущем. Если архив или библиотека выберет конкретную стратегию, контент и связанные с ним метаданные должны сохраниться, чтобы можно было предпринять или не предпринять действия по усмотрению контролирующей стороны.
Метаданные сохранности являются ключевым фактором обеспечения цифровой сохранности и включают техническую информацию о цифровых объектах, информацию о компонентах цифрового объекта и его вычислительной среде, а также информацию, документирующую процесс сохранения и основные права. Это позволяет организациям или отдельным лицам понять цепочку поставок . Метаданные сохранности: стратегии реализации (PREMIS) — это фактический стандарт, определяющий реализуемые основные метаданные сохранности, необходимые большинству хранилищ и учреждений. Он включает руководящие принципы и рекомендации по его использованию, а также разработал общие словари сообщества. [36] [37]
Проблемы долгосрочного сохранения цифровой информации признаются архивным сообществом уже много лет. [38] В декабре 1994 года Группа исследовательских библиотек (RLG) и Комиссия по сохранению и доступу (CPA) сформировали Целевую группу по архивированию цифровой информации с основной целью изучения того, что необходимо сделать для обеспечения долгосрочного хранения и постоянный доступ к цифровым записям. Итоговый отчет, опубликованный Целевой группой (Гарретт Дж. и Уотерс Д., изд. (1996). «Сохранение цифровой информации: Отчет целевой группы по архивированию цифровой информации». [39] ) стал основополагающим документом. в области цифрового хранения, что помогло сформулировать ключевые концепции, требования и проблемы. [38] [40]
Целевая группа предложила разработать национальную систему цифровых архивов, которая взяла бы на себя ответственность за долгосрочное хранение и доступ к цифровой информации; представил концепцию доверенных цифровых хранилищ и определил их роли и обязанности; определил пять характеристик целостности цифровой информации (содержание, надежность, ссылка, происхождение и контекст), которые впоследствии были включены в определение информации об описании сохранности в эталонной модели открытой архивной информационной системы; и определил миграцию как важнейшую функцию цифровых архивов. Концепции и рекомендации, изложенные в отчете, заложили основу для последующих исследований и инициатив по сохранению цифровой информации. [41] [42]
Чтобы стандартизировать практику цифрового хранения и предоставить набор рекомендаций по реализации программы сохранения, была разработана и опубликована в 2012 году Эталонная модель открытой архивной информационной системы ( OAIS ). OAIS занимается всеми техническими аспектами жизненного цикла цифрового объекта: прием, архивное хранение, управление данными, администрирование, планирование доступа и сохранения. [43] Модель также рассматривает проблемы метаданных и рекомендует прикреплять к цифровому объекту пять типов метаданных: справочную (идентификационную) информацию, происхождение (включая историю сохранности), контекст, фиксированность (показатели подлинности) и представление (форматирование, файл структуру и то, что «придаёт смысл битовому потоку объекта»). [44]
В марте 2000 года Группа исследовательских библиотек (RLG) и Центр компьютерных онлайн-библиотек (OCLC) начали сотрудничество по установлению атрибутов цифрового хранилища для исследовательских организаций, опираясь на новый международный стандарт Справочной модели для открытой архивной информации и внедряя его. Система (ОАИС). В 2002 году они опубликовали «Надежные цифровые репозитории: атрибуты и обязанности». В этом документе «Доверенный цифровой репозиторий» (TDR) определяется как «тот, чья миссия состоит в том, чтобы обеспечить надежный, долгосрочный доступ к управляемым цифровым ресурсам назначенному сообществу сейчас и в будущем». TDR должен включать следующие семь атрибутов: соответствие эталонной модели открытой архивной информационной системы (OAIS), административная ответственность, организационная жизнеспособность, финансовая устойчивость, технологическая и процедурная пригодность, безопасность системы, процедурная подотчетность. Модель доверенного цифрового репозитория описывает отношения между этими атрибутами. В отчете также рекомендуется совместная разработка сертификатов цифровых репозиториев, моделей кооперативных сетей, а также обмен исследованиями и информацией о сохранении цифровых данных в отношении прав интеллектуальной собственности. [45]
В 2004 году Генри М. Гладни предложил другой подход к сохранению цифровых объектов, который призвал к созданию «Надежных цифровых объектов» (TDO). TDO — это цифровые объекты, которые могут говорить о своей подлинности, поскольку они содержат запись, сохраняющую историю их использования и изменений, что позволяет будущим пользователям проверять достоверность содержимого объекта. [46]
Международное исследование постоянных аутентичных записей в электронных системах (InterPARES) — это совместная исследовательская инициатива, возглавляемая Университетом Британской Колумбии, направленная на решение проблем долгосрочного сохранения аутентичных цифровых записей. Исследование проводится фокус-группами из различных учреждений Северной Америки , Европы , Азии и Австралии с целью разработки теорий и методологий, которые обеспечивают основу для стратегий, стандартов, политики и процедур, необходимых для обеспечения надежности и надежности. и точность цифровых записей с течением времени. [47]
Под руководством профессора архивного дела Лусианы Дуранти проект начался в 1999 году с первого этапа InterPARES 1, который длился до 2001 года и был сосредоточен на установлении требований к подлинности неактивных записей, созданных и поддерживаемых в больших базах данных и системах управления документами, созданных правительством. агентства. [48] InterPARES 2 (2002–2007 гг.) сосредоточил внимание на вопросах надежности, точности и аутентичности записей на протяжении всего их жизненного цикла и исследовал записи, созданные в динамичных средах в ходе художественной, научной и онлайн-деятельности правительства. [49] Третий пятилетний этап (InterPARES 3) был начат в 2007 году. Его цель – использовать теоретические и методологические знания, полученные в результате InterPARES и других исследовательских проектов по сохранению, для разработки руководств, планов действий и программ обучения по долгосрочному сохранению. подлинных документов для малых и средних архивных организаций. [50]
Наследие общества было представлено на многих различных материалах, включая камень, пергамент, бамбук, шелк и бумагу. Сейчас большое количество информации существует в цифровой форме, включая электронную почту, блоги, веб-сайты социальных сетей, веб-сайты национальных выборов, веб-фотоальбомы и сайты, содержание которых со временем меняется. [51] С помощью цифровых медиа легче создавать контент и поддерживать его в актуальном состоянии, но в то же время существует множество проблем в сохранении этого контента, как технических, так и экономических.
В отличие от традиционных аналоговых объектов, таких как книги или фотографии, где пользователь имеет непосредственный доступ к контенту, цифровой объект всегда нуждается в программной среде для его визуализации. Эти среды продолжают развиваться и меняться быстрыми темпами, угрожая непрерывности доступа к контенту. [52] Физические носители информации, форматы данных, оборудование и программное обеспечение со временем устаревают, создавая значительную угрозу для выживания контента. [3] Этот процесс можно назвать цифровым устареванием .
В случае цифрового контента (например, институциональные архивы, веб-сайты, электронный аудио- и видеоконтент, цифровая фотография и искусство, наборы исследовательских данных, данные наблюдений) огромное и растущее количество контента представляет собой серьезную проблему масштабирования для цифрового контента. усилия по сохранению. Быстро меняющиеся технологии могут препятствовать работе и методам специалистов по сохранению цифровых материалов из-за устаревших машин или технологий. Это стало общей проблемой, которая постоянно беспокоит цифровых архивистов: как подготовиться к будущему.
Цифровой контент также может создавать проблемы с сохранением из-за его сложного и динамичного характера, например, интерактивные веб-страницы, [53] виртуальная реальность и игровые среды, [54] учебные объекты, сайты социальных сетей. [55] Во многих случаях возникающих технологических достижений возникают существенные трудности с поддержанием аутентичности, неизменности и целостности объектов с течением времени, что обусловлено фундаментальной проблемой опыта работы с этим конкретным цифровым носителем данных, и хотя отдельные технологии могут оказаться более надежными. Что касается емкости хранилища, существуют проблемы с обеспечением системы мер, гарантирующих, что объект останется неподвижным во время его управления. [2] [56]
Особой проблемой сохранения программного обеспечения в виде цифрового контента является отсутствие исходного кода, поскольку коммерческое программное обеспечение обычно распространяется только в скомпилированном двоичном виде. Без исходного кода адаптация ( портирование ) на современное вычислительное оборудование или операционные системы чаще всего невозможна, поэтому необходимо эмулировать исходный аппаратный и программный контекст . Еще одной потенциальной проблемой для сохранения программного обеспечения может быть авторское право , которое зачастую запрещает обход механизмов защиты от копирования ( Закон об авторском праве в цифровую эпоху ) в случае, если программное обеспечение стало бесхозным произведением ( Abandonware ). Исключение из Закона США об авторском праве в цифровую эпоху, позволяющее обходить защиту от копирования, было одобрено в 2003 году сроком на 3 года для Интернет- архива , который создал архив «старинного программного обеспечения» в качестве способа их сохранения. [57] [58] Исключение было продлено в 2006 году, а с 27 октября 2009 года оно [обновлять]было продлено на неопределенный срок в ожидании дальнейшего принятия правил [59] «с целью сохранения или архивного воспроизведения опубликованных цифровых произведений библиотекой или архивом». [60] Программа архивирования GitHub хранит весь открытый исходный код GitHub в безопасном хранилище на Шпицбергене , на замерзшем норвежском острове Шпицберген , как часть Всемирного архива Арктики , причем код хранится в виде QR-кодов . [61]
Еще одна проблема, связанная с сохранением цифрового контента, связана с проблемой масштаба. Объем создаваемой цифровой информации наряду с «распространением типов форматов» [2] делает создание надежных цифровых хранилищ с адекватными и устойчивыми ресурсами сложной задачей. Интернет – это лишь один пример того, что можно назвать «потоком данных». [2] Например, в период с 2006 по 2010 год Библиотека Конгресса США накопила 170 миллиардов твитов общим объёмом 133,2 терабайта [62] , и каждый твит состоит из 50 полей метаданных. [63]
Экономические проблемы, связанные с сохранением цифровой информации, также велики. Программы сохранения требуют значительных первоначальных инвестиций, а также текущих затрат на прием данных, управление данными, хранение данных и персонал. Одной из ключевых стратегических проблем таких программ является тот факт, что, хотя они требуют значительного текущего и постоянного финансирования, их выгоды достаются в основном будущим поколениям. [64]
Различные уровни безопасности можно представить в виде трех уровней: «горячего» (доступные онлайн-хранилища ) и «теплого» (например, Интернет-архива ). Оба уровня имеют недостаток: они основаны на электронике — оба будут уничтожены при повторении мощная геомагнитная буря XIX века , известная как « Событие Кэррингтона ». Всемирный архив Арктики, хранящийся на специально разработанной пленке, покрытой галогенидом серебра , со сроком службы более 500 лет, представляет собой более надежный снимок данных, при этом предполагается архивирование с пятилетними интервалами. [61]
В 2006 году Центр компьютерных онлайн-библиотек разработал стратегию долгосрочного сохранения цифровых объектов, состоящую из четырех пунктов:
Существует несколько дополнительных стратегий, которые отдельные лица и организации могут использовать для активной борьбы с потерей цифровой информации.
Обновление — это передача данных между двумя типами одного и того же носителя данных, поэтому не происходит битрот- изменений или изменений данных. [44] Например, перенос данных переписи населения со старого компакт-диска на новый. Эту стратегию, возможно, придется объединить с миграцией, когда программное или аппаратное обеспечение , необходимое для чтения данных, больше не доступно или неспособно понять формат данных. Обновление, вероятно, всегда будет необходимо из-за износа физического носителя.
Миграция — это перенос данных в более новую системную среду (Garrett et al., 1996). Это может включать преобразование ресурсов из одного формата файла в другой (например, преобразование Microsoft Word в PDF или OpenDocument ) или из одной операционной системы в другую (например, из Windows в Linux ), чтобы ресурс оставался полностью доступным и функциональным. Миграция как возможный метод сохранения цифровых данных в долгосрочной перспективе сталкивается с двумя серьезными проблемами. В связи с тем, что цифровые объекты подвержены почти непрерывным изменениям, миграция может вызвать проблемы в отношении аутентичности, а миграция оказалась трудоемкой и дорогостоящей для «больших коллекций разнородных объектов, которые потребуют постоянного мониторинга и [2] Миграция может быть очень полезной стратегией для сохранения данных, хранящихся на внешних носителях (например, компакт-дисках, флэш-накопителях USB и 3,5-дюймовых дискетах). Устройства такого типа, как правило, не рекомендуется использовать в течение длительного времени, а данные могут стать недоступными из-за устаревания или деградации носителей и оборудования. [66]
Создание дубликатов данных в одной или нескольких системах называется репликацией . Данные, существующие в виде единственной копии только в одном месте, очень уязвимы к сбоям программного или аппаратного обеспечения, преднамеренным или случайным изменениям, а также к экологическим катастрофам, таким как пожар, наводнение и т. д. Цифровые данные с большей вероятностью выживут, если они будут реплицированы в нескольких местах. Реплицированные данные могут создавать трудности при обновлении, миграции, управлении версиями и управлении доступом , поскольку данные расположены в нескольких местах.
Понимание сохранения цифровой информации означает понимание того, как создается и воспроизводится цифровая информация. Поскольку цифровая информация (например, файл) может быть точно реплицирована вплоть до битового уровня, можно создавать идентичные копии данных. Точные дубликаты позволяют архивам и библиотекам управлять, хранить и предоставлять доступ к идентичным копиям данных в нескольких системах и/или средах.
Эмуляция — это копирование функциональности устаревшей системы. По словам ван дер Хувена, «Эмуляция фокусируется не на цифровом объекте, а на аппаратной и программной среде, в которой объект визуализируется. Она направлена на (вос)создание среды, в которой цифровой объект был первоначально создан». [67] Примерами являются возможности копировать или имитировать другую операционную систему. [68] Примеры включают эмуляцию Atari 2600 в системе Windows или эмуляцию WordPerfect 1.0 на Macintosh . Эмуляторы могут быть созданы для приложений, операционных систем или аппаратных платформ. Эмуляция была популярной стратегией сохранения функциональности старых систем видеоигр, например, в проекте MAME . Возможность эмуляции как универсального решения обсуждается в академическом сообществе. (Грейнджер, 2000)
Рэймонд А. Лори предположил, что универсальный виртуальный компьютер (UVC) можно использовать для запуска любого программного обеспечения в будущем на пока неизвестной платформе. [69] Стратегия UVC использует комбинацию эмуляции и миграции. Стратегия UVC еще не получила широкого распространения среди специалистов по сохранению цифровой информации.
Джефф Ротенберг, главный сторонник эмуляции цифрового хранения в библиотеках, работая в партнерстве с Koninklijke Bibliotheek и Национальным архивом Нидерландов , разработал программу под названием Dioscuri, модульный эмулятор, который успешно запускает игры MS-DOS, WordPerfect 5.1, DOS. , и более. [70]
Другой пример эмуляции как формы цифрового сохранения можно увидеть на примере Университета Эмори и документов Салмана Рушди . Рушди подарил библиотеке Университета Эмори устаревший компьютер , который был настолько старым, что библиотека не могла извлечь документы с жесткого диска. Чтобы получить документы, библиотека эмулировала старую систему программного обеспечения и смогла извлечь документы из его старого компьютера. [71]
Этот метод утверждает, что сохранившиеся объекты должны иметь самоописание, фактически «связывая контент со всей информацией, необходимой для его расшифровки и понимания». [2] Файлы, связанные с цифровым объектом, будут содержать подробную информацию о том, как интерпретировать этот объект с помощью «логических структур, называемых «контейнерами» или «обертками», для обеспечения связи между всеми информационными компонентами [72] , которые могут быть использованы в будущей разработке. эмуляторов, программ просмотра или конвертеров с помощью машиночитаемых спецификаций. [73] Метод инкапсуляции обычно применяется к коллекциям, которые не будут использоваться в течение длительного периода времени. [73]
Этот метод , разработанный Суперкомпьютерным центром Сан-Диего и финансируемый Национальным управлением архивов и документации , требует развития комплексной и обширной инфраструктуры, которая позволит «сохранить организацию коллекции, а также объекты, составляющие эту коллекцию, хранящиеся в независимая от платформы форма». [2] Постоянный архив включает в себя как данные, составляющие цифровой объект, так и контекст, который определяет происхождение, подлинность и структуру цифровых объектов. [74] Это позволяет производить замену аппаратных или программных компонентов с минимальным воздействием на систему консервации. Этот метод может быть основан на виртуальных сетках данных и напоминает информационную модель OAIS (в частности, пакет архивной информации).
Метаданные — это данные в цифровом файле, которые включают информацию о создании, правах доступа, ограничениях, истории сохранения и управлении правами. [75] Устаревание формата файла может повлиять на метаданные, прикрепленные к цифровым файлам. ASCII считается наиболее надежным форматом метаданных [76] , поскольку он широко распространен, обратно совместим при использовании с Unicode и использует удобочитаемые символы, а не числовые коды. Он сохраняет информацию, но не информацию о структуре, в которой она представлена. Для более высокой функциональности следует использовать SGML или XML . Оба языка разметки хранятся в формате ASCII, но содержат теги, обозначающие структуру и формат.
Ниже описаны некоторые основные механизмы оценки и сертификации хранилищ цифровой сохранности. Более подробный список ведет Центр исследовательских библиотек США. [77]
В 2007 году CRL/OCLC опубликовала «Аудит и сертификация надежных репозиториев: критерии и контрольный список» ( TRAC ), документ, позволяющий цифровым репозиториям оценить их способность надежно хранить, мигрировать и предоставлять доступ к цифровому контенту. TRAC основан на существующих стандартах и передовом опыте создания надежных цифровых хранилищ и включает набор из 84 критериев аудита и сертификации, разбитых на три раздела: Организационная инфраструктура; Управление цифровыми объектами; и технологии, техническая инфраструктура и безопасность. [78]
TRAC «предоставляет инструменты для аудита, оценки и потенциальной сертификации цифровых хранилищ, устанавливает требования к документации, необходимой для аудита, описывает процесс сертификации и устанавливает соответствующие методологии для определения надежности и устойчивости цифровых хранилищ». [79]
Метод аудита цифровых репозиториев на основе оценки рисков ( DRAMBORA ), представленный Центром цифрового курирования (DCC) и DigitalPreservationEurope (DPE) в 2007 году, предлагает методологию и набор инструментов для оценки рисков цифровых репозиториев. [80] Этот инструмент позволяет хранилищам данных либо проводить оценку самостоятельно (самооценка), либо передавать этот процесс на аутсорсинг.
Процесс DRAMBORA состоит из шести этапов и концентрируется на определении мандата, характеристике базы активов, выявлении рисков и оценке вероятности и потенциального воздействия рисков на хранилище. Аудитор обязан описать и документировать роль, цели, политику, деятельность и активы репозитория, чтобы идентифицировать и оценить риски, связанные с этой деятельностью и активами, и определить соответствующие меры по управлению ими. [81]
Европейская основа аудита и сертификации цифровых хранилищ была определена в меморандуме о взаимопонимании, подписанном в июле 2010 года между Консультативным комитетом по системам космических данных (CCSDS), Советом по сертификации данных (DSA) и Немецким институтом стандартизации (DIN) «Надежный». Архивы – Рабочая группа «Сертификация».
Эта структура призвана помочь организациям получить соответствующую сертификацию в качестве надежного цифрового хранилища и устанавливает три все более требовательных уровня оценки:
Немецкая инициатива Nestor. Архивировано 26 октября 2012 г. в Wayback Machine (Сеть экспертов в области долгосрочного хранения цифровых ресурсов), спонсируемая Министерством образования и исследований Германии , в 2004 году разработала каталог критериев доверенных цифровых хранилищ. В 2008 году была опубликована вторая версия документа. Каталог, ориентированный в первую очередь на немецкое культурное наследие и высшие учебные заведения, устанавливает рекомендации по планированию, внедрению и самооценке надежных долгосрочных цифровых хранилищ. [83]
Каталог критериев Nestor соответствует терминологии эталонной модели OAIS и состоит из трех разделов, охватывающих темы, связанные с организационной структурой, управлением объектами, инфраструктурой и безопасностью. [84]
В 2002 году проект «Сохранение и долгосрочный доступ через сетевые службы » (PLANETS), являющийся частью Рамочных программ ЕС по исследованиям и технологическому развитию 6, был направлен на решение основных проблем цифрового сохранения. Основной целью Planets было создание практических сервисов и инструментов, которые помогут обеспечить долгосрочный доступ к цифровым культурным и научным активам. Проект «Открытые планеты» завершился 31 мая 2010 года. [85] Результаты проекта в настоящее время поддерживаются последующей организацией — Фондом «Открытые планеты». [85] [86] 7 октября 2014 года Фонд «Открытые планеты» объявил, что он будет переименован в Фонд «Открытое сохранение», чтобы соответствовать текущему направлению организации. [87]
Инструмент планирования для доверенных электронных репозиториев (PLATTER) — это инструмент, выпущенный DigitalPreservationEurope (DPE), который помогает цифровым репозиториям определить свои самостоятельно определенные цели и приоритеты, чтобы завоевать доверие заинтересованных сторон. [88]
PLATTER предназначен для использования в качестве дополнительного инструмента к DRAMBORA, NESTOR и TRAC. Он основан на десяти основных принципах для доверенных хранилищ и определяет девять планов стратегических целей, охватывающих такие области, как приобретение, сохранение и распространение контента, финансы, кадровое обеспечение, планирование преемственности, техническая инфраструктура, спецификации данных и метаданных, а также планирование на случай стихийных бедствий. Инструмент позволяет репозиториям разрабатывать и поддерживать документацию, необходимую для аудита. [89]
Система «аудита и сертификации надежных цифровых хранилищ» была разработана Консультативным комитетом по системам космических данных (CCSDS) и опубликована в качестве стандарта ISO 16363 15 февраля 2012 года . [90] Расширение эталонной модели OAIS и в основном основано на Контрольный список TRAC, стандарт был разработан для всех типов цифровых хранилищ. Он предоставляет подробную спецификацию критериев, по которым можно оценить надежность цифрового репозитория. [91]
Рабочая группа CCSDS по аудиту и сертификации репозиториев также разработала и представила второй стандарт, определяющий эксплуатационные требования для организаций, намеревающихся проводить аудит и сертификацию репозиториев, как указано в ISO 16363. [ 92] Этот стандарт был опубликован как ISO 16919 – «требования к органам, предоставляющим аудит и сертификация кандидатов в надежные цифровые хранилища» – 1 ноября 2014 г. [93]
Хотя стратегии сохранения различаются для разных типов материалов и в разных учреждениях, соблюдение признанных на национальном и международном уровне стандартов и практик является важной частью деятельности по сохранению цифровых материалов. Лучшие или рекомендуемые практики определяют стратегии и процедуры, которые могут помочь организациям внедрить существующие стандарты или предоставить рекомендации в областях, где официальные стандарты не были разработаны. [94]
Передовые методы цифрового хранения продолжают развиваться и могут включать в себя процессы, выполняемые с контентом до или в момент загрузки в цифровой репозиторий, а также процессы, выполняемые с сохраненными файлами после загрузки с течением времени. Передовая практика может также применяться к процессу оцифровки аналогового материала и может включать создание специализированных метаданных (таких как технические, административные метаданные и метаданные по правам) в дополнение к стандартным описательным метаданным. Сохранение изначально цифрового контента может включать преобразование формата для облегчения долгосрочного сохранения или обеспечения лучшего доступа. [95]
Ни одно учреждение не может себе позволить разработать все программные инструменты, необходимые для обеспечения доступности цифровых материалов в долгосрочной перспективе. Таким образом, возникает проблема поддержания репозитория общих инструментов. Библиотека Конгресса занималась этим уже много лет, [96] пока эту роль не взял на себя Реестр средств цифрового хранения, принадлежащий сообществу. [97]
Были разработаны различные передовые методы и рекомендации по сохранению цифрового аудио, в том числе:
Общество аудиоинженеров (AES) также выпускает различные стандарты и рекомендации, касающиеся создания архивного аудиоконтента и технических метаданных. [103]
Термин «движущиеся изображения» включает аналоговые фильмы и видео, а также их изначально цифровые формы: цифровое видео, цифровые киноматериалы и цифровое кино. Поскольку аналоговые видеокассеты и пленки устаревают, оцифровка стала ключевой стратегией сохранения, хотя многие архивы продолжают осуществлять фотохимическую консервацию пленок. [104] [105]
«Цифровое сохранение» имеет двоякое значение для аудиовизуальных коллекций: аналоговые оригиналы сохраняются посредством цифрового переформатирования, при этом сохраняются полученные цифровые файлы; а изначально цифровой контент собирается, чаще всего в запатентованных форматах, которые создают проблемы для будущего цифрового сохранения.
В настоящее время не существует общепринятого стандартного целевого цифрового формата сохранения аналоговых движущихся изображений. [106] Сложность цифрового видео, а также различные потребности и возможности архивного учреждения являются причинами того, что для цифрового видео не существует универсального стандарта формата для долгосрочного хранения, как для других типов. цифровых записей «(например, текстовые файлы, преобразованные в PDF/A или TIFF для изображений)». [107] [108]
Библиотеки и архивные учреждения, такие как Библиотека Конгресса и Нью-Йоркский университет , приложили значительные усилия для сохранения движущихся изображений; однако национальное движение за сохранение видео еще не материализовалось». [109] Сохранение аудиовизуальных материалов «требует гораздо большего, чем просто помещение объектов в холодное хранилище». [109] Движущиеся изображения необходимо проецировать, воспроизводить, перемещать и показывать. .Материалы, рожденные цифровыми, требуют аналогичного подхода». [109]
Следующие ресурсы предлагают информацию об аналогово-цифровом переформатировании и сохранении цифрового аудиовизуального контента.
Движущиеся изображения требуют кодека для процесса декодирования; поэтому определение кодека имеет важное значение для сохранения цифровой информации. [115] [116] В книге «Букварль по кодекам для архивов движущихся изображений и звуков: 10 рекомендаций по выбору и управлению кодеками», написанной Крисом Ласинаком и опубликованной AudioVisual Preservation Solutions, Ласинак подчеркивает важность выбора архивистами правильного кодека, поскольку это может «повлиять на возможность сохранения цифрового объекта». [116] [115] Таким образом, процесс выбора кодека имеет решающее значение, «независимо от того, идет ли речь о рожденном цифровом контенте, переформатировании старого контента или преобразовании аналоговых материалов». [116] [115] Десять рекомендаций Лачинака по выбору кодеков и управлению ими заключаются в следующем: принятие, раскрытие, прозрачность, внешние зависимости, документация и метаданные, предварительное планирование, обслуживание, мониторинг устаревания, поддержание оригинала и избежание ненужных трансляций. -кодирование или перекодирование. [116] [115] На сегодняшний день среди архивного сообщества нет единого мнения относительно того, какой стандартный кодек следует использовать для оцифровки аналогового видео и долгосрочного сохранения цифрового видео, а также не существует ни одного «правильного» кодека. для цифрового объекта; каждое архивное учреждение должно «принять решение как часть общей стратегии сохранения». [116] [117] [108] [115]
Для перемещения изображений также требуется цифровой формат контейнера или оболочка, и его следует выбирать тщательно, как и кодек. [117] Согласно международному опросу, проведенному в 2010 году среди более чем 50 учреждений, занимающихся переформатированием фильмов и видео, «тремя основными вариантами продуктов для сохранения были AVI , QuickTime (.MOV) или MXF (формат обмена материалами)». [118] Это лишь несколько примеров контейнеров. Национальное управление архивов и документации (NARA) выбрало оболочку AVI в качестве стандартного формата контейнера по нескольким причинам, в том числе потому, что файлы AVI совместимы с многочисленными инструментами с открытым исходным кодом, такими как VLC . [118]
Неопределенность относительно того, какие форматы устареют или не станут будущим стандартом, затрудняет выбор одного кодека и одного контейнера » . устойчивость обеспечена». [108]
Рассмотрев следующие шаги, создатели контента и архивисты могут обеспечить лучшую доступность и сохранность движущихся изображений в долгосрочной перспективе:
Электронная почта создает особые проблемы для ее сохранения: программное обеспечение почтовых клиентов сильно различается; нет общей структуры сообщений электронной почты; электронная почта часто передает конфиденциальную информацию; отдельные учетные записи электронной почты могут содержать смешанные деловые и личные сообщения; Электронная почта может включать прикрепленные документы в различных форматах файлов. Сообщения электронной почты также могут содержать вирусы или спам. Хотя передача электронной почты стандартизирована, формального стандарта долгосрочного хранения сообщений электронной почты не существует. [120]
Подходы к сохранению электронной почты могут различаться в зависимости от цели ее сохранения. Для предприятий и государственных учреждений сохранение электронной почты может быть обусловлено необходимостью соблюдения требований к хранению и надзору для соблюдения нормативных требований, а также обеспечения возможности юридического раскрытия информации. (Дополнительную информацию о подходах к архивированию электронной почты для деловых и институциональных целей можно найти в отдельной статье « Архивирование электронной почты» .) Для исследовательских библиотек и архивов сохранение электронной почты, которая является частью изначально цифровых или гибридных архивных коллекций, имеет своей целью обеспечение его долгосрочная доступность как часть исторического и культурного наследия. [121]
Несколько проектов по разработке инструментов и методологий сохранения электронной почты были реализованы на основе различных стратегий сохранения: нормализация электронной почты в формате XML, перенос электронной почты в новую версию программного обеспечения и эмуляция среды электронной почты: «Воспоминания с использованием электронной почты» (MUSE), «Проект совместных электронных записей» ( CERP), сбор и сохранение электронной почты (EMCAP), программное обеспечение для извлечения электронной почты PeDALS (PeDALS), инструмент электронной нормализации архивов XML (XENA).
Некоторые передовые методы и рекомендации по сохранению электронной почты можно найти на следующих ресурсах:
В 2007 году проект «Сохранение переносимости среды эмуляции» (KEEP), входящий в состав Рамочных программ ЕС по исследованиям и технологическому развитию 7, разработал инструменты и методологии, позволяющие сохранять цифровые программные объекты доступными в их исходном контексте. Объекты цифрового программного обеспечения, такие как видеоигры, могут быть потеряны из-за цифрового устаревания и отсутствия необходимого устаревшего оборудования или программного обеспечения операционной системы; такое программное обеспечение называется заброшенным ПО . Поскольку исходный код часто больше не доступен, [54] эмуляция является единственной возможностью сохранения. KEEP предоставил среду эмуляции, помогающую создавать такие эмуляторы. KEEP был разработан Винсентом Жогеном, впервые запущен в феврале 2009 года и координировался Элизабет Фрейр из Национальной библиотеки Франции . [124]
Проект сообщества MAME направлен на эмуляцию любой исторической компьютерной игры, включая аркадные, консольные игры и тому подобное, на аппаратном уровне для будущего архивирования.
В январе 2012 года проект POCOS, финансируемый JISC, организовал семинар по сохранению игровой среды и виртуальных миров. [125]
Есть много вещей, которые потребители и художники могут сделать сами, чтобы ухаживать за своими коллекциями дома.
В Библиотеке Конгресса также имеется список для самосохранения, который включает в себя рекомендации по программам и рекомендациям других учреждений, которые помогут пользователю сохранить социальные сети, электронную почту и общие рекомендации по форматированию (например, уход за компакт-дисками). [127] Некоторые из перечисленных программ включают:
В 2020 году исследователи сообщили в препринте, что они обнаружили «176 журналов открытого доступа , которые из-за отсутствия полных и открытых архивов исчезли из Интернета в период с 2000 по 2019 год, охватывая все основные исследовательские дисциплины и географические регионы мира», и что в В 2019 году только около трети из 14 068 журналов, индексированных DOAJ , обеспечили долгосрочную сохранность своего контента. [129] [130] [131] Некоторые результаты научных исследований размещены не на веб-сайте научного журнала, а на других сайтах, таких как репозитории исходного кода, такие как GitLab . Интернет -архив заархивировал многие (но не все) утерянные научные публикации и сделал их доступными в Интернете. [132] Согласно анализу Интернет-архива, «18 процентов всех статей в открытом доступе с 1945 года, а это более трех миллионов, не архивируются независимо нами или другой организацией по сохранению, кроме самих издателей». [132] Sci-Hub осуществляет академическое архивирование вне рамок современного закона об авторском праве , а также предоставляет доступ к академическим произведениям, не имеющим лицензии открытого доступа. [132]
«Создание 3D-модели исторического здания требует больших усилий». [133] Последние достижения в области технологий привели к разработке 3D-рендеринга зданий в виртуальном пространстве. Традиционно здания в видеоиграх нужно было визуализировать с помощью кода, и многие игровые студии выполняли очень детальную визуализацию (см. Assassin's Creed ). Но поскольку большинство защитников природы не являются высококвалифицированными командами профессиональных программистов, университеты начали разрабатывать методы с помощью трехмерного лазерного сканирования. Подобную работу предпринял Тайваньский национальный университет науки и технологий в 2009 году. Их целью было «построить готовые 3D-компьютерные модели исторического здания, Дома Дона Нан-Куана, чтобы удовлетворить потребности в цифровой сохранности». [134] С довольно большим успехом им удалось отсканировать дом Дона Нан-Куана с помощью громоздких 10-килограммовых (22 фунтов) камер и лишь с небольшими доработками там, где сканеры не были достаточно детализированы. Совсем недавно, в 2018 году, в Кальве , Германия, команда провела сканирование исторической церкви Святых Петра и Павла, собрав данные с помощью лазерного сканирования и фотограмметрии. «Башня нынешней церкви имеет высоту около 64 м, а ее архитектурный стиль - неоготика конца девятнадцатого века. Эта церковь имеет главный неф, хор и два боковых нефа с каждой стороны с трибунами на высоте. богатая история, которая видна в различных используемых элементах и архитектурных стилях.Два небольших окна между хором и башней являются самыми старыми сохранившимися частями, датируемыми тринадцатым веком.Церковь была реконструирована и расширена в шестнадцатом веке (расширение церкви). неф) и семнадцатом веках (строительство трибун), после разрушений, вызванных Тридцатилетней войной (1618-1648). Однако в конце семнадцатого века церковь была снова сожжена французской армией под командованием генерала Мелака. с этого времени сохранились нынешний орган и кафедра. В конце девятнадцатого века церковь была перестроена, а старый купол Вельша был заменен нынешней неоготической башней. Другие произведения этого периода - верхняя часть кафедры, хор сиденья и футляр для органа. Витражи хора относятся к концу девятнадцатого - началу двадцатого веков, а некоторые окна нефа - к середине двадцатого века. После окончания Второй мировой войны некоторые неоготические элементы были заменены чистой готикой, например, алтарь церкви и некоторые рисунки на стенах и потолках » . шанс объединить различные технологии в большом пространстве с целью достижения высокого разрешения.Результаты оказались довольно хорошими и доступны для просмотра в Интернете.
Отдел по связям с общественностью и просвещением в области сохранения цифрового контента (DPOE), являющийся частью Библиотеки Конгресса, способствует сохранению цифрового контента посредством совместной сети инструкторов и специалистов по управлению коллекциями, работающих в учреждениях культурного наследия. В состав DPOE входят сотрудники Библиотеки Конгресса, Национальная сеть тренеров, Руководящий комитет DPOE и сообщество защитников образования в области сохранности цифровой информации. По состоянию на 2013 год в DPOE работают 24 тренера в шести регионах США. [136] В 2010 году DPOE провела оценку, охватив архивистов, библиотекарей и других специалистов в области информации по всей стране. Затем рабочая группа инструкторов DPOE разработала учебную программу [137] на основе результатов оценки и других аналогичных учебных программ по сохранению цифровых данных, разработанных другими учебными программами, такими как LYRASIS , Институт Educopia, Кооператив MetaArchive, Университет Северной Каролины , DigCCurr (Учебная программа по цифровому курированию). ) и Корнельского университета – семинары ICPSR по управлению сохранностью цифровых данных. Полученные в результате основные принципы также моделируются на принципах, изложенных в «Руководстве по созданию качественных цифровых коллекций» Национальной организации по информационным стандартам (NISO). [138]
В Европе Университет Гумбольдта в Берлине и Королевский колледж Лондона предлагают совместную программу цифрового курирования. Архивировано 26 декабря 2015 г. в Wayback Machine , в которой особое внимание уделяется как цифровым гуманитарным наукам, так и технологиям, необходимым для долгосрочного курирования. Программа магистратуры в области управления и сохранения информации (цифровая), предлагаемая HATII Университета Глазго, действует с 2005 года и является новаторской программой в этой области.
Для помощи в сохранении цифровых данных был разработан ряд продуктов с открытым исходным кодом, включая Archivematica, DSpace , Fedora Commons , OPUS , SobekCM и EPrints . Коммерческий сектор также предлагает программные инструменты для цифрового хранения, такие как Rosetta от Ex Libris Ltd. , Cloud от Preservica, Standard и Enterprise Edition, CONTENTdm, Digital Commons, Equella, IntraLibrary, Open Repository и Vital. [139]
Многие исследовательские библиотеки и архивы начали или собираются начать крупномасштабные инициативы по сохранению цифровой информации (LSDI). Основными игроками в LSDI являются учреждения культуры, коммерческие компании, такие как Google и Microsoft, а также некоммерческие группы, включая Open Content Alliance (OCA), Million Book Project (MBP) и HathiTrust . Основной мотивацией этих групп является расширение доступа к научным ресурсам.
Около 30 организаций культуры, включая Комитет по институциональному сотрудничеству (CIC), состоящий из 12 членов , подписали соглашения об оцифровке с Google или Microsoft. Некоторые из этих культурных организаций участвуют в Альянсе открытого контента и Проекте «Миллион книг». Некоторые библиотеки участвуют только в одной инициативе, а другие диверсифицировали свои стратегии оцифровки за счет участия в нескольких инициативах. Тремя основными причинами участия библиотек в LSDI являются: доступ, сохранение, а также исследования и разработки. Есть надежда, что цифровая сохранность обеспечит доступность библиотечных материалов для будущих поколений. Библиотеки обязаны гарантировать постоянный доступ к своим материалам и обязуются архивировать свои цифровые материалы. Библиотеки планируют использовать оцифрованные копии в качестве резервных копий произведений на случай, если они выйдут из печати, испортятся, будут потеряны или повреждены.
Арктический всемирный архив — это хранилище исторических и культурных данных из нескольких стран, в том числе с открытым исходным кодом . [61]
Сохранение цифровой информации относится к серии управляемых действий, необходимых для обеспечения постоянного доступа к цифровой информации в течение всего необходимого времени.
Существование разлагающихся технологий, дезорганизации и плохого хранения теоретически может привести к тому, что видеоигра навсегда зависнет, и в нее больше никогда нельзя будет играть. За прошедшие годы появились тревожные признания относительно сохранения видеоигр. Например, когда во время интервью с разработчиками поднимаются вопросы, касающиеся переиздания определенных игр, эти разработчики раскрывают проблемы, связанные с потерей или уничтожением производственных материалов игры. Некоторые игры не могли быть переизданы из-за различных проблем. Начала распространяться история о полной потере исходного кода известной ролевой игры, что помешало ее перевыпуску на новой консоли.
Компьютерные программы и видеоигры, распространяемые в устаревших форматах и требующие наличия оригинального носителя или аппаратного обеспечения в качестве условия доступа, когда обход осуществляется с целью сохранения или архивного воспроизведения опубликованных цифровых произведений библиотекой или архивом. Формат считается устаревшим, если машина или система, необходимые для того, чтобы сделать воспринимаемым произведение, хранящееся в этом формате, больше не производятся или более не доступны на коммерческом рынке.
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )