В библиотечном и архивном деле цифровое сохранение — это формальный процесс, гарантирующий, что цифровая информация, имеющая постоянную ценность, останется доступной и пригодной к использованию в долгосрочной перспективе. [1] Он включает планирование, распределение ресурсов и применение методов и технологий сохранения , [2] и объединяет политику, стратегии и действия для обеспечения доступа к переформатированному и « цифровому » контенту, независимо от проблем, связанных с отказом носителей и технологическими изменениями. Целью цифрового сохранения является точное воспроизведение аутентифицированного контента с течением времени. [3]
Ассоциация по сохранению и переформатированию библиотечных коллекций и технических служб Американской библиотечной ассоциации определила цифровое сохранение как совокупность «политик, стратегий и действий, которые обеспечивают доступ к цифровому контенту с течением времени». [4] Согласно словарю Harrod's Librarian , цифровое сохранение — это метод сохранения цифровых материалов в актуальном состоянии, чтобы они оставались пригодными для использования, в то время как технический прогресс делает оригинальные спецификации оборудования и программного обеспечения устаревшими. [5]
Необходимость в цифровом сохранении в основном возникает из-за относительно короткого срока службы цифровых носителей. Широко используемые жесткие диски могут стать непригодными для использования через несколько лет из-за различных причин, таких как повреждение шпиндельных двигателей, а флэш-память (находится на SSD , телефонах, USB-флеш-накопителях и в картах памяти, таких как карты SD, microSD и CompactFlash ) может начать терять данные примерно через год после последнего использования, в зависимости от температуры хранения и того, сколько данных было записано на нее в течение ее срока службы. [ требуется ссылка ] В настоящее время доступны архивные дисковые носители, но они рассчитаны только на 50 лет, и это запатентованный формат, продаваемый всего двумя японскими компаниями, Sony и Panasonic. M-DISC — это формат на основе DVD, который, как утверждается, сохраняет данные в течение 1000 лет, но для записи на него требуются специальные оптические дисководы, а для чтения содержащихся на нем данных требуются все более редкие оптические дисководы , кроме того, компания, стоящая за этим форматом, обанкротилась. Данные, хранящиеся на лентах LTO , требуют периодической миграции, поскольку старые ленты не могут быть прочитаны новыми ленточными накопителями LTO. RAID- массивы могут использоваться для защиты от сбоя отдельных жестких дисков, хотя необходимо соблюдать осторожность, чтобы не смешивать диски одного массива с дисками другого.
Архивная оценка (или, альтернативно, выбор [6] ) относится к процессу идентификации записей и других материалов, которые необходимо сохранить, путем определения их постоянной ценности. При принятии этого решения обычно учитываются несколько факторов. [7] Это сложный и критический процесс, поскольку оставшиеся выбранные записи будут формировать понимание исследователями этого корпуса записей, или фондов . Оценка определяется как A4.2 в модели цепочки сохранения (COP) [8], созданной проектом InterPARES 2. [9] Архивная оценка — это не то же самое, что денежная оценка, которая определяет справедливую рыночную стоимость .
Архивная оценка может быть выполнена один раз или на различных этапах приобретения и обработки . Макрооценка, [10] функциональный анализ записей на высоком уровне, может быть выполнена даже до того, как записи были приобретены, чтобы определить, какие записи следует приобрести. Более подробная, итеративная оценка может быть выполнена во время обработки записей.
Оценка выполняется для всех архивных материалов, а не только цифровых. Было высказано предположение, что в цифровом контексте может быть желательно сохранять больше записей, чем традиционно сохранялось после оценки аналоговых записей, в первую очередь из-за сочетания снижающейся стоимости хранения и доступности сложных инструментов обнаружения, которые позволят исследователям находить ценность в записях с низкой плотностью информации. [11] [12] В аналоговом контексте эти записи могли быть отброшены или сохранена только репрезентативная выборка. Однако выбор, оценка и расстановка приоритетов материалов должны быть тщательно продуманы в отношении способности организации ответственно управлять всей совокупностью этих материалов.
Часто библиотеки и, в меньшей степени, архивы предлагают одни и те же материалы в нескольких различных цифровых или аналоговых форматах. Они предпочитают выбирать тот формат, который, по их мнению, имеет наибольший потенциал для долгосрочного сохранения контента. Библиотека Конгресса создала набор рекомендуемых форматов для долгосрочного сохранения. [13] Они будут использоваться, например, если Библиотеке будут предложены материалы для авторского депозита непосредственно от издателя.
В цифровом сохранении и управлении коллекциями обнаружение и идентификация объектов облегчаются использованием назначенных идентификаторов и точных описательных метаданных. Идентификатор — это уникальная метка, которая используется для ссылки на объект или запись, обычно представленная в виде числа или строки чисел и букв. Как важный элемент метаданных, который должен быть включен в запись базы данных или инвентарь, он используется в тандеме с другими описательными метаданными для дифференциации объектов и их различных экземпляров. [14]
Описательные метаданные относятся к информации о содержании объекта, такой как название, создатель, тема, дата и т. д. [14] Определение элементов, используемых для описания объекта, облегчается использованием схемы метаданных. Обширные описательные метаданные о цифровом объекте помогают минимизировать риски того, что цифровой объект станет недоступным. [15]
Другим распространенным типом идентификации файлов является имя файла . Реализация протокола именования файлов имеет важное значение для поддержания согласованности и эффективного обнаружения и извлечения объектов в коллекции и особенно применима во время оцифровки аналоговых носителей. Использование соглашения об именовании файлов, такого как имя файла 8.3 или стандартное именование Warez , обеспечит совместимость с другими системами и облегчит миграцию данных, а выбор между описательными (содержащими описательные слова и числа) и неописательными (часто случайно сгенерированными числами) именами файлов обычно определяется размером и областью действия данной коллекции. [16] Однако имена файлов не подходят для семантической идентификации, поскольку они являются непостоянными метками для определенного местоположения в системе и могут быть изменены, не влияя на профиль цифрового файла на уровне битов.
Краеугольный камень цифрового сохранения, « целостность данных » относится к гарантии того, что данные являются «полными и неизменными во всех существенных отношениях»; программа, разработанная для поддержания целостности, направлена на «обеспечение того, чтобы данные записывались точно так, как предполагалось, и при последующем извлечении, чтобы данные были такими же, какими они были, когда они были первоначально записаны». [17]
Непреднамеренных изменений данных следует избегать, и следует применять ответственные стратегии для обнаружения непреднамеренных изменений и реагирования в соответствии с надлежащим определением. Однако усилия по цифровому сохранению могут потребовать внесения изменений в контент или метаданные посредством ответственно разработанных процедур и хорошо документированных политик. Организации или отдельные лица могут выбрать сохранение исходных, проверенных на целостность версий контента и/или измененных версий с соответствующими метаданными сохранения. Практики обеспечения целостности данных также применяются к измененным версиям, поскольку их состояние захвата должно поддерживаться и быть устойчивым к непреднамеренным изменениям.
Целостность записи может быть сохранена посредством сохранения на уровне битов, проверки фиксированности и сбора полного аудиторского следа всех действий по сохранению, выполненных с записью. Эти стратегии могут обеспечить защиту от несанкционированного или случайного изменения. [18]
Фиксированность файла — свойство цифрового файла быть фиксированным или неизменным. Проверка фиксированности файла — это процесс подтверждения того, что файл не был изменен или изменен по сравнению с предыдущим состоянием. [19] Это усилие часто обеспечивается созданием, проверкой и управлением контрольными суммами .
Хотя контрольные суммы являются основным механизмом мониторинга фикса на уровне отдельных файлов, важным дополнительным соображением для мониторинга фикса является посещаемость файлов. В то время как контрольные суммы определяют, изменился ли файл, посещаемость файлов определяет, был ли файл в назначенной коллекции вновь создан, удален или перемещен. Отслеживание и отчетность о посещаемости файлов являются основополагающим компонентом управления и фикса цифровой коллекции.
Характеристика цифровых материалов — это идентификация и описание того, что представляет собой файл, а также его определяющих технических характеристик [20], которые часто фиксируются техническими метаданными, в которых записаны его технические атрибуты, такие как среда создания или производства. [21]
Цифровая устойчивость охватывает ряд вопросов и проблем, которые способствуют долговечности цифровой информации. [22] В отличие от традиционных временных стратегий и более постоянных решений, цифровая устойчивость подразумевает более активный и непрерывный процесс. Цифровая устойчивость меньше концентрируется на решении и технологии и больше на создании инфраструктуры и подхода, который является гибким с упором на совместимость , постоянное обслуживание и непрерывное развитие. [23] Цифровая устойчивость включает в себя действия в настоящем, которые будут способствовать доступу и доступности в будущем. [24] [25] Постоянное обслуживание, необходимое для цифрового сохранения, аналогично успешному, многовековому, общественному обслуживанию Уффингтонской белой лошади (по Стюарту М. Шиберу) или Великого храма Исэ (по Джеффри Шнаппу ). [26] [27]
Возможность визуализации относится к постоянной возможности использования и доступа к цифровому объекту при сохранении его неотъемлемых существенных свойств. [28]
Устаревание физических носителей может произойти, когда доступ к цифровому контенту требует внешних зависимостей, которые больше не производятся, не обслуживаются и не поддерживаются. Внешние зависимости могут относиться к оборудованию, программному обеспечению или физическим носителям. Например, лента DLT использовалась для резервного копирования и сохранения данных, но больше не используется.
Устаревание форматов файлов может произойти, когда принятие новых форматов кодирования вытесняет использование существующих форматов или когда соответствующие инструменты представления больше не доступны. [29]
Хотя использование форматов файлов будет различаться в зависимости от возможностей архивных учреждений, в этой области существует документально подтвержденное согласие с тем, что выбранные форматы файлов должны быть «открытыми, стандартными, непатентованными и общепризнанными», чтобы обеспечить долгосрочное архивное использование. [30] Факторы, которые следует учитывать при выборе устойчивых форматов файлов, включают раскрытие, принятие, прозрачность, самодокументирование, внешние зависимости, влияние патентов и механизмы технической защиты. [31] Другие соображения при выборе устойчивых форматов файлов включают «долговечность и зрелость формата, адаптацию в соответствующих профессиональных сообществах, встроенные информационные стандарты и долгосрочную доступность любого необходимого программного обеспечения для просмотра». [30] Например, Архив Смитсоновского института считает несжатые TIFF «хорошим форматом сохранения для изначально цифровых и оцифрованных неподвижных изображений из-за его зрелости, широкой адаптации в различных сообществах и тщательного документирования». [30]
Форматы, принадлежащие одному поставщику программного обеспечения, с большей вероятностью будут затронуты устареванием форматов. Широко используемые стандарты, такие как Unicode и JPEG , с большей вероятностью будут читаемы в будущем.
Значимые свойства относятся к «существенным атрибутам цифрового объекта, которые влияют на его внешний вид, поведение, качество и удобство использования» и которые «должны сохраняться с течением времени, чтобы цифровой объект оставался доступным и значимым». [32]
«Правильное понимание существенных свойств цифровых объектов имеет решающее значение для установления наилучших практических подходов к цифровому сохранению. Оно помогает оценке и отбору, процессам, в которых делается выбор относительно того, какие существенные свойства цифровых объектов стоит сохранять; оно помогает разработке метаданных по сохранению, оценке различных стратегий сохранения и информирует о будущей работе по разработке общих стандартов в сообществе по сохранению». [33]
Независимо от того, аналоговые или цифровые, архивы стремятся сохранять записи как достоверные представления того, что было получено изначально. Подлинность определяется как «...достоверность записи как записи; т. е. качество записи, которая является тем, чем она претендует быть, и которая свободна от подделки или искажения». [34] Подлинность не следует путать с точностью; [35] неточная запись может быть получена архивом и ее подлинность будет сохранена. Содержание и значение этой неточной записи останутся неизменными.
Сочетание политик, процедур безопасности и документации может использоваться для обеспечения и предоставления доказательств того, что значение записей не было изменено во время хранения в архивах.
Усилия по цифровому сохранению в значительной степени направлены на обеспечение принятия решений в будущем. Если архив или библиотека выберет определенную стратегию для реализации, контент и связанные с ним метаданные должны сохраняться, чтобы позволить предпринимать или не предпринимать действия по усмотрению контролирующей стороны.
Метаданные сохранения являются ключевым фактором для цифрового сохранения и включают техническую информацию для цифровых объектов, информацию о компонентах цифрового объекта и его вычислительной среде, а также информацию, которая документирует процесс сохранения и лежащую в основе основу прав. Это позволяет организациям или отдельным лицам понять цепочку хранения . Метаданные сохранения: стратегии внедрения (PREMIS) — это фактический стандарт, который определяет реализуемые основные метаданные сохранения, необходимые большинству репозиториев и учреждений. Он включает руководящие принципы и рекомендации по его использованию и разработал общие словари сообщества. [36] [37]
Проблемы долгосрочного сохранения цифровой информации были признаны архивным сообществом в течение многих лет. [38] В декабре 1994 года Группа исследовательских библиотек (RLG) и Комиссия по сохранению и доступу (CPA) сформировали Целевую группу по архивированию цифровой информации с главной целью исследования того, что необходимо сделать для обеспечения долгосрочного сохранения и постоянного доступа к цифровым записям. Окончательный отчет, опубликованный Целевой группой (Garrett, J. and Waters, D., ed. (1996). "Preserving digital information: Report of the task force on archiveing of digital information." [39] ), стал основополагающим документом в области цифрового сохранения, который помог изложить ключевые концепции, требования и проблемы. [38] [40]
Целевая группа предложила разработать национальную систему цифровых архивов, которая бы взяла на себя ответственность за долгосрочное хранение и доступ к цифровой информации; представила концепцию доверенных цифровых репозиториев и определила их роли и обязанности; определила пять характеристик целостности цифровой информации (контент, фиксированность, ссылка, происхождение и контекст), которые впоследствии были включены в определение информации описания сохранения в Справочной модели открытой архивной информационной системы; и определила миграцию как важнейшую функцию цифровых архивов. Концепции и рекомендации, изложенные в отчете, заложили основу для последующих исследований и инициатив по цифровому сохранению. [41] [42]
Для стандартизации практики цифрового сохранения и предоставления набора рекомендаций по реализации программы сохранения была разработана и опубликована в 2012 году Эталонная модель для открытой архивной информационной системы ( OAIS ). OAIS занимается всеми техническими аспектами жизненного цикла цифрового объекта: прием, архивное хранение, управление данными, администрирование, доступ и планирование сохранения. [43] Модель также решает вопросы метаданных и рекомендует прикреплять к цифровому объекту пять типов метаданных: справочную (идентификационную) информацию, происхождение (включая историю сохранения), контекст, фиксированность (индикаторы подлинности) и представление (форматирование, структура файла и то, что «придает значение потоку битов объекта»). [44]
В марте 2000 года Группа исследовательских библиотек (RLG) и Центр компьютерных библиотек в режиме онлайн (OCLC) начали сотрудничество с целью установления атрибутов цифрового репозитория для исследовательских организаций, основываясь на новом международном стандарте Справочной модели для открытой архивной информационной системы (OAIS) и внедряя его. В 2002 году они опубликовали «Доверенные цифровые репозитории: атрибуты и обязанности». В этом документе «Доверенный цифровой репозиторий» (TDR) определяется как «тот, чья миссия заключается в предоставлении надежного долгосрочного доступа к управляемым цифровым ресурсам своему назначенному сообществу сейчас и в будущем». TDR должен включать следующие семь атрибутов: соответствие справочной модели для открытой архивной информационной системы (OAIS), административная ответственность, организационная жизнеспособность, финансовая устойчивость, технологическая и процедурная пригодность, безопасность системы, процедурная подотчетность. Модель доверенного цифрового репозитория описывает отношения между этими атрибутами. В отчете также рекомендуется совместная разработка сертификатов цифровых хранилищ, моделей для кооперативных сетей и обмен исследованиями и информацией о цифровом сохранении с учетом прав интеллектуальной собственности. [45]
В 2004 году Генри М. Глэдни предложил другой подход к сохранению цифровых объектов, который призывал к созданию «достоверных цифровых объектов» (TDO). TDO — это цифровые объекты, которые могут подтвердить свою подлинность, поскольку они включают запись, сохраняющую историю их использования и изменений, что позволяет будущим пользователям проверять, что содержимое объекта является действительным. [46]
International Research on Permanent Authentic Records in Electronic Systems (InterPARES) — это совместная исследовательская инициатива, возглавляемая Университетом Британской Колумбии, которая сосредоточена на решении вопросов долгосрочного сохранения подлинных цифровых записей. Исследование проводится фокус-группами из различных учреждений в Северной Америке , Европе , Азии и Австралии с целью разработки теорий и методологий, которые обеспечивают основу для стратегий, стандартов, политик и процедур, необходимых для обеспечения достоверности, надежности и точности цифровых записей с течением времени. [47]
Под руководством профессора архивных наук Лучианы Дуранти проект начался в 1999 году с первой фазы, InterPARES 1, которая продолжалась до 2001 года и была сосредоточена на установлении требований к подлинности неактивных записей, созданных и поддерживаемых в больших базах данных и системах управления документами, созданных государственными учреждениями. [48] InterPARES 2 (2002–2007) был сосредоточен на вопросах надежности, точности и подлинности записей на протяжении всего их жизненного цикла и исследовал записи, созданные в динамических средах в ходе художественной, научной и онлайн-правительственной деятельности. [49] Третья пятилетняя фаза (InterPARES 3) была начата в 2007 году. Ее цель — использовать теоретические и методологические знания, полученные в ходе InterPARES и других исследовательских проектов по сохранению, для разработки руководств, планов действий и учебных программ по долгосрочному сохранению подлинных записей для малых и средних архивных организаций. [50]
Наследие общества было представлено на многих различных материалах, включая камень, пергамент, бамбук, шелк и бумагу. Теперь большое количество информации существует в цифровых формах, включая электронные письма, блоги, сайты социальных сетей, сайты национальных выборов, веб-фотоальбомы и сайты, которые меняют свое содержание с течением времени. [51] С цифровыми медиа легче создавать контент и поддерживать его в актуальном состоянии, но в то же время существует множество проблем в сохранении этого контента, как технических, так и экономических.
В отличие от традиционных аналоговых объектов, таких как книги или фотографии, где пользователь имеет непосредственный доступ к контенту, цифровому объекту всегда нужна программная среда для его отображения. Эти среды продолжают развиваться и меняться быстрыми темпами, угрожая непрерывности доступа к контенту. [52] Физические носители данных, форматы данных, аппаратное и программное обеспечение со временем устаревают, создавая значительные угрозы для выживания контента. [3] Этот процесс можно назвать цифровым устареванием .
В случае изначально цифрового контента (например, институциональные архивы, веб-сайты, электронный аудио- и видеоконтент, изначально цифровая фотография и искусство, наборы исследовательских данных, данные наблюдений) огромное и растущее количество контента представляет значительные проблемы масштабирования для усилий по цифровому сохранению. Быстро меняющиеся технологии могут препятствовать работе и методам специалистов по цифровому сохранению из-за устаревших и несовременных машин или технологий. Это стало распространенной проблемой и постоянной заботой для цифрового архивиста — как подготовиться к будущему.
Цифровой контент также может представлять трудности для сохранения из-за его сложной и динамичной природы, например, интерактивные веб-страницы, [53] виртуальная реальность и игровые среды, [54] учебные объекты, сайты социальных сетей. [55] Во многих случаях новых технологических достижений существуют значительные трудности в сохранении подлинности, фиксированности и целостности объектов с течением времени, вытекающие из фундаментальной проблемы опыта работы с этим конкретным цифровым носителем данных, и хотя определенные технологии могут оказаться более надежными с точки зрения емкости хранения, существуют проблемы в обеспечении структуры мер, гарантирующих, что объект останется фиксированным во время управления. [2] [56]
Для сохранения программного обеспечения как цифрового контента особой проблемой обычно является недоступность исходного кода , поскольку коммерческое программное обеспечение обычно распространяется только в скомпилированной двоичной форме. Без исходного кода адаптация ( портирование ) на современном вычислительном оборудовании или операционных системах чаще всего невозможна, поэтому необходимо эмулировать исходный аппаратный и программный контекст . Еще одной потенциальной проблемой для сохранения программного обеспечения может быть авторское право , которое часто запрещает обход механизмов защиты от копирования ( Закон об авторском праве в цифровую эпоху ) в случае, если программное обеспечение стало бесхозным произведением ( Abandonware ). Исключение из Закона США об авторском праве в цифровую эпоху, разрешающее обход защиты от копирования, было одобрено в 2003 году сроком на 3 года для Архива Интернета , который создал архив «старого программного обеспечения» в качестве способа его сохранения. [57] [58] Исключение было возобновлено в 2006 году, и с 27 октября 2009 года [обновлять]было продлено на неопределенный срок в ожидании дальнейших правил [59] «в целях сохранения или архивного воспроизведения опубликованных цифровых работ библиотекой или архивом». [60] Программа архива GitHub сохранила весь открытый исходный код GitHub в безопасном хранилище на Шпицбергене , на замерзшем норвежском острове Шпицберген , как часть Архива арктического мира , с кодом, хранящимся в виде QR-кодов . [61]
Другая проблема, связанная с сохранением цифрового контента, заключается в вопросе масштаба. Объем создаваемой цифровой информации вместе с «распространением типов форматов» [2] делает создание надежных цифровых хранилищ с адекватными и устойчивыми ресурсами сложной задачей. Интернет — это лишь один пример того, что можно считать «потоком данных». [2] Например, в настоящее время Библиотека Конгресса накопила 170 миллиардов твитов между 2006 и 2010 годами общим объемом 133,2 терабайта [62] [63] , и каждый твит состоит из 50 полей метаданных. [64]
Экономические проблемы цифрового сохранения также велики. Программы сохранения требуют значительных первоначальных инвестиций для создания, наряду с текущими расходами на прием данных, управление данными, хранение данных и персонал. Одной из ключевых стратегических проблем таких программ является тот факт, что, хотя они требуют значительного текущего и постоянного финансирования, их выгоды в основном достаются будущим поколениям. [65]
Различные уровни безопасности можно представить в виде трех слоев: «горячие» (доступные онлайн-хранилища ) и «теплые» (например, Интернет-архив ) слои оба имеют слабость, основанную на электронике — оба были бы уничтожены повторением мощной геомагнитной бури 19-го века , известной как « Событие Кэррингтона ». Архив Arctic World, хранящийся на специально разработанной пленке, покрытой галогенидом серебра , со сроком службы более 500 лет, представляет собой более защищенный снимок данных, с архивированием, запланированным на пятилетние интервалы. [61]
В 2006 году Центр компьютерной электронной библиотеки разработал стратегию из четырех пунктов для долгосрочного сохранения цифровых объектов, которая состояла из:
Существует несколько дополнительных стратегий, которые отдельные лица и организации могут использовать для активной борьбы с потерей цифровой информации.
Обновление — это перенос данных между двумя типами одного и того же носителя информации, чтобы не было никаких изменений битрота или изменения данных. [44] Например, перенос данных переписи со старого компакт-диска для сохранения на новый. Эту стратегию может потребоваться объединить с миграцией, когда программное обеспечение или оборудование, необходимые для чтения данных, больше не доступны или не могут понять формат данных. Обновление, скорее всего, всегда будет необходимо из-за ухудшения состояния физических носителей.
Миграция — это перенос данных в более новые системные среды (Garrett et al., 1996). Это может включать преобразование ресурсов из одного формата файла в другой (например, преобразование Microsoft Word в PDF или OpenDocument ) или из одной операционной системы в другую (например, Windows в Linux ), чтобы ресурс оставался полностью доступным и функциональным. Две существенные проблемы сталкиваются с миграцией как с вероятным методом цифрового сохранения в долгосрочной перспективе. В связи с тем, что цифровые объекты подвержены состоянию почти непрерывных изменений, миграция может вызвать проблемы в отношении подлинности, и миграция оказалась трудоемкой и дорогостоящей для «больших коллекций разнородных объектов, которые требуют постоянного мониторинга и вмешательства». [2] Миграция может быть очень полезной стратегией для сохранения данных, хранящихся на внешних носителях (например, компакт-дисках, USB-флеш-накопителях и 3,5-дюймовых дискетах). Эти типы устройств, как правило, не рекомендуются для долгосрочного использования, и данные могут стать недоступными из-за устаревания или деградации носителя и оборудования. [67]
Создание дубликатов данных на одной или нескольких системах называется репликацией . Данные, которые существуют в виде одной копии только в одном месте, крайне уязвимы к программным или аппаратным сбоям, преднамеренным или случайным изменениям и экологическим катастрофам, таким как пожар, наводнение и т. д. Цифровые данные с большей вероятностью выживут, если они реплицированы в нескольких местах. Реплицированные данные могут вызывать трудности при обновлении, миграции, управлении версиями и контроле доступа , поскольку данные находятся в нескольких местах.
Понимание цифрового сохранения означает понимание того, как создается и воспроизводится цифровая информация. Поскольку цифровая информация (например, файл) может быть точно воспроизведена вплоть до уровня бита, возможно создание идентичных копий данных. Точные копии позволяют архивам и библиотекам управлять, хранить и предоставлять доступ к идентичным копиям данных в нескольких системах и/или средах.
Эмуляция — это воспроизведение функциональности устаревшей системы. По словам ван дер Хувена, «Эмуляция фокусируется не на цифровом объекте, а на аппаратной и программной среде, в которой объект визуализируется. Она направлена на (вос)создание среды, в которой цифровой объект был изначально создан». [68] Примерами являются возможность реплицировать или имитировать другую операционную систему. [69] Примерами являются эмуляция Atari 2600 в системе Windows или эмуляция WordPerfect 1.0 на Macintosh . Эмуляторы могут быть созданы для приложений, операционных систем или аппаратных платформ. Эмуляция была популярной стратегией для сохранения функциональности старых систем видеоигр, например, в проекте MAME . Осуществимость эмуляции как всеобъемлющего решения обсуждалась в академическом сообществе. (Granger, 2000)
Рэймонд А. Лори предположил, что универсальный виртуальный компьютер (UVC) может быть использован для запуска любого программного обеспечения в будущем на пока неизвестной платформе. [70] Стратегия UVC использует комбинацию эмуляции и миграции. Стратегия UVC пока не получила широкого распространения в сообществе по сохранению цифровых данных.
Джефф Ротенберг, главный сторонник эмуляции для цифрового сохранения в библиотеках, работая в партнерстве с Koninklijke Bibliotheek и Национальным архивом Нидерландов , разработал программное обеспечение под названием Dioscuri, модульный эмулятор, который успешно запускает MS-DOS, WordPerfect 5.1, игры DOS и многое другое. [ 71]
Другой пример эмуляции как формы цифрового сохранения можно увидеть на примере Университета Эмори и бумаг Салмана Рушди . Рушди подарил библиотеке Университета Эмори устаревший компьютер , который был настолько старым, что библиотека не могла извлечь бумаги с жесткого диска. Чтобы получить бумаги, библиотека эмулировала старую программную систему и смогла извлечь бумаги из его старого компьютера. [72]
Этот метод утверждает, что сохраняемые объекты должны быть самоописываемыми, фактически «связывающими контент со всей информацией, необходимой для его расшифровки и понимания». [2] Файлы, связанные с цифровым объектом, будут содержать сведения о том, как интерпретировать этот объект, используя «логические структуры, называемые «контейнерами» или «оболочками», чтобы обеспечить связь между всеми информационными компонентами [73] , которые могут быть использованы в будущей разработке эмуляторов, просмотрщиков или преобразователей посредством машиночитаемых спецификаций. [74] Метод инкапсуляции обычно применяется к коллекциям, которые не будут использоваться в течение длительных периодов времени. [74]
Разработанный Суперкомпьютерным центром Сан-Диего и финансируемый Национальным управлением архивов и записей , этот метод требует разработки всеобъемлющей и обширной инфраструктуры, которая обеспечивает «сохранение организации коллекции, а также объектов, составляющих эту коллекцию, поддерживаемых в форме, независимой от платформы». [2] Постоянный архив включает как данные, составляющие цифровой объект, так и контекст, который определяет происхождение, подлинность и структуру цифровых сущностей. [75] Это позволяет заменять аппаратные или программные компоненты с минимальным влиянием на систему сохранения. Этот метод может быть основан на виртуальных сетках данных и напоминает информационную модель OAIS (в частности, архивный информационный пакет).
Метаданные — это данные о цифровом файле, которые включают информацию о создании, правах доступа, ограничениях, истории сохранения и управлении правами. [76] Метаданные, прикрепленные к цифровым файлам, могут быть затронуты устареванием формата файла. ASCII считается самым долговечным форматом метаданных [77], поскольку он широко распространен, обратно совместим при использовании с Unicode и использует понятные человеку символы, а не числовые коды. Он сохраняет информацию, но не информацию о структуре, в которой она представлена. Для более высокой функциональности следует использовать SGML или XML . Оба языка разметки хранятся в формате ASCII, но содержат теги, которые обозначают структуру и формат.
Ниже описаны некоторые из основных фреймворков для оценки и сертификации хранилища цифрового сохранения. Более подробный список поддерживается Центром исследовательских библиотек США. [78]
В 2007 году CRL/OCLC опубликовали Trustworthy Repositories Audit & Certification: Criteria & Checklist ( TRAC ), документ, позволяющий цифровым репозиториям оценить свою способность надежно хранить, переносить и предоставлять доступ к цифровому контенту. TRAC основан на существующих стандартах и передовых практиках для надежных цифровых репозиториев и включает набор из 84 критериев аудита и сертификации, организованных в три раздела: Организационная инфраструктура; Управление цифровыми объектами; и Технологии, техническая инфраструктура и безопасность. [79]
TRAC «предоставляет инструменты для аудита, оценки и потенциальной сертификации цифровых репозиториев, устанавливает требования к документации, необходимой для аудита, описывает процесс сертификации и устанавливает соответствующие методологии для определения надежности и устойчивости цифровых репозиториев». [80]
Метод аудита цифрового хранилища на основе оценки рисков ( DRAMBORA ), представленный Центром цифрового курирования (DCC) и DigitalPreservationEurope (DPE) в 2007 году, предлагает методологию и набор инструментов для оценки рисков цифрового хранилища. [81] Инструмент позволяет хранилищам либо проводить оценку собственными силами (самостоятельная оценка), либо передавать этот процесс на аутсорсинг.
Процесс DRAMBORA организован в шесть этапов и концентрируется на определении мандата, характеристике базы активов, идентификации рисков и оценке вероятности и потенциального воздействия рисков на репозиторий. Аудитор должен описать и задокументировать роль, цели, политику, деятельность и активы репозитория, чтобы идентифицировать и оценить риски, связанные с этими видами деятельности и активами, и определить соответствующие меры для управления ими. [82]
Европейская структура аудита и сертификации цифровых репозиториев была определена в меморандуме о взаимопонимании, подписанном в июле 2010 года между Консультативным комитетом по системам космических данных (CCSDS), Советом по знаку одобрения данных (DSA) и рабочей группой «Надежные архивы – Сертификация» Немецкого института стандартизации (DIN).
Структура призвана помочь организациям получить соответствующую сертификацию в качестве надежного цифрового хранилища и устанавливает три все более требовательных уровня оценки:
Немецкая инициатива, nestor Архивировано 2012-10-26 в Wayback Machine (Сеть экспертизы в области долгосрочного хранения цифровых ресурсов), спонсируемая Министерством образования и исследований Германии , разработала каталог критериев для надежных цифровых репозиториев в 2004 году. В 2008 году была опубликована вторая версия документа. Каталог, нацеленный в первую очередь на немецкое культурное наследие и высшие учебные заведения, устанавливает руководящие принципы для планирования, внедрения и самооценки надежных долгосрочных цифровых репозиториев. [84]
Каталог критериев Nestor соответствует терминологии эталонной модели OAIS и состоит из трех разделов, охватывающих темы, связанные с организационной структурой, управлением объектами, а также инфраструктурой и безопасностью. [85]
В 2002 году проект «Сохранение и долгосрочный доступ через сетевые службы » (PLANETS), часть Рамочных программ ЕС по научным исследованиям и технологическому развитию 6, был направлен на решение основных проблем цифрового сохранения. Основной целью Planets было создание практических услуг и инструментов, которые помогут обеспечить долгосрочный доступ к цифровым культурным и научным активам. Проект Open Planets завершился 31 мая 2010 года. [86] Результаты проекта теперь поддерживаются последующей организацией — Фондом Open Planets. [86] [87] 7 октября 2014 года Фонд Open Planets объявил, что он будет переименован в Фонд Open Preservation, чтобы соответствовать текущему направлению организации. [88]
Инструмент планирования для доверенных электронных репозиториев (PLATTER) — это инструмент, выпущенный DigitalPreservationEurope (DPE), чтобы помочь цифровым репозиториям определить свои собственные цели и приоритеты для завоевания доверия заинтересованных сторон. [89]
PLATTER предназначен для использования в качестве дополнительного инструмента к DRAMBORA, NESTOR и TRAC. Он основан на десяти основных принципах для доверенных репозиториев и определяет девять стратегических целевых планов, охватывающих такие области, как приобретение, сохранение и распространение контента, финансы, кадровое обеспечение, планирование преемственности, техническая инфраструктура, спецификации данных и метаданных и планирование на случай стихийных бедствий. Инструмент позволяет репозиториям разрабатывать и поддерживать документацию, необходимую для аудита. [90]
Система для «аудита и сертификации надежных цифровых репозиториев» была разработана Консультативным комитетом по системам космических данных (CCSDS) и опубликована как стандарт ISO 16363 15 февраля 2012 года. [91] Расширяя эталонную модель OAIS и основываясь в значительной степени на контрольном списке TRAC, стандарт был разработан для всех типов цифровых репозиториев. Он предоставляет подробную спецификацию критериев, по которым можно оценить надежность цифрового репозитория. [92]
Рабочая группа по аудиту и сертификации репозиториев CCSDS также разработала и представила второй стандарт, определяющий эксплуатационные требования для организаций, намеревающихся проводить аудит и сертификацию репозиториев, как указано в ISO 16363. [93] Этот стандарт был опубликован как ISO 16919 – «Требования к органам, проводящим аудит и сертификацию кандидатов на надежные цифровые репозитории» – 1 ноября 2014 года. [94]
Хотя стратегии сохранения различаются для разных типов материалов и между учреждениями, соблюдение общепризнанных на национальном и международном уровне стандартов и практик является важнейшей частью деятельности по цифровому сохранению. Лучшие или рекомендуемые практики определяют стратегии и процедуры, которые могут помочь организациям внедрить существующие стандарты или предоставить руководство в областях, где не были разработаны формальные стандарты. [95]
Лучшие практики в области цифрового сохранения продолжают развиваться и могут охватывать процессы, которые выполняются с контентом до или в момент загрузки в цифровой репозиторий, а также процессы, выполняемые с сохраненными файлами после загрузки с течением времени. Лучшие практики могут также применяться к процессу оцифровки аналогового материала и могут включать создание специализированных метаданных (таких как технические, административные и метаданные прав) в дополнение к стандартным описательным метаданным. Сохранение изначально цифрового контента может включать преобразования форматов для облегчения долгосрочного сохранения или предоставления лучшего доступа. [96]
Ни одно учреждение не может позволить себе разрабатывать все программные средства, необходимые для обеспечения доступности цифровых материалов в долгосрочной перспективе. Таким образом, возникает проблема поддержания хранилища общих инструментов. Библиотека Конгресса делала это годами, [97] пока эта роль не была взята на себя Реестром инструментов сохранения цифровых материалов, принадлежащих сообществу. [98]
Были разработаны различные передовые практики и рекомендации по сохранению цифрового аудио, в том числе:
Общество звукорежиссеров (AES) также выпускает ряд стандартов и руководств, касающихся создания архивного аудиоконтента и технических метаданных. [104]
Термин «движущиеся изображения» включает в себя аналоговые фильмы и видео и их изначально цифровые формы: цифровое видео, цифровые киноматериалы и цифровое кино. Поскольку аналоговые видеоленты и киноленты устаревают, оцифровка стала ключевой стратегией сохранения, хотя многие архивы продолжают выполнять фотохимическую консервацию кинопленки. [105] [106]
«Цифровое сохранение» имеет двойное значение для аудиовизуальных коллекций: аналоговые оригиналы сохраняются посредством цифрового переформатирования, при этом сохраняются полученные цифровые файлы; изначально цифровой контент собирается, чаще всего в закрытых форматах, что создает проблемы для будущего цифрового сохранения.
В настоящее время не существует общепринятого стандартного целевого формата цифрового сохранения для аналоговых движущихся изображений. [107] Сложность цифрового видео, а также различные потребности и возможности архивных учреждений являются причинами того, что не существует «универсального» стандарта формата для долгосрочного сохранения цифрового видео, как это существует для других типов цифровых записей «(например, текстовый процессор, преобразованный в PDF/A или TIFF для изображений)». [108] [109]
Библиотечные и архивные учреждения, такие как Библиотека Конгресса и Нью-Йоркский университет , приложили значительные усилия для сохранения движущихся изображений; однако общенациональное движение за сохранение видео пока не материализовалось». [110] Сохранение аудиовизуальных материалов «требует гораздо большего, чем просто помещение объектов в холодное хранилище». [110] Движущиеся изображения должны проецироваться и воспроизводиться, перемещаться и демонстрироваться. Изначально цифровые материалы требуют аналогичного подхода». [110]
Следующие ресурсы предоставляют информацию о переформатировании аналоговых данных в цифровые и сохранении изначально цифрового аудиовизуального контента.
Для процесса декодирования движущихся изображений требуется кодек ; поэтому определение кодека имеет важное значение для цифрового сохранения. [116] [117] В «A Primer on Codecs for Moving Image and Sound Archives: 10 Recommendations for Codec Selection and Management», написанной Крисом Ласинаком и опубликованной AudioVisual Preservation Solutions, Ласинак подчеркивает важность выбора архивистами правильного кодека, поскольку это может «повлиять на способность сохранять цифровой объект». [117] [116] Поэтому процесс выбора кодека имеет решающее значение, «независимо от того, имеете ли вы дело с изначально цифровым контентом, переформатированием старого контента или преобразованием аналоговых материалов». [117] [116] Десять рекомендаций Ласинака по выбору и управлению кодеками следующие: принятие, раскрытие, прозрачность, внешние зависимости, документирование и метаданные, предварительное планирование, обслуживание, мониторинг устаревания, обслуживание оригинала и избежание ненужного транскодирования или повторного кодирования. [117] [116] На сегодняшний день в архивном сообществе отсутствует консенсус относительно того, какой стандартный кодек следует использовать для оцифровки аналогового видео и долгосрочного сохранения цифрового видео, а также не существует единого «правильного» кодека для цифрового объекта; каждое архивное учреждение должно «принять решение как часть общей стратегии сохранения». [117] [118] [109] [116]
Формат цифрового контейнера или оболочка также требуется для движущихся изображений и должен быть выбран тщательно, как и кодек. [118] Согласно международному опросу, проведенному в 2010 году среди более чем 50 учреждений, занимающихся переформатированием фильмов и видео, «тремя основными вариантами для продуктов сохранения были AVI , QuickTime (.MOV) или MXF (Material Exchange Format)». [119] Это всего лишь несколько примеров контейнеров. Национальное управление архивов и записей (NARA) выбрало оболочку AVI в качестве своего стандартного формата контейнера по нескольким причинам, включая то, что файлы AVI совместимы с многочисленными инструментами с открытым исходным кодом, такими как VLC . [119]
Неопределенность относительно того, какие форматы устареют или не устареют или станут будущим стандартом, затрудняет выбор одного кодека и одного контейнера». [109] Выбор формата должен «быть компромиссом, при котором обеспечиваются наилучшие требования к качеству и долгосрочная устойчивость». [109]
Создатели контента и архивисты могут обеспечить лучшую доступность и сохранность движущихся изображений в долгосрочной перспективе, приняв во внимание следующие шаги:
Электронная почта создает особые проблемы для сохранения: программное обеспечение почтовых клиентов сильно различается; не существует общей структуры для сообщений электронной почты; электронная почта часто передает конфиденциальную информацию; отдельные учетные записи электронной почты могут содержать деловые и личные сообщения вперемешку; и электронная почта может включать прикрепленные документы в различных форматах файлов. Сообщения электронной почты также могут переносить вирусы или иметь спам-контент. Хотя передача электронной почты стандартизирована, не существует формального стандарта для долгосрочного сохранения сообщений электронной почты. [121]
Подходы к сохранению электронной почты могут различаться в зависимости от цели, для которой она сохраняется. Для предприятий и государственных учреждений сохранение электронной почты может быть обусловлено необходимостью соблюдения требований к хранению и надзору для соблюдения нормативных требований и обеспечения возможности юридического раскрытия информации. (Дополнительную информацию о подходах к архивированию электронной почты для деловых и институциональных целей можно найти в отдельной статье Архивирование электронной почты .) Для исследовательских библиотек и архивов сохранение электронной почты, которая является частью изначально цифровых или гибридных архивных коллекций, имеет своей целью обеспечение ее долгосрочной доступности как части исторической и культурной записи. [122]
Было реализовано несколько проектов по разработке инструментов и методологий для сохранения электронной почты на основе различных стратегий сохранения: нормализация электронной почты в формат XML, миграция электронной почты в новую версию программного обеспечения и эмуляция сред электронной почты: Memories Using Email (MUSE), Collaborative Electronic Records Project (CERP), E-Mail Collection And Preservation (EMCAP), PeDALS Email Extractor Software (PeDALS), XML Electronic Normalizing of Archives Tool (XENA).
Некоторые передовые методы и рекомендации по сохранению электронной почты можно найти в следующих ресурсах:
В 2007 году проект Keeping Emulation Environments Portable (KEEP), часть Рамочных программ ЕС по исследованиям и технологическому развитию 7, разработал инструменты и методологии для сохранения цифровых программных объектов, доступных в их исходном контексте. Цифровые программные объекты, такие как видеоигры, могут быть утеряны из-за цифрового устаревания и недоступности необходимого устаревшего оборудования или программного обеспечения операционной системы; такое программное обеспечение называется abandonware . Поскольку исходный код часто больше недоступен, [54] эмуляция является единственной возможностью сохранения. KEEP предоставил фреймворк эмуляции, чтобы помочь в создании таких эмуляторов. KEEP был разработан Винсентом Жогуэном, впервые запущен в феврале 2009 года и координировался Элизабет Фрейр из Французской национальной библиотеки . [125]
Целью общественного проекта MAME является эмуляция любой исторической компьютерной игры, включая аркадные игры, консольные игры и тому подобное, на аппаратном уровне для будущего архивирования.
В январе 2012 года проект POCOS, финансируемый JISC, организовал семинар по сохранению игровых сред и виртуальных миров. [126]
Потребители и художники могут сделать многое самостоятельно, чтобы помочь себе заботиться о своих коллекциях дома.
Библиотека Конгресса также размещает список для самосохраняющихся, который включает в себя указания по программам и рекомендациям других учреждений, которые помогут пользователю сохранить социальные сети, электронную почту и общие рекомендации по форматированию (например, уход за компакт-дисками). [128] Некоторые из перечисленных программ включают:
В 2020 году исследователи сообщили в препринте , что они обнаружили «176 журналов открытого доступа , которые из-за отсутствия всеобъемлющих и открытых архивов исчезли из Интернета в период с 2000 по 2019 год, охватывая все основные исследовательские дисциплины и географические регионы мира», и что в 2019 году только около трети из 14 068 журналов, проиндексированных DOAJ, обеспечили долгосрочное сохранение своего контента. [130] [131] [132] Часть результатов научных исследований размещена не на веб-сайте научного журнала, а на других сайтах, таких как репозитории исходного кода, такие как GitLab . Архив Интернета заархивировал многие — но не все — утраченные академические публикации и сделал их доступными в Интернете. [133] Согласно анализу Архива Интернета, «18 процентов всех статей открытого доступа с 1945 года, более трех миллионов, не архивируются нами или другой организацией по сохранению, кроме самих издателей». [133] Sci-Hub осуществляет академическое архивирование вне рамок современного закона об авторском праве , а также предоставляет доступ к академическим работам, не имеющим лицензии открытого доступа. [133]
«Создание 3D-модели исторического здания требует больших усилий». [134] Недавние достижения в области технологий привели к разработке 3D-рендеринга зданий в виртуальном пространстве. Традиционно здания в видеоиграх приходилось визуализировать с помощью кода, и многие игровые студии делали очень подробные рендеры (см. Assassin's Creed ). Но из-за того, что большинство специалистов по сохранению не были высококвалифицированными командами профессиональных кодеров, университеты начали разрабатывать методы, выполняя 3D-лазерное сканирование. Такая работа была предпринята Национальным тайваньским университетом науки и технологий в 2009 году. Их целью было «создать построенные 3D-компьютерные модели исторического здания, дома Дон Нан-Куан, чтобы удовлетворить потребность в цифровом сохранении». [135] С довольно большим успехом они смогли отсканировать дом Дон Нан-Куан с помощью громоздких 10-килограммовых (22 фунта) камер и лишь с незначительной доработкой там, где сканеры были недостаточно подробными. Совсем недавно, в 2018 году, в Кальве , Германия, группа провела сканирование исторической церкви Святых Петра и Павла, собрав данные с помощью лазерного сканирования и фотограмметрии. «Башня нынешней церкви имеет высоту около 64 м, а ее архитектурный стиль — неоготика конца девятнадцатого века. Эта церковь насчитывает главный неф, хор и два боковых нефа с каждой стороны с трибунами на высоте. Церковь демонстрирует богатую историю, которая видна в различных элементах и использованных архитектурных стилях. Два небольших окна между хором и башней являются старейшими сохранившимися частями, которые датируются тринадцатым веком. Церковь была реконструирована и расширена в шестнадцатом (расширение нефа) и семнадцатом веках (строительство трибун), после разрушений, вызванных Тридцатилетней войной (1618-1648). Однако церковь была снова сожжена французской армией под командованием генерала Мелака в конце семнадцатого века. Нынешний орган и кафедра сохранились с того времени. В конце девятнадцатого века церковь была перестроена, и старый купол Вельша был заменен нынешней неоготической башней. Другие работы к этому периоду относятся верхняя часть кафедры, сиденья хора и органный корпус. Витражи хора относятся к концу девятнадцатого и началу двадцатого веков, а некоторые окна нефа — к середине двадцатого века. После окончания Второй мировой войны некоторые неоготические элементы были заменены чисто готическими, такими как алтарь церкви и некоторые рисунки на стенах и потолках». [136] При таком большом архитектурном разнообразии это представляло собой вызов и возможность объединить различные технологии в большом пространстве с целью получения высокого разрешения. Результаты были довольно хорошими и доступны для просмотра в Интернете.
Digital Preservation Outreach and Education (DPOE), как часть Библиотеки Конгресса, служит для содействия сохранению цифрового контента посредством совместной сети инструкторов и специалистов по управлению коллекциями, работающих в учреждениях культурного наследия. Состоящая из сотрудников Библиотеки Конгресса, Национальной сети инструкторов, Руководящего комитета DPOE и сообщества сторонников образования в области цифрового сохранения, по состоянию на 2013 год DPOE имеет 24 работающих инструктора в шести регионах Соединенных Штатов. [137] В 2010 году DPOE провела оценку, обратившись к архивистам, библиотекарям и другим специалистам по информации по всей стране. Затем рабочая группа инструкторов DPOE разработала учебную программу [138] на основе результатов оценки и других подобных учебных программ по цифровому сохранению, разработанных другими учебными программами, такими как LYRASIS , Educopia Institute, MetaArchive Cooperative, University of North Carolina , DigCCurr (Digital Curation Curriculum) и Cornell University - ICPSR Digital Preservation Management Workshops. Полученные основные принципы также смоделированы на основе принципов, изложенных в «Рамках руководства по созданию хороших цифровых коллекций» Национальной организации по информационным стандартам (NISO). [139]
В Европе Университет Гумбольдта в Берлине и Королевский колледж Лондона предлагают совместную программу по цифровому кураторству Архивировано 2015-12-26 в Wayback Machine , которая делает акцент как на цифровых гуманитарных науках, так и на технологиях, необходимых для долгосрочного кураторства. Магистр наук по управлению и сохранению информации (цифровой), предлагаемый HATII в Университете Глазго, работает с 2005 года и является пионерской программой в этой области.
Разработано множество продуктов с открытым исходным кодом для помощи в цифровом сохранении, включая Archivematica, DSpace , Fedora Commons , OPUS , SobekCM и EPrints . Коммерческий сектор также предлагает программные инструменты для цифрового сохранения, такие как Rosetta компании Ex Libris Ltd. , Cloud компании Preservica, Standard и Enterprise Editions, CONTENTdm, Digital Commons, Equella, intraLibrary, Open Repository и Vital. [140]
Многие исследовательские библиотеки и архивы начали или собираются начать крупномасштабные инициативы по цифровому сохранению (LSDI). Основными игроками в LSDI являются культурные учреждения, коммерческие компании, такие как Google и Microsoft, и некоммерческие группы, включая Open Content Alliance (OCA), Million Book Project (MBP) и HathiTrust . Основной мотивацией этих групп является расширение доступа к научным ресурсам.
Около 30 культурных организаций, включая Комитет по институциональному сотрудничеству (CIC), состоящий из 12 членов , подписали соглашения об оцифровке с Google или Microsoft. Несколько из этих культурных организаций участвуют в Open Content Alliance и Million Book Project. Некоторые библиотеки участвуют только в одной инициативе, а другие диверсифицировали свои стратегии оцифровки, участвуя в нескольких инициативах. Три основные причины участия библиотек в LSDI: доступ, сохранение и исследования и разработки. Есть надежда, что цифровое сохранение обеспечит доступность библиотечных материалов для будущих поколений. Библиотеки обязаны гарантировать постоянный доступ к своим материалам и обязуются архивировать свои цифровые материалы. Библиотеки планируют использовать оцифрованные копии в качестве резервных копий произведений на случай, если они выйдут из печати, испортятся или будут утеряны и повреждены.
Arctic World Archive — это хранилище исторических и культурных данных из нескольких стран, включая открытый исходный код . [61]
Цифровое сохранение относится к серии управляемых действий, необходимых для обеспечения непрерывного доступа к цифровой информации в течение необходимого времени.
Существование устаревших технологий, неорганизованности и плохого хранения теоретически может навсегда отправить видеоигру в спячку — в нее больше никогда не будут играть. За эти годы появились тревожные признания относительно сохранения видеоигр. Например, когда во время интервью с разработчиками поднимались вопросы о переиздании определенных игр, эти разработчики рассказывали о проблемах с потерей или уничтожением игрового производственного материала. Некоторые игры не могли быть переизданы из-за различных проблем. Начала циркулировать одна история о том, что исходный код известной RPG был полностью утерян, что помешало ее переизданию на новой консоли.
Компьютерные программы и видеоигры, распространяемые в устаревших форматах, для которых в качестве условия доступа требуются исходные носители или оборудование, когда обход осуществляется с целью сохранения или архивного воспроизведения опубликованных цифровых произведений библиотекой или архивом. Формат считается устаревшим, если машина или система, необходимые для того, чтобы сделать воспринимаемым произведение, хранящееся в этом формате, больше не производятся или больше не являются разумно доступными на коммерческом рынке.
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )