Цифровое устаревание — это риск потери данных из-за невозможности доступа к цифровым активам из-за того, что необходимое для поиска информации оборудование или программное обеспечение постоянно заменяется новыми устройствами и системами, что приводит к все более несовместимым форматам. [2] [3] Хотя угроза возможного « цифрового темного века » (когда большие объемы важной культурной и интеллектуальной информации, хранящейся в архаичных форматах, становятся безвозвратно утерянными) изначально не вызывала беспокойства до 1990-х годов, современные усилия по цифровому сохранению в области информации и архивирования внедрили протоколы и стратегии, такие как миграция данных и технический аудит, в то время как спасение и эмуляция устаревшего оборудования и программного обеспечения решают проблему цифрового устаревания, чтобы ограничить потенциальный ущерб для долгосрочного доступа к информации. [3] [4] [5]
Ложное чувство безопасности сохраняется в отношении цифровых документов: поскольку из исходных файлов можно создать бесконечное количество идентичных копий, многие пользователи полагают, что их документы имеют практически неограниченный срок хранения. [5] В действительности носители, используемые для хранения и доступа к цифровой информации, представляют собой уникальные проблемы сохранности по сравнению со многими физическими форматами, традиционно используемыми архивами и библиотеками. Бумажные материалы и печатные носители, перенесенные на пленочные микроформы , например, могут быть доступны в течение столетий, если они созданы и поддерживаются в идеальных условиях, по сравнению с всего лишь десятилетиями физической стабильности, предлагаемыми магнитной лентой и диском или оптическими форматами . [7] Таким образом, цифровые носители имеют более неотложные проблемы сохранности, чем постепенное изменение письменного или устного языка, наблюдаемое с печатным словом.
Мало профессиональных размышлений в области библиотечного и архивного дела было направлено на тему цифрового устаревания, поскольку использование компьютеризированных систем становилось все более распространенным и обычным, но в 1990-х годах началось много обсуждений. [4] [5] Несмотря на это, было предложено мало вариантов в качестве подлинных альтернатив стандартному методу непрерывной миграции данных на все более новые носители информации, которые использовались с тех пор, как магнитная лента начала сменять бумажные перфокарты в качестве практического хранилища данных в 1960-х и 1970-х годах. [4] [8] [9] Эти основные методы миграции сохраняются и в современную эпоху жестких дисков и твердотельных накопителей, поскольку исследования показали, что многие цифровые носители информации часто служат значительно меньше в полевых условиях по сравнению с заявлениями производителей или лабораторными испытаниями, что привело к шутливому замечанию, что «цифровые документы хранятся вечно — или пять лет, в зависимости от того, что наступит раньше». [5]
Причины цифрового устаревания не всегда чисто технические. Капиталистическое накопление и потребительство были названы ключевыми мотиваторами цифрового устаревания в обществе, при этом вновь представленные продукты часто имеют большую ценность, чем старые продукты. [10] Цифровое сохранение зависит от постоянного обслуживания и использования аппаратных и программных форматов, которым может помешать угроза устаревания. В сфере доступа к аппаратному и программному обеспечению существует четыре типа цифрового устаревания:. [4]
Поскольку большая часть цифровой информации зависит от двух факторов — хранения и поиска, — важно отдельно классифицировать, как цифровое устаревание влияет на цифровую сохранность как через аппаратные, так и через программные средства.
Проблемы с оборудованием двояки в архивных и библиотечных областях: в дополнение к физическому носителю информации магнитной ленты, оптического диска или твердотельной компьютерной памяти для доступа к информации часто требуется отдельное электронное устройство. И хотя надлежащее хранение может помочь смягчить некоторые экологические уязвимости форматов хранения (включая пыль, влажность, радиацию и температуру) и продлить сохранность на десятилетия, существуют и другие неизбежные факторы опасности. [12] [7] Магнитная лента и дискеты уязвимы как к ухудшению адгезива, удерживающего магнитный слой данных на его подложке, так и к размагничиванию слоя данных, обычно называемому « битовой гнилью »; оптические диски особенно восприимчивы к физическому повреждению их считываемой поверхности и к окислению, происходящему между неправильно запечатанными внешними слоями; процесс, называемый « дисковой гнилью » или, неточно, «лазерной гнилью» (особенно в отношении LaserDiscs). [13] Более старые формы памяти с плавающим затвором на основе МОП-транзисторов, предназначенные только для чтения, такие как (некоторые) картриджи и (большинство) карт памяти, сталкиваются со своей собственной формой битовой порчи, когда заряды, представляющие отдельные биты двоичной информации, рассеиваются после определенного уровня (называемого «переворачиванием»), и данные становятся нечитаемыми. [14]
Работоспособность соответствующего формату устройства воспроизведения или записи имеет свои собственные уязвимости. Кассетные деки и дисководы полагаются на функциональность прецизионно изготовленных подвижных частей, которые подвержены повреждениям, вызванным повторяющимися физическими нагрузками и посторонними материалами, такими как пыль и грязь. Плановое обслуживание, калибровка и операции по очистке могут помочь продлить срок службы многих устройств, но сломанные или вышедшие из строя детали потребуют ремонта или замены: поиск деталей становится все более сложным и дорогим, поскольку запасы для старых машин достигают дефицита, а технические навыки пользователей становятся все более сложными, поскольку новые машины и форматы хранения используют меньше электромеханических деталей и больше интегральных схем и других сложных компонентов. [12]
Всего лишь спустя десятилетие после программы Viking 1970-х годов сотрудники NASA обнаружили , что большая часть данных миссии, хранящихся на магнитных лентах, включая более 3000 необработанных изображений поверхности Марса, переданных двумя зондами Viking, была недоступна из-за множества факторов. [15] Несмотря на то, что агентство обладало неразборчивыми записями, написанными давно ушедшими или умершими программистами, компьютерное оборудование и исходный код, необходимые для правильной работы декодирующего программного обеспечения, были заменены и утилизированы. [15] [4] Информация в конечном итоге была восстановлена после более чем года обратного проектирования того, как необработанные данные были закодированы на лентах, что включало консультации с первоначальными инженерами камер и оборудования для получения изображений посадочных модулей Viking. [15] NASA столкнулось с похожими проблемами при попытке восстановить и обработать изображения с лунных орбитальных миссий 1960-х годов. Инженеры Лаборатории реактивного движения в 1990 году признали, что после годичного поиска, в результате которого на базе ВВС США был обнаружен совместимый считыватель ленточных данных, недостающую часть, возможно, придется восстановить собственными силами, если замену нельзя будет найти на складах по утилизации компьютеров. [15]
За последние несколько десятилетий существовало множество различных, когда-то отраслевых стандартных форматов файлов и платформ приложений для данных, изображений и текста, которые неоднократно заменялись и вытеснялись новыми итерациями форматов программного обеспечения и приложений, часто со все большей степенью несовместимости друг с другом и по их собственным линейкам продуктов. Такие несовместимости теперь часто распространяются на то, какая версия операционной системы установлена в системе (например, экземпляры Microsoft Works, предшествующие версии 4.5, не могли работать в операционной системе Windows 2000 и более поздних версиях). Один из примеров отмены разработчиком запланированного устаревания произошел в 2008 году, когда Microsoft отказалась от намерений пакета услуг Office прекратить поддержку ряда старых форматов файлов из-за интенсивности общественного возмущения. [16]
Системное устаревание программного обеспечения можно проиллюстрировать на примере истории текстового процессора WordStar . Популярный вариант для редактирования документов WYSIWYG в операционных системах C/PM и MS-DOS в 1980-х годах, запоздалый порт на Windows 1.0 привел к тому, что WordStar к 1991 году потерял значительную долю рынка в пользу конкурентов WordPerfect и Microsoft Word . [17] [18] Дальнейшая разработка версии для Windows прекратилась в 1994 году, а WordStar 7 для MS-DOS последний раз обновлялся в 1999 году. [19] Со временем любая версия WordStar становилась все более несовместимой с современными версиями Windows после 3.1 , что вызвало разочарование давних преданных пользователей, включая авторов Уильяма Ф. Бакли-младшего и Энн Райс . [20] [21]
Цифровое устаревание оказывает заметное влияние на сохранение истории видеоигр, поскольку многие старые игры и оборудование рассматривались игроками как недолговечные продукты из-за непрерывного процесса обновления компьютерного оборудования и циклов поколений домашних консолей . Такие циклы часто являются результатом как системного, так и технического устаревания. Некоторые из старейших компьютерных игр, такие как Spacewar! 1962 года для коммерческого мини-компьютера PDP-1 , были разработаны для аппаратных платформ, настолько устаревших, что сегодня их практически не существует. [22] Во многие старые игры 1960-х и 1970-х годов, созданные для современных мэйнфреймовых терминалов и микрокомпьютеров, сегодня можно играть только с помощью программной эмуляции . В то время как видеоигры и другие программные приложения могут быть оставлены их родительскими разработчиками или издательскими компаниями, вопросы авторских прав, связанные с программным обеспечением, являются очень сложным препятствием на пути цифрового сохранения. [22]
Одним из ярких примеров проблем с авторскими правами на программное обеспечение были те, которые возникли во время усилий по сохранению для проекта BBC Domesday Project, британского исследования по сбору мультимедийных данных 1986 года, которое было посвящено 900-летию оригинальной Книги Страшного суда . В то время как специально настроенный считыватель LaserDisc для проекта привел к собственным проблемам с сохранением на аппаратном уровне, сочетание миллиона личных авторских прав, принадлежащих участвующим гражданским лицам, в дополнение к корпоративным претензиям на специализированное компьютерное оборудование, означает, что общедоступные усилия по цифровому сохранению могут быть приостановлены до 2090 года. [23] [24]
Организации, имеющие цифровые архивы, должны проводить оценку своих записей, чтобы определить повреждение файлов и снизить риски, связанные с устареванием форматов файлов. Такие оценки могут быть выполнены с помощью внутренних планов действий по форматам файлов, которые перечисляют типы цифровых файлов в архивных фондах и оценивают действия, предпринятые для обеспечения постоянной доступности. [25]
Одним из новых стратегических направлений в борьбе с цифровым устареванием является принятие программного обеспечения с открытым исходным кодом , благодаря доступности исходного кода, прозрачности и потенциальной адаптивности в современных аппаратных средах. [26] [27] Например, приложение OpenOffice от Apache Software Foundation поддерживает доступ к ряду устаревших форматов текстовых процессоров, включая версию 6 Microsoft Word , и базовую поддержку версии 4 WordPerfect . [16] Это контрастирует с критикой, направленной на собственный предполагаемый формат Open XML Microsoft со стороны сообщества разработчиков программного обеспечения с открытым исходным кодом за соглашения о неразглашении и требования переводчиков. [27]
Стандартные стратегии цифрового сохранения, используемые информационными учреждениями, часто взаимосвязаны или иным образом связаны по функциям или целям. Копирование битового потока (или резервное копирование данных ) является основополагающей операцией, часто применяемой до многих других практик, и облегчает создание избыточности нескольких мест хранения: обновление представляет собой транспортировку неизменных данных, часто между идентичными или функционально схожими форматами хранения, в то время как миграция преобразует формат или кодирование цифровой информации, чтобы обеспечить ее перемещение между различными операционными системами и поколениями оборудования. [4] Нормализация снижает организационную сложность для архивных учреждений за счет сокращения количества схожих типов файлов посредством преобразования, а инкапсуляция собирает цифровую информацию со связанными с ней метаданными, чтобы гарантировать доступность информации. [4] Цифровые архивы используют канонизацию, чтобы гарантировать, что ключевые аспекты документов сохранились после процесса преобразования, в то время как опора на стандарты, установленные региональными архивными учреждениями, поддерживает организацию в более широком спектре области. [4] Сохранение технологий (также называемое компьютерным музеем ) и цифровая археология соответственно включают учреждения, сохраняющие владение или доступ к устаревшим аппаратным и программным платформам, а также методы спасения, используемые для восстановления цифровой информации с поврежденных или устаревших носителей и устройств. [4] После восстановления некоторые данные, такие как документация, могут быть преобразованы в аналоговые резервные копии в форме физически доступных копий, в то время как исполняемый код может быть запущен через платформы эмуляции в современных аппаратных и программных средах, разработанных для имитации устаревших компьютерных систем. [4]
В 1999 году Джефф Ротенберг критиковал многие современные процедуры сохранения и то, как они неправильно решали проблему цифрового устаревания как наиболее значимую проблему долгосрочного хранения цифровой информации. Ротенберг не одобрял зависимость от бумажных копий, утверждая, что печать цифровых документов лишает их присущих им «цифровых» качеств, включая машиночитаемость и динамические пользовательские функции. [5] Компьютерные музеи также упоминались как неадекватная практика. Существуют практические ограничения ограниченного числа мест, способных поддерживать устаревшее оборудование вечно, что реалистично ограничивает возможности полного доступа к устаревшим цифровым документам: кроме того, большинство старых данных редко существуют в форматах кодирования, чтобы в полной мере использовать их исходные аппаратные или программные среды. [5] Два процесса цифрового сохранения, которые особенно критиковались, были внедрение стандартов реляционных баз данных (RDB) и чрезмерная зависимость от миграции. Хотя РБД и функции их систем управления (РСУБД) были разработаны для стандартизации, они часто способствовали непреднамеренным племенным практикам среди региональных учреждений, внося несовместимости между РБД: между тем, повсеместность миграции файлов и программ часто рисковала не компенсировать конверсионные сдвиги парадигмы между все более новыми программными средами. [5] Эмуляция, при которой цифровые данные поддерживаются инкапсуляцией метаданных, документации и спецификаций программного обеспечения и среды эмуляции, была признана наиболее идеальной практикой сохранения перед лицом цифрового устаревания. [5]
Национальный архив Великобритании опубликовал вторую редакцию своей Модели зрелости обеспечения информации (IAMM) в 2009 году, в которой рассматривается управление рисками цифрового устаревания для учреждений и предприятий. После инструктажа старших владельцев информационных рисков по первоначальным требованиям, которые определяют как потенциальный риск цифрового устаревания, так и смягчающие действия по его противодействию, руководство анализирует многоэтапный процесс по поддержанию цифровой непрерывности архивной информации. [28] Такие шаги охватывают весь спектр от обеспечения ответственности за непрерывность информации и подтверждения степени метаданных контента до обеспечения обнаружения критически важной информации посредством институционального использования и того, что миграция системы не влияет на доступность информации, до гарантии поддержки ИТ и обеспечения планов действий на случай непредвиденных обстоятельств для обеспечения выживаемости информации посредством организационных изменений. [28]
В 2014 году Национальный альянс по цифровому управлению рекомендовал разработать планы действий по форматам файлов, заявив, что «важно перейти от более абстрактных соображений об устаревании форматов файлов к разработке действенных стратегий для мониторинга и извлечения информации о разнородных цифровых файлах, которыми управляют организации». [29] Другими важными ресурсами для поддержки оценки являются страница Библиотеки Конгресса «Устойчивость цифровых форматов» и онлайн-реестр форматов файлов PRONOM Национального архива Великобритании .
ЦЕРН начал свой проект «Цифровая память» в 2016 году, стремясь сохранить десятилетия медиапродукции организации с помощью стандартизированных инициатив. [30] ЦЕРН определил, что их решение потребует постоянного доступа к метаданным, скорейшего внедрения архива Открытой архивной информационной системы (OAIS) для сокращения расходов и предварительного выполнения плана архивирования любой новой системы. [30] Используя OAIS, ЦЕРН разработал сертификацию для надежных цифровых репозиториев (TDR), стандарт ISO 16363 и внедрил E-Ternity в качестве прототипа для своей модели соответствующего цифрового архива. [30]
1 января 2021 года Adobe прекратила поддержку и заблокировала запуск контента в своем Flash Player в ответ на достижения в области открытых стандартов для Интернета. [31] Это действие последовало за объявлением от июля 2017 года, несмотря на то, что оно в разной степени повлияло на пользовательский опыт миллионов веб-сайтов. [32] С января 2018 года Архив Flashpoint стал одним из нескольких проектов по сохранению Adobe Flash Player, в ходе которого было спасено более 160 000 анимаций и игр. [33]
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite web}}
: Отсутствует или пусто |title=
( помощь )