В информационных технологиях резервная копия или резервное копирование данных — это копия компьютерных данных , взятая и сохраненная в другом месте, чтобы ее можно было использовать для восстановления оригинала после события потери данных . Форма глагола, относящаяся к процессу выполнения этого, — «резервное копирование», тогда как форма существительного и прилагательного — «резервное копирование». [1] Резервные копии могут использоваться для восстановления данных после их потери из -за удаления или повреждения данных или для восстановления данных с более раннего времени. [2] Резервные копии обеспечивают простую форму восстановления ИТ-сбоев ; однако не все системы резервного копирования способны восстановить компьютерную систему или другую сложную конфигурацию, такую как компьютерный кластер , сервер активных каталогов или сервер баз данных . [3]
Система резервного копирования содержит по крайней мере одну копию всех данных, которые считаются достойными сохранения. Требования к хранению данных могут быть большими. Модель хранилища информации может использоваться для обеспечения структуры этого хранилища. Существуют различные типы устройств хранения данных, используемых для копирования резервных копий данных, которые уже находятся во вторичном хранилище, в архивные файлы . [примечание 1] [4] Существуют также различные способы организации этих устройств для обеспечения географического распределения, [5] безопасности данных и портативности .
Данные выбираются, извлекаются и обрабатываются для хранения. Процесс может включать методы работы с живыми данными , включая открытые файлы, а также сжатие, шифрование и дедупликацию . Дополнительные методы применяются к резервному копированию клиент-сервер предприятия . Схемы резервного копирования могут включать пробные прогоны , которые проверяют надежность резервных копируемых данных. Существуют ограничения [6] и человеческие факторы, связанные с любой схемой резервного копирования.
Стратегия резервного копирования требует информационного хранилища, «вторичного хранилища данных» [7] , которое объединяет резервные копии «источников» данных. Репозиторий может быть таким же простым, как список всех резервных носителей (DVD и т. д.) и дат их создания, или может включать компьютеризированный индекс, каталог или реляционную базу данных .
Резервные данные необходимо хранить, что требует схемы ротации резервных копий [4] , которая представляет собой систему резервного копирования данных на компьютерные носители, которая ограничивает количество резервных копий разных дат, сохраняемых отдельно, путем соответствующего повторного использования носителя данных путем перезаписи резервных копий, которые больше не нужны. Схема определяет, как и когда каждая часть съемного хранилища используется для операции резервного копирования и как долго она сохраняется после того, как на ней сохранены резервные данные. Правило 3-2-1 может помочь в процессе резервного копирования. Оно гласит, что должно быть не менее 3 копий данных, хранящихся на 2 различных типах носителей, и одна копия должна храниться вне офиса, в удаленном месте (сюда может входить облачное хранилище ). Следует использовать 2 или более различных носителя, чтобы исключить потерю данных по схожим причинам (например, оптические диски могут выдерживать нахождение под водой, в то время как ленты LTO — нет, а твердотельные накопители не могут выйти из строя из-за сбоев головок или повреждения шпиндельных двигателей, поскольку у них нет движущихся частей, в отличие от жестких дисков). Копия, хранящаяся вне офиса, защищает от пожара, кражи физических носителей (например, лент или дисков) и стихийных бедствий, таких как наводнения и землетрясения. Физически защищенные жесткие диски являются альтернативой копии, хранящейся вне офиса, но у них есть ограничения, например, они могут противостоять огню только в течение ограниченного периода времени, поэтому копия, хранящаяся вне офиса, по-прежнему остается идеальным выбором.
Поскольку идеального хранилища не существует, многие эксперты по резервному копированию рекомендуют хранить вторую копию на локальном физическом устройстве, даже если резервные копии данных также хранятся за пределами офиса. [8] [9] [10] [11]
Неструктурированное хранилище может быть просто стопкой лент, DVD-R или внешних жестких дисков с минимальной информацией о том, что и когда было скопировано. Этот метод наиболее прост в реализации, но вряд ли позволит достичь высокого уровня восстанавливаемости, поскольку ему не хватает автоматизации.
Репозиторий, использующий этот метод резервного копирования, содержит полные копии исходных данных, сделанные в один или несколько определенных моментов времени. Копирование образов системы , этот метод часто используется компьютерными техниками для записи известных хороших конфигураций. Однако создание образов [12] обычно более полезно как способ развертывания стандартной конфигурации для многих систем, а не как инструмент для создания постоянных резервных копий различных систем.
Инкрементная резервная копия хранит данные, измененные с момента отсчета времени. Дубликаты неизмененных данных не копируются. Обычно полная резервная копия всех файлов делается один раз или через нечастые интервалы, служащие точкой отсчета для инкрементного репозитория. Впоследствии, несколько инкрементных резервных копий создаются через последовательные периоды времени. Восстановление начинается с последней полной резервной копии, а затем применяются инкрементные. [13] Некоторые системы резервного копирования [14] могут создаватьсинтетическое полное резервное копирование из серии инкрементных, что обеспечивает эквивалент частого выполнения полного резервного копирования. При изменении одного архивного файла это ускоряет восстановление последних версий файлов.
Непрерывная защита данных (CDP) относится к резервному копированию, которое мгновенно сохраняет копию каждого изменения, внесенного в данные. Это позволяет восстанавливать данные на любой момент времени и является наиболее полной и передовой защитой данных. [15] Приложения резервного копирования Near-CDP — часто продаваемые как «CDP» — автоматически создают инкрементные резервные копии с определенным интервалом, например каждые 15 минут, один час или 24 часа. Поэтому они могут разрешать восстановление только до границы интервала. [15] Приложения резервного копирования Near-CDP используют ведение журнала и, как правило, основаны на периодических «снимках», [16] копиях данных, замороженных только для чтения в определенный момент времени .
Near-CDP (за исключением Apple Time Machine ) [17] намеренно регистрирует каждое изменение в хост-системе, [18] часто сохраняя различия на уровне байтов или блоков, а не на уровне файлов. Этот метод резервного копирования отличается от простого зеркалирования дисков тем, что он позволяет откатить журнал и, таким образом, восстановить старые образы данных. Намеренное регистрирование позволяет принимать меры предосторожности для согласованности живых данных, защищая самосогласованные файлы, но требуя, чтобы приложения «были приостановлены и готовы к резервному копированию».
Почти CDP более практичен для обычных персональных приложений резервного копирования, в отличие от настоящего CDP, который должен работать совместно с виртуальной машиной [19] [20] или эквивалентом [21] и поэтому обычно используется в корпоративных клиент-серверных резервных копиях.
Программное обеспечение может создавать копии отдельных файлов, таких как письменные документы, мультимедийные проекты или пользовательские настройки, чтобы предотвратить потерю данных в результате сбоев записи, вызванных отключением электроэнергии, сбоями операционной системы или исчерпанием дискового пространства. Распространенной реализацией является добавление расширения «.bak» к имени файла .
Метод обратного инкрементального резервного копирования сохраняет недавний архивный файл «зеркало» исходных данных и ряд различий между «зеркалом» в его текущем состоянии и его предыдущими состояниями. Метод обратного инкрементального резервного копирования начинается с полной резервной копии без образа. После выполнения полного резервного копирования система периодически синхронизирует полную резервную копию с живой копией, сохраняя при этом данные, необходимые для реконструкции более старых версий. Это можно сделать либо с помощью жестких ссылок — как это делает Apple Time Machine, либо с помощью двоичных различий .
Дифференциальное резервное копирование сохраняет только те данные, которые изменились с момента последнего полного резервного копирования. Это означает, что для восстановления данных используются максимум две резервные копии из репозитория. Однако по мере увеличения времени с момента последнего полного резервного копирования (и, следовательно, накопленных изменений в данных) увеличивается и время выполнения дифференциального резервного копирования. Восстановление всей системы требует начала с самого последнего полного резервного копирования, а затем применения только последнего дифференциального резервного копирования.
Дифференциальное резервное копирование копирует файлы, которые были созданы или изменены с момента последнего полного резервного копирования, независимо от того, были ли сделаны другие дифференциальные резервные копии с тех пор, тогда как инкрементальное резервное копирование копирует файлы, которые были созданы или изменены с момента самого последнего резервного копирования любого типа (полного или инкрементального). Изменения в файлах могут быть обнаружены с помощью более позднего атрибута даты/времени последнего изменения файла и/или изменений в размере файла. Другие варианты инкрементального резервного копирования включают многоуровневые инкрементальные и инкрементальные на уровне блоков, которые сравнивают части файлов, а не только целые файлы.
Независимо от используемой модели репозитория данные должны быть скопированы на носитель данных архивного файла. Используемый носитель также называется типом назначения резервной копии.
Магнитная лента долгое время была наиболее часто используемым носителем для хранения больших объемов данных, резервного копирования, архивирования и обмена. Раньше это был менее дорогой вариант, но теперь это не так для небольших объемов данных. [22] Лента является носителем последовательного доступа , поэтому скорость непрерывной записи или чтения данных может быть очень высокой. Хотя ленточный носитель сам по себе имеет низкую стоимость за единицу пространства, ленточные накопители обычно в десятки раз дороже жестких дисков и оптических приводов .
Многие форматы лент были запатентованы или специфичны для определенных рынков, таких как мэйнфреймы или конкретная марка персональных компьютеров. К 2014 году LTO стала основной технологией лент. [23] Другим оставшимся жизнеспособным «супер» форматом является IBM 3592 (также называемый серией TS11xx). Oracle StorageTek T10000 был снят с производства в 2016 году. [24]
Использование жестких дисков для хранения данных со временем возросло, поскольку они стали постепенно дешевле. Жесткие диски обычно просты в использовании, широко доступны и к ним можно быстро получить доступ. [23] Однако резервные копии жестких дисков являются механическими устройствами с малым допуском и могут быть повреждены легче, чем ленты, особенно при транспортировке. [25] В середине 2000-х годов несколько производителей дисков начали выпускать портативные диски, использующие технологию загрузки по пандусу и акселерометра (иногда называемую «датчиком удара»), [26] [27] и к 2010 году средний показатель по отрасли в испытаниях на падение для дисков с этой технологией показал, что диски остаются целыми и работают после падения с 36-дюймовой высоты на промышленное ковровое покрытие в нерабочем состоянии. [28] Некоторые производители также предлагают «защищенные» портативные жесткие диски, которые включают в себя амортизирующий корпус вокруг жесткого диска и заявляют о ряде более высоких характеристик падений. [28] [29] [30] В течение нескольких лет стабильность резервных копий на жестком диске короче, чем у резервных копий на ленте. [24] [31] [25]
Внешние жесткие диски могут быть подключены через локальные интерфейсы, такие как SCSI , USB , FireWire или eSATA , или через технологии с большим расстоянием, такие как Ethernet , iSCSI или Fibre Channel . Некоторые дисковые системы резервного копирования, через виртуальные ленточные библиотеки или иным образом, поддерживают дедупликацию данных, что может уменьшить объем дискового хранилища, потребляемый ежедневными и еженедельными данными резервного копирования. [32] [33] [34]
Оптические накопители используют лазеры для хранения и извлечения данных. Записываемые CD , DVD и Blu-ray диски обычно используются с персональными компьютерами и, как правило, дешевы. Емкость и скорость этих дисков обычно ниже, чем у жестких дисков или лент. Достижения в области оптических носителей могут сократить этот разрыв в будущем. [35] [36]
Потенциальные будущие потери данных, вызванные постепенной деградацией носителя , можно предсказать , измерив частоту исправимых незначительных ошибок данных , из которых слишком много последовательно увеличивают риск неисправимых секторов. Поддержка сканирования ошибок различается среди поставщиков оптических приводов . [37]
Многие форматы оптических дисков относятся к типу WORM , что делает их полезными для архивных целей, поскольку данные не могут быть изменены. Более того, оптические диски неуязвимы к сбоям головок , магнетизму, неизбежному попаданию воды или скачкам напряжения ; а неисправность привода обычно просто останавливает вращение.
Оптические носители являются модульными ; контроллер хранилища не привязан к самому носителю, как в случае с жесткими дисками или флэш-накопителями (→ контроллер флэш-памяти ), что позволяет извлекать его и получать доступ через другой диск. Однако записываемые носители могут деградировать раньше при длительном воздействии света. [38]
Некоторые оптические системы хранения данных позволяют создавать каталогизированные резервные копии данных без человеческого контакта с дисками, что обеспечивает более длительную целостность данных. Французское исследование 2008 года показало, что срок службы обычно продаваемых CD-R составляет 2–10 лет, [39] но один производитель позже оценил долговечность своих CD-R с золотым напылением в 100 лет. [40] Собственный архив оптических дисков Sony [23] может в 2016 году достичь скорости чтения 250 МБ/с. [41]
Твердотельные накопители (SSD) используют интегральные схемы для хранения данных. Флэш-память , флэш-накопители , USB-флеш-накопители , CompactFlash , SmartMedia , Memory Sticks и устройства Secure Digital card относительно дороги из-за своей малой емкости, но удобны для резервного копирования относительно небольших объемов данных. Твердотельный накопитель не содержит подвижных частей, что делает его менее восприимчивым к физическим повреждениям, и может иметь огромную пропускную способность около 500 Мбит/с до 6 Гбит/с. Доступные SSD стали более емкими и дешевыми. [42] [29] Резервные копии флэш-памяти стабильны в течение меньшего количества лет, чем резервные копии жестких дисков. [24]
Удаленные службы резервного копирования или облачные резервные копии подразумевают хранение данных поставщиками услуг вне офиса. Это использовалось для защиты от таких событий, как пожары, наводнения или землетрясения, которые могли уничтожить локально сохраненные резервные копии. [43] Облачное резервное копирование (через такие службы, как Google Drive и Microsoft OneDrive или аналогичные им ) обеспечивает уровень защиты данных. [25] Однако пользователи должны доверять поставщику в сохранении конфиденциальности и целостности своих данных, причем конфиденциальность повышается за счет использования шифрования . Поскольку скорость и доступность ограничены подключением пользователя к сети, [25] пользователям с большими объемами данных может потребоваться использовать облачное заполнение и масштабное восстановление.
Различные методы могут использоваться для управления резервными носителями, обеспечивая баланс между доступностью, безопасностью и стоимостью. Эти методы управления носителями не являются взаимоисключающими и часто комбинируются для удовлетворения потребностей пользователя. Использование онлайн-дисков для подготовки данных перед отправкой в ближайшую ленточную библиотеку является распространенным примером. [44] [45]
Онлайн- хранилище резервных копий обычно является наиболее доступным типом хранения данных и может начать восстановление за миллисекунды. Внутренний жесткий диск или дисковый массив (возможно, подключенный к SAN ) является примером онлайн-резервного копирования. Этот тип хранилища удобен и быстр, но уязвим для удаления или перезаписи, как случайно, так и в результате злонамеренных действий или в результате вредоносной нагрузки, удаляющей данные.
Nearline-хранение обычно менее доступно и менее затратно, чем онлайн-хранение, но все равно полезно для резервного хранения данных. Механическое устройство обычно используется для перемещения носителей из хранилища в дисковод, где данные могут быть прочитаны или записаны. Обычно оно имеет свойства безопасности, аналогичные онлайн-хранению. Примером может служить ленточная библиотека со временем восстановления от нескольких секунд до нескольких минут.
Оффлайновое хранилище требует некоторых прямых действий для предоставления доступа к носителям данных: например, вставка ленты в ленточный накопитель или подключение кабеля. Поскольку данные не доступны ни через один компьютер, за исключением ограниченных периодов, в течение которых они записываются или считываются обратно, они в значительной степени невосприимчивы к режимам сбоев резервного копирования в режиме онлайн. Время доступа зависит от того, находятся ли носители на месте или за его пределами.
Резервные носители могут быть отправлены в хранилище за пределами площадки для защиты от катастрофы или другой проблемы, специфичной для площадки. Хранилище может быть таким же простым, как домашний офис системного администратора, или таким же сложным, как защищенный от катастроф, температурно-контролируемый, высокозащищенный бункер с возможностями для хранения резервных носителей. Реплика данных может быть как за пределами площадки, так и в режиме онлайн (например, зеркало RAID за пределами площадки ).
Резервный сайт или центр аварийного восстановления используется для хранения данных, которые могут позволить восстановить и правильно настроить компьютерные системы и сети в случае аварии. Некоторые организации имеют собственные центры восстановления данных, в то время как другие передают это на подряд третьей стороне. Из-за высоких затрат резервное копирование редко считается предпочтительным методом перемещения данных на сайт аварийного восстановления. Более типичным способом было бы удаленное зеркалирование диска , которое поддерживает данные аварийного восстановления в максимально актуальном состоянии.
Операция резервного копирования начинается с выбора и извлечения связных единиц данных. Большинство данных в современных компьютерных системах хранится в дискретных единицах, известных как файлы . Эти файлы организованы в файловые системы . Решение о том, что именно следует резервировать в любой момент времени, требует компромиссов. При резервном копировании слишком большого количества избыточных данных хранилище информации будет заполняться слишком быстро. Резервное копирование недостаточного количества данных может в конечном итоге привести к потере критически важной информации. [46]
Файлы, которые активно обновляются, представляют собой проблему для резервного копирования. Один из способов резервного копирования живых данных — временно заморозить их (например, закрыть все файлы), сделать «снимок» и затем возобновить живые операции. На этом этапе снимок можно скопировать обычными методами. [50] Снимок — это мгновенная функция некоторых файловых систем , которая представляет копию файловой системы, как если бы она была заморожена в определенный момент времени, часто с помощью механизма копирования при записи . Снимок файла во время его изменения приводит к повреждению файла, который становится непригодным для использования. Это также касается взаимосвязанных файлов, как это можно найти в обычной базе данных или в таких приложениях, как Microsoft Exchange Server . [16] Термин нечеткое резервное копирование может использоваться для описания резервного копирования живых данных, которые выглядят так, как будто они работали правильно, но не представляют состояние данных в определенный момент времени. [51]
Варианты резервного копирования файлов данных, которые не могут быть заморожены или не заморожены, включают: [52]
Не вся информация, хранящаяся на компьютере, хранится в файлах. Точное восстановление полной системы с нуля требует отслеживания и этих нефайловых данных . [57]
Часто бывает полезно или необходимо манипулировать резервируемыми данными для оптимизации процесса резервного копирования. Эти манипуляции могут улучшить скорость резервного копирования, скорость восстановления, безопасность данных, использование носителя и/или снизить требования к пропускной способности.
Устаревшие данные могут быть автоматически удалены, но для персональных приложений резервного копирования — в отличие от корпоративных клиент-серверных приложений резервного копирования, где автоматическая «очистка» данных может быть настроена — удаление [примечание 2] [58] [59] может быть максимум [60] отложено на глобальном уровне или отключено. [61]
Различные схемы могут быть использованы для уменьшения размера исходных данных, которые будут храниться, так что они будут использовать меньше места для хранения. Сжатие часто является встроенной функцией оборудования ленточного накопителя. [62]
Избыточность из-за резервного копирования аналогично настроенных рабочих станций может быть уменьшена, таким образом, сохраняя только одну копию. Этот метод может применяться на уровне файлов или необработанных блоков. Это потенциально большое сокращение [62] называется дедупликацией . Это может происходить на сервере до того, как какие-либо данные перемещаются на резервный носитель, иногда это называется дедупликацией на стороне источника/клиента. Этот подход также уменьшает полосу пропускания, необходимую для отправки данных резервного копирования на целевой носитель. Процесс также может происходить на целевом устройстве хранения, иногда это называется встроенной или внутренней дедупликацией.
Иногда резервные копии дублируются на второй набор носителей. Это может быть сделано для переупорядочивания архивных файлов для оптимизации скорости восстановления или для того, чтобы иметь вторую копию в другом месте или на другом носителе — как в возможности резервного копирования с диска на диск на ленту в Enterprise client-server backup.
Съемные носители большой емкости, такие как резервные ленты, представляют риск для безопасности данных в случае их утери или кражи. [63] Шифрование данных на этих носителях может смягчить эту проблему, однако шифрование является процессом, интенсивно использующим процессор, что может замедлить скорость резервного копирования, а безопасность зашифрованных резервных копий эффективна только настолько, насколько эффективна политика управления ключами. [62]
Когда компьютеров, подлежащих резервному копированию, намного больше, чем целевых устройств хранения, возможность использовать одно устройство хранения с несколькими одновременными резервными копиями может быть полезной. [64] Однако заполнение запланированного окна резервного копирования с помощью «мультиплексного резервного копирования» используется только для ленточных устройств назначения. [64]
Процесс перераспределения наборов резервных копий в архивном файле называется рефакторингом. Например, если система резервного копирования использует одну ленту каждый день для хранения инкрементальных резервных копий для всех защищенных компьютеров, восстановление одного из компьютеров может потребовать много лент. Рефакторинг может использоваться для консолидации всех резервных копий для одного компьютера на одной ленте, создавая «синтетическую полную резервную копию». Это особенно полезно для систем резервного копирования, которые делают инкрементальные резервные копии в стиле forever.
Иногда резервные копии копируются на промежуточный диск перед копированием на ленту. [64] Этот процесс иногда называют D2D2T, аббревиатурой от Disk-to-disk-to-tape . Он может быть полезен, если есть проблема согласования скорости конечного устройства назначения с исходным устройством, что часто встречается в сетевых системах резервного копирования. Он также может служить централизованным местом для применения других методов манипулирования данными.
О резервном копировании
Похожие темы
жесткий диск ... известная компания ... объявила о банкротстве ... где многие ... имели ...
В смысле подхода к управлению данными хранилище информации — это вторичное хранилище данных.
Настоящий подход CDP должен захватывать все записи данных, тем самым непрерывно создавая резервные копии данных и устраняя окна резервного копирования.... CDP является золотым стандартом — наиболее всеобъемлющей и передовой защитой данных. Но технологии "почти CDP" могут обеспечить достаточную защиту для многих компаний с меньшей сложностью и стоимостью. Например, моментальные снимки могут обеспечить разумный уровень защиты, близкий к CDP, для общих файловых ресурсов, позволяя пользователям напрямую получать доступ к данным на общем файловом ресурсе через регулярные интервалы времени — скажем, каждые полчаса или 15 минут. Это, безусловно, более высокий уровень защиты, чем ночное резервное копирование на основе ленты или диска, и, возможно, это все, что вам нужно.
... копирует данные из источника в цель. True CDP делает это каждый раз, когда вносится изменение, в то время как так называемый near-CDP делает это через заранее заданные интервалы времени. Near-CDP фактически то же самое, что и моментальный снимок.... True CDP systems записывает каждую запись и копирует их в цель, где все изменения сохраняются в журнале. [новый абзац] Напротив, near-CDP/snapshot systems копируют файлы простым способом, но требуют, чтобы приложения были приостановлены и подготовлены к резервному копированию, либо через режим резервного копирования приложения, либо с помощью, например, служб теневого копирования томов (VSS) от Microsoft.
Хранилище событий файловой системы — это скрытый журнал, который OSX ведет на каждом отформатированном в HFS+ диске/разделе об изменениях, внесенных в данные на нем. Он не перечисляет все измененные файлы, но каждый каталог (папку), в котором что-либо было изменено.
разделяет операции ввода-вывода записи в VMDK/RDM виртуальной машины и отправляет копию в производственный VMDK, а также в кластер RecoverPoint for VMs.
не использует технологию моментальных снимков, как Veeam. Вместо этого Zerto развертывает небольшие виртуальные машины на своих физических хостах. Эти виртуальные машины Zerto захватывают данные по мере их записи на хост, а затем отправляют копию этих данных на сайт репликации.....Однако у Veeam есть преимущество в том, что он может более эффективно захватывать и хранить данные для долгосрочных нужд хранения. Существует также значительная разница в ценах: Veeam дешевле Zerto.
CloudEndure выполняет начальное чтение на уровне блоков содержимого любого тома, подключенного к серверу, и реплицирует его на сервер репликации. Затем агент действует как фильтр чтения на уровне ОС для захвата записей и синхронизации любых изменений на уровне блоков с сервером репликации CloudEndure, обеспечивая практически нулевую RPO.
Эффективное удаленное резервное копирование требует регулярного резервного копирования производственных данных в место, достаточно удаленное от основного местоположения, чтобы оба местоположения не были затронуты одним и тем же разрушительным событием.