Непрерывная защита данных ( CDP ), также называемая непрерывным резервным копированием или резервным копированием в реальном времени , относится к резервному копированию компьютерных данных путем автоматического сохранения копии каждого изменения, внесенного в эти данные, по сути, захватывая каждую версию данных, сохраненную пользователем. В своей истинной форме она позволяет пользователю или администратору восстанавливать данные на любой момент времени. [1] Эта техника была запатентована британским предпринимателем Питом Малкольмом в 1989 году как «система резервного копирования, в которой копия [выделено редактором] каждого изменения, внесенного в носитель информации, записывается по мере возникновения изменения [выделено редактором]». [2]
В идеальном случае непрерывной защиты данных целевой показатель точки восстановления — «максимальный целевой период, в течение которого данные (транзакции) могут быть утеряны из ИТ-службы из-за серьезного инцидента» — равен нулю, даже если целевой показатель времени восстановления — «целевая продолжительность времени и уровень обслуживания, в течение которых бизнес-процесс должен быть восстановлен после аварии (или сбоя), чтобы избежать неприемлемых последствий, связанных с нарушением непрерывности бизнеса» — не равен нулю. [3] Примером периода, в течение которого могут быть утеряны транзакции данных, является крупная дисконтная сеть, в которой считыватели карт на кассах были отключены в нескольких местах почти на два часа в июне 2019 года.
CDP работает как служба, которая фиксирует изменения данных в отдельном месте хранения. Существует несколько методов фиксации непрерывных изменений данных в реальном времени , включающих различные технологии, которые обслуживают различные потребности. Решения на основе CDP могут обеспечить тонкую детализацию восстанавливаемых объектов, начиная от устойчивых к сбоям изображений и заканчивая логическими объектами, такими как файлы, почтовые ящики, сообщения, файлы баз данных и журналы. [4] Это не обязательно относится к решениям, близким к CDP .
Настоящая непрерывная защита данных отличается от традиционного резервного копирования тем, что не нужно указывать момент времени для восстановления до готовности к восстановлению. [5] Традиционные резервные копии восстанавливают данные только с момента создания резервной копии. Настоящая непрерывная защита данных, в отличие от «моментальных снимков», не имеет расписаний резервного копирования. [5] Когда данные записываются на диск, они также асинхронно записываются во второе место, либо на другой компьютер по сети [6], либо на устройство. [7] Это приводит к некоторым накладным расходам на операции записи на диск, но устраняет необходимость в запланированном резервном копировании.
Позволяет восстанавливать данные на любой момент времени, «CDP является золотым стандартом — наиболее всеобъемлющей и передовой защитой данных. Но технологии «почти CDP» могут обеспечить достаточную защиту для многих компаний с меньшей сложностью и стоимостью. Например, моментальные снимки [уточнение «почти CDP» в разделе ниже ] могут обеспечить разумный уровень защиты, близкий к CDP, для общих файловых ресурсов, позволяя пользователям напрямую получать доступ к данным на общем файловом ресурсе через регулярные интервалы времени — скажем, каждые полчаса или 15 минут. Это, безусловно, более высокий уровень защиты, чем ночные резервные копии на основе ленты или диска, и, возможно, это все, что вам нужно». [1] Поскольку «почти CDP выполняет это [копирование] через заданные интервалы времени», [8] это по сути инкрементное резервное копирование , инициируемое — отдельно для каждой исходной машины — таймером, а не сценарием.
Поскольку истинные CDP «операции резервной записи выполняются на уровне базовой системы ввода-вывода (BIOS) микрокомпьютера таким образом, что это не влияет на нормальное использование компьютера», [2] истинное резервное копирование CDP на практике должно выполняться совместно с виртуальной машиной [6] [9] или эквивалентом [10] — что исключает его для обычных персональных приложений резервного копирования. Поэтому оно обсуждается в статье «Корпоративное клиент-серверное резервное копирование» , а не в статье « Резервное копирование ».
Некоторые решения, позиционируемые как непрерывная защита данных , могут разрешать восстановление только через фиксированные интервалы, такие как 15 минут, один час или 24 часа, поскольку они автоматически создают инкрементные резервные копии через эти интервалы. Такие схемы «почти CDP» — сокращение от «почти непрерывной защиты данных » — не являются общепризнанными как настоящая непрерывная защита данных, поскольку они не предоставляют возможности восстановления на любой момент времени. Когда интервал короче одного часа, [11] решения «почти CDP» — например, Arq Backup [12] — обычно основаны на периодических «моментальных снимках» ; «чтобы избежать простоя, системы высокой доступности могут вместо этого выполнять резервное копирование на ... копии набора данных, доступной только для чтения, замороженной в определенный момент времени, — и позволять приложениям продолжать записывать свои данные».
В отрасли ведутся дебаты о том, должна ли гранулярность резервного копирования быть «каждой записью», чтобы быть CDP, или достаточно ли решения «почти CDP», которое захватывает данные каждые несколько минут. Последнее иногда называют почти непрерывным резервным копированием . Дискуссия зависит от использования термина «непрерывный» : должен ли только процесс резервного копирования быть непрерывно автоматически запланированным , что часто достаточно для достижения преимуществ, указанных выше , или же возможность восстановления из резервной копии также должна быть непрерывной. Ассоциация индустрии сетевых устройств хранения данных (SNIA) использует определение «каждой записи». [5]
В статье «Резервное копирование» есть краткий подраздел об этом, который теперь переименован в «Near-CDP» во избежание путаницы.
Непрерывная защита данных отличается от RAID , репликации или зеркалирования тем, что эти технологии защищают только одну копию данных (самую последнюю). Если данные повреждены таким образом, что это не обнаруживается немедленно, эти технологии просто защищают поврежденные данные без возможности восстановления неповрежденной версии.
Непрерывная защита данных защищает от некоторых последствий повреждения данных, позволяя восстановить предыдущую, неповрежденную версию данных. Однако транзакции, которые имели место между событием повреждения и восстановлением, теряются. Их можно восстановить другими способами, например, с помощью журналирования .
В некоторых ситуациях непрерывная защита данных требует меньше места на резервном носителе (обычно диске), чем традиционное резервное копирование. Большинство решений для непрерывной защиты данных сохраняют различия на уровне байтов или блоков, а не на уровне файлов . Это означает, что если один байт файла размером 100 ГБ изменяется, резервируется только измененный байт или блок. Традиционные инкрементные и дифференциальные резервные копии создают копии целых файлов; однако, начиная с 2013 года, корпоративные клиент-серверные приложения резервного копирования реализовали возможность инкрементного резервного копирования на уровне блоков , предназначенного для больших файлов, таких как базы данных.
Когда изменения в реальном времени, особенно в средах проектирования мультимедиа и САПР , резервируются за пределами площадки по восходящему каналу широкополосной сети установки, [13] может потребоваться регулирование пропускной способности сети [14] для снижения влияния истинной CDP. [13] Альтернативным подходом является резервное копирование на отдельное устройство SAN, подключенное по Fibre-Channel . [7]
Настоящий подход CDP должен захватывать все записи данных, таким образом непрерывно создавая резервные копии данных и устраняя окна резервного копирования.... CDP является золотым стандартом — наиболее всеобъемлющей и передовой защитой данных. Но технологии "почти CDP" могут обеспечить достаточную защиту для многих компаний с меньшей сложностью и стоимостью. Например, моментальные снимки могут обеспечить разумный уровень защиты, близкий к CDP, для общих файловых ресурсов, позволяя пользователям напрямую получать доступ к данным в общем файловом ресурсе через регулярные интервалы времени — скажем, каждые полчаса или 15 минут. Это, безусловно, более высокий уровень защиты, чем ночное резервное копирование на основе ленты или диска, и, возможно, это все, что вам нужно.
Дата подачи 13 ноября 1989 г. ... система резервного копирования, в которой копия каждого изменения, внесенного в носитель информации, записывается по мере возникновения изменения ... операции записи резервных копий выполняются на уровне базовой системы ввода-вывода (BIOS) ...
... могут быть основаны на блоках, файлах или приложениях и могут обеспечивать тонкую детализацию восстанавливаемых объектов для бесконечно изменяющихся моментов времени.... Появились новые технологии гранулярного восстановления, которые позволяют восстанавливать почтовые сообщения, почтовые ящики и папки по отдельности без необходимости восстановления всей базы данных электронной почты и без отдельных и избыточных резервных копий почтовых ящиков.
...плюсы использования снимков: [новый абзац] Позволяет восстанавливать файлы с определенного момента времени (на основе графика снимков) ... CDP может обеспечить возможность восстановления на любой предыдущий момент времени, поскольку резервное копирование происходит практически мгновенно; поэтому вероятность потери данных очень мала.
Разделитель разделяет операции ввода-вывода записи в VMDK/RDM виртуальной машины и отправляет копию в производственный VMDK, а также в кластер RecoverPoint for VMs.
NetBackup RealTime — это решение CDP на базе устройств, предназначенное для защиты нескольких хостов. Находясь в корпоративных сетях FC-SAN в качестве устройства боковой полосы, оно находится за пределами пути данных между серверами приложений и назначенным им хранилищем, чтобы исключить любые возможности нарушения работы приложений.
... копирует данные из источника в цель. True CDP делает это каждый раз, когда вносится изменение, в то время как так называемый near-CDP делает это через заранее установленные интервалы времени. Near-CDP фактически то же самое, что и моментальный снимок.... True CDP systems записывает каждую запись и копирует их в цель, где все изменения сохраняются в журнале. [новый абзац] Напротив, системы near-CDP/snapshot копируют файлы простым способом, но требуют, чтобы приложения были приостановлены и подготовлены к резервному копированию, либо через режим резервного копирования приложения, либо с помощью, например, служб теневого копирования томов (VSS) от Microsoft.
не использует технологию моментальных снимков, как Veeam. Вместо этого Zerto развертывает небольшие виртуальные машины на своих физических хостах. Эти виртуальные машины Zerto захватывают данные по мере их записи на хост, а затем отправляют копию этих данных на сайт репликации.....Однако у Veeam есть преимущество в том, что он может более эффективно захватывать и хранить данные для долгосрочных нужд хранения. Существует также значительная разница в ценах: Veeam дешевле Zerto.
CloudEndure выполняет начальное чтение на уровне блоков содержимого любого тома, подключенного к серверу, и реплицирует его на сервер репликации. Затем агент действует как фильтр чтения на уровне ОС для захвата записей и синхронизации любых изменений на уровне блоков с сервером репликации CloudEndure, обеспечивая практически нулевую RPO.
Time Machine была разработана и оптимизирована для выполнения резервного копирования каждый час.... Вы не можете изменить расписание в Time Machine. Вам необходимо использовать стороннее приложение или вручную изменить некоторые системные файлы.
Arq использует
службу теневого копирования томов Windows (VSS)
для резервного копирования открытых/заблокированных файлов. [Reitshamer — главный разработчик Arq Backup]
В настоящей среде CDP, когда сохраняются большие файлы – изображения, аудио, видео, CAD или 3D-модели – данные передаются по тому же широкополосному соединению, которое питает электронную почту и интернет пользователей, не говоря уже о внутренних бизнес-процессах. Более того, эти передачи полагаются на более редкий из двух каналов, канал восходящего потока. Результатом для многих компаний является нестабильная производительность широкополосного доступа и даже замедление работы сервера.
такие опции, как «Включить регулирование пропускной способности» и «Не выполнять резервное копирование, если загруженность ЦП превышает этот процент».