Введение
Непрерывная защита данных (Continuous Data Protection, CDP) – технология резервного копирования и защиты данных, при которой каждое изменение данных (запись на диск) немедленно реплицируется в защищённое хранилище с сохранением временной метки. Это позволяет восстановить данные на любой момент времени в прошлом – не только на момент последнего планового backup'а, но и на любую произвольную точку.
Ключевой показатель, который оптимизирует CDP, – Recovery Point Objective (RPO). Традиционные backup-системы с ночным резервным копированием обеспечивают RPO около 24 часов. Snapshot-системы – RPO 1–4 часа. CDP обеспечивает RPO от нескольких секунд до нуля, фактически устраняя потерю данных.
История и контекст
Термин «Continuous Data Protection» был популяризован аналитиком SNIA (Storage Networking Industry Association) в начале 2000-х годов. Первые коммерческие CDP-продукты появились около 2003–2004 гг.: Revivio (поглощена EMC), XOsoft (поглощена CA Technologies) и InfiniStor. EMC (ныне Dell EMC) выпустила RecoverPoint, ставший отраслевым стандартом для enterprise CDP.
SNIA дала формальное определение: «CDP – это методология, которая непрерывно захватывает или отслеживает изменения данных и независимо хранит изменения, позволяя восстановление на любой момент времени». Современные CDP-решения интегрированы в гиперконвергентные платформы (Veeam, Zerto, Commvault), а облачные провайдеры (AWS, Azure) предлагают CDP как managed-сервис.
Как это работает
CDP реализуется на нескольких уровнях стека хранения:
- Journal-based CDP: Каждая операция записи захватывается в журнал изменений (write journal) с временной меткой. Восстановление «прокручивает» журнал до нужного момента.
- Агент на уровне операционной системы: Программный агент перехватывает I/O-операции до записи на диск и параллельно отправляет их в CDP-хранилище.
- Репликация на уровне хранилища (Storage-level CDP): Массивы хранения (EMC, NetApp, HPE) встраивают CDP в прошивку, не требуя агентов на серверах.
- Hypervisor-based CDP: Veeam, Zerto перехватывают операции записи на уровне гипервизора (VMware, Hyper-V), обеспечивая защиту виртуальных машин.
- Восстановление: Администратор указывает целевую точку времени; система применяет или откатывает журнал изменений, восстанавливая данные в указанный момент.
Где применяется
CDP применяется там, где потеря данных за несколько часов неприемлема:
- Финансовые системы: Транзакционные базы данных, торговые платформы – потеря транзакций за минуту означает серьёзные финансовые и репутационные потери.
- E-commerce: Защита данных о заказах и транзакциях в периоды пиковой нагрузки (распродажи).
- Медицинские системы: МИС с электронными медицинскими картами – потеря записей о назначениях недопустима.
- Промышленные системы: Данные SCADA и MES-систем для восстановления после программных или аппаратных сбоев.
- Облачные среды: Защита данных в облаке от ransomware с возможностью отката до момента, предшествовавшего шифрованию.
Связь с другими понятиями
CDP является технологическим развитием традиционного резервного копирования (Backup) с принципиально иной частотой снятия точек восстановления. Оно пересекается со snapshot-технологиями, но отличается от них: снимки делаются по расписанию, CDP записывает каждое изменение.
Репликация данных схожа с CDP, но нацелена на синхронизацию между узлами, а не на сохранение истории изменений. В контексте непрерывности бизнеса (BCP) CDP обеспечивает технический фундамент для достижения целевых показателей RPO. Проверка непрерывности включает тестирование способности CDP-систем выполнить восстановление в требуемые сроки. В облачной среде CDP интегрируется с Disaster Recovery as a Service (DRaaS) для оркестрации восстановления.