CC Suche Sitemap
Hochverfügbarkeit  / Komponenten  / Applikationsverfügbarkeit  / Cluster  / High Availability Cluster  / SteelEye LifeKeeper  / Erweiterte Anwendungsszenarien  /  Continuous Data Protection (CDP)

Continuous Data Protection

Continuous Data Protection (CDP) ist die kontinuierliche Sicherung von Daten, die versioniert und mit einem Zeitstempel oder einem anderen Kennzeichen versehen werden. CDP schafft damit die Möglichkeit, Daten nach logischen Fehlern, wie der Zerstörung durch Viren, Korruption durch Softwarefehler oder Löschen durch Benutzer, an einem geeigneten Punkt vor Eintritt eines Schadensfalles wieder herstellen zu können. Der Benutzer kann sich damit einen temporären Datensatz aufbauen, diesen testen und, wenn dies nötig ist, rückwärts oder vorwärts solange weiter suchen, bis ein konsistenter Datenbestand erreicht ist.

CDP-Prinzip

Prinzip Continuous Data Protection
Zur vergrößerten Darstellung bitte anklicken

In zwei wesentlichen Punkten unterscheidet sich Continuous Data Protection von der klassischen Datensicherung:

  • Jede Änderung des primären Datenbestandes führt auch zu einer Änderung des Backup-Datenbestandes. Damit steht eine Kopie des Datenbestandes in Echtzeit zur Verfügung.
  • Basierend auf einem Urdatenbestand wird der Datenfluß aufgezeichnet, der die Daten verändert. Mittels Marker lassen sich signifikante Zeitpunkte kennzeichnen.

Die für CDP verwendete Datenmenge ist größer als der primäre Datenbestand, da zusätzliche Informationen enthalten sind. Der Urdatenbestand plus der Datenfluß bis zu einem Marker ergeben den Datenbestand zu dem dem Marker entsprechenden Zeitpunkt.

Marker können durch die Anwendungssoftware (z.B Beginn der Reorganisation einer Datenbank, Datenbankwartung, Schreiben eines Datensatzes) oder manuell durch den Nutzer (z.B Installieren von Patches) gesetzt werden. Anhand dieser Marker kann innerhalb des Datenstromes navigiert werden.

Wächst der CDP Datenbestand bis an die Grenze des zur Verfügung gestellten Speicherplatzes, werden die Ursprungsdaten mit den ältesten aufgezeichneten Daten zu einem neuen Basisdatenbestand verschmolzen. Der gewonnene Speicherplatz wird für aktuelle Aufzeichnungen wieder frei gegeben. Der auf diesem Wege dann wieder herstellbare älteste Datenbestand sind die neu generierten Basisdaten.

Nutzung von CDP

Continuous Data Protection (CDP) ist eine Ergänzung und Erweiterung des klassischen Backup. Während beim Backup Daten zu einem diskreten Zeitpunkt gesichert werden, wird der Datenbestand bei CDP kontinuierlich aktualisiert. Zu bestimmten Zeiten oder Ereignissen werden Marker im Datenstrom gesetzt, um diese später einfach wieder finden zu können. Marker kennzeichnen so gleichzeitig konsistente Datenbestände.

Neben technischen Fehlern (z.B Hardwareausfall, fehlerhafte Patches oder Updates) können mittels CDP auch logische Fehler (z.B. Löschen von Datenbanken oder -sätzen, Löschen von Verzeichnissen) repariert werden. Wichtig ist, möglichst viele aussagekräftige Marker zu haben.

Bekannt ist anfangs, nach Auftreten eines Fehlers, nur die Zeit, zu dem der Fehler erkannt wurde. Mit der Feststellung des Zeitpunktes, an dem die Daten sicher noch fehlerfrei waren, ist im ersten Schritt der Schadenszeitraum definiert. Ziel ist es nun, im Schadenszeitraum den letzten Zeitpunkt vor dem Schadereignis zu finden, an dem die Daten noch fehlerfrei und konsistent waren. Itterativ wird dazu der Datenbestand durchsucht, indem aus einer Kopie des Basisdatenbestandes plus dem Datenfluß bis zu einem bestimmten Marker ein Testdatenbestand generiert wird. Dieser Testdatenbestand wird mit der Applikation getestet und bewertet. Während dieser Tätigkeiten ist die Arbeit mit den Originaldaten zu unterbrechen.

Nachdem der bestmögliche Datenbestand auf diesem Wege gefunden wurde, wird dieser auf die Primärseite kopiert und die Arbeit kann mit minimalem Datenverlust wieder aufgenommen werden. Dieser Datenbestand bildet gleichzeitig die Urdaten für die Fortsetzung der CDP Funktion.

 

CDP-Navigation

Navigation im Datenbestand - Continuous Data Protection
Zur vergrößerten Darstellung bitte anklicken

Mittels CDP bestmöglich wiederherstellbare Daten

Bestmögliche Daten - Continuous Data Protection
Zur vergrößerten Darstellung bitte anklicken

In der Grafik ist der mittels CDP in Verbindung mit Zeit- und Funktions-Markern bestmögliche, wiederherstellbare Datenbestand gekennzeichnet.

Im Schadenszeitraum, der anfangs durch Erkennen des Fehlers und dem letzten bekannten fehlerfreien Datenbestand definiert wird, ist durch gezieltes Testen der Punkt vor Zerstörung der Daten zu finden, um möglichst wenig Daten zu verlieren.