Zum Hauptinhalt wechseln

Recovery Time Objective (RTO) erklärt

Notfallwiederherstellung und fortgesetzter Betrieb

Stromausfälle. Diebstahl. Beschädigte Server und Festplatten. Cyberattacken und Ransomware. Tornados, Erdbeben und Wirbelstürme. Es gibt viele verschiedene Arten von Katastrophen, die Ihr Unternehmen in Mitleidenschaft ziehen können, wenn Sie nicht auf sie vorbereitet sind. Da diese Katastrophen oft unvermeidbar sind, sind eine starke IT-Infrastruktur und die Festlegung regelmäßiger Wiederherstellungszeiten und -punkte für die Unterstützung Ihrer Wiederherstellung unerlässlich. Es ist möglich, dass Ihre IT-Abteilung ein Failover einer Anwendung und eine Replikation Ihrer Daten durchführt, um den Verlust nahezu auszuschließen, allerdings erfordert dies erhebliche Ressourcen. Ihre IT-Abteilung muss ein RTO festlegen, das auf der Anwendungspriorität und dem zugewiesenen Budget und den Ressourcen basiert. 

Was ist ein RPO und wie unterscheiden sich RTOs?

Die RTOs decken sich mit den Recovery Point Objectives (RPOs), einer Messung der Zeit ab einem Ausfall, einer Katastrophe oder einem ähnlichen verlustverursachenden Ereignis. RPOs berechnen die Zeit zurück bis zu dem Zeitpunkt, an dem Ihre Daten zum letzten Mal nutzbar waren, vermutlich das letzte Backup. RPOs und RTOs sind wichtige Konzepte für die Geschäftskontinuität und sind notwendige Geschäftsmetriken, um zu bestimmen, wie oft Ihr Unternehmen seine Datensicherungen planen sollte.Attaining a near-zero RTO or RPO

Was ist Recovery Time Objective (RTO)?

RTOs stellen die Zeitspanne dar, in der eine Anwendung ausfallen kann, ohne dass ein signifikanter Schaden für ein Unternehmen entsteht, sowie die Zeit, die das System vom Ausfall bis zur Wiederherstellung benötigt. Dieser Wiederherstellungsprozess umfasst die Schritte, die die IT-Abteilung unternehmen muss, um die Anwendung und ihre Daten wieder in den Zustand vor dem Ausfall zu versetzen. Für Anwendungen mit hoher Priorität kann ein RTO sicher in Sekunden ausgedrückt werden, sofern die IT-Abteilung in Failover-Services investiert hat.   RTOs erfordern, dass Ihre IT-Abteilung Anwendungen zunächst nach ihrer Priorität und dem Risiko eines Geschäftsverlusts sortiert. Die IT-Abteilung teilt diesen Anwendungen dann den entsprechenden Anteil der Unternehmensressourcen zu, nämlich Zeit, Geld und IT-Infrastruktur.  

Festlegen eines RTO

RTOs werden verwendet, um zu messen, wie viel Zeit die IT-Abteilung nach einer Systemkatastrophe für die Wiederherstellung der Daten benötigt. Als Bemessungsgrundlage stellen die RTOs den Gesamtbedarf Ihres Unternehmens dar und bestimmen, wie lange Ihr Unternehmen ohne IT-Infrastruktur und -Services überleben kann. Die RTOs müssen zunächst mit den Möglichkeiten Ihrer IT-Abteilung abgeglichen werden. IT-Administratoren müssen die verschiedenen Arten von Wiederherstellungsgeschwindigkeiten gründlich kennen, um ein RTO zu berechnen, die den Anforderungen des Unternehmens entspricht. Beispielsweise kann ein RTO von einer Stunde nicht erfüllt werden, wenn die minimal mögliche Wiederherstellungszeit zwei Stunden beträgt.   

Da der Prozess die Wiederherstellung des gesamten IT-Betriebs beinhaltet, sind RTOs oft kompliziert. Ihre IT-Abteilung kann einen Teil des Wiederherstellungsprozesses rationalisieren, indem sie so viel wie möglich automatisiert.  Der RTO kann höhere Kosten verursachen als ein granularer RPO, und ein anspruchsvoller RTO betrifft Ihre gesamte Unternehmensinfrastruktur und nicht nur Daten. Die Kosten für das Erreichen eines RTO oder RPO richten sich nach der Priorisierung von Anwendungen und Daten durch Ihre IT-Abteilung. Die IT-Abteilung priorisiert Anwendungen und Daten auf der Grundlage von Einnahmen und Risiko.  Wenn die Daten einer Anwendung reguliert sind, kann ein Datenverlust dieser App zu hohen Geldstrafen führen, unabhängig davon, wie oft diese App verwendet wird.

Erreichen eines RTO oder RPO nahe null

Während RTOs und RPOs in Bezug auf die Anwendungs- und Datenpriorität variieren, ist es für jedes Unternehmen unglaublich kostspielig, einen RTO oder RPO nahe Null für alle seine Anwendungen zu erreichen. Eine 100-prozentige Verfügbarkeitszeit für RTO und null Datenverluste für RPO können nur durch Investitionen in kontinuierliche Datenreplikation und virtuelle Umgebungen erreicht werden.

Beispiel für einen RTO

Die granulare Elementwiederherstellung ist ein Beispiel für einen RTO. In diesem Beispiel löscht ein Benutzer in einem großen Unternehmen eine wichtige E-Mail und leert den Papierkorb. Dieses Unternehmen verwendet Microsoft Exchange als geschäftskritische Anwendung und seine IT-Abteilung sichert ständig Änderungen auf Delta-Ebene in Exchange zusammen mit einer Backup-App, die eine granulare Sicherung und Wiederherstellung bietet. Diese Funktion ermöglicht es der IT-Abteilung, die wichtige E-Mail in etwa fünf Minuten wiederherzustellen, anstatt eine komplette virtuelle Maschine für nur eine E-Mail wiederherzustellen.

Orchestrierung für Ausfallsicherheit und Disaster Recovery

Es gibt viele Herausforderungen für eine Disaster-Recovery-Strategie, insbesondere für eine Disaster-Recovery in einer hybriden IT-Umgebung. Zu diesen Herausforderungen gehören unter anderem die folgenden:

  • In verschiedenen Umgebungen implementierte Workloads
  • Interdependenzen zwischen IT-Infrastruktur und Anwendungen
  • Wiederherstellung aller Geräte, Komponenten und Anwendungen bis zum RPO und Wiederherstellung des vollen Geschäftsbetriebs
  • Die Systemwiederherstellung kann weiter verzögert werden, wenn Systeme und Anwendungen in der falschen Reihenfolge wiederhergestellt werden.

Was kann man tun, um trotz aller Hindernisse eine erfolgreiche Disaster-Recovery-Strategie zu entwickeln und umzusetzen? Die Wiederherstellung einiger kritischer Anwendungen innerhalb weniger Stunden ist mit dem richtigen IT-Team grundsätzlich möglich, erfordert aber eine Menge wertvoller Ressourcen. Die heutigen Anforderungen sind gute RTOs und RPOs und eine Systemwiederherstellung, bei der mehrere geschäftskritische Anwendungen schnell wiederhergestellt werden. Es ist jetzt möglich, die Auswirkungen der Unterbrechung zu minimieren und eine Wiederherstellung innerhalb von Minuten nach einem Ausfall durchzuführen. Automatisierung ist von entscheidender Bedeutung und ermöglicht die Skalierung von Disaster-Recovery-Programmen, indem Workflows zwischen verschiedenen Anwendungen schnell und zuverlässig beim Übergang zu hybriden Umgebungen automatisiert werden. 

Die heutige Resiliency-Orchestration-Technologie hilft Ihnen, Ihre Disaster-Recovery-Strategie erfolgreich zu implementieren und die Anforderungen an Produktionsausfälle und die Gefährdung des Unternehmens durch Ausfälle zu reduzieren. In Bezug auf die Vorbereitung hilft die Orchestrierung für Ausfallsicherheit Unternehmen, Disaster-Recovery-Tests mit weniger Personal erfolgreich durchzuführen. Die Orchestrierung für Ausfallsicherheit hilft diesen Unternehmen auch, die Vorbereitung und Validierung von Disaster-Recovery-Drills zu reduzieren. Einer der Hauptvorteile der Resilienz-Orchestrierungstechnologie besteht darin, dass sie über physische, virtuelle und Cloud-Umgebungen hinweg funktioniert und dabei die Anwendungserkennung aufrechterhält. Der Endnutzer erwartet von Cloud-Services zunehmend Self-Service und Parameter für einfache Service-Level-Vereinbarungen. Daher werden orchestrierungsbasierte Ausfallsicherheitsstrategien für moderne Unternehmen, die Cloud-Umgebungen einführen möchten, immer wichtiger.