Notfallwiederherstellung (DR) ist ein Framework, das IT-Technologien und Best Practices umfasst, die darauf abzielen, Datenverluste und Geschäftsunterbrechungen infolge von Katastrophenereignissen zu verhindern oder zu minimieren.
Sie umfasst alles von Equipment-Ausfällen und lokalen Stromausfällen bis hin zu kriminellen oder militärischen Angriffen, Cyberangriffen und Naturkatastrophen.
Viele Unternehmen – insbesondere kleine und mittelständische Organisationen – vernachlässigen es, einen zuverlässigen und praktischen Notfallwiederherstellungsplan (DRP) zu entwickeln. Ohne einen solchen Plan sind sie vor den Auswirkungen schwerwiegender Krisenereignisse kaum geschützt.
Die Kosten von Ausfallzeit machen den Schutz vor Datenverlusten unerlässlich. Laut Forschungen von Splunk und Oxford Economics können die durchschnittlichen Ausfallzeitkosten für Unternehmensorganisationen bis zu 9.000 USD pro Minute (oder 540.000 USD pro Stunde) betragen. Für wichtige Finanz- und Gesundheitseinrichtungen, die mit sensiblen Daten umgehen, kann Ausfallzeit zu Kosten von mehr als 5 Millionen US-Dollar pro Stunde führen.1 Die Notfallwiederherstellung kann diese Risiken erheblich mindern.
Notfallwiederherstellung umfasst das Strategisieren, die Planung, das Bereitstellen geeigneter Technologie und die Implementierung kontinuierlicher Tests. Datensicherungen sind zwar eine wichtige Komponente, aber ein Sicherungs- und Wiederherstellungsprozess allein macht noch keinen umfassenden Disaster Recovery Plan aus.
Zur Notfallwiederherstellung gehört auch die Sicherstellung, dass ausreichend Speicher- und Rechenkapazitäten zur Verfügung stehen, um robuste Ausfallsicherungs- und Rückfallverfahren aufrechtzuerhalten. Failover ist der Prozess, Workload an Backup-Systeme zu übertragen, sodass Produktionsprozesse und Endnutzererfahrungen so wenig wie möglich gestört werden. Beim Failback wird auf die ursprünglichen primären Systeme zurückgeschaltet.
Branchen-Newsletter
Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und darüber hinaus auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.
Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.
Notfallwiederherstellung für die Geschäftskontinuität (BCDR) ist ein Prozess, der Ihrem Unternehmen hilft, den normalen Geschäftsbetrieb wiederaufzunehmen, wenn eine Katastrophe eintritt. Geschäftskontinuität und Notfallwiederherstellung bestehen aus vielen Gemeinsamkeiten, aber es sind zwei unterschiedliche Herangehensweisen.
Obwohl BCDR im Geschäftsleben manchmal als Notfallmanagement bezeichnet wird, unterscheidet es sich erheblich von Programmen der Regierung wie der Federal Emergency Management Agency (FEMA). Diese Programme konzentrieren sich auf zivile Notfälle und bieten öffentliche Sicherheit sowie gemeindeweite Katastrophenhilfe, anstatt organisatorische IT und Betriebsabläufe zu unterstützen.
Die Geschäftskontinuität (BCP) umfasst Systeme und Prozesse, die sicherstellen, dass alle Bereiche eines Unternehmens im Falle einer Krise oder eines Notfalls den wesentlichen Betrieb aufrechterhalten oder schnell wiederaufnehmen können.
Die Notfallwiederherstellungsplanung ist ein Teilbereich der Geschäftskontinuitätsplanung, die sich auf die Wiederherstellung der IT-Infrastruktur und -Systeme konzentriert. Es beinhaltet einen Notfallwiederherstellungsplan (DRP), der die Schritte zur Notfallwiederherstellung nach einem unerwarteten Ereignis festlegt. Unternehmen verlassen sich auf DRPs, um verschiedene Katastrophensituationen zu bewältigen (zum Beispiel Naturkatastrophen, Ransomware, Malware-Angriffe).
Die folgenden sieben Schritte sind entscheidend für eine effektive Notfallwiederherstellung:
Die Erstellung eines umfassenden Disaster Recovery-Plans beginnt mit einer Business Impact Analysis (BIA). Im Rahmen dieser Analyse erstellen Sie eine Reihe detaillierter Katastrophenszenarien. Anhand dieser Szenarien lassen sich dann Ausmaß und Umfang der Verluste abschätzen, die Ihnen im Falle einer Störung bestimmter Geschäftsprozesse entstehen würden. Was passiert beispielsweise, wenn Ihr Kundenservice-Call-Center durch ein Feuer zerstört wird? Oder Ihr Hauptsitz wurde von einem Erdbeben getroffen?
Mithilfe dieser Analyse können Sie die wichtigsten Geschäftsfunktionen identifizieren und bestimmen, wie viel Ausfallzeit jede dieser Funktionen tolerieren kann. Mit diesen Informationen können Sie nun einen Plan zur Aufrechterhaltung der kritischsten Betriebsabläufe in verschiedenen Szenarien erstellen.
Die IT-Katastrophenwiederherstellungsplanung sollte auf der Business-Continuity-Planung basieren und sie unterstützen. Was ist, wenn Ihr Geschäftskontinuitätsplan beispielsweise vorsieht, dass Kundenservice-Mitarbeiter nach einem Call-Center-Brand von zu Hause aus arbeiten? Welche Hardware, Software und IT-Ressourcen müssten zur Unterstützung dieses Plans zur Verfügung stehen?
Die Bewertung der Wahrscheinlichkeit und potenziellen Folgen der Risiken, denen Ihr Unternehmen ausgesetzt ist, ist eine entscheidende Komponente einer Notfallwiederherstellungsstrategie. Angesichts der zunehmenden Verbreitung von Cyberangriffen und Ransomware ist es wichtig, die allgemeinen Cybersicherheitsrisiken zu verstehen, denen alle Unternehmen heute gegenüberstehen. Darüber hinaus ist es wichtig, die Risiken zu verstehen, die für Ihre Branche und Ihren geografischen Standort spezifisch sind.
Für verschiedene Szenarien, darunter Naturkatastrophen, Ausfälle des Equipments, Insider Threats, Sabotage und Fehler der Mitarbeiter, ist es wichtig, Ihre Risiken zu bewerten und die Gesamtauswirkungen auf Ihr Unternehmen zu berücksichtigen.
Stellen Sie sich die folgenden Fragen:
Nicht alle Workloads sind gleichermaßen kritisch für die Aufrechterhaltung des Geschäftsbetriebs Ihres Unternehmens, und Ausfallzeit ist für manche Anwendungen weitaus besser zu tolerieren als für andere.
Unterteilen Sie Ihre IT-Systeme und Anwendungen in drei Stufen, je nachdem, wie lange Sie einen Ausfall verkraften können und wie schwerwiegend die Folgen eines Datenverlusts wären:
Der nächste Schritt bei der Planung der Notfallwiederherstellung besteht darin, eine umfassende Bestandsaufnahme Ihrer Hardware- und Softwareassets zu erstellen. In dieser Phase ist es wichtig, wichtige Anwendungsinterdependenzen zu verstehen. Wenn eine Softwareanwendung ausfällt, welche anderen sind betroffen?
Die beste Methode, um Anwendungsabhängigkeiten zu verwalten, ist es, Modelle für Datenresilienz und Notfallwiederherstellung in Systeme zu integrieren, wenn sie anfänglich eingebaut werden. Es ist bei heutigen Microservice-basiertenArchitekturen nur allzu üblich, Prozesse zu entdecken, die nicht gestartet werden können, wenn andere Systeme oder Prozesse ausgefallen sind, und umgekehrt.
Es ist schwierig, sich von dieser Situation zu erholen. Es ist außerdem wichtig, solche Probleme zu erkennen, wenn Sie Zeit haben, alternative Pläne für Ihre Systeme und Prozesse zu entwickeln – bevor es zu einer echten Katastrophe kommt.
Wenn Sie Ihre Risiko- und Geschäftsauswirkungsanalysen berücksichtigen, sollten Sie in der Lage sein, mehrere Ziele festzulegen. Zu diesen Zielen gehören, wie lange es dauern würde, die Systeme wieder online zu bringen, wie viele Daten Sie verlieren können und wie viel Datenbeschädigung oder -abweichung Sie tolerieren können.
Alle Notfallwiederherstellungs-Software und -Lösungen, die Ihr Unternehmen eingeführt hat, müssen alle Datenschutz- und Sicherheitsanforderungen erfüllen, zu deren Einhaltung Sie verpflichtet sind. Das bedeutet, dass alle Daten-Backup- und Ausfallsicherungssysteme so konzipiert sein müssen, dass sie die gleichen Standards für die Gewährleistung der Vertraulichkeit und Integrität der Daten erfüllen wie Ihre primären Systeme.
Zugleich schreiben mehrere gesetzliche Normen vor, dass alle Unternehmen Pläne für die Notfallwiederherstellung und die Geschäftskontinuität unterhalten müssen. Der Sarbanes-Oxley Act (SOX) verlangt beispielsweise von allen börsennotierten Unternehmen in den USA, Kopien aller Geschäftsunterlagen mindestens fünf Jahre lang aufzubewahren.
Die Nichteinhaltung dieser Vorschrift (einschließlich der Vernachlässigung der Einrichtung und Prüfung geeigneter Daten-Backup-Systeme) kann für Unternehmen erhebliche finanzielle Strafen und für deren Führungskräfte sogar Gefängnisstrafen nach sich ziehen.
Einfach ausgedrückt: Wenn Ihr Notfallwiederherstellungsplan nicht getestet wurde, kann man sich nicht auf die Notfallwiederherstellung verlassen. Alle Mitarbeiter mit entsprechenden Verantwortlichkeiten sollten an der Übung zur Notfallwiederherstellung teilnehmen, die die Aufrechterhaltung des Betriebs vom Ausweichstandort für einen festgelegten Zeitraum beinhalten kann.
Falls die Durchführung umfassender Notfallwiederherstellungs-Tests über Ihr Budget oder Ihre Funktionen hinausgeht, können Sie auch ein „Planspiel“ vereinbaren, bei dem die Testverfahren durchgespielt werden. Allerdings ist es weniger wahrscheinlich, dass diese Art von Tests Anomalien oder Schwächen in Ihren DR-Verfahren aufdeckt – insbesondere das Vorhandensein bisher unentdeckter Anwendungsabhängigkeiten – als ein vollständiger Test.
Da sich Ihre Hard- und Softwareressourcen im Laufe der Zeit ändern, sollten Sie sicherstellen, dass Ihr Disaster Recovery-Plan entsprechend aktualisiert wird. Daher ist es wichtig, den Plan regelmäßig zu überprüfen und fortlaufend zu überarbeiten.
Hier finden Sie ein Beispiel für einen Notfallwiederherstellungsplan.
Die Notfallwiederherstellung bietet wesentliche Vorteile, darunter:
Notfallwiederherstellung umfasst folgende Arten von Technologien und Lösungen:
Der Aufbau Ihres eigenen Rechenzentrums für die Notfallwiederherstellung erfordert ein Gleichgewicht zwischen mehreren konkurrierenden Zielen.
Dennoch sollte eine Kopie Ihrer Daten an einem Ort speichert werden, der geografisch weit genug von Ihrem Hauptsitz oder Ihren Bürostandorten entfernt ist. Auf diese Weise können dieselben seismischen Ereignisse, Umweltgefahren oder andere Risiken, die Ihren Hauptstandort betreffen, Ihre Daten nicht dauerhaft zerstören.
Gleichzeitig dauert die Wiederherstellung von extern gespeicherten Backups länger als die von Backups, die sich vor Ort am primären Standort befinden. Darüber hinaus kann die Netzwerklatenz bei größeren Entfernungen noch größer sein.
Backup und Wiederherstellung dienen als Grundlage, auf der jeder solide Notfallwiederherstellungs-Plan basiert.
Ein Snapshot-Backup einer Datenbank erfasst den aktuellen Zustand einer Anwendung oder eines Datenträgers zu einem bestimmten Zeitpunkt. Da nur die geänderten Daten seit dem letzten Snapshot geschrieben werden, trägt diese Methode zum Schutz der Daten und zur Einsparung von Speicherplatz bei.
Snapshots können an andere Orte repliziert oder in der Cloud für Notfallwiederherstellung gespeichert werden.
Cloud DR verwendet cloudbasierte Infrastrukturen und Dienste zur Sicherung und Wiederherstellung von Daten und Anwendung, sodass kein physisches sekundäres Rechenzentrum mehr gewartet werden muss.
Es ermöglicht Ihnen, Anwendungsdaten und die gesamte Serverinfrastruktur zu schützen, einschließlich physischer oder virtuelle Maschinen (VMs), die entweder Public Cloud oder dedizierte Service-Provider-Einstellungen verwenden. Sie können Backup-Zeitpläne entsprechend Ihren spezifischen Anforderungen konfigurieren.
Cloud-Backup-Lösungen können sich auch mit Virtualisierungsplattformen wie VMware oder Cloud Native Backup-Lösungen integrieren. Diese Ansätze bieten flexible Skalierbarkeit und Kostenoptimierung, wenn sich Ihre Speicheranforderungen ändern, und unterstützen Unternehmen, die eine Cloud-Migration durchführen.
Disaster Recovery as a Service (DRaaS) ist eine Cloud-Lösung von Drittanbietern, die Datenschutz und Notfallwiederherstellungs-Funktionen auf Abruf und auf Pay-as-you-go-Basis bereitstellt.
DRaaS ist eines der beliebtesten und am schnellsten wachsenden Managed-IT-Serviceangebote, die derzeit verfügbar sind. Eine Branchenstudie aus dem Jahr 2023 prognostizierte, dass der DRaaS-Markt von 10,7 Mrd. USD auf 26,5 Mrd. USD bis 2028 mit einer zusammengesetzten jährlichen Wachstumsrate wachsen würde.2
Mit DRaaS dokumentiert Ihr Dienstleister RTOs und RPOs in einer Service-Level-Vereinbarung (SLA), die Ihre Ausfallzeitlimits und Anwendungswiederherstellungs-Erwartungen festlegt.
DRaaS-Angebote umfassen in der Regel auch Cloud-basierte Anwendungswiederherstellungsvorgänge. Dieser Ansatz bietet erhebliche Kosteneinsparungen im Vergleich zur Wartung redundanter dedizierter Hardware-Ressourcen in Ihrem eigenen Rechenzentrum. Es gibt Verträge, bei denen Sie eine Gebühr für die Aufrechterhaltung der Failover-Funktionen zahlen, zuzüglich der Kosten pro Nutzung der Ressourcen, die in einer Notfallwiederherstellung-Situation verbraucht werden. So übernimmt Ihr Anbieter in der Regel die gesamte Verantwortung für die Konfiguration und Wartung der Failover-Umgebung.
Wenn Sie bereits eine lokale Notfallwiederherstellung-Lösung (DR) entwickelt haben, kann es schwierig sein, die Kosten und den Vorteil einer solchen Lösung im Vergleich zu einem monatlichen DRaaS-Abonnement abzuwägen.
Die meisten lokalen DR-Lösungen verursachen Kosten für Hardware, Strom, Arbeitskräfte für Wartung und Verwaltung sowie Software und Netzwerkverbindung. Zusätzlich zu den Anfangsinvestitionen für die Einrichtung Ihrer DR-Umgebung müssen Sie auch regelmäßige Software-Upgrades einplanen.
Da Ihre DR-Lösung mit Ihrer primären Produktionsumgebung kompatibel bleiben muss, sollten Sie sicherstellen, dass Ihre DR-Lösung über die gleichen Softwareversionen verfügt. Je nach den Besonderheiten Ihrer Lizenzvereinbarung können sich Ihre Softwarekosten dadurch effektiv verdoppeln.
Wenn Sie DRaaS-Lösungen von Drittanbietern in Betracht ziehen, stellen Sie sicher, dass der Anbieter die Kapazität für regionsübergreifende, standortübergreifende Backups besitzt. Wenn ein schwerwiegendes Wetterereignis (zum Beispiel ein Hurrikan) Ihren Hauptstandort treffen würde, wäre der Ausweichstandort weit genug entfernt, um von dem Sturm unberührt zu bleiben?
Wenn viele Kunden Ihres Lieferanten in Ihrer Region gleichzeitig betroffen wären, hätte Ihr Lieferant dann ausreichende Kapazitäten, um deren kombinierten Bedarf zu decken? Sie verlassen sich darauf, dass Ihr DRaaS-Anbieter die RTOs und RPOs in Krisenzeiten einhält. Suchen Sie daher nach einem Dienstleister mit einem guten Ruf in puncto Zuverlässigkeit.
Für einen besseren Vergleich beider Lösungen finden Sie unter: „Notfallwiederherstellung als Dienst (DRaaS) versus Notfallwiederherstellung (DR): Was benötigen Sie?“
Die Integration von künstlicher Intelligenz (KI) transformiert die Notfallwiederherstellung mit Funktionen, die die Erkennung von Bedrohungen verbessern, die Reaktion auf Vorfälle automatisieren und das Management in hybriden und Multicloud-Umgebungen optimieren.
Im IBM 2025 Cost of a Data Breach Report sanken die durchschnittlichen globalen Kosten von 4,88 Mio. USD auf 4,44 Mio. USD, was einem Rückgang von 9 % entspricht. Dem Bericht zufolge waren die Unternehmen in der Lage, eine Sicherheitsverletzung innerhalb von durchschnittlich 241 Tagen zu erkennen und einzudämmen. Das ist der niedrigste Wert seit 9 Jahren.
Künstliche Intelligenz im Bereich der Katastrophenbewältigung bietet folgende wesentliche Vorteile:
Schützen Sie Ihre Daten mit Backup, KI-gestützter Erkennung von Bedrohungen und schneller Wiederherstellung vor neuen Gefahren, unabhängig davon, wo sie gespeichert werden.
Beschleunigen Sie Backup- und Wiederherstellungsprozesse im Unternehmen, um Daten und IT-Services für On-Premises- und Cloud-Workloads schnell wiederherzustellen.
Schützen Sie Ihre Daten mit einem Cloud-Notfallwiederherstellungsplan und mindern Sie das Risiko von Ausfallzeit.
1. Die versteckten Kosten von Ausfallzeit – Laut Führungskräften der Global 2000, Splunk, Juni 2024
2. Marktgröße für Notfallwiederherstellung als Service (DRaaS), MarketsandMarkets, 2023