Hohe Verfügbarkeit (HA) ist ein Begriff, der sich auf die Fähigkeit eines Systems bezieht, nahezu 100 % der Zeit zugänglich und zuverlässig zu sein.
Hochverfügbare Systeme müssen in der Lage sein, Ausfälle zu überstehen, einschließlich geplanter Ausfallzeiten und standortweiter Katastrophen. In der Regel erfüllen HA-Systeme zwei Eigenschaften:
Mit der zunehmenden Verbreitung von Initiativen zur digitalen Transformation und der damit verbundenen Verlagerung vieler Dienste in die Cloud bieten zahlreiche Technologie- und Software-as-a-Service-Anbieter (SaaS) wie Microsoft, Amazon (AWS), IBM und Red Hat hochverfügbare Lösungen an.
Eine hohe Verfügbarkeit von IT-Systemen ist besonders in Branchen von Bedeutung, in denen kritische Anwendungen auf geringe oder gar keine Systemausfälle angewiesen sind. Beispielsweise sind Benutzer in Krankenhäusern und Rechenzentren auf hochverfügbare Lösungen angewiesen, um viele routinemäßige, tägliche Funktionen auszuführen. Wenn Benutzer aus irgendeinem Grund nicht auf ein System zugreifen können, gilt es als „nicht verfügbar“. Der Zeitraum, in dem ein System für Benutzer nicht verfügbar ist, wird als Ausfallzeit bezeichnet.
Notfallwiederherstellung (DR) umfasst IT-Infrastrukturtechnologien und Best Practices, die Datenverluste und Störungen der Geschäftskontinuität infolge katastrophaler Ereignisse verhindern oder minimieren sollen. Hochverfügbarkeit (HA) hingegen betrifft in der Regel kleinere Ausfälle oder Störungen, die die Verfügbarkeit eines Systems beeinträchtigen können.
Obwohl sie sich unterscheiden, verfolgen DR und HA beide das Ziel, Störungen von IT-Systemen zu minimieren, und beide setzen in der Regel redundante Komponenten und redundante Systeme als Teil einer Gesamtstrategie ein. Darüber hinaus verwenden sowohl DR als auch HA Daten-Backups, um Daten im Falle einer Vielzahl von Problemen, einschließlich Hardwareausfällen, Softwarefehlern und Stromausfällen, verfügbar zu halten.
Fehlertoleranz bezeichnet die Fähigkeit eines Systems, nach dem Ausfall einer oder mehrerer kritischer Komponenten einen kontinuierlichen Betrieb aufrechtzuerhalten. Ähnlich wie HA kann Fehlertoleranz dazu beitragen, die Verfügbarkeit eines Systems während oder nach einem Störfall sicherzustellen.
Der Unterschied zwischen Fehlertoleranz und hoher Verfügbarkeit besteht jedoch im Umgang mit Ausfallzeiten. Während HA möglichst geringe Ausfallzeiten anstrebt, ist das Ziel der Fehlertoleranz eine Ausfallzeit von null. Dieses Ziel kann nur durch Redundanz erreicht werden, d. h. durch ein Backup oder eine zweite Kopie jeder einzelnen Komponente in der Infrastruktur.
Da Unternehmen mehr denn je auf Online-Services und Cloud- sowie Hybrid Cloud-Architekturen angewiesen sind, um geschäftskritische Anwendungen und Services bereitzustellen, steigen die Anforderungen an die Infrastruktur, sodass Hochverfügbarkeit oberste Priorität hat. Hier sind einige der häufigsten Vorteile hochverfügbarer Systeme für Unternehmen.
Da die digitale Transformation für die meisten Unternehmen ein wichtiges Ziel ist, ist eine hohe Verfügbarkeit der Systeme entscheidend, um Mitarbeitern und Kunden uneingeschränkten Zugriff auf kritische Anwendungen zu ermöglichen1
Systemausfälle, die zu minuten- oder sogar stundenlangen Ausfallzeiten führen, können für Unternehmen in einer Vielzahl von Branchen, darunter SaaS, Luftfahrt und Mobilfunk, zu einem PR-Albtraum werden2. Eine hochverfügbare Infrastruktur stellt sicher, dass der Ruf einer Marke nicht durch Ausfälle oder unerwartete Ausfallzeiten beeinträchtigt wird.
Managed Service Provider (MSPs) müssen eine hohe Verfügbarkeit von Netzwerken gewährleisten, da sie sonst Gefahr laufen, ihre Service Level Agreements (SLAs) nicht zu erfüllen. HA-Systeme unterstützen MSPs bei der Bereitstellung von Netzwerken, auf die sich ihre wichtigsten Kunden verlassen können, beispielsweise für die sichere Steuerung autonomer Fahrzeuge oder die Verwaltung von Patientenakten in einer Gesundheitseinrichtung.
Unabhängig davon, ob sie in einer Branche wie dem Gesundheitswesen oder dem Finanzwesen keine Ausfallzeiten zulassen dürfen oder einfach nur nach Möglichkeiten suchen, Reputationsschäden durch Ausfälle zu vermeiden, verfolgen Unternehmen, die hohe Verfügbarkeit anstreben, in der Regel einen vierstufigen Prozess.
Viele HA-Systeme verwenden Lastausgleich, einen Prozess, bei dem der Datenverkehr auf mehrere Server verteilt wird, um die Verfügbarkeit von Anwendungen zu optimieren. Bei einer stark frequentierten Website oder einem Cloud-Service empfängt ein System beispielsweise täglich Millionen von Benutzeranfragen. Lastausgleich stellt sicher, dass Anwendungen Inhalte von Webservern prompt und ohne Unterbrechungen an Benutzer liefern können. Lastausgleich, insbesondere der gleichzeitige Einsatz mehrerer Lastausgleichsfunktionen, kann dazu beitragen, dass keine einzelne Komponente in einem System überlastet wird, was zu einem Single Point of Failure führen könnte, der Ausfallzeiten oder einen Ausfall verursachen könnte.
Redundanz – also eine sekundäre oder Backup-Komponente, die bei Ausfall einer primären Komponente deren Aufgaben übernimmt – ist ein wichtiger Bestandteil eines hochverfügbaren Systems. Mithilfe von Redundanz bleiben Datenbanken für Benutzer und Anwendungen auch dann verfügbar, wenn eine Komponente nicht funktioniert. Wenn eine Komponente in einem System nicht redundant ist, wird diese Komponente als Single Point of Failure betrachtet, da ihr Ausfall möglicherweise dazu führen könnte, dass das gesamte System nicht mehr funktioniert.
Hochverfügbare Cluster, auch als Hochverfügbarkeits-Clustering bezeichnet, sind Gruppen miteinander verbundener Maschinen, die als ein einziges System zusammenarbeiten. Wenn ein Maschine in einem Cluster ausfällt, überträgt die Cluster-Verwaltungssoftware dessen Workloads auf einen anderen Rechner. In einem Hochverfügbarkeits-Cluster gewährleistet der gemeinsame Speicher zwischen den einzelnen Knoten (Computern) einen vollständigen Datenerhalt, falls ein einzelner Knoten ausfällt.
Hohe Verfügbarkeit wird anhand der 100-prozentigen Betriebsbereitschaft eines Systems gemessen, d. h. es darf zu keinem einzigen Ausfall kommen. Zwar kann kein System zu 100 % betriebsbereit sein, doch hilft es, dies als Ziel festzulegen, um die Verfügbarkeit eines Systems über einen bestimmten Zeitraum zu messen. Die gängigste Metrik für Hochverfügbarkeitssysteme und -dienste ist die sogenannte „Fünf-Neunen-Verfügbarkeit“.
Die Fünf-Neunen-Verfügbarkeit bedeutet, dass ein System 99,999 % der Zeit laufen und seine Leistung erbringen kann. In der Regel benötigen nur Systeme in hochkritischen Branchen wie dem Gesundheitswesen, dem Transportwesen, dem Finanzwesen oder der Regierung eine Fünf-Neunen-Verfügbarkeit. Diese Systeme sind für das Leben der Menschen, den Zugang zu Nahrung und Unterkunft sowie für das wirtschaftliche Wohlergehen von großer Bedeutung.
Systeme, die nicht in diesen hochkritischen Branchen eingesetzt werden, erfordern in der Regel keine so hohe Betriebsverfügbarkeit und kommen mit einer Verfügbarkeit von „drei oder vier Neunen“ (99,9 % oder 99,99 %) aus. Eine weitere gängige Beschreibung lautet, dass ein hochverfügbares System eine „Verfügbarkeit von 99,9/99,999 %” aufweist.
Neben einer Fünf-Neunen-Verfügbarkeit verwenden IT-Systemmanager mehrere weitere wichtige Metriken, um die Verfügbarkeit ihrer Systeme zu messen:
Da Unternehmen in vielen Branchen umfassende Initiativen zur digitalen Transformation durchführen, steigen die Anforderungen an die Verfügbarkeit ihrer Infrastruktur. Durch Remote-Arbeit und die Verbreitung von 5G-Netzen ist es für Nutzer selbstverständlich geworden, jederzeit und überall auf Daten und Anwendungen zugreifen zu können. Allerdings nur, wenn die zugrunde liegenden Systeme, die die Anwendungen betreiben und den Zugriff auf die Daten regeln, verfügbar sind. Nachfolgend finden Sie einige Beispiele für hochverfügbare Systeme, die moderne Unternehmen in ihrer Entwicklung unterstützen:
Die Zeiten, in denen ein Arzt in einem Schrank nach Akten blätterte, um das Datum Ihrer letzten Impfung zu finden, sind vorbei. Wenn Sie heute in die Notaufnahme oder zu einem Facharzt gehen, ist es fast sicher, dass Ihr Arzt Ihre Unterlagen online einsehen wird. Aufgrund der kritischen und privaten Natur dieser Art von Informationen sind Patientenakten ein Beispiel für ein hochverfügbares System, das innerhalb von Sekunden präzise Informationen mit nahezu keinen Ausfallzeiten sicher bereitstellen kann.
Fahrerlose oder autonome Fahrzeuge wie Autos, Drohnen und andere sind auf schnelle, leistungsstarke Internetverbindungen angewiesen, damit die künstliche Intelligenz (KI), die sie steuert, funktionieren kann. Wenn ein autonomes Fahrzeug beispielsweise an einer Ampel hält, werden Zehntausende von Daten nahezu in Echtzeit verarbeitet, damit es an der richtigen Stelle anhält und seine Fahrt zum Ziel fortsetzt. Hohe Verfügbarkeit ist für den sicheren Betrieb autonomer Fahrzeuge aller Art von entscheidender Bedeutung.
Das Internet der Dinge (IoT) ist ein Netzwerk aus physischen Geräten, Fahrzeugen, Anwendungen und anderen Objekten, die mit Sensoren ausgestattet und mit dem Internet verbunden sind, sodass sie Daten sammeln und austauschen können. Mit der Ausweitung des IoT-Ökosystems auf Straßen, Wasserwege, Haushaltsgeräte, Wetterüberwachung und vieles mehr sind Millionen von Geräten auf Netzwerke angewiesen. Hohe Verfügbarkeit trägt dazu bei, dass Netzwerke, die IoT-Geräte unterstützen, reibungslos und ohne Unterbrechungen funktionieren.
Da Unternehmen immer mehr Möglichkeiten finden, die im digitalen Zeitalter generierten riesigen Datenmengen zu nutzen, ist eine hohe Verfügbarkeit für eine effiziente und effektive Datenverarbeitung unerlässlich. Rechenzentren und komplexe Analyseplattformen führen kontinuierlich Datenverarbeitungen und Echtzeitanalysen durch, und Ausfallzeiten können Projekte um Monate zurückwerfen. HA-Lösungen ermöglichen Unternehmen einen ununterbrochenen Zugriff auf ihre wichtigsten Daten.
IBM Cloud Infrastructure Center ist eine mit OpenStack kompatible Softwareplattform für die Verwaltung der Infrastruktur von Private Clouds auf IBM zSystems und IBM LinuxONE.
Entdecken Sie Server, Speicher und Software für die Hybrid-Cloud- und KI-Strategie Ihres Unternehmens.
Finden Sie die richtige Cloud-Infrastrukturlösung für Ihre Geschäftsanforderungen und skalieren Sie Ressourcen nach Bedarf.
1. „Gartner says 89% of Board Directors Say Digital is Embedded in All Business Growth Strategies , Gartner, 19. Oktober 2022
2. „The Global IT Outage Provides Several Crisis Management Lessons , Forbes, 19. Juli 2024