Wann werden 10 Sekunden zu einer großen Sache? Wenn es um die Leistung der Anwendung geht.
Für cloudnativ Microservice-Anwendungen sind 10 Sekunden wirklich eine lange Zeit.
Die Dinge, die in 10 Sekunden mit Ihren Anwendungen passieren können, sind unerschöpflich und die meisten sind nicht gut.
Bevor wir uns jedoch mit den Details der möglichen Auswirkungen auf Ihre Anwendungen befassen, werfen wir einen Blick auf einige reale Ereignisse, die zeigen, was innerhalb von 10 Sekunden passieren kann:
Das Beispiel von Usain Bolt gefällt uns besonders, weil diese Distanz eine lange Strecke ist, die man in weniger als 10 Sekunden zurücklegen muss.
Für die Leistung und Verfügbarkeit von cloudnativen Anwendungen sind 10 Sekunden eine Ewigkeit. Transaktionen rasen durchs Internet und halten die Räder des Handels in Bewegung.
Was kann in 10 Sekunden passieren, wenn etwas schiefgeht? Nun ja, es kann zu Verzögerungen, Abstürzen und sogar zum kompletten Scheitern von Transaktionen kommen.
Bei dieser Art von Problem können die Einnahmen aufgrund von Umsatzeinbußen sinken. Kunden werden Warenkörbe und Ihre Website verlassen und einen anderen Ort finden, um das zu kaufen, was sie wollen. Und Ihr Markenimage kann darunter leiden.
Warum sollte es dann akzeptabel sein, dass Observability-Tools, die Metriken langsam erfassen oder noch schlimmer, Metriken und Traces stichprobenartig erfassen und aggregieren? Wie kann eine solche Plattform als gleichwertig mit einer Observabilitäts-Plattform betrachtet werden, wie der IBM® Instana-Plattform, die Informationen mit der Geschwindigkeit moderner Microservices sammelt und kontextualisiert? Sie lassen die oben beschriebenen Probleme über einen längeren Zeitraum bestehen, bis die Informationen verfügbar sind, die zur Behebung des Problems benötigt werden.
Für PRISA Tecnologia ist Leistung der Schlüssel. Wenn ein Leistungsproblem auftritt, hat dies unmittelbare und nachteilige Auswirkungen auf die Leistung und die Wahrnehmung der Marke durch die Verbraucher.
„Eine Sekunde Zeitunterschied bei der Anzeige von Inhalten macht einen enormen Unterschied für die Erfahrung unserer Zielgruppe.” – Jorge Tomé Hernando, Director of IT Architecture, Operations, Security and Workplace, PRISA Tecnologia
Die wichtigsten Konkurrenten der Observability der Instana-Plattform prüfen entweder Metriken in 10-Sekunden-Intervallen oder aggregieren Metriken in Intervallen von einer Minute oder mehr, verglichen mit dem ultrapräzisen Metrikintervall der Instana-Plattform von einer Sekunde. Die Instana-Plattform benachrichtigt Sie außerdem innerhalb von drei Sekunden über ein Problem. Diese Reaktion wird in dem hier abgebildeten Diagramm zur Observability-Erkennungslücke veranschaulicht.
Können Sie es sich wirklich leisten, 10 Sekunden oder bis zu einer Minute zu warten, bis Ihre Observability-Plattform Sie über ein Problem informiert? Mit manueller Triage, vielleicht. Mit automatisierter oder auch nur halbautomatisierter Sanierung ist das jedoch nicht möglich.
Für alle Anwendungen sind Geschwindigkeit und Zuverlässigkeit das Ziel. Um eine bessere Anwendungsleistung und Zuverlässigkeit zu erreichen, muss die Strategie, dass „ein Mensch immer ein Problem beheben muss (MTTR)“, geändert werden. Menschliche Eingriffe zur Behebung von Mängeln würden die Ressourcen überlasten und das Tempo des Wandels einschränken. Außerdem werden Service-Level-Indikatoren (SLIs) reduziert.
„Mit Instana ist unser tägliches Ziel, eine Latenzerwartung garantieren zu können. Unser Ziel für Serviceaufrufe ist es, diese in weniger als 250 Millisekunden abzuschließen. Es geht also nicht nur um Notfallübungen. Im täglichen Betrieb können wir die Leistung verbessern, und das treibt uns auf das Ziel von 250 Millisekunden zu. Instana macht dies möglich.“ – Bryce Hendrix, Lead Platform Architect, Dealerware
Für verbesserte Leistung mit höherer Verfügbarkeit ist automatisiertes AIOps der richtige Weg. Automatisierte AIOps bietet eine zusätzliche Automatisierung in Kombination mit AIOps, über die ein höheres Maß an Leistung und Verfügbarkeit erreicht werden kann. Wie ist das möglich? Indem automatisierte AIOps Probleme lösen, die die Maschine fehlerfrei beheben kann, und zwar viel schneller als ein Mensch. Es gibt viele Probleme im Zusammenhang mit der Zuteilung von Infrastrukturressourcen und andere, die die Maschine beheben und verhindern kann, noch bevor ein Mensch eingreifen kann.
Bedeuten diese Vorteile, dass alle Anwendungsprobleme mit automatisierten AIOps gelöst werden können? Natürlich nicht.
Es gibt viele komplexe logische Probleme, die nur durch menschliche Triage gelöst werden können, wie zum Beispiel Codeprobleme und Ähnliches. Aber es gibt auch viele Probleme, bei denen automatisiertes AIOps schneller und effizienter ist und bei der Problembehebung bevorzugt werden sollte.
Betrachten wir die mittlere Zeit bis zur Problemvermeidung (MTTP), die als die Zeitspanne definiert wird, die Observability plus AIOps benötigt, um zu verhindern, dass ein Problem sich negativ auf Hybrid-Cloud-Anwendungen und -Infrastruktur auswirkt.
Automatisiertes AIOps fügt der Sanierung von Anwendungsproblemen eine neue Option hinzu. Das vorherige Diagramm veranschaulicht, dass dieses Kontinuum von der vollautomatisierten Problembehebung bis hin zur menschlichen MTTR reicht.
Im Kontinuum ist Observability der Ausgangspunkt für jede Art von Sanierung. Je länger es dauert, bis ein Problem von der Observability-Plattform erkannt wird, desto länger dauert es, bis der Behebungsprozess eingeleitet wird. Dieser Zeitverlauf bedeutet, dass bei der Einführung automatisierter AIOps der Unterschied zwischen einer Sekunden-Erkennung und 10-Sekunden-oder mehr Erkennung enorm wird. Wenn Ihre Anwendung es sich leisten kann, mehr als 10 Sekunden auf die Erkennung eines Problems zu warten, warum sollten Sie dann überhaupt automatisierte AIOps verwenden?
Die automatisierte AIOps-Sanierung ist der Trend der Zukunft. Das ist der nächste logische Schritt, um die Anwendungsleistung und -resilienz zu verbessern. Probleme mit der Leistung der Infrastruktur überwiegen oft die Probleme mit dem Code von Microservice und werden dies auch in Zukunft fortfahren.
Der neue Goldstandard für die Erkennung und Behebung von Anwendungsproblemen wird die Kombination aus automatisierter Observability und AIOps sein. Sie werden gemeinsam eingesetzt, um sicherzustellen, dass sich Probleme nicht zu größeren Problemen auswachsen.
Um die Vorteile der automatisierten AIOps-Problembehebung voll auszuschöpfen, benötigen Sie hochfrequente, hochpräzise Metriken und Traces, um die AIOps-Engine zu speisen. Und man kann sie für einen Bruchteil der Kosten der langsameren Observability-Technologien bekommen.
Tatsächlich kann in 10 Sekunden viel passieren. Mit Echtzeitmetriken und automatisierten AIOps können Sie sicherstellen, dass Ihre Anwendungen keine schwerwiegenden Probleme haben.
