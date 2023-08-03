Tags
IT-Automatisierung

Wie Unternehmen einen Prozess zur Überwachung des Anwendungs-Zustands erfolgreich messen können

In Unternehmen müssen heute alle Mitarbeiter, Anwendungen und Prozesse koordiniert zusammenarbeiten, um einen Mehrwert zu schaffen. Unternehmen verlassen sich zunehmend auf ihren Technologie-Stack – der die Gesamtheit ihrer Netzwerkschnittstellen, CPUs, virtuellen Maschinen, Betriebssysteminformationen und installierten Anwendungen umfasst – um dem Endbenutzer einen konsistenten Service zu bieten. Das bedeutet, dass Unternehmen insbesondere ihre Software-Anwendungen optimal funktionieren müssen, da diese oft eine Quelle für Wettbewerbsvorteile sind.

Was ist Überwachung des Anwendungszustands?

Dies ist auch der Grund, warum die Überwachung der Anwendung für moderne Unternehmen so kritisch ist. Die Überwachung des Anwendungszustands ist ein Diagnoseprozess, bei dem Probleme im Anwendungszustand identifiziert und ein Lösungsplan erstellt werden, bevor sie sich zu größeren Problemen für ein Unternehmen entwickeln.

Unternehmen können keine unnötige ungeplante Ausfallzeit oder erhöhte Latenz riskieren, weil eine Anwendung fehlgeschlagen ist oder eine unzureichende Leistung erbracht hat. Die systembedingten Abhängigkeiten der Anwendung können dazu führen, dass ein Fehler kaskadierende Auswirkungen auf das gesamte Leistungsangebot hat. Daher ist es von entscheidender Bedeutung, in die Überwachung des Anwendungszustands zu investieren und sicherzustellen, dass Ihre Anwendungen den täglichen Anforderungen eines Unternehmens gerecht wird. Da jede Störung dieses Ablaufs erhebliche Auswirkungen auf das Unternehmensergebnis und die Kundenbeziehung haben kann, ist es wichtig, der Anwendungsüberwachung in modernen Unternehmen Priorität einzuräumen.

Die Überwachung des Anwendungszustands weist einige Ähnlichkeiten mit der Überwachung der Anwendungsleistung auf, bei der Digital Experience wie Ladezeit, Reaktionszeit, Verfügbarkeit und Betriebszeit überwacht werden. Beide verbessern zwar die Funktionsweise von Anwendungen für Endbenutzer, doch die Überwachung des Anwendungszustands befasst sich in erster Linie mit der Funktionsfähigkeit einer Anwendung, während die Überwachung der Anwendungsleistung auch auf die Verbesserung der Benutzererfahrung ausgerichtet ist.

Sieben Metriken, die den relativen Erfolg Ihres Prozesses zur Überwachung des Anwendungs-Zustands identifizieren

Unternehmen benötigen einen umfassenden Plan, um den Zustand ihrer Anwendung sicherzustellen, aber eine Schlüsselkomponente jedes Überwachungsprozesses für den Anwendungszustand ist die Datenerfassung. Anwendungen können aus vielen verschiedenen Gründen ausfallen oder nicht die erwarteten Ergebnisse liefern. Daher ist es wichtig, mehrere wichtige Zustandsstatus und Leistungsmetriken zu verfolgen, damit Sie Leistungsprobleme nicht zu spät entdecken. Aus diesem Grund versuchen viele Unternehmen, den Zustand ihrer Anwendungen zu verwalten und wichtige Metriken durch erweiterte Zustandsberichte zu verfolgen.

Hier sind sieben wichtige Metriken, die den relativen Erfolg Ihres Prozesses zur Überwachung des Anwendungszustands identifizieren:

  1. Verfügbarkeit und Betriebszeit von Anwendungen: Dies ist die Zeitspanne, in der ein Endgerät (z. B. ein mobiles Gerät, ein Computer oder eine virtuelle Maschine) auf eine Anwendung zugreifen und diese nutzen kann. Softwareausfallzeiten stellen ein enormes Risiko für Unternehmen dar, da sie die Kundenzufriedenheit beeinträchtigen und möglicherweise gegen eine Service-Level-Vereinbarung mit Endnutzern verstoßen. Die Aufrechterhaltung der Verfügbarkeit von Anwendungen ist in letzter Zeit immer schwieriger geworden, da mehrere Anwendungen miteinander verbunden sind und viele von ihnen externe Ressourcen aus den APIs der Anbieter abrufen. Unternehmen müssen wissen, wann Leistungsprobleme auftreten und wie sie diese beheben können.
  2. App-Startzeit und Reaktionszeit: Dies bezieht sich auf die anfängliche Ladezeit der Anwendung und die Reaktionszeit auf Anfragen oder Benutzeranfragen. Ein Benutzer öffnet beispielsweise eine Anwendung, die die Server abfragt, um den Startbildschirm der Anwendung anzuzeigen. Wenn das Öffnen einer Anwendung viel Zeit in Anspruch nimmt, sinkt die Kundenzufriedenheit und es kann ein Hinweis auf ein größeres Problem sein. Deshalb benötigen Unternehmen automatisierte Zustandsprüfungen in Echtzeit, um die Ausführungszeit von Anwendungen zu ermitteln und gegebenenfalls Anpassungen an der Funktionalität vornehmen zu können, falls die Reaktionszeit der Anwendung unter den akzeptablen Schwellenwert fällt. Unternehmen, die ihre Reaktionszeiten kennen, können wahrscheinlich proaktive Strategien zur Behebung entwickeln, bevor die Anwendung ausfällt.
  3. Ressourcennutzung: Dies misst den Prozentsatz der verfügbaren Ressourcen, die eine Anwendung zu einem bestimmten Zeitpunkt nutzt. Bestimmte Anwendungen, die ressourcenintensiv sind, können sich an anderer Stelle auf die Leistung auswirken. Sie haben wahrscheinlich schon einmal etwas Ähnliches erlebt – zum Beispiel, wenn Ihr Computer langsam ist, weil Sie mehrere Anwendungen geöffnet haben oder eine Anwendung überlastet ist (wie ein Browser mit Dutzenden von geöffneten Tabs).
  4. Anzahl und Schweregrad der Instanzen und Probleme: Es ist auch wichtig, zu ermitteln, wie schwerwiegend jeder Vorfall ist und wie sich sein Ausfall oder seine Leistungseinbußen auf das Gesamtsystem auswirken. Die Überwachung des Anwendungszustands beeinflusst häufig das Vorfallmanagement und das Problemmanagement, was die Sanierung der durch die Überwachung des Anwendungszustands entdeckten Probleme beinhaltet.
  5. Mittlere Erkennungszeit (MTTD): Es kann von einer Millisekunde bis zu mehreren Tagen dauern, bis festgestellt wird, dass eine Anwendung fehlgeschlagen ist oder ihre Leistung über einen akzeptablen Rahmen hinaus nicht mehr akzeptabel ist. MTTD (mitunter auch als mittlere Entdeckungszeit bezeichnet) misst die durchschnittliche Zeit, die benötigt wird, um zu erkennen, dass eine Anwendung oder ein Teil des IT-Systems ausgefallen ist. Idealerweise hat ein Unternehmen entweder automatisierte Benachrichtigungen oder Datenvisualisierung und Workflows eingerichtet, damit menschliche Intervention stattfinden kann, um Probleme schnell zu identifizieren.
  6. Mittlere Reparaturzeit (MTTR): Die MTTR misst die durchschnittliche Zeit, die für die Reparatur eines Systems oder Geräts nach einem Ausfall benötigt wird. Die MTTR verfolgt die Zeit vom Auftreten des Ausfalls bis zur erneuten Funktion der Anwendung. Die MTTR ist eine wichtige Metrik, die überwacht werden muss, weil sie die Wirksamkeit von Reparaturmaßnahmen verfolgt und eine Schlüsselkomponente für die Betriebszeit oder Verfügbarkeit von Anwendungen darstellt.
  7. Die Zahl der Cybersicherheitsvorfälle: Laut IBM Research belaufen sich die durchschnittlichen Kosten einer Data Breach weltweit im Jahr 2023 auf 4,45 Millionen US-Dollar, was einem Anstieg von 15 % innerhalb von drei Jahren entspricht. Seit Beginn der Pandemie hat sich die „Zahl der Spear-Phishing-Angriffe fast versiebenfacht“. Es gibt viele Gründe, warum eine Anwendung fehlschlagen oder eine schlechte Leistung erbringen kann, aber einer der besorgniserregendsten ist, dass sie aufgrund einer externen Cybersicherheitsbedrohung fehlgeschlagen ist. Der Einsatz von Überwachungstool zur Erkennung potenzieller Sicherheitsprobleme wie Malware-Injektionen, Distributed Denial-of-Service (DDoS) und andere kann den allgemeinen Anwendungszustand verbessern.

Unternehmen sind darauf angewiesen, dass ihre Anwendungen funktionieren, um die Effizienz ihrer Abläufe zu steigern und ihren Kunden Services bereitzustellen. Der beste Weg zur Verbesserung des Anwendungszustands ist ein strukturierter Prozess, der wichtige Metriken identifiziert und verfolgt, welche Aufschluss darüber geben, wie einzelne Anwendungen abschneiden, und einen ganzheitlichen Überblick über das Gesamtsystem ermöglichen.

Autor

Keith O'Brien

Writer

IBM Consulting

