Was ist IT Operations Analytics?

IT-Fachmann blickt auf seinen Laptop, während er im Rechenzentrum am Server arbeitet

Die Komplexität von IT-Systemen hat in den letzten Jahren erheblich zugenommen, so dass es für IT-Teams immer dringlicher wird, den Zustand des Betriebs im Auge zu behalten. Die Zunahme von Geräten, die sich mit einzelnen Anwendungen verbinden, der Aufstieg des Cloud Computing und die Entwicklung neuer Produkte haben Unternehmen dazu veranlasst, in digitale Dienste zu investieren, um die Bedürfnisse ihrer Kunden zu erfüllen.

Zum Beispiel gaben 99 % der von McKinsey befragten Unternehmen an, seit 2020 eine groß angelegte Technologietransformation durchgeführt zu haben. Und dennoch sagen CIOs, dass ihre Führungskräfte glauben, dass 59
% der digitalen Initiativen zu lange dauern und 52 % zu lange brauchen, um den Wert zu realisieren, so eine Gartner-Umfrage aus dem Jahr 2023.

Die zunehmende Komplexität erfordert einen systematischen Ansatz, um den Zustand und die Optimierung der IT-Dienste eines Unternehmens sicherzustellen. Dies hat zu einer Zunahme der Bedeutung von IT Operations Analytics (ITOA) geführt, dem datengesteuerten Prozess, mit dem Unternehmen die von ihren IT-Diensten erzeugten Daten sammeln, speichern und analysieren.

ITOA wandelt operative Daten in Echtzeit-Erkenntnisse um. Es ist oft ein Teil von AIOps, das künstliche Intelligenz (KI) und maschinelles Lernen nutzt, um die DevOps eines Unternehmens insgesamt zu verbessern, damit das Unternehmen einen besseren Service bieten kann. Der Einsatz von Automatisierung und maschinellem Lernen beschleunigt operative Workflows, schafft sofort Erkenntnisse und eliminiert potenzielle menschliche Fehler aus der Gleichung.

ITOA unterstützt ITOps bei der Optimierung ihrer Entscheidungsfindung, indem es mithilfe von Technologie große Datensätze analysiert und die richtige Strategie ermittelt.

Aufgrund der zunehmenden Komplexität von IT-Systemen müssen Unternehmen Daten besser überwachen und analysieren, um fundiertere Entscheidungen treffen zu können. Jedes Unternehmen verfügt über einen eigenen Technologie-Stack, der sich in der Regel aus nativer Software und Cloud-Plattformen zusammensetzt. Die IT-Infrastruktur moderner Unternehmen besteht aus einem großen, voneinander abhängigen Ökosystem, in dem ein einziger Vorfall oder Fehler das gesamte System gefährden kann.

Der Technologie-Stack einer Organisation, bestehend aus Software, Infrastruktur und Netzwerkdiensten, ermöglicht es Unternehmen, ihren Kunden mehr Dienstleistungen anzubieten. Die erhöhte Komplexität bedeutet jedoch auch, dass mehr schiefgehen kann, und diese Fehler können exponentielle Auswirkungen haben. Unternehmen sind bestrebt, Ausfallzeit zu minimieren, da diese ihre Dienstleistungen unterbrechen und ihren Ruf bei Kunden und Partnern gefährden. IT-Abteilungen müssen wissen, wie sie ihre Ressourcen am besten einsetzen können, um aufkommende Probleme zu lösen, die Betriebszeit zu erhöhen und dafür zu sorgen, dass das IT-Betriebsmanagement (ITOM) des Unternehmens reibungslos läuft.

Zum Glück produzieren IT-Systeme ihre eigenen Daten und sammeln noch mehr Daten von Kunden, Partnern und Mitarbeitern. Unternehmen können all diese Daten nutzen, um den Gesamtzustand ihres Systems durch IT Operations Analytics zu verstehen.

IT Operations Analytics (ITOA) vs. Observability

ITOA und Observability teilen das gemeinsame Ziel, IT-Betriebsdaten zu nutzen, um die Leistung eines Systems zu verfolgen und zu analysieren, um im Endeffekt die betriebliche Effizienz und Effektivität zu verbessern. Beide unterstützen die Business Intelligence, indem sie Unternehmen in die Lage versetzen, IT-Probleme schneller zu lösen, Triage-Strategien für zukünftige Probleme zu entwickeln und bei der Bereitstellung neuer Technologien zu helfen.

Bei der Observability – der Beobachtbarkeit – geht es um das Verständnis des internen Zustands eines komplexen Systems, das nur auf der Kenntnis seiner externen Ergebnisse beruht. Sie verfolgt vier wichtige Säulen: Metriken, Ereignisse, Logs und Traces (MELT), um das Verhalten, die Leistung und andere Aspekte der Cloud-Infrastruktur und -Apps zu verstehen. Sie zielt darauf ab, zu verstehen, was innerhalb eines Systems geschieht, indem sie externe Daten untersucht. ITOA verwendet Data-Mining- und Big-Data-Prinzipien, um verrauschte Datensätze innerhalb des Systems zu analysieren, und erstellt ein Framework, das diese aussagekräftigen Erkenntnisse nutzt, um das gesamte System reibungsloser laufen zu lassen. Sie befasst sich mit der Ursachenanalyse von Vorfällen im IT-Betrieb, damit IT-Teams Probleme beheben können, die wieder auftreten könnten. Ziel ist es, das zugrundeliegende Problem zu lösen und gleichzeitig festzustellen, ob auch andere Software oder Systeme ausfallgefährdet sind.

Technologien von IT Operations Analytics

Die IT Operations Analytics (ITOA) umfasst mehrere wichtige tools, Prozesse und Technologien, die alle zusammenarbeiten, um innerhalb der Unternehmen Wert zu schaffen. Hier sind einige der häufigsten Technologien und Anwendungsfallen:

  • Application Performance Management (APM): Application Performance Management ist ein wichtiger Bestandteil von ITOA, dessen Volumen von McKinsey auf 11,8 Milliarden USD geschätzt wird. Dabei werden Telemetriedaten und Überwachungstools verwendet, um die Leistung von Anwendungen zu verfolgen, die Ressourcen und die Metriken zu identifizieren und zur Lösung von Engpässen und zur Erkennung von Anomalien beizutragen. Beispiele für APM sind die Identifizierung langsam ladender Webseiten, Transaktionsverarbeitungszeiten und Latenzprobleme.
  • Vorfallmanagement: Unternehmen müssen Vorfälle identifizieren und einen optimierten Ansatz zu deren Behebung verfolgen. Incident Management ermöglicht es DevOps-Teams, ungeplante Ereignisse wie Serverabstürze oder andere Qualitätsprobleme so schnell wie möglich zu adresse. 
  • Workflow-Automatisierung: Die Workflow-Automatisierung umfasst die Koordination von von Menschen erledigten Aufgaben und automatisierten Aufgaben, wie E-Mail-Benachrichtigungen sowie der Automatisierung der Dateneingabe und -archivierung.
  • Predictive Analytics: Die vorausschauende Analyse-Lösung nutzt historische und Echtzeitdaten, um vorherzusagen, ob Software und IT-Services zukünftig auf Probleme stoßen könnten. Dadurch erhalten Unternehmen die Möglichkeit, Verbesserungen vorzunehmen oder Fehler zu beheben, bevor diese auftreten. Vorausschauende Analysen helfen bei der Optimierung des IT-Betriebs, indem sie eingreifen, bevor ein Vorfall eintritt. Prädiktive Analysen können dabei helfen, Serverprobleme oder Datenverkehrsspitzen zu erkennen, so dass das Unternehmen eine Verteidigung vorbereiten oder das Problem proaktiv beheben kann.
  • Eventkorrelation und Alertausgabe: Dabei werden Anwendungs- oder Host-Logdaten analysiert, um Muster zu erkennen, besser zu verstehen, wie eine Anwendung oder ein System die andere beeinflusst, und DevOps auf potenzielle Probleme aufmerksam zu machen, die mehrere Systeme betreffen könnten. Die Korrelation von Ereignissen ist besonders wertvoll, um zu erkennen, ob Probleme wie ungewöhnliche Datenverkehrsmuster oder mehrfach fehlgeschlagene Anmeldungen Teil eines größeren Sicherheitsproblems sind.
  • Cloud-Überwachung und Wartung: Unternehmen müssen die Zuverlässigkeit ihrer Rechenzentren kennen, egal ob sie die Public Cloud, Multicloud-Umgebungen oder On-Premises-Ansätze nutzen. Wenn die Cloud ausfällt, müssen Unternehmen verstehen, wie sich das auf ihre Fähigkeit zur Bereitstellung von Services auswirkt.

Etappen der IT Operations Analytics

IT Operations Analytics (ITOA) hilft Unternehmen, große Mengen strukturierter und unstrukturierter Betriebsdaten systemübergreifend in drei Schlüsselphasen zu verteilen: 

  1. Suche: IT-Betriebssysteme erfassen und speichern Big Data, die durch Geschäftsabläufe, Kundeninteraktionen und Protokolldateien generiert werden und die ein Unternehmen verwenden kann, um den Zustand seines Systems besser zu verstehen und zu verwalten. ITOA umfasst das Durchsuchen der Daten, um den aktuellen Status zu bewerten, bestehende oder potenzielle zukünftige Probleme zu identifizieren und das IT-Betriebsteam über Probleme zu informieren.
  2. Visualisieren: Diese Funktion unterstützt die Geschäftsentscheidungen des Unternehmens, indem sie einen Überblick über die Funktionsweise eines Systems gibt. IT Operations Analytics verarbeitet Big Data und wandelt sie in nutzbare Grafiken, Diagramme und Spreadsheets um. Die Visualisierung kann über interaktive Dashboards oder andere Verwaltungspanels erfolgen. Sie hilft Unternehmen zu verstehen, wo sie investieren müssen, z.B. in die Lizenzierung, in Sicherheitsanwendungen oder in den Kauf neuer Geräte oder Software.
  3. Analyse: Die Unternehmen kann die visualisierten Analyse nutzen, um die Leistung zu ermitteln und ungewöhnliche Aktivitäten in IT-Umgebungen zu erkennen und Maßnahmen zur Lösung dieser Probleme zu empfehlen.

KPIs für die IT Operations Analytics

Unternehmen können erfolgreiche IT-Betriebsanalyseprogramme (IT Operations Analytics, ITOA) anhand mehrerer wichtiger Leistungsindikatoren (KPI) beurteilen:

  • Mittlere Zeit bis zur Reparatur (Mean Time To Repair, MTTR): Die Operations Analytics kann IT-Teams bei der Behebung von Problemen helfen, die durch die Disziplin entdeckt werden, und so die MTTR verbessern. Unternehmen mit einem nahtlos integrierten ITOA- und Incident-Management-Programm können Probleme schnell lösen.
  • Falsch-positive Raten: Die ITOA, die sich zunehmend auf Automatisierung stützt, kann manchmal falsch-positive Ergebnisse liefern, was zu einer unnötigen Triage führen und die Zuverlässigkeitstechniker und andere IT-Mitarbeiter ermüden kann. Eine zunehmende Anzahl von Fehlalarmen zeigt möglicherweise, dass der ITOA-Prozess oder der IT-Betrieb nicht wie vorgesehen funktionieren.
  • Serviceverfügbarkeit: Dies ist der Prozentsatz der Betriebszeit des Dienstes (d. h. die Zeitspanne, in der die Services wie erwartet funktionieren und für Endbenutzer zugänglich sind). Es ist wichtig, dass Unternehmen die Verfügbarkeit von Services verfolgen, um sicherzustellen, dass sie die Erwartungen ihrer Kunden erfüllen und ihre Service Level Agreements (SLAs) einhalten.
  • Kapazitätsauslastung: ITOA kann Unternehmen auch dabei helfen, herauszufinden, ob ihre IT-Systeme ausgelastet oder nicht ausgelastet sind. Letzteres wird für Unternehmen, die die Cloud nutzen, immer wichtiger, um ihre Nutzung einzuschätzen und unnötige Kosten zu vermeiden.

Wichtigste Vorteile der IT Operations Analytics

Jedes Unternehmen, das über eine starke IT Operations Analytics (ITOA) verfügt, hat mehrere Vorteile:

  • Kosteneinsparungen: Unternehmen, die ITOA nutzen, profitieren von mehreren Kostenvorteilen, darunter operative Effizienz, reduzierte Ausfallzeiten und -ausfälle sowie die Minimierung kostspieliger Datenpannen und anderer externer Bedrohungen.
  • Verbesserte Customer Experience: Kunden haben hohe Erwartungen daran, dass die von ihnen gekauften Services und Produkte dann funktionieren, wenn sie es wünschen. Unternehmen, die einen ausgezeichneten Kundenservice bieten wollen, verlassen sich auf ITOA, um unnötige Störungen zu vermeiden, damit die Kunden bei Bedarf auf die Produkte und Lösungen dieser Unternehmen zugreifen können.
  • Verbesserte Sicherheit und Compliance: ITOA spielt eine entscheidende Rolle bei der Erkennung potenzieller Sicherheitsprobleme, die durch anfällige Endpunkte und Endgeräte verursacht werden. ITOA kann auch Compliance-Probleme erkennen, wie zum Beispiel nicht konforme Systemkonfigurationen und nicht funktionierende Audit-Logs.
  • Datengesteuerte Entscheidungsfindung: ITOA ist oft Teil eines größeren organisatorischen Fokus auf Daten- und Analytics-Tools. ITOA hilft Unternehmen, intelligentere IT-Investitionen zu tätigen, Ressourcen besser zuzuteilen und sich auf zukünftige Herausforderungen vorzubereiten.

Setzen Sie auf IT-Automatisierung

Die IT-Automatisierungstools von IBM – darunter IBM AIOps Insights, IBM Cloud Pak for AIOps, IBM Turbonomic und IBM Instana – helfen dabei, alle Ihre Systeme am Laufen zu halten, indem sie Ihnen die Observability und Ressourcenmanagement-Funktionen bieten, um Vorfälle schneller und günstiger vorherzusagen, zu erkennen und zu beheben. Sie können auch zur Automatisierung von Innovation und Management innerhalb und zwischen IT-Teams beitragen.

 

Autor

Keith O'Brien

Writer

IBM Consulting

Weiterführende Lösungen
IBM Instana Observability

Nutzen Sie die Leistungsfähigkeit von KI und Automatisierung, um Probleme im gesamten Anwendungs-Stack proaktiv zu lösen.

IBM Instana Observability kennenlernen
Beratungsleistungen für Automatisierung

Gehen Sie über einfache Aufgabenautomatisierungen hinaus und bewältigen Sie anspruchsvolle, kundenorientierte und umsatzfördernde Prozesse mit integrierter Akzeptanz und Skalierung.

Erkunden Sie die Beratungsleistungen von IBM zur Automatisierung
AIOps-Lösungen

Erfahren Sie, wie KI für den IT-Betrieb die Erkenntnisse liefert, die Sie benötigen, um die Leistung Ihres Unternehmens entscheidend zu verbessern.

AIOps-Lösungen erkunden
Machen Sie den nächsten Schritt

Erfahren Sie, wie KI für den IT-Betrieb die Erkenntnisse liefert, die Sie benötigen, um die Leistung Ihres Unternehmens entscheidend zu verbessern.

Instana Observability erkunden Erkunden Sie Instana