Der von Gartner geprägte Begriff AIOps – die Kurzform für „Artificial Intelligence for IT Operations“ (d. h. Künstliche Intelligenz für den IT-Betrieb) – bezeichnet die Anwendung von Funktionen der künstlichen Intelligenz (KI), wie z. B. die Verarbeitung natürlicher Sprache und Modelle für maschinelles Lernen, zur Automatisierung und Rationalisierung von betrieblichen Arbeitsabläufen.
Insbesondere nutzt AIOps Big Data, Analytik und maschinelles Lernen für folgende Aufgaben:
Durch das Integrieren mehrerer separater manueller IT-Betriebstools in einer einzigen intelligenten und automatisierten IT-Betriebsplattform versetzt AIOps die für den IT-Betrieb verantwortlichen Teams in die Lage, zügiger – und sogar proaktiv – mit durchgängiger Transparenz und Kontext auf Verlangsamungen und Betriebsunterbrechungen zu reagieren.
AIOps schließt so die Lücke zwischen einer zunehmend vielfältigen, dynamischen und schwer zu überwachenden IT-Landschaft und voneinander isolierten Teams einerseits und den Erwartungen der Anwender hinsichtlich einer geringen oder gar keiner Unterbrechung der Anwendungsleistung und -verfügbarkeit andererseits. Die meisten Experten halten AIOps für die Zukunft des IT-Betriebsmanagements und die Nachfrage wird mit dem zunehmenden Fokus der Unternehmen auf Initiativen zur digitalen Transformation noch weiter steigen.
Der Weg zu AIOps verläuft in jedem Unternehmen anders. Sobald Sie einschätzen können, an welchem Punkt Sie sich auf Ihrem Weg zu AIOps befinden, können Sie damit beginnen, Tools zu integrieren, die den Teams dabei helfen, Probleme im Zusammenhang mit dem IT-Betrieb zu beobachten, vorherzusagen und rasch auf sie zu reagieren. Wenn Sie Tools zur Verbesserung von AIOps in Ihrem Unternehmen in Betracht ziehen, sollten Sie dabei darauf achten, dass diese Tools die folgenden Leistungsmerkmale aufweisen:
Beobachtbarkeit: Beobachtbarkeit bezieht sich auf Software-Tools und Verfahren für die Ingestion, Aggregation und Analyse eines stetigen Stroms von Leistungsdaten aus einer verteilten Anwendung und der Hardware, auf der sie ausgeführt wird. Ziel ist es, die Anwendung effektiver zu überwachen, auf Fehler zu überprüfen und diese zu beheben, um wiederum Erwartungen an das Kundenerlebnis, Service-Level-Agreements (SLAs) und andere Geschäftsanforderungen erfüllen zu können. Diese Lösungen können durch Datenaggregation und -konsolidierung einen ganzheitlichen Überblick über Ihre Anwendungen, Ihre Infrastruktur und Ihr Netzwerk liefern, aber sie ergreifen keine Korrekturmaßnahmen zur Behebung von IT-Problemen. Auch wenn diese Lösungen keine Korrekturmaßnahmen zur Behebung von IT-Problemen ergreifen, sammeln und aggregieren sie IT-Daten aus einer Vielzahl von Datenquellen über alle IT-Domänen hinweg, um Endbenutzer vor potenziellen Problemen zu warnen, und gehen davon aus, dass die IT-Serviceteams die notwendigen Korrekturen einleiten. Die von diesen Tools gelieferten Daten und ihre entsprechenden Visualisierungen sind zwar wertvoll, schaffen aber eine Abhängigkeit von IT-Organisationen, wenn es darum geht, Entscheidungen zu treffen und angemessen auf technische Probleme zu reagieren. Eine Ressourcenoptimierung, die eine manuelle Aktualisierung operativer Systeme erfordert, bringt in Situationen der dynamischen Nachfrage möglicherweise nicht den gewünschten Nutzen.
Prädiktive Analytik: AIOps-Lösungen können Daten analysieren und miteinander korrelieren, um bessere Einblicke zu ermöglichen und automatisierte Maßnahmen einzuleiten, so dass IT-Teams die Kontrolle über die immer komplexer werdenden IT-Umgebungen behalten und die Anwendungsleistung sicherstellen können. Die Fähigkeit zur Korrelation und Isolierung von Problemen bedeutet für jedes mit dem IT-Betrieb betraute Team einen riesigen Schritt nach vorn. Sie verkürzt die Zeit bis zur Erkennung von Problemen, die andernfalls im Unternehmen vielleicht überhaupt nicht bemerkt worden wären. Unternehmen profitieren von der automatischen Erkennung von Anomalien, Warnungen und Lösungsempfehlungen, was wiederum die Gesamtausfallzeit sowie die Anzahl von Vorfällen und Tickets reduziert. Die dynamische Ressourcenoptimierung kann mithilfe prädiktiver Analytik automatisiert werden. Dies stellt die Anwendungsleistung sicher und reduziert Ressourcenkosten selbst bei stark schwankender Nachfrage.
Proaktive Intervention: Manche AIOps-Lösungen reagieren proaktiv auf unbeabsichtigte Ereignisse wie etwa Verlangsamungen und Ausfälle und bringen so Anwendungsleistung und Ressourcenmanagement in Echtzeit zusammen. Durch die Einspeisung von Metriken zur Anwendungsleistung in prädiktive Algorithmen können sie Muster und Trends erkennen, die mit verschiedenen IT-Problemen zusammenhängen. Mit der Fähigkeit, IT-Probleme vorherzusagen, noch bevor sie überhaupt auftreten, können AIOps-Tools relevante, automatisierte Prozesse einleiten und dadurch Probleme zügig beheben. Die Vorteile der intelligenten Automatisierung, wie z. B. die Verbesserung der MTTD (Mean Time To Detection, d. h. durchschnittliche Zeit bis zur Erkennung), liegen dabei für Unternehmen klar auf der Hand.
Diese Art von Technologie ist die Zukunft des IT-Betriebsmanagements, da sie Unternehmen dabei helfen kann, die Erfahrung sowohl der Mitarbeiter als auch der Kunden zu verbessern. AIOps-Systeme stellen nicht nur sicher, dass Probleme im IT-Service zeitnah gelöst werden, sondern sie stellen für Teams, die für den IT-Betrieb zuständig sind, auch eine Art von Sicherheitsnetz dar, da sie auf Probleme reagieren, die aufgrund menschlicher Versäumnisse, wie z. B. organisatorischer Silos, personell unterbesetzte Teams usw., ansonsten unbemerkt und ungelöst bleiben könnten.
Der übergreifende Vorteil von AIOps besteht darin, dass der IT-Betrieb nun in der Lage ist, Verlangsamungen und Betriebsunterbrechungen schneller zu erkennen, anzugehen und zu beheben, als dies durch manuelles Durchsuchen von Warnmeldungen aus verschiedenen IT-Betriebstools möglich wäre. Daraus ergeben sich mehrere wichtige Vorteile:
Machen Sie den Schritt von reaktivem über proaktives zu prädiktivem Management: Mit integrierten Funktionen für prädiktive Analytik lernt AIOps kontinuierlich, die dringendsten Alerts zu ermitteln und zu priorisieren, sodass IT-Teams potenzielle Probleme angehen können, noch bevor sie überhaupt zu Verlangsamungen oder Betriebsunterbrechungen führen. Electrolux beschleunigte die Lösung von IT-Problemen durch Verkürzung der MTTD (Mean Time To Detection, d. h. durchschnittliche Zeit bis zur Erkennung) von 3 Wochen auf eine Stunde und konnte durch die Automatisierung von Reparaturaufgaben mehr als 1.000 Stunden pro Jahr einsparen.
AIOps vereint Big Data mit fortgeschrittener Analytik und Funktionen für maschinelles Lernen, um die folgenden Anwendungsfälle zu bewältigen:
Am einfachsten lässt sich die Funktionsweise von AIOps verstehen, wenn man die Rolle betrachtet, die die Technologie jeder einzelnen AIOps-Komponente – Big Data, maschinelles Lernen und Automatisierung – in diesem Prozess spielt.
AIOps stützt sich auf eine Big-Data-Plattform, um in Silos isolierte IT-Betriebsdaten, -teams und -tools an einem Ort zusammenzuführen. Diese Daten können Folgendes enthalten:
AIOps wendet dann gezielte Analysen und maschinelle Lernfunktionen auf diese Daten an:
Automatisieren Sie kontinuierlich kritische Aktionen in Echtzeit – und ohne menschliches Eingreifen –, die proaktiv die effizienteste Nutzung von Rechen-, Speicher- und Netzwerkressourcen für Ihre Anwendungen auf jeder Ebene des Stacks ermöglichen.
Verbessern Sie die Überwachung der Leistung Ihrer Anwendungen, um schneller Kontext zu Vorfällen bereitzustellen und diese so besser lösen zu können.
AIOps Insights ist ein Produkt im Frühstadium seiner Entwicklung, das der Validierung und Lösung von Problemen dient, mit denen zentrale IT-Betriebsteams bei der Verwaltung der Verfügbarkeit von Unternehmens-IT-Ressourcen durch Ereignis- und Vorfalls-Management konfrontiert sind. ITOps-Führungskräfte sind eingeladen, an der Betaphase teilzunehmen und exklusiven Zugang zu AIOps Insights zu erhalten.
Verbessern Sie die Systemverwaltung, den IT-Betrieb, die Anwendungsleistung und die operative Resilienz mit künstlicher Intelligenz auf dem Mainframe.