Überwachung

Es ist wichtig, eine stabile Hochverfügbarkeitsumgebung bereitzustellen und gleichzeitig ein genaues Verfügbarkeitsbild in Echtzeit über alle E-Commerce-Kanäle hinweg sicherzustellen. Die verschiedenen Überwachungsservices und -tools unterstützen Sie bei der Bewertung von Metriken, Leistung und Allgemeinzustand, um sicherzustellen, dass Ihr Konto frei von Unterbrechungen ist.

Die Überwachung hilft bei der Analyse von Trends, bei der Leistungsoptimierung und bei der Kapazitätsplanung. Die synthetische Überwachung wird auch implementiert, um Ausfälle oder abnormalen Datenverkehr zu mindern und bei Bedarf automatisch an wichtige Mitarbeiter zu berichten. Ein IBM Betriebsteam ist 24 Stunden am Tag verfügbar, um sicherzustellen, dass Ausfälle zeitnah behandelt werden.
Haftungsausschluss:
  • Einige Metriken oder Komponenten sind nur für detaillierte Diagnosen verfügbar.
  • Die Überwachungstools, Parameter und Spezifikationen, die von IBM verwendet werden, können ohne weitere Mitteilung geändert werden. Viele der Überwachungsdetails sind IBM proprietär und vertraulich, z. B. für die Netz-, Datenbank-und Infrastrukturüberwachung.

Was überwacht IBM ?

System- und Infrastrukturüberwachung

Die System-und Infrastrukturüberwachung überprüft den Zustand und das Wohlbefinden der physischen Server-Hardware, der Ressourcen der virtuellen Maschine und des Netzes. Diese Überwachung umfasst die CPU-und Betriebssystemspeicherbelegung, den Zustand des Dateisystems, die Netzverfügbarkeit, den Durchsatz usw. Infrastrukturüberwachung und Alertausgabe an das IBM Betriebsteam sind Standardservices, die als Teil Ihrer Anwendungskonten bereitgestellt werden.
Hinweis: Die System-und Infrastrukturüberwachung wird für alle Umgebungen ausgeführt. Alerts werden jedoch nur für das Produktionskonto ausgelöst.
In der folgenden Tabelle sind einige der von der Anwendung durchgeführten System-und Infrastrukturüberwachungen aufgeführt.
Überwachungsstufe Beschreibung
Serverplattenbelegung IBM überwacht und stellt sicher, dass die Serverdateisysteme über Plattenspeicherplatz verfügen.
Platten-E/A IBM verfolgt E/A-Probleme bei Operationen in den Dateisystemen.
Physischer Hauptspeicher IBM überwacht die Speicherbelegung der Server.
Server-CPU-Belastung IBM überwacht die CPU auf Lastspitzen und verfolgt Daten auf Leistungstrends.
Netz IBM überwacht die Netzkonnektivität und -bandbreite auf unterschiedliche Weise und auf mehreren Ebenen, einschließlich synthetischer Überwachung und interner Methoden. Dies umfasst Server, Firewalls, Router, Proxy-Server und Programme für den Lastausgleich.
Lastausgleichsfunktion (HAProxy) IBM überwacht und stellt sicher, dass die Lastausgleichsfunktionen für Anwendungen (HAProxy) aktiv und empfangsbereit sind. Durch die URL-Überwachung wird sichergestellt, dass Anforderungen an die Anwendungsserver geleitet werden.
Verkehrsabnormität IBM überwacht abnormalen Webdatenverkehr und verhindert DDOS-Attacken.

Überwachung auf Anwendungsebene

Die Anwendung wird über die Serverinfrastruktur ausgeführt und stellt die Software und die Services zur Unterstützung der Anwendung bereit. Die Anwendung umfasst die Überwachung der Anwendungs-JVM, der Anwendungsserverknoteninstanzen, der logischen Datenbankserver, der Messaging-Systeme und der Anwendungskomponenten.
Hinweis: Die Anwendungsüberwachung wird immer in Produktionsumgebungen und nur in eingeschränkten Umgebungen in Vorproduktionsumgebungen ausgeführt.
In der folgenden Tabelle sind einige der von der Anwendung durchgeführten Anwendungsüberwachungen aufgeführt.
Tabelle 1. Überwachung auf Anwendungsebene
Überwachungsstufe Beschreibung
Docker-Container IBM überwacht Docker-Container, um sicherzustellen, dass sie immer betriebsbereit sind.
Middlewarekomponenten
  • IBM überwacht die Anwendungsserverknoten.
  • IBM überwacht alle Hintergrundservices.
  • IBM überwacht den Datenbankserver auf verschiedene Leistungsspitzen und Unregelmäßigkeiten.
  • IBM überwacht Messaging-Systeme, um zufriedenstellende Antwortzeiten und Nachrichtenübertragungsraten zu gewährleisten. Eröffnen Sie ein Ticket mit IBM® Support, um mehr Einblick in einen bestimmten Prozess zu erhalten, wenn Sie eine verzögerte Antwort erhalten.
  • Web- und Anwendungsserver werden aus Gründen der Hochverfügbarkeit in Clustern gruppiert. Die Lastausgleichsfunktion für Hochverfügbarkeit (Proxy-Server) verteilt den Datenverkehr auf Cluster und übernimmt die Funktionsübernahme.
Anwendungsfehlerrate IBM überwacht alle Anwendungs-und Hintergrundservices, um die Fehlerrate auszuwerten. Ein Alert wird ausgelöst, wenn eine Fehlerrate einen Schwellenwert innerhalb eines definierten Zeitrahmens überschreitet.
Nachrichtenweitergabeverzögerung IBM überwacht die Nachrichtenweitergabegeschwindigkeit, um eine minimale Verzögerung sicherzustellen.
Aggregierte Verzögerung IBM überwacht die Gesamtverzögerung zwischen Beginn und Ende eines Hintergrundprozesses.
Antwortzeit des Web-Servers IBM überwacht die API-Antwortzeiten, um sicherzustellen, dass die Zeiten in zufriedenstellende Bewertungen ähnlich wie APDEX fallen.
Servicedurchsatz IBM stellt sicher, dass die Anzahl der pro Minute verarbeiteten Anforderungen einen zufriedenstellenden Schwellenwert erreicht.

Überwachung von Anwendungsverzögerungen

Einige API-Anforderungen werden asynchron verarbeitet, daher ist es wichtig, diese Prozesszeiten zu überwachen. Bei einer Angebotsaktualisierung erhält der Benutzer beispielsweise einen akzeptierten Status, kann aber nicht bestätigen, wann der Prozess abgeschlossen ist.

Die Überwachung spielt eine wichtige Rolle, um sicherzustellen, dass die Prozesszeit unter einen zufriedenstellenden Schwellenwert fällt. Wenn ein Schwellenwert überschritten wird, wird das Operationsteam sofort benachrichtigt, um das Problem zu lösen. Details zu Schwellenwerten oder Toleranzstufen finden Sie im Service-Level-Agreement Ihres Nutzers.

Die Verzögerungsüberwachung verwendet einige Schlüsselmetriken:
  • Nachrichtenweitergabeverzögerung
  • Netzverzögerung
  • Antwortzeit (Web-und Hintergrundprozess)
  • Aggregatverzögerung
Das folgende Diagramm zeigt die überwachten Metriken für jeden Service und den zugehörigen Hintergrundprozess.
Diagramm zur Darstellung von Netzverzögerung, Antwortzeit, Laufzeitverzögerung und Aggregatverzögerung

Die Metriken werden auf globaler Ebene für alle Tenantkonten überwacht.

Synthetische Überwachung

Die synthetische Überwachung ist ein Verfahren, das ein spezielles Tool verwendet, um Webanforderungen an jede der unterstützten APIs zu simulieren. Die synthetische Überwachung wird für die folgenden Ebenen implementiert:
Tabelle 2. Synthetische Überwachung
Überwachungsstufe Frequenz Beschreibung
Konnektivität Alle 5 Minuten Die synthetische Überwachung ruft API-Anforderungen an jede unterstützte API auf und überprüft den erwarteten Antwortstatus und die zufriedenstellende Antwortzeit.
Datenintegrität Alle 15 Minuten Die synthetische Überwachung simuliert typische Anwendungsfälle und stellt sicher, dass vom System akzeptierte Daten abgerufen werden können. Außerdem werden die berechneten Werte auf ihre Richtigkeit überprüft.
Sicherungsweitergabe Stündlich Stellt sicher, dass die an einer Position verarbeiteten Daten ordnungsgemäß gespeichert und von einer Sicherungsposition abgerufen werden können.