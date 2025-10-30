Geschäftsoperationen Cloud DevOps IT-Infrastruktur Sicherheit

Was ist AWS-Überwachung?

AWS-Überwachung ist der Prozess der Verfolgung, Erfassung und Analyse von Daten von der Cloud-Computing-Plattform von Amazon Web Services (AWS). Es hilft, AWS Ressourcen zu optimieren, Leistung zu identifizieren, Kosten zu verwalten und eine sichere Cloud-Infrastruktur aufrechtzuerhalten.

Mit über 30 % des Cloud-Marktes betreibt AWS mehr Infrastruktur als jeder andere Anbieter von Cloud-Infrastruktur.1 Unternehmen nutzen AWS für Webhosting, Datenspeicher, Big Data Analyse, mobile App Entwicklung und Enterprise-IT-Services.

Für diese Unternehmen ist die Überwachung ihrer Workloads auf AWS von entscheidender Bedeutung. Es ermöglicht ihnen, Leistung und Metriken, Systemprotokolle und Ereignisse zu verfolgen, um sicherzustellen, dass AWS-Umgebungen wie erwartet funktionieren.

Ohne AWS-Überwachung können Leistungsprobleme unentdeckt vervielfacht werden, die Kosten durch übermäßige Bereitstellung von Ressourcen in die Höhe schnellen und Sicherheitslücken können aufgedeckt bleiben. Beispielsweise kann übermäßiger Netzwerkverkehr eine zentrale Verarbeitungseinheit (CPU) überlasten und Engpässe verursachen. Oder falsch konfigurierte Cloud-Speicher-Container könnten sensible Daten durch öffentlichen Zugriff offenlegen.

AWS-Überwachungstools können diese Probleme identifizieren und automatische Reaktionen auslösen – wie z. B. das Aufrufen von AWS Lambda-Funktionen zur Sanierung – oder Teams zur manuellen Fehlerbehebung benachrichtigen. Dies hilft Unternehmen, eine optimale Leistung aufrechtzuerhalten, Kosten zu senken, ihren Sicherheitsstatus zu stärken und datengesteuerte Entscheidungen über ihre Infrastruktur zu treffen.

Warum ist die AWS-Überwachung wichtig?

Die AWS-Überwachung trägt dazu bei, die Zuverlässigkeit, Verfügbarkeit und Leistung der AWS-Cloud-Ressourcen sicherzustellen. Es bietet Einblick in AWS-Infrastrukturen, sodass Unternehmen Probleme proaktiv erkennen und beheben können, um Störungen zu reduzieren und Ausfallzeiten zu minimieren.

Sorgen Sie für Zuverlässigkeit und Verfügbarkeit

Die Überwachung hilft dabei, den Betriebszustand der Cloud-basierten AWS-Ressourcen aufzudecken, einschließlich Rechenkapazität, Speichersystemen und Netzwerkinfrastruktur.

Wenn ein Server beispielsweise durch Kundenverkehr stark ausgelastet ist, löst die Überwachung eine automatische Skalierung aus, um weitere Server hinzuzufügen. Dies hilft, Anwendungsabstürze zu verhindern und auch bei Datenverkehrsspitzen konsistente Reaktionszeiten zu gewährleisten, sodass Anwendungen für Endbenutzer zugänglich bleiben. 

Verbesserung der Performance 

Durch das Sammeln von Metriken zu AWS-Cloud-Ressourcen kann die Überwachung helfen, Konfigurationen für mehr Geschwindigkeit und Effizienz zu optimieren.

Wenn Benutzer in Asien beispielsweise langsame Seitenaufbau erleben, können Überwachungstools Inhalte in Singapur zwischenspeichern, näher an ihrem Standort. Dies trägt zur Reduzierung der Latenz bei und ermöglicht schnellere Seitenladevorgänge, was ein reibungsloseres Streaming gewährleistet und die Erfahrung verbessert.

Verwalten von AWS-Kosten

Cloud-Kosten sind oft einer der größten Posten im IT-Budget eines Unternehmens.

Die Überwachung kann nicht ausgelastete oder unnötige AWS-Ressourcen identifizieren, um die Cloud-Kosten zu optimieren. Zum Beispiel kann ein virtueller Server, der nur 10 % seines zugewiesenen Speichers für seine Workload nutzt, Gefahr laufen, 90% der Speicherkosten zu verschwenden. Die AWS-Überwachung kann dabei helfen, die Größe von Instanzen automatisch anzupassen und ungenutzte Ressourcen außerhalb der Spitzenzeiten abzuschalten. 

Erhöhte Sicherheit

Die Überwachung erkennt verdächtige Aktivitäten oder ungewöhnliche Änderungen an AWS-Infrastrukturen, die auf Sicherheitsbedrohungenhinweisen könnten, wie unautorisierte API-Aufrufe, ungewöhnliche Datenübertragungen und Konfigurationsänderungen.

Wenn Überwachungstools beispielsweise wiederholt fehlgeschlagene Anmeldeversuche erkennen, können sie die Quell-IP-Adresse blockieren und Sicherheitsbenachrichtigungen auslösen.

Probleme antizipieren

Die Überwachung kann potenzielle Probleme erkennen, bevor sie auftreten und sich auf Endbenutzer auswirken. Dies kann das Erreichen von Kapazitätsgrenzen, die Verringerung von Leistungstrends und das Ablaufen von SSL-Zertifikaten beinhalten.

Wenn zum Beispiel eine Datenbank überwacht wird, die sich einer Speicherkapazität von über 90 % nähert, werden Entwickler gewarnt, mehr Speicherplatz hinzuzufügen, bevor die Datenbank ausfällt.

Wie funktioniert die AWS-Überwachung?

Die AWS-Überwachung erfasst und analysiert kontinuierlich Daten aus der AWS-Infrastruktur.

Überwachungsdaten umfassen in der Regel Leistung, Ressourcen und Metriken von Servern, Datenbanken und Anwendungen sowie Systemprotokolle wie API-Aufrufe, Konfigurationsänderungen, Netzwerkaktivitäten und Sicherheitsereignisse.

Tools analysieren diese Daten, um Trends zu identifizieren, Anomalien zu erkennen und die Leistung in Echtzeit über Dashboards zu visualisieren.

AWS-Überwachungstools können Teams dann auf potenzielle Probleme zur Fehlerbehebung und Ursachenanalyse aufmerksam machen. Einige Probleme können auch automatisch behoben werden, z. B. das Hinzufügen von Ressourcen oder das Neustarten von AWS-Services.

Wenn Kunden beispielsweise Online-Warenkörbe aufgrund fehlgeschlagener Bezahlvorgänge abbrechen, kann die AWS-Überwachung Fehler im Zahlungsgateway identifizieren und das DevOps-Team benachrichtigen. Sie können dann die veraltete Timeout-Einstellung untersuchen und korrigieren, um Umsatzverluste zu minimieren.

Die Preisgestaltung für die AWS-Überwachung skaliert in der Regel mit der Anzahl der benutzerdefinierten Metriken, dem Protokollaufnahmevolumen und der Analysehäufigkeit, abhängig von den genutzten Services.

Wichtige Metriken für die AWS-Überwachung

Um eine umfassende Abdeckung zu gewährleisten, verfolgt die AWS-Überwachung in der Regel Metriken in vier Kernbereichen:

  • Leistung und Nutzung derInfrastruktur
  • Leistung und Verhalten der Anwendung
  • Sicherheit und Compliance
  • Operative und geschäftliche Metriken

Leistung und Nutzung der Infrastruktur

AWS-Überwachung verfolgt automatisch die Leistung und den Ressourcenverbrauch über alle AWS-Infrastruktur-Komponenten.

Mithilfe dieser Metriken können Teams überprovisionierte Ressourcen erkennen, Kapazitätsanforderungen vorhersagen und Leistungseinbußen erkennen, bevor sie sich auf die Benutzer auswirken.

Amazon CloudWatch, die Grundlage der AWS-Überwachung, ist das primäre Tool zur Erfassung dieser Daten. Es sammelt, aggregiert und analysiert automatisch Metriken für alle AWS-Services. Andere AWS-Tools wie X-Ray und CloudTrail lassen sich in CloudWatch integrieren, um eine einheitliche Sicht auf den Systemzustand, die Leistung und die Sicherheit zu bieten.

Amazon EC2 (Elastic Compute Cloud)

EC2 bietet virtuellen Servern, auf denen Anwendungen in der Cloud ausgeführt werden, bedarfsgerechte Rechenkapazität.

Zu den wichtigsten EC2-Metriken gehören:

  • CPU-Auslastung: Prozentsatz der zugewiesenen Recheneinheiten, die genutzt werden
  • Festplatten-E/A: Lese- und Schreibrate von angeschlossenen Speichervolumes
  • Netzwerkverkehr: Daten, die in und aus der EC2-Instanz fließen
  • Statusprüfungen: System- und Instanzzustandsprüfungen, die Erreichbarkeit überprüfen und Hardware- oder Softwareprobleme erkennen 

ECS (Elastic Container Service) und EKS (Elastic Kubernetes Service)

ECS und EKS, die nativen Container-Services von Amazon, bereitstellen containerisierte Anwendungen in großem Maßstab und orchestrieren sie.

Zu den wichtigsten Containern gehören die Metriken:

  • Ressourcennutzung: CPU, Speichernutzung und Netzwerknutzung
  • Leistungsprotokolle: Diagnoseinformationen wie z. B. Fehler beim Neustart von Containern zur Ursachenanalyse
  • Netzwerkleistung: Netzwerkverkehr zwischen Containern, Diensten und externen Ressourcen

Amazon RDS (Relational Database Service)

RDS bietet verwaltete Datenbanken in AWS-Cloud-Umgebungen.

Zu den wichtigsten RDS-Metriken gehören:

  • Datenbankverbindungen: Anzahl der aktiven Verbindungen zu jeder RDS-Datenbankinstanz
  • Abfragelatenz: Zeit zum Abschließen von Datenbankabfragen
  • Speichernutzung: Von Datenbanken beanspruchter Speicherplatz

AWS Lambda

Lambda bietet Serverlos-Computing für Aufgaben wie die Größenänderung von Bildern oder das Aktualisieren von Datenbanken.

Zu den wichtigsten Lambda-Metriken gehören:

  • Anzahl der Aufrufe: Anzahl der Ausführungen einer Funktion
  • Dauer: Zeit für die Ausführung der einzelnen Funktionen
  • Fehler: Anzahl der Fehler beider Funktionsausführung

Elastic Load Balancing (ELB)

ELB verteilt eingehenden Traffic an die entsprechenden Cloud-Ressourcen, um die Hochverfügbarkeit aufrechtzuerhalten.

Zu den wichtigsten ELB-Metriken gehören:

  • Latenz: Die Zeit, die Anfragen zur Verarbeitung durch den Load Balancer benötigen
  • Anzahl der Anfragen: Gesamtzahl der Anfragen, die vom Load Balancer bearbeitet wurden  
  • Anzahl der aktiven Verbindungen: Gleichzeitige Verbindungen von Clients zu Zielen
  • Verarbeitete Bytes: Gesamtzahl der vom Load Balancer verarbeiteten Bytes

Leistung und Verhalten der Anwendung

AWS Leistungsüberwachung kann die Anwendung verfolgen, jedoch nur mit manueller Konfiguration und Code-Instrumentierung.

Anwendungen existieren selten isoliert – sie sind mit externen Zahlungsabwicklern, APIs von Drittanbietern und Nicht-AWS-Datenbanken verbunden.

Die Überwachung dieser Interaktionen zeigt, ob Leistungsprobleme auf Ressourcen oder auf externe Abhängigkeiten zurückzuführen sind. Sie bietet auch Erkenntnis in die Interaktion von Endbenutzern mit Anwendungen.

AWS X-Ray, ein verteilter Verfolgungsdienst, ist das primäre Tool für die Erfassung dieser Metriken. Wenn Code mit seinem SDK instrumentiert ist, verfolgt X-Ray Anforderungen, während sie sich durch Anwendungen verschieben, und bietet so Einblick in Latenz, Fehler und Engpässe in allen AWS-Services.

Zu den wichtigsten Metriken zur Überwachung der Anwendungsleistung gehören:

  • Anforderungsraten: Volumen und Muster eingehender Anfragen, die Verkehrsspitzen und Nutzungstrends aufzeigen
  • Fehlerraten: Fehlgeschlagene Transaktionen, abgestürzte Prozesse und unterbrochene API- Verbindungen
  • Benutzerüberwachung: Echte Daten zur Erfahrung – Seitenladezeiten, JavaScript-Fehler, Klickraten
  • Verteiltes Tracing: End-to-End-Anforderungen durchsuchen die Microservice, ermitteln, wo Engpässe oder Ausfälle auftreten 

Sicherheit und Compliance 

AWS Monitoring verfolgt automatisch Aktivitäten und Konfigurationsänderungen innerhalb eines AWS-Kontos. Mithilfe dieser Metriken können sie ermitteln, wer auf vertrauliche Daten zugegriffen hat, Richtlinienverstöße erkennen und die Einhaltung gesetzlicher Vorschriften nachweisen.

Verschiedene AWS-Sicherheitsservices bieten unterschiedliche Sicherheitsvorteile, wie z. B. Überprüfungsprotokolle, Konfigurationsverfolgung und Bedrohungserkennung. Einige, wie CloudTrail, protokollieren standardmäßig grundlegende Aktivitäten, während andere – wie GuardDuty und Config – eine explizite Einrichtung erfordern.

Zu den wichtigsten AWS-nativen Sicherheitsservices gehören:

  • AWS CloudTrail: Verfolgt jeden API-Aufruf in AWS-Umgebungen und macht Protokollierung, wer was wann getan hat – unerlässlich für Auditing und Untersuchung von Vorfällen.
  • AWS Config: Zeichnet auf, wie die AWS-Ressourcen konfiguriert sind, und verfolgt Änderungen im Laufe der Zeit, um die Einhaltung von Vorschriften und Richtlinien nachzuweisen.
  • Amazon Inspector: Ein Service für das Sicherheits- und Schwachstellenmanagement, der EC2-Instanzen und -Container automatisch auf bekannte Schwachstellen und Abweichungen von Best Practices für die Sicherheit durchsucht.
  • Amazon GuardDuty: Ein kontinuierlicher Dienst zur Erkennung von Bedrohungen, der maschinelles Lernen einsetzt, um bösartige Aktivitäten zu erkennen, einschließlich Kryptowährungsmining, unbefugte Zugriffsversuche und ungewöhnliche API-Aufrufe über ein AWS-Konto.

Zu den wichtigsten Sicherheitsmetriken gehören:

  • API-Aufrufe: API-Aufrufe sind Kommunikationen zwischen AWS-APIs und Softwareprogrammen, um Daten, Services oder Aktionen anzufordern. Quelle, Ziel und Timing werden für alle Anrufe aufgezeichnet.
  • Unautorisierter Zugriff: Jede ungewöhnliche oder böswillige Anmeldeaktivität.
  • Konfigurationsänderungen: Änderungen an den AWS-Ressourcenkonfigurationen für Compliance und Auditing. Zum Beispiel können Änderungen der Benutzerberechtigungen oder der Verschlüsselung die Einhaltung von Sicherheitsrichtlinien oder Datenschutzbestimmungen beeinträchtigen.
  • Analyse des Netzwerkverkehrs: Netzwerkverkehr über virtuelle Private Clouds (VPCs) hinweg, um Sicherheitsbedrohungen wie Fehlkonfigurationen oder Datenexfiltrationsversuche zu erkennen.

Operative und geschäftliche Metriken

Die AWS-Überwachung kann geschäftliche Metriken verfolgen, erfordert jedoch eine benutzerdefinierte Konfiguration, bei der Unternehmen sie definieren und als benutzerdefinierte Metriken an AWS-Überwachungstools senden.

Diese Metriken – wie Umsatz, Auftragserfüllungszeit oder Kundenzufriedenheit – können dabei helfen, die technische Leistung mit den Geschäftsergebnissen in Verbindung zu bringen, Cloud-Ausgaben zu rechtfertigen und zu ermitteln, wie sich Systemprobleme auf den Umsatz auswirken.

Zu den wichtigsten betrieblichen und geschäftlichen Metriken gehören:

  • Reaktionszeit des Kundenservice: Wie schnell Systeme auf Kundenanfragen reagieren
  • Zeit für die Auftragserfüllung: Durchschnittliche Zeit, die für die Bearbeitung und den Versand von E-Commerce-Bestellungen benötigt wird
  • Benutzeraktivität: Täglich und monatlich aktive Benutzer, neue Anmeldungen und Sitzungszahlen
  • Umsatz: Gesamter monetärer Wert der Einkäufe über einen bestimmten Zeitraum
  • AWS-Abrechnung: Die Erkennung von Anomalien kann ungewöhnliche Nutzungsspitzen erkennen, sodass Teams kostengünstige Anpassungen vornehmen und Budgetschwellen einhalten können

Überwachung vs. Observability

Überwachung hilft dabei, Antworten auf Fehler zu finden, und Observability hilft zu erklären, warum etwas nicht stimmt.

AWS-Überwachungslösungen beinhalten in der Regel AWS-Observability -Funktionen. Beide arbeiten zusammen, um Probleme zu lösen und die Zuverlässigkeit aufrechtzuerhalten.

Überwachung

Die Überwachung erfasst vordefinierte Metriken wie CPU-Auslastung und Netzwerklatenz und bietet eine Momentaufnahme der Systemleistung, aber wenig Erkenntnis darüber, warum ein Problem auftritt. Beispielsweise kann die Überwachung eine hohe CPU-Auslastung auf einem Webserver identifizieren, aber nicht die eigentliche Ursache. 

Observability

Observability korreliert mehrere Telemetriedatentypen – Metriken, Ereignisse, Protokolle und Traces (MELT-Daten) – um eine Echtzeitansicht von AWS-Umgebungen zu ermöglichen. Es hat sich von der traditionellen Überwachung weiterentwickelt, um die Komplexität von cloudnativen Architekturen zu bewältigen.
