AWS-Überwachung ist der Prozess der Verfolgung, Erfassung und Analyse von Daten von der Cloud-Computing-Plattform von Amazon Web Services (AWS). Es hilft, AWS Ressourcen zu optimieren, Leistung zu identifizieren, Kosten zu verwalten und eine sichere Cloud-Infrastruktur aufrechtzuerhalten.
Mit über 30 % des Cloud-Marktes betreibt AWS mehr Infrastruktur als jeder andere Anbieter von Cloud-Infrastruktur.1 Unternehmen nutzen AWS für Webhosting, Datenspeicher, Big Data Analyse, mobile App Entwicklung und Enterprise-IT-Services.
Für diese Unternehmen ist die Überwachung ihrer Workloads auf AWS von entscheidender Bedeutung. Es ermöglicht ihnen, Leistung und Metriken, Systemprotokolle und Ereignisse zu verfolgen, um sicherzustellen, dass AWS-Umgebungen wie erwartet funktionieren.
Ohne AWS-Überwachung können Leistungsprobleme unentdeckt vervielfacht werden, die Kosten durch übermäßige Bereitstellung von Ressourcen in die Höhe schnellen und Sicherheitslücken können aufgedeckt bleiben. Beispielsweise kann übermäßiger Netzwerkverkehr eine zentrale Verarbeitungseinheit (CPU) überlasten und Engpässe verursachen. Oder falsch konfigurierte Cloud-Speicher-Container könnten sensible Daten durch öffentlichen Zugriff offenlegen.
AWS-Überwachungstools können diese Probleme identifizieren und automatische Reaktionen auslösen – wie z. B. das Aufrufen von AWS Lambda-Funktionen zur Sanierung – oder Teams zur manuellen Fehlerbehebung benachrichtigen. Dies hilft Unternehmen, eine optimale Leistung aufrechtzuerhalten, Kosten zu senken, ihren Sicherheitsstatus zu stärken und datengesteuerte Entscheidungen über ihre Infrastruktur zu treffen.
Die AWS-Überwachung trägt dazu bei, die Zuverlässigkeit, Verfügbarkeit und Leistung der AWS-Cloud-Ressourcen sicherzustellen. Es bietet Einblick in AWS-Infrastrukturen, sodass Unternehmen Probleme proaktiv erkennen und beheben können, um Störungen zu reduzieren und Ausfallzeiten zu minimieren.
Die Überwachung hilft dabei, den Betriebszustand der Cloud-basierten AWS-Ressourcen aufzudecken, einschließlich Rechenkapazität, Speichersystemen und Netzwerkinfrastruktur.
Wenn ein Server beispielsweise durch Kundenverkehr stark ausgelastet ist, löst die Überwachung eine automatische Skalierung aus, um weitere Server hinzuzufügen. Dies hilft, Anwendungsabstürze zu verhindern und auch bei Datenverkehrsspitzen konsistente Reaktionszeiten zu gewährleisten, sodass Anwendungen für Endbenutzer zugänglich bleiben.
Durch das Sammeln von Metriken zu AWS-Cloud-Ressourcen kann die Überwachung helfen, Konfigurationen für mehr Geschwindigkeit und Effizienz zu optimieren.
Wenn Benutzer in Asien beispielsweise langsame Seitenaufbau erleben, können Überwachungstools Inhalte in Singapur zwischenspeichern, näher an ihrem Standort. Dies trägt zur Reduzierung der Latenz bei und ermöglicht schnellere Seitenladevorgänge, was ein reibungsloseres Streaming gewährleistet und die Erfahrung verbessert.
Cloud-Kosten sind oft einer der größten Posten im IT-Budget eines Unternehmens.
Die Überwachung kann nicht ausgelastete oder unnötige AWS-Ressourcen identifizieren, um die Cloud-Kosten zu optimieren. Zum Beispiel kann ein virtueller Server, der nur 10 % seines zugewiesenen Speichers für seine Workload nutzt, Gefahr laufen, 90% der Speicherkosten zu verschwenden. Die AWS-Überwachung kann dabei helfen, die Größe von Instanzen automatisch anzupassen und ungenutzte Ressourcen außerhalb der Spitzenzeiten abzuschalten.
Die Überwachung erkennt verdächtige Aktivitäten oder ungewöhnliche Änderungen an AWS-Infrastrukturen, die auf Sicherheitsbedrohungenhinweisen könnten, wie unautorisierte API-Aufrufe, ungewöhnliche Datenübertragungen und Konfigurationsänderungen.
Wenn Überwachungstools beispielsweise wiederholt fehlgeschlagene Anmeldeversuche erkennen, können sie die Quell-IP-Adresse blockieren und Sicherheitsbenachrichtigungen auslösen.
Die Überwachung kann potenzielle Probleme erkennen, bevor sie auftreten und sich auf Endbenutzer auswirken. Dies kann das Erreichen von Kapazitätsgrenzen, die Verringerung von Leistungstrends und das Ablaufen von SSL-Zertifikaten beinhalten.
Wenn zum Beispiel eine Datenbank überwacht wird, die sich einer Speicherkapazität von über 90 % nähert, werden Entwickler gewarnt, mehr Speicherplatz hinzuzufügen, bevor die Datenbank ausfällt.
Die AWS-Überwachung erfasst und analysiert kontinuierlich Daten aus der AWS-Infrastruktur.
Überwachungsdaten umfassen in der Regel Leistung, Ressourcen und Metriken von Servern, Datenbanken und Anwendungen sowie Systemprotokolle wie API-Aufrufe, Konfigurationsänderungen, Netzwerkaktivitäten und Sicherheitsereignisse.
Tools analysieren diese Daten, um Trends zu identifizieren, Anomalien zu erkennen und die Leistung in Echtzeit über Dashboards zu visualisieren.
AWS-Überwachungstools können Teams dann auf potenzielle Probleme zur Fehlerbehebung und Ursachenanalyse aufmerksam machen. Einige Probleme können auch automatisch behoben werden, z. B. das Hinzufügen von Ressourcen oder das Neustarten von AWS-Services.
Wenn Kunden beispielsweise Online-Warenkörbe aufgrund fehlgeschlagener Bezahlvorgänge abbrechen, kann die AWS-Überwachung Fehler im Zahlungsgateway identifizieren und das DevOps-Team benachrichtigen. Sie können dann die veraltete Timeout-Einstellung untersuchen und korrigieren, um Umsatzverluste zu minimieren.
Die Preisgestaltung für die AWS-Überwachung skaliert in der Regel mit der Anzahl der benutzerdefinierten Metriken, dem Protokollaufnahmevolumen und der Analysehäufigkeit, abhängig von den genutzten Services.
Um eine umfassende Abdeckung zu gewährleisten, verfolgt die AWS-Überwachung in der Regel Metriken in vier Kernbereichen:
AWS-Überwachung verfolgt automatisch die Leistung und den Ressourcenverbrauch über alle AWS-Infrastruktur-Komponenten.
Mithilfe dieser Metriken können Teams überprovisionierte Ressourcen erkennen, Kapazitätsanforderungen vorhersagen und Leistungseinbußen erkennen, bevor sie sich auf die Benutzer auswirken.
Amazon CloudWatch, die Grundlage der AWS-Überwachung, ist das primäre Tool zur Erfassung dieser Daten. Es sammelt, aggregiert und analysiert automatisch Metriken für alle AWS-Services. Andere AWS-Tools wie X-Ray und CloudTrail lassen sich in CloudWatch integrieren, um eine einheitliche Sicht auf den Systemzustand, die Leistung und die Sicherheit zu bieten.
EC2 bietet virtuellen Servern, auf denen Anwendungen in der Cloud ausgeführt werden, bedarfsgerechte Rechenkapazität.
Zu den wichtigsten EC2-Metriken gehören:
ECS und EKS, die nativen Container-Services von Amazon, bereitstellen containerisierte Anwendungen in großem Maßstab und orchestrieren sie.
Zu den wichtigsten Containern gehören die Metriken:
RDS bietet verwaltete Datenbanken in AWS-Cloud-Umgebungen.
Zu den wichtigsten RDS-Metriken gehören:
Lambda bietet Serverlos-Computing für Aufgaben wie die Größenänderung von Bildern oder das Aktualisieren von Datenbanken.
Zu den wichtigsten Lambda-Metriken gehören:
ELB verteilt eingehenden Traffic an die entsprechenden Cloud-Ressourcen, um die Hochverfügbarkeit aufrechtzuerhalten.
Zu den wichtigsten ELB-Metriken gehören:
AWS Leistungsüberwachung kann die Anwendung verfolgen, jedoch nur mit manueller Konfiguration und Code-Instrumentierung.
Anwendungen existieren selten isoliert – sie sind mit externen Zahlungsabwicklern, APIs von Drittanbietern und Nicht-AWS-Datenbanken verbunden.
Die Überwachung dieser Interaktionen zeigt, ob Leistungsprobleme auf Ressourcen oder auf externe Abhängigkeiten zurückzuführen sind. Sie bietet auch Erkenntnis in die Interaktion von Endbenutzern mit Anwendungen.
AWS X-Ray, ein verteilter Verfolgungsdienst, ist das primäre Tool für die Erfassung dieser Metriken. Wenn Code mit seinem SDK instrumentiert ist, verfolgt X-Ray Anforderungen, während sie sich durch Anwendungen verschieben, und bietet so Einblick in Latenz, Fehler und Engpässe in allen AWS-Services.
Zu den wichtigsten Metriken zur Überwachung der Anwendungsleistung gehören:
AWS Monitoring verfolgt automatisch Aktivitäten und Konfigurationsänderungen innerhalb eines AWS-Kontos. Mithilfe dieser Metriken können sie ermitteln, wer auf vertrauliche Daten zugegriffen hat, Richtlinienverstöße erkennen und die Einhaltung gesetzlicher Vorschriften nachweisen.
Verschiedene AWS-Sicherheitsservices bieten unterschiedliche Sicherheitsvorteile, wie z. B. Überprüfungsprotokolle, Konfigurationsverfolgung und Bedrohungserkennung. Einige, wie CloudTrail, protokollieren standardmäßig grundlegende Aktivitäten, während andere – wie GuardDuty und Config – eine explizite Einrichtung erfordern.
Zu den wichtigsten AWS-nativen Sicherheitsservices gehören:
Zu den wichtigsten Sicherheitsmetriken gehören:
Die AWS-Überwachung kann geschäftliche Metriken verfolgen, erfordert jedoch eine benutzerdefinierte Konfiguration, bei der Unternehmen sie definieren und als benutzerdefinierte Metriken an AWS-Überwachungstools senden.
Diese Metriken – wie Umsatz, Auftragserfüllungszeit oder Kundenzufriedenheit – können dabei helfen, die technische Leistung mit den Geschäftsergebnissen in Verbindung zu bringen, Cloud-Ausgaben zu rechtfertigen und zu ermitteln, wie sich Systemprobleme auf den Umsatz auswirken.
Zu den wichtigsten betrieblichen und geschäftlichen Metriken gehören:
Überwachung hilft dabei, Antworten auf Fehler zu finden, und Observability hilft zu erklären, warum etwas nicht stimmt.
AWS-Überwachungslösungen beinhalten in der Regel AWS-Observability -Funktionen. Beide arbeiten zusammen, um Probleme zu lösen und die Zuverlässigkeit aufrechtzuerhalten.
Die Überwachung erfasst vordefinierte Metriken wie CPU-Auslastung und Netzwerklatenz und bietet eine Momentaufnahme der Systemleistung, aber wenig Erkenntnis darüber, warum ein Problem auftritt. Beispielsweise kann die Überwachung eine hohe CPU-Auslastung auf einem Webserver identifizieren, aber nicht die eigentliche Ursache.
Observability korreliert mehrere Telemetriedatentypen – Metriken, Ereignisse, Protokolle und Traces (MELT-Daten) – um eine Echtzeitansicht von AWS-Umgebungen zu ermöglichen. Es hat sich von der traditionellen Überwachung weiterentwickelt, um die Komplexität von cloudnativen Architekturen zu bewältigen.
