Cos'è il monitoraggio AWS?

Una donna con gli occhiali e i capelli raccolti lavora a una scrivania, con lo sguardo rivolto ai diversi monitor di computer che mostrano varie visualizzazioni dei dati.

Autori

Gregg Lindemulder

Staff Writer

IBM Think

Annie Badman

Staff Writer

IBM Think

Che cos'è il monitoraggio di AWS?

Il monitoraggio AWS è il processo di tracciamento, raccolta e analisi dei dati dalla piattaforma di cloud computing Amazon Web Services (AWS). Aiuta a ottimizzare le risorse AWS, identificare i problemi di prestazioni, gestire i costi e mantenere un'infrastruttura cloud sicura.

Possedendo oltre il 30% del mercato del cloud, AWS gestisce più infrastrutture di qualsiasi altro fornitore di infrastrutture cloud.1 Le aziende utilizzano AWS per l'hosting web, lo storage dei dati, l'analytics dei big data, lo sviluppo di app mobili e i servizi IT aziendali.

Per queste organizzazioni, il monitoraggio dei loro workload su AWS è critico. Consente loro di tenere traccia delle metriche delle prestazioni, dei log di sistema e degli eventi per garantire che gli ambienti AWS funzionino come previsto.

Senza il monitoraggio di AWS, i problemi di prestazioni possono moltiplicarsi inosservati, i costi possono aumentare a causa dell'eccessivo provisioning delle risorse e le vulnerabilità di sicurezza possono rimanere esposte. Ad esempio, un traffico di rete eccessivo potrebbe sovraccaricare un' unità di elaborazione centrale (CPU) e causare colli di bottiglia. Oppure, contenitori di storage cloud  non configurati correttamente potrebbero esporre dati sensibili attraverso l'accesso pubblico.

Gli strumenti di monitoraggio AWS possono identificare questi problemi e attivare risposte automatiche, come l'invocazione delle funzioni AWS Lambda per la correzione, o avvisare i team per la risoluzione manuale dei problemi. Questo aiuta le organizzazioni a mantenere prestazioni ottimali, ridurre i costi, rafforzare il loro livello di sicurezza e prendere decisioni basate sui dati sulla propria infrastruttura.

Le ultime notizie nel campo della tecnologia, supportate dalle analisi degli esperti

Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Perché il monitoraggio AWS è importante?

Il monitoraggio AWS aiuta a garantire l'affidabilità, la disponibilità e le prestazioni delle risorse cloud AWS. Fornisce visibilità sulle infrastrutture AWS in modo che le organizzazioni possano rilevare e risolvere i problemi in modo proattivo, riducendo le interruzioni e riducendo al minimo i tempi di inattività.

Mantieni l'affidabilità e la disponibilità

Il monitoraggio aiuta a rivelare lo stato di salute delle risorse basate sul cloud AWS, tra cui capacità di calcolo, sistemi di storage e infrastruttura di rete.

Ad esempio, se un server subisce un carico elevato a causa del traffico dei clienti, il monitoraggio attiva lo scaling automatico per aggiungere altri server. Questo aiuta a prevenire arresti anomali delle applicazioni e garantisce tempi di risposta costanti anche durante i picchi di traffico, in modo che le applicazioni rimangano accessibili agli utenti finali. 

Migliori performance 

Raccogliendo metriche sulle risorse cloud AWS, il monitoraggio può aiutare a ottimizzare le configurazioni per una maggiore velocità ed efficienza.

Ad esempio, se gli utenti in Asia riscontrano un caricamento lento delle pagine, gli strumenti di monitoraggio possono memorizzare nella cache i contenuti a Singapore, più vicino alla loro posizione. Questo aiuta a ridurre la latenza e consente un caricamento delle pagine più rapido, garantendo uno streaming più fluido e migliorando l'esperienza utente.

Gestisci i costi di AWS

I costi del cloud rappresentano spesso una delle principali voci del budget IT di un'organizzazione.

Il monitoraggio può identificare risorse AWS sottoutilizzate o non necessarie per aiutare a ottimizzare i costi del cloud. Ad esempio, un Virtual Servers che utilizza solo il 10% della memoria allocata per il workload può rischiare di sprecare il 90% dei costi di memoria. Il monitoraggio AWS può aiutare a correggere automaticamente le dimensioni delle istanze e a chiudere le risorse inattive durante le ore non di punta. 

Maggiore sicurezza

Il monitoraggio rileva attività sospette o modifiche insolite alle infrastrutture AWS che potrebbero indicare minacce alla sicurezza, come chiamate API non autorizzate, trasferimenti di dati insoliti e modifiche alla configurazione.

Ad esempio, quando gli strumenti di monitoraggio rilevano ripetutamente tentativi di accesso falliti, possono bloccare l'indirizzo IP di origine e attivare notifiche di sicurezza.

Anticipa i problemi

Il monitoraggio può individuare potenziali problemi prima che si verifichino e abbiano un impatto sugli utenti finali. Ciò può includere l'avvicinamento ai limiti di capacità, il peggioramento dei trend delle prestazioni e la scadenza dei certificati SSL.

Ad esempio, il monitoraggio di un database che si avvicina a una capacità di storage superiore al 90% attiva gli avvisi agli sviluppatori affinché aggiungano più spazio prima che il database si guasti.

AI Academy

Prepararsi all'AI con l'hybrid cloud

Condotto dai migliori leader di pensiero di IBM, il programma di studi è stato progettato per aiutare i dirigenti aziendali ad acquisire le conoscenze necessarie per dare priorità agli investimenti in AI che possono favorire la crescita.

Come funziona il monitoraggio di AWS?

Il monitoraggio di AWS raccoglie e analizza continuamente i dati dall'infrastruttura AWS.

I dati di monitoraggio in genere includono metriche delle prestazioni, utilizzo delle risorse e tassi di errore di server, database e applicazioni, insieme a registri di sistema come chiamate API, modifiche alla configurazione, attività di rete ed eventi di sicurezza.

Gli strumenti analizzano questi dati per identificare tendenze, rilevare anomalie e visualizzare le prestazioni in tempo reale tramite dashboard.

Gli strumenti di monitoraggio AWS possono quindi avvisare i team di potenziali problemi per la risoluzione dei problemi e l'analisi della causa principale. Possono anche risolvere automaticamente alcuni problemi, tra cui l'aggiunta di risorse o il riavvio dei servizi AWS.

Ad esempio, quando i clienti abbandonano i carrelli della spesa online a causa dei check-out falliti, il monitoraggio AWS può identificare gli errori del gateway di pagamento e avvisare il team DevOps. I team possono quindi esaminare e correggere l'impostazione del timeout obsoleta, riducendo al minimo la perdita di guadagni.

I prezzi del monitoraggio di AWS in genere variano in base al numero di metriche personalizzate, ai volumi di inserimento dei log e alla frequenza di analisi, a seconda dei servizi utilizzati.

metriche chiave per il monitoraggio di AWS

Per fornire una copertura completa, il monitoraggio AWS in genere tiene traccia delle metriche in quattro aree principali:

  • Prestazioni e utilizzo dell'infrastruttura
  • Prestazioni e comportamento delle applicazioni
  • Sicurezza e conformità
  • Metriche operative e aziendali

Prestazioni e utilizzo dell'infrastruttura

Il monitoraggio AWS monitora automaticamente le prestazioni e il consumo di risorse tra i componenti dell'infrastruttura AWS.

Queste metriche aiutano i team a identificare le risorse sovradimensionate, prevedere le esigenze di capacità e rilevare il degrado delle prestazioni prima che abbia un impatto sugli utenti.

Amazon CloudWatch, la base del monitoraggio AWS, è lo strumento principale per la raccolta di questi dati. Raccoglie, aggrega e analizza automaticamente le metriche di tutti i servizi AWS. Altri strumenti AWS come X-Ray e CloudTrail si integrano con CloudWatch per fornire una visione unificata dello stato di salute, delle prestazioni e della sicurezza del sistema.

Amazon EC2 (Elastic Compute Cloud)

EC2 fornisce virtual servers che eseguono applicazioni nel cloud con capacità di calcolo su richiesta.

Le metriche chiave di EC2 includono:

  • Utilizzo della CPU: percentuale delle unità di calcolo allocate utilizzate
  • I/O su disco: velocità di lettura e scrittura dai volumi di storage collegati
  • Traffico di rete: flusso di dati in entrata e in uscita dall'istanza EC2
  • Controlli di stato: controlli dello stato di salute del sistema e delle istanze che verificano la raggiungibilità e rilevano problemi a livello di hardware o software 

ECS (Elastic Container Service) ed EKS (Elastic Kubernetes Service)

ECS e EKS, i servizi container nativi di Amazon, implementano e orchestrano applicazioni containerizzate su larga scala.

Le metriche chiave dei container includono:

  • Utilizzo delle risorse: CPU, utilizzo della memoria e utilizzo della rete
  • Log delle prestazioni: informazioni diagnostiche come gli errori di riavvio del container per l'analisi della causa principale
  • Prestazioni di rete: traffico di rete tra contenitori, servizi e risorse esterne

Amazon RDS (servizio di database relazionale)

RDS fornisce database gestiti in ambienti cloud AWS.

Le metriche RDS chiave includono:

  • Connessioni al database: numero di connessioni attive a ciascuna istanza del database RDS
  • Latenza delle query: tempo necessario per completare le query del database
  • Utilizzo dello spazio di archiviazione: spazio su disco consumato dai database

AWS Lambda

Lambda offre l'elaborazione serverless per attività come il ridimensionamento delle immagini o l'aggiornamento dei database.

Le metriche Lambda chiave includono:

  • Numero di chiamate: numero di volte in cui una funzione viene eseguita
  • Durata: Tempo per completare ogni funzione
  • Errori: numero di errori di esecuzione delle funzioni

Bilanciamento del carico elastico (ELB)

L'ELB distribuisce il traffico in entrata verso le risorse cloud appropriate per contribuire a mantenere un'elevata disponibilità.

Le metriche chiave dell'ELB includono:

  • Latenza: tempo impiegato per l'elaborazione delle richieste tramite il load balancer
  • Conteggio delle richieste: totale delle richieste gestite dal load balancer  
  • Conteggio delle connessioni attive: connessioni contemporanee dai client ai target
  • Byte elaborati: byte totali elaborati dal bilanciatore di carico

Prestazioni e comportamento delle applicazioni

Il monitoraggio delle prestazioni di AWS può tracciare il comportamento delle applicazioni, ma solo con la configurazione manuale e la strumentazione del codice.

Le applicazioni raramente esistono in isolamento: si connettono a processori di pagamento esterni, API di terze parti e database non AWS.

Il monitoraggio di queste interazioni rivela se i problemi di prestazioni derivano dalle risorse AWS o da dipendenze esterne. Fornisce inoltre insight su come gli utenti finali interagiscono con le applicazioni.

AWS X-Ray, un servizio di tracciamento distribuito, è lo strumento principale per la raccolta di queste metriche. Quando il codice è strumentato con il suo SDK, X-Ray traccia le richieste mentre si spostano tra le applicazioni, fornendo visibilità su latenza, errori e colli di bottiglia tra i servizi AWS.

Le principali metriche di monitoraggio delle prestazioni delle applicazioni includono:

  • Tassi di richiesta: volume e modelli delle richieste in arrivo, che rivelano picchi di traffico e tendenze di utilizzo
  • Tassi di errore: transazioni non riuscite, processi bloccati e connessioni API interrotte
  • Monitoraggio degli utenti: dati reali sull'esperienza utente (tempi di caricamento delle pagine, errori JavaScript, percentuali di clic)
  • Tracciamento distribuito: percorsi di richiesta end-to-end tra i microservizi, che individuano dove si verificano strozzature o guasti 

Sicurezza e conformità 

Il monitoraggio di AWS tiene traccia automaticamente delle attività e delle modifiche alla configurazione all'interno di un account AWS. Queste metriche aiutano a identificare chi ha avuto accesso ai dati sensibili, a rilevare le violazioni delle politiche e a dimostrare la conformità normativa.

I diversi servizi di sicurezza AWS offrono diversi vantaggi in termini di sicurezza, come audit trail, tracciamento della configurazione e rilevamento delle minacce. Alcuni, come CloudTrail, registrano l'attività di base per impostazione predefinita, mentre altri, come GuardDuty e Config, richiedono una configurazione esplicita.

I principali servizi di sicurezza nativi di AWS includono:

  • AWS CloudTrail: tiene traccia di ogni chiamata API negli ambienti AWS, registrando chi ha fatto cosa e quando, ed è essenziale per l'audit e le indagini in caso di incidenti.
  • AWS Config: registra come sono configurate le risorse AWS e tiene traccia delle modifiche nel tempo, contribuendo a dimostrare la conformità e il rispetto delle politiche.
  • Amazon Inspector: un servizio di gestione della sicurezza e delle vulnerabilità che analizza automaticamente le istanze e i contenitori EC2 alla ricerca di vulnerabilità note e deviazioni dalle best practice di sicurezza.
  • Amazon GuardDuty: un servizio di rilevamento continuo delle minacce che utilizza l'apprendimento automatico per rilevare attività dannose, tra cui mining di criptovalute, tentativi di accesso non autorizzati e chiamate API insolite su un account AWS.

Le principali metriche di sicurezza includono:

  • Chiamate API: Le chiamate API sono comunicazioni tra le API AWS e i programmi software per richiedere dati, servizi o azioni. La fonte, la destinazione e l'ora vengono registrate per tutte le chiamate.
  • Accesso non autorizzato: Qualsiasi attività di accesso insolita o dannosa.
  • Modifiche alla configurazione: modifiche alle impostazioni delle risorse AWS per la conformità e il controllo. Ad esempio, le modifiche alle autorizzazioni utente o alla crittografia dei dati potrebbero influire sulla conformità alle politiche di sicurezza o alle normative sulla protezione dei dati.
  • Analisi del traffico di rete: traffico di rete su cloud privati virtuali (VPC) per aiutare a individuare minacce alla sicurezza come configurazioni errate o tentativi di esfiltrazione dei dati.

Metriche operative e aziendali

Il monitoraggio AWS può tenere traccia delle metriche aziendali, ma richiede una configurazione personalizzata in cui le organizzazioni le definiscono e le inviano agli strumenti di monitoraggio AWS sotto forma di metriche personalizzate.

Queste metriche, come le entrate, i tempi di evasione degli ordini o la soddisfazione dei clienti, possono aiutare a collegare le prestazioni tecniche ai risultati aziendali, giustificare la spesa per il cloud e identificare l'impatto dei problemi di sistema sulle entrate.

Le principali metriche operative e aziendali includono:

  • Tempo di risposta del servizio clienti: quanto velocemente i sistemi rispondono alle richieste dei clienti
  • Tempo di evasione dell'ordine: tempo medio di elaborazione e spedizione degli ordini di e-commerce
  • Attività degli utenti: utenti attivi giornalieri e mensili, nuove iscrizioni e conteggi delle sessioni
  • Ricavi: valore monetario totale degli acquisti in un periodo specifico
  • Fatturazione AWS: il rilevamento delle anomalie può identificare picchi di utilizzo insoliti in modo che i team possano apportare modifiche convenienti e rispettare le soglie di budget

Monitoraggio e osservabilità a confronto

Il monitoraggio aiuta a rispondere a ciò che non va, mentre l'observability aiuta a spiegare perché sta accadendo.

Le soluzioni di monitoraggio AWS in genere includono funzionalità di observability di AWS. Entrambi lavorano insieme per risolvere i problemi e mantenere l'affidabilità.

Monitoraggio

Il monitoraggio acquisisce metriche predefinite come l'utilizzo della CPU e la latenza di rete, offrendo un'istantanea delle prestazioni del sistema ma poche informazioni sul motivo per cui si verifica un problema. Ad esempio, il monitoraggio potrebbe identificare un elevato utilizzo della CPU in un server Web, ma non la causa principale. 

Observability

L'osservabilità mette in correlazione diversi tipi di dati di telemetria (metriche, eventi, log e tracce, ovvero i dati MELT) per fornire una visione in tempo reale degli ambienti AWS. Si è evoluta dal monitoraggio tradizionale per gestire la complessità delle architetture cloud-native.

Soluzioni correlate
IBM Z Operational Log and Data Analytics 

Accelera l'identificazione ibrida degli incidenti con analytics operative quasi in tempo reale.

Esplora IBM Z
Soluzioni di cloud analytics

Sblocca i risultati che cambiano il business con le soluzioni di cloud analytics che ti consentono di analizzare facilmente i dati e di creare modelli di machine learning.

Esplora le soluzioni di cloud analytics
Servizi di consulenza cloud

Scopri nuove funzionalità e promuovi l'agilità aziendale con i servizi di consulenza cloud di IBM.

Esplora i servizi di consulenza cloud
Prossimi passi

Sblocca insight in tempo reale dai tuoi dati IBM Z con analytics che collegano mainframe e cloud, in modo da poter agire più velocemente, ridurre i rischi e prendere decisioni più intelligenti.

Esplora IBM Z Ottieni maggiori informazioni