Cos'è AIOps?
Scopri in che modo AIOps (Artificial Intelligence for IT Operations) utilizza i dati e il machine learning per migliorare e automatizzare la gestione dei servizi IT
Iscriviti alla newsletter di IBM Scopri in che modo AIOps promuove le prestazioni delle app (1,3 MB)
Sfondo nero e blu
Cos'è AIOps?

Coniato da Gartner, il termine AIOps, acronimo di artificial intelligence for IT operations, consiste nell'applicazione delle funzionalità di AI (Artificial Intelligence), quali i modelli di NLP (natural language processing) e machine learning, per automatizzare e semplificare i flussi di lavoro operativi.

Nello specifico, AIOps utilizza le funzionalità di big data, analytics e machine learning per effettuare quanto segue:

  • Raccogliere e aggregare gli enormi e sempre crescenti volumi di dati generati da più componenti dell'infrastruttura IT, dalle esigenze delle applicazioni, dagli strumenti di monitoraggio delle prestazioni e dai sistemi di ticketing di assistenza
  • Distinguere in modo intelligente i "segnali" dal "rumore" per identificare gli eventi e i modelli significativi correlati ai problemi di prestazioni e disponibilità dei sistemi.
  • Diagnosticare le cause principali e segnalarle a IT e DevOps per una risposta e una risoluzione rapide oppure, in alcuni casi, risolvere automaticamente questi problemi senza intervento umano. 

Integrando più strumenti di operazioni IT manuali separati con una singola piattaforma di operazioni IT automatizzata e intelligente, AIOps consente ai team di operazioni IT di rispondere più rapidamente, e anche proattivamente, ai rallentamenti e alle interruzioni, con una visibilità e un contesto end-to-end.

Colma il divario che vede da una parte uno scenario IT sempre più diversificato, dinamico e difficile da monitorare e team isolati e, dall'altro, le aspettative degli utenti di interruzioni minime o inesistenti nelle prestazioni e nella disponibilità delle applicazioni. La maggior parte degli esperti considera AIOps il futuro della gestione di ITOps e la domanda non fa che crescere, dato il maggiore focus aziendale sulle iniziative di trasformazione digitale.

Implementazione di AIOps

Il percorso verso AIOps è diverso in ogni organizzazione. Dopo aver valutato a che punto sei nel tuo percorso verso AIOps, puoi iniziare a integrare gli strumenti che aiutano i team a osservare, prevedere e agire rapidamente in caso di problemi operativi IT. Mentre valuti gli strumenti per migliorare AIOps all'interno della tua organizzazione, assicurati che dispongano delle seguenti funzioni:

Osservabilità: l'osservabilità si riferisce a strumenti software e procedure atti a inserire, aggregare, correlare e analizzare un flusso costante di dati sulle prestazioni da un'applicazione distribuita e dall'hardware su cui viene eseguita, al fine di monitorare, risolvere i problemi ed eseguire il debug dell'applicazione in modo più efficace, per soddisfare le aspettative del cliente, gli accordi sul livello di servizio (SLA) e altri requisiti aziendali. Queste soluzioni possono offrirti una vista olistica di applicazioni, infrastruttura e rete mediante l'aggregazione e il consolidamento dei dati ma non intraprendono azioni correttive per risolvere i problemi IT. Sebbene non intraprendano azioni correttive per risolvere i problemi IT, raccolgono e aggregano dati IT da diverse origini di dati nei domini IT per avvisare gli utenti finali di potenziali problemi, per far sì che i team di assistenza IT implementino le necessarie misure correttive. Sebbene i dati e le visualizzazioni corrispondenti di questi strumenti siano preziosi, creano una dipendenza dalle organizzazioni IT per prendere decisioni e rispondere in modo appropriato ai problemi tecnici. Un'ottimizzazione delle risorse che richiede che un operatore aggiorni manualmente i sistemi operativi potrebbe non riscontrare i vantaggi in situazioni di domanda dinamica.

Analytics predittiva: le soluzioni AIOps possono analizzare e correlare i dati per insight e azioni automatizzate migliori, consentendo ai team IT di mantenere il controllo su ambienti IT sempre più complessi e garantire le prestazioni delle applicazioni.  Essere in grado di correlare e isolare i problemi è un grosso passo in avanti per qualsiasi team ITOps. Riduce i tempi per rilevare i problemi che altrimenti potrebbero non essere stati riscontrati nell'organizzazione. Le organizzazioni godranno dei vantaggi del rilevamento delle anomalie, degli avvisi e dei consigli per le soluzioni automatici che, a loro volta, ridurranno i tempi di inattività complessivi e il numero di incidenti e ticket. L'ottimizzazione dinamica delle risorse può essere automatizzata utilizzando l'analytics predittiva, che può garantire le prestazioni delle applicazioni riducendo al contempo in modo sicuro i costi delle risorse anche in presenza di un'elevata variabilità della domanda.

Risposta proattiva: alcune soluzioni AIOps risponderanno in modo proattivo agli eventi indesiderati, come i rallentamenti e le interruzioni, mettendo insieme le prestazioni delle applicazioni e la gestione delle risorse in tempo reale. Eseguendo il feed delle metriche delle prestazioni delle applicazioni negli algoritmi predittivi, possono identificare i modelli e le tendenze che coincidono con diversi problemi IT. Con la capacità di prevedere i problemi IT prima che si verifichino, gli strumenti AIOps possono avviare in risposta un processo automatizzato e pertinente, correggendo rapidamente i problemi. Le organizzazioni saranno in grado di vedere i vantaggi derivanti dall'automazione intelligente, come un tempo medio di rilevamento (MTTD, mean time to detection) migliore.

Questo tipo di tecnologia è il futuro della gestione di ITOps e può aiutare le aziende a migliorare sia l'esperienza dei dipendenti che quella dei clienti. Non solo i sistemi AIOps garantiscono che i problemi di assistenza IT vengano risolti in modo tempestivo, ma forniscono anche una rete di sicurezza per i team ITOps, risolvendo i problemi che potrebbero sfuggire a causa di una svista umana, come i silos organizzativi, i team con risorse insufficienti e altro ancora. 

Vantaggi di AIOps

Il vantaggio principale di AIOps è quello di consentire alle operazioni IT di identificare, affrontare e risolvere i rallentamenti e le interruzioni in tempi più rapidi rispetto a quelli possibili passando manualmente al vaglio gli avvisi da più strumenti ITOps. Questo comporta diversi vantaggi specifici:

  • Un tempo medio di risoluzione (mean time to resolution, MTTR) migliore: riducendo il "rumore" di ITOps e correlando i dati delle operazioni da più ambienti IT, AIOps è in grado di identificare le cause principali e proporre soluzioni in modo più rapido e accurato di quanto potrebbero mai fare delle persone reali. Ciò consente alle organizzazioni di fissare e raggiungere obiettivi di MTTR precedentemente impensabili. Ad esempio, l'infrastruttura IT di Vivy ha ridotto del 66% il tempo medio di riparazione (mean time to repair, MTTR) per l'app dell'azienda, da tre giorni a un giorno o meno.
  • Costi operativi inferiori: l'identificazione automatica dei problemi operativi e gli script di risposta riprogrammati ridurranno i costi operativi, consentendo una migliore allocazione delle risorse. Ciò consente anche alle risorse di personale di essere libere di dedicarsi a lavori più innovativi e complessi, migliorando di conseguenza l'esperienza dei dipendenti. Mediante l'ottimizzazione, Providence ha risparmiato più di 2 milioni di dollari garantendo al tempo stesso le prestazioni dell'app durante i picchi.
  • Più osservabilità e migliore collaborazione: le integrazioni disponibili negli strumenti di monitoraggio AIOps facilitano una collaborazione tra i team più efficace nelle funzioni DevOps, ITOps, governance e sicurezza. Una visibilità, delle comunicazioni e una trasparenza migliori consentono a questi team di migliorare il processo decisionale e rispondere più rapidamente ai problemi. Per fare un esempio, Dealerware ha portato più osservabilità nella sua architettura basata sui container, migliorando così le prestazioni dell'app durante la pandemia e riducendo la latenza di consegna del 98%.

Passa da una gestione reattiva a una proattiva e quindi predittiva: con funzionalità di analytics predittiva integrate, AIOps apprende costantemente per identificare e dare la priorità agli avvisi più urgenti, consentendo ai team IT di occuparsi dei potenziali problemi prima che causino rallentamenti o interruzioni. Electrolux ha accelerato la risoluzione dei problemi IT da 3 settimane a 1 ora mediante un tempo medio di rilevamento (mean time to detection, MTTD) più rapido e ha risparmiato più di 1.000 ore all'anno automatizzando le attività di riparazione.

Casi di utilizzo di AIOps

AIOps integra funzionalità di big data, analytics avanzata e machine learning per affrontare i seguenti casi di utilizzo:

  • Analisi delle cause ultime: come suggerito dal nome, le analisi delle cause ultime determinano la causa ultima dei problemi per apportare misure correttive con le soluzioni appropriate. Identificando le cause ultime, i team possono evitare il lavoro non necessario legato al trattamento dei sintomi del problema piuttosto che al problema di fondo. Ad esempio, una piattaforma AIOps può tracciare l'origine di un'interruzione di rete per risolvere immediatamente il problema e impostare delle misure di sicurezza per evitare problemi simili in futuro.
  • Rilevamento delle anomalie: gli strumenti AIOps possono esaminare accuratamente ampie quantità di dati cronologici e rilevare punti di dati atipici in un dataset. Questi valori anomali agiscono come 'segnali' che identificano e prevedono eventi problematici, come le violazioni dei dati. Questa funzionalità consente alle aziende di evitare costose conseguenze, come pubblicità negativa, sanzioni normative e cali nella fiducia dei consumatori.  
  • Monitoraggio delle prestazioni: le applicazioni moderne sono spesso separate da molteplici livelli di astrazione, il che rende difficile comprendere quali risorse fisiche di server, storage e rete sottostanti stiano supportando le specifiche applicazioni. AIOps aiuta a colmare questo divario. Funge da strumento di monitoraggio per i sistemi di storage, virtualizzazione e infrastruttura cloud, segnalando metriche quali l'utilizzo, la disponibilità e i tempi di risposta. Inoltre, si avvale delle funzionalità di correlazione degli eventi per consolidare e aggregare le informazioni, consentendo un migliore utilizzo delle informazioni per gli utenti finali.  
  • Adozione del cloud/migrazione al cloud: per la maggior parte delle organizzazioni, l'adozione del cloud non è immediata e completa, bensì graduale, con un conseguente ambiente multicloud ibrido (cloud privato, cloud pubblico, più fornitori) e con molteplici interdipendenze che possono variare troppo velocemente e frequentemente per essere documentate. Fornendo una chiara visibilità in queste interdipendenze, AIOps può ridurre drasticamente i rischi operativi della migrazione al cloud e dell'approccio di cloud ibrido.
  • Adozione DevOps: DevOps velocizza lo sviluppo offrendo ai gruppi di sviluppo più capacità per eseguire il provisioning e la riconfigurazione dell'infrastruttura, ma i team IT continueranno ad avere la responsibilità di gestire questa infrastruttura. AIOps fornisce la visibilità e l'automazione di cui l'IT ha bisogno per supportare DevOps senza un grande sforzo ulteriore di gestione.
Come funziona AIOps?

Il modo più facile per comprendere come funziona AIOps consiste nell'esaminare il ruolo che ogni tecnologia del componente AIOps - big data, machine learning e automazione - riveste nel processo.

AIOps utilizza una piattaforma di big data per aggregare i dati ITOps, i team e gli strumenti separati  in un unico posto. Questi dati possono includere:

  • Dati cronologici delle prestazioni e degli eventi
  • Eventi delle operazioni di streaming in tempo reale
  • Log e metriche di sistema
  • Dati di rete, inclusi i dati di pacchetto
  • Dati e apertura di ticket correlati agli incidenti
  • Dati delle richieste delle applicazioni
  • Dati dell'infrastruttura

AIOps applica quindi funzionalità di analitica e machine learning focalizzate a:

  • Separare gli avvisi di evento significativi dal "rumore": AIOps  esamina accuratamente i dati ITOps separando i segnali, avvisi di evento anomalo importanti, dal rumore (tutto il resto).
  • Identificare le cause principali e proporre soluzioni: AIOps può correlare gli eventi anomali con altri dati di evento negli ambienti per individuare con precisione la causa di un'interruzione o di un problema di prestazioni e consigliare delle misure correttive.
  • Automatizzare le risposte, inclusa la risoluzione proattiva in tempo reale: come minimo, AIOps può indirizzare automaticamente avvisi e soluzioni consigliate ai gruppi IT appropriati, o addirittura creare team di risposta in base alla natura del problema e della soluzione. In molti casi, può elaborare i risultati dal machine learning per attivare risposte di sistema automatiche che si occupano dei problemi in tempo reale, prima ancora che gli utenti si accorgano che si sono verificati.
  • Apprendere costantemente, per migliorare la gestione dei problemi futuri: i modelli AI possono anche aiutare il sistema ad apprendere e adattarsi alle variazioni nell'ambiente, come ad esempio il provisioning di nuova infrastruttura o la sua riconfigurazione eseguita dai team DevOps.
Soluzioni correlate
IBM® Turbonomic

È possibile automatizzare continuamente le azioni critiche in tempo reale e senza l'intervento umano, in modo da garantire alle applicazioni l'uso più efficiente delle risorse di elaborazione, storage e rete a ogni livello dello stack.

Esplora IBM Turbonomic
IBM® Instana Observability

Migliora il tuo monitoraggio delle prestazioni delle applicazioni per fornire il contesto di cui hai bisogno per risolvere gli incidenti più velocemente

Esplora l'automazione basata sull'AI
Informazioni dettagliate su IBM AIOps

AIOps Insights è un'anteprima del prodotto che consente di convalidare e risolvere i problemi affrontati dai team centrali delle operazioni IT nella gestione dalla disponibilità di risorse IT aziendali mediante la gestione di eventi e incidenti. I leader ITOps sono invitati a partecipare alla  beta e ad ottenere l'accesso esclusivo ad AIOps Insights.

Esplora la prima esperienza del prodotto AIOps Insights
AIOps per IBM zSystems

Migliora la gestione dei sistemi, le operazioni IT, le prestazioni delle applicazioni e la resilienza operativa con l'AI sul mainframe.

Esplora AIOps for IBM zSystems
Passa alla fase successiva

IBM AIOps aiuta le organizzazioni a garantire le prestazioni delle applicazioni riducendo al contempo i costi IT. Le organizzazioni sono state in grado di ottenere una disponibilità delle applicazioni del 99,99% e di ridurre il MTTD del 55% per i problemi che influiscono sul servizio. Non aspettare a proporre esperienze del cliente eccezionali con IBM AIOps. Scopri come realizzare un ROI del 471% con AIOps e come ridurre la spesa per il consumo di cloud pubblico del 33%. Utilizzando l'automazione intelligente dell'IT con IBM AIOps, le organizzazioni possono identificare ed eseguire meglio le automazioni ad alto impatto in tutto il business e l'IT utilizzando strumenti, insight ed esperti comprovati per ottenere migliori risultati di business.

Esplora il portfolio IBM AIOps