Cos'è AIOps?
Scopri come l'intelligenza artificiale per l'esercizio IT (AIOps, Artificial Intelligence for IT Operations) utilizza i dati e l'apprendimento automatico (o machine learning) per migliorare e automatizzare la gestione dei servizi IT
Iscriviti alla newsletter IBM Scopri come l'AIOps governa le prestazioni delle app
Sfondo nero e blu
Cos'è AIOps?

Coniato da Gartner, l'acronimo AIOps, ovvero intelligenza artificiale per l'esercizio IT, indica l'applicazione di capacità di intelligenza artificiale (AI), come l'elaborazione del linguaggio naturale e i modelli di machine learning, per automatizzare e razionalizzare workflow operativi.

In particolare, l'AIOps sfrutta capacità a livello di big data, analitica e machine learning per eseguire le operazioni seguenti:

  • Raccogliere e aggregare volumi enormi e sempre crescenti di dati generati da molteplici componenti dell'infrastruttura IT, richieste applicative, tool di monitoraggio prestazioni e sistemi di gestione di ticket di servizio.
  • Scorporare in modo intelligente i "segnali" dal "rumore" per identificare eventi e pattern significativi correlati alle prestazioni delle applicazioni e a problemi di disponibilità.
  • Diagnosticare le cause principali e segnalarle alle aree IT e DevOps per una rapida risposta e correzione o, in alcuni casi, per risolvere automaticamente il caso senza l'intervento umano. 

Integrando più strumenti manuali e distinti, in un'unica piattaforma intelligente e automatizzata, dedicata all'esercizio IT, l'AIOps consente ai gruppi assegnati di rispondere in modo più celere, persino proattivo, a rallentamenti e periodi di interruzione, con visibilità e contesto end-to-end.

L'AIOPS colma il divario che separa, da un lato, un panorama IT sempre più eterogeneo, dinamico, difficile da monitorare e contraddistinto da gruppi scarsamente integrati e, dall'altro, le aspettative degli utenti per prestazioni e disponibilità applicative senza, o quasi, interruzioni. La maggior parte degli esperti ritiene che l'AIOps rappresenti il futuro nella gestione dell'esercizio IT e, alla luce della crescente attenzione dei business verso iniziative di trasformazione digitale, la domanda non farà che aumentare.

Implementazione dell'AIOps

Il percorso di adozione dell'AIOps si differenzia da un'organizzazione all'altra. Una volta individuato il punto in cui ti trovi all'interno di tale percorso, puoi iniziare a incorporare strumenti per aiutare i gruppi a osservare, predire e agire rapidamente in caso di problemi operativi a livello IT. Nel considerare i diversi strumenti per migliorare l'AIOps nella tua organizzazione, dovrai assicurarti che presentino le seguenti caratteristiche:

Osservabilità: l'osservabilità si riferisce agli strumenti e alle pratiche software per l'acquisizione, l'aggregazione e l'analisi di un flusso costante di dati prestazione da un'applicazione distribuita e dall'hardware su cui viene eseguita. L'intento è monitorare, risolvere eventuali problemi ed eseguire il debug in modo più efficace per rispondere alle aspettative di esperienza del cliente e al contempo soddisfare i Service Level Agreement (SLA) e altri requisiti di business. Mediante l'aggregazione e il consolidamento dei dati, queste soluzioni possono fornire una visione olistica attraverso tutte le applicazioni, l'infrastruttura e la rete, ma senza intraprendere azioni correttive per affrontare eventuali problemi IT. Malgrado ciò, sono comunque in grado di raccogliere e aggregare i dati IT da una varietà di origini dei dati in tutti i domini IT per avvisare gli utenti finali di potenziali problemi, in attesa che i gruppi dedicati al servizio IT implementino le necessarie correzioni. Per quanto preziosi, i dati e le corrispondenti visualizzazioni provenienti da questi strumenti creano una dipendenza nei confronti delle organizzazioni IT, in particolare per quanto riguarda i processi decisionali e la capacità di rispondere a problemi tecnici con efficacia. L'ottimizzazione delle risorse che preveda l'intervento di un operatore per l'aggiornamento manuale dei sistemi operativi potrebbe non vedere i vantaggi in situazioni in cui la domanda è dinamica.

Analisi predittiva: le soluzioni AIOps sono in grado di analizzare e correlare i dati al fine di ottimizzare la conoscenza e l'automazione, consentendo ai gruppi IT di mantenere il controllo su ambienti IT sempre più complessi e garantire le massime prestazioni a livello applicativo.  Essere in grado di correlare e isolare i problemi rappresenta un enorme passo avanti per qualsiasi gruppo operazioni IT. Riduce i tempi necessari a rilevare nodi da sciogliere difficilmente identificabili in altro modo. D'altro canto, le organizzazioni trarranno vantaggi significativi automatizzando il rilevamento anomalie, gli avvisi e le raccomandazioni per la soluzione dei problemi e, grazie a ciò, riscontreranno inoltre una diminuzione dei tempi di inattività complessivi nonché del numero di incidenti e ticket. L'ottimizzazione dinamica delle risorse può essere automatizzata con l'analisi predittiva, il che può garantire prestazioni applicative ottimali e ridurre in modo sicuro i costi delle risorse anche in caso di elevata variabilità della domanda.

Risposta proattiva: alcune soluzioni AIOps risponderanno in modo proattivo a eventi imprevisti, come rallentamenti e periodi di interruzione, centralizzando in tempo reale la gestione delle prestazioni delle applicazioni e delle risorse. Inserendo metriche delle prestazioni applicative in algoritmi predittivi, dette soluzioni sono in grado di identificare pattern e tendenze che coincidono con problemi IT diversi. Grazie alla capacità di previsione, gli strumenti AIOps possono anticipare gli eventuali problemi IT avviando in risposta processi pertinenti e automatizzati e rettificando rapidamente la situazione. Le organizzazioni saranno in grado di vedere i vantaggi dell'automazione intelligente, ad esempio in un minor tempo medio di rilevamento (MTTD).

Aiutando il business a migliorare l'esperienza sia a livello dei dipendenti sia a livello del cliente, questo tipo di tecnologia rappresenta il futuro della gestione dell'esercizio IT. I sistemi AIOps, infatti, non solo assicurano una soluzione tempestiva dei problemi del servizio IT, ma forniscono anche una rete di protezione per i gruppi dedicati all'esercizio IT, affrontando disfunzioni che potrebbero passare inosservate, quali ambiti organizzativi a bassa integrazione, gruppi con risorse insufficienti e altro ancora. 

Vantaggi dell'AIOps

Il vantaggio principale dell'AIOps è che consente all'esercizio IT di identificare, affrontare e risolvere rallentamenti e periodi di interruzione più rapidamente di quanto non sia possibile fare vagliando manualmente gli avvisi provenienti da più strumenti IT dedicati. Ciò si traduce in diversi vantaggi chiave:

  • Minore tempo medio di risoluzione (MTTR): filtrando il rumore dell'esercizio IT e correlando i dati operativi provenienti da ambienti informativi diversi, l'AIOps è in grado di identificare le cause principali e proporre soluzioni in modo più celere e accurato di quanto umanamente possibile. Ciò consente alle organizzazioni di stabilire e raggiungere obiettivi MTTR precedentemente impensabili. Ad esempio, l'infrastruttura IT di Vivy ha ridotto del 66% il tempo medio della riparazione (MTTR) dell'app dell'azienda, portandolo da tre giorni a un solo giorno e anche meno.
  • Costi operativi inferiori: l'identificazione automatica di problemi operativi e script di risposta riprogrammati riducono i costi, consentendo una migliore allocazione risorse. Ciò contribuisce inoltre a rendere disponibili risorse umane da destinare a lavori più innovativi e complessi, migliorando così l'esperienza dei dipendenti. Grazie all'ottimizzazione, Providence ha registrato risparmi per oltre 2 milioni di dollari e al tempo stesso garantito ottimali prestazioni dell'app durante i picchi.
  • Maggiore osservabilità e migliore collaborazione: le integrazioni disponibili negli strumenti di monitoraggio AIOps agevolano una più incisiva collaborazione trasversale tra le funzioni DevOps, ITOps, di governance e sicurezza. Visibilità, trasmissione e trasparenza efficaci consentono a questi gruppi di affinare il processo decisionale e rispondere ai problemi con maggior celerità. Ad esempio, Dealerware ha conseguito maggiore osservabilità per la propria architettura basata su container, migliorando le prestazioni delle app durante la pandemia e riducendo la latenza di consegna del 98%.

Transizione da gestione reattiva a proattiva e predittiva: grazie a capacità integrate di analitica predittiva, l'AIOps apprende di continuo a identificare e assegnare priorità agli avvisi più urgenti, consentendo ai gruppi IT di affrontare potenziali problemi prima che causino rallentamenti o periodi di interruzione. Electrolux ha accelerato la risoluzione dei problemi IT da 3 settimane a un'ora grazie a un minor tempo medio di rilevamento (MTTD, Meantime to Detection) e risparmiato oltre 1.000 ore all'anno automatizzando le attività di riparazione.

Casi d'uso AIOps

L'AIOps incorpora big data, analitica avanzata e capacità di apprendimento automatico come illustrano i seguenti casi d'uso:

  • Analisi dell'origine del problema: come suggerisce il nome, questo tipo di analisi individua la causa principale dei problemi al fine di porvi rimedio con le soluzioni più opportune. Identificando le cause principali, i gruppi possono evitare di sprecare tempo a trattare i sintomi di un malfunzionamento concentrandosi invece sul problema reale. Ad esempio, una piattaforma AIOps è in grado di identificare l'origine di un periodo di interruzione di rete per porvi immediatamente rimedio e impostare salvaguardie al fine di prevenire problemi analoghi.
  • Rilevamento anomalie: gli strumenti AIOps possono vagliare grandi quantità di dati cronologici e rilevare punti dati atipici all'interno di un dataset. Questi outlier fungono da "segnali" che identificano e predicono eventi problematici, ad esempio una violazione dei dati. Tale capacità permette ai business di evitare onerose conseguenze, quali danni d'immagine, sanzioni normative e calo nella fiducia dei consumatori.  
  • Monitoraggio prestazioni: le applicazioni odierne sono spesso suddivise in multipli livelli di astrazione, rendendo difficile capire quali server fisici, risorse di archiviazione e di rete sottostanti supportano le diverse applicazioni. L'AIOps aiuta a colmare questa lacuna. Funge da strumento di monitoraggio per l'infrastruttura cloud, la virtualizzazione e i sistemi di memoria, segnalando metriche quali utilizzo, disponibilità e tempi di risposta. Inoltre, sfrutta le capacità di correlazione degli eventi per consolidare e aggregare le informazioni, consentendo un migliore consumo di informazioni per gli utenti finali.  
  • Migrazione al cloud: per la maggior parte delle organizzazioni l'adozione del cloud è un processo graduale, non repentino e immediato, che si traduce in un ambiente multicloud ibrido (cloud privato, cloud pubblico, multipli fornitori), con molteplici interdipendenze che possono cambiare troppo rapidamente e frequentemente per essere documentate. Offrendo una visibilità cristallina su queste interdipendenze, l'AIOps può ridurre drasticamente i rischi operativi della migrazione al cloud e un approccio al cloud ibrido.
  • Adozione della metodologia DevOps: il DevOps accelera lo sviluppo liberando risorse per il provisioning e la riconfigurazione dell'infrastruttura, che deve comunque essere gestita dall'IT. L'AIOps fornisce la visibilità e l'automazione di cui l'IT ha bisogno per supportare la metodologia DevOps senza troppi sforzi di gestione aggiuntivi.
Come funziona l'AIOps?

Per comprendere il funzionamento dell'AIOps il modo più semplice è esaminare il ruolo svolto nel processo da ogni tecnologia componente, vale a dire big data, apprendimento automatico e automazione.

L'AIOps utilizza una piattaforma big data per aggregare in un unico luogo dati, gruppi  e strumenti a bassa integrazione dell'esercizio IT. Questi dati possono includere:

  • Dati cronologici riguardanti prestazioni ed eventi
  • Streaming di eventi operativi in tempo reale
  • Log di sistema e metriche
  • Dati di rete, inclusi pacchetti dati
  • Dati correlati a incidenti e creazione di ticket
  • Dati relativi alla domanda delle applicazioni
  • Dati di infrastruttura

L'AIOps applica quindi capacità di analisi mirata e apprendimento automatico:

  • Distingue gli avvisi di eventi significativi dal "rumore": l'AIOps  vaglia i dati delle operazioni IT e distingue i segnali (avvisi di eventi anomali significativi) dal rumore (tutto il resto).
  • Identifica le cause principali e propone soluzioni: l'AIOps è in grado di correlare eventi anomali ad altri dati evento in ambienti diversi per concentrarsi sulla causa di un periodo di interruzione o di un problema di prestazioni e suggerire rimedi.
  • Automatizza le risposte, inclusa la risoluzione proattiva in tempo reale: AIOps è in grado come minimo di indirizzare automaticamente gli avvisi e le soluzioni consigliate ai gruppi IT appropriati o persino creare gruppi di risposta in base alla natura del problema e alla soluzione. In molti casi, può elaborare i risultati dell’apprendimento automatico per attivare risposte automatiche del sistema risolvendo i problemi in tempo reale, prima ancora che gli utenti se ne rendano conto.
  • Apprende in modo continuo, per migliorare la gestione dei problemi futuri: i modelli di IA possono inoltre aiutare il sistema a riconoscere e adattarsi ai cambiamenti nell'ambiente, ad esempio la nuova infrastruttura in seguito al provisioning o alla riconfigurazione da parte dei gruppi DevOps.
Soluzioni correlate
IBM® Turbonomic

Automatizza in modo continuo le azioni critiche in tempo reale, e senza intervento umano, per offrire alle tue applicazioni in modo proattivo l'utilizzo più efficiente delle risorse di calcolo, archiviazione e rete a ogni livello dello stack.

Esplora IBM Turbonomic
IBM Instana® Observability

Arricchisci il monitoraggio delle prestazioni delle applicazioni con il contesto di cui hai bisogno per risolvere gli incidenti più velocemente

Esplora l'automazione basata sull'intelligenza artificiale
IBM AIOps Insights

AIOps Insights è una soluzione SaaS che affronta e risolve i problemi che i gruppi di operazioni IT centrali devono affrontare nella gestione della disponibilità delle risorse IT aziendali tramite la gestione degli eventi e degli incidenti basata sull'intelligenza artificiale.

Esplora AIOps Insights
AIOps per IBM zSystems

Migliora la gestione dei sistemi, le operazioni IT, le prestazioni delle applicazioni e la resilienza operativa con l'AI sul mainframe.

Esplora AIOps per IBM zSystems
Fai il passo successivo

IBM AIOps aiuta le organizzazioni a garantire le prestazioni delle applicazioni riducendo in modo sicuro i costi IT. Organizzazioni sono state in grado di ottenere una disponibilità delle applicazioni pari al 99,99% e una riduzione del MTTD del 55% per problemi aventi ripercussioni sul servizio. Affrettati a offrire ai clienti esperienze eccezionali con IBM AIOps. Scopri come realizzare un ROI del 471% con l'AIOps e come ridurre la spesa per il consumo del cloud pubblico del 33%. Sfruttando l'automazione IT intelligente di IBM AIOps, le organizzazioni possono identificare ed eseguire meglio automazioni ad alto impatto attraverso l'intero business e la sfera IT utilizzando strumenti, conoscenze ed esperti comprovati per conseguire migliori risultati d'impresa.

Esplora il portfolio IBM AIOps