Webinar IBM in diretta: registrati ora Qual è il futuro di APM e Observability?

Cos'è AIOps?

Uomini d'affari in riunione presso una grande agenzia creativa

Cos'è AIOps?

L'intelligenza artificiale per le operazioni IT, o AIOps, è l'applicazione di funzionalità di intelligenza artificiale (AI), come l'elaborazione del linguaggio naturale e i modelli di machine learning, per automatizzare, semplificare e ottimizzare la gestione dei servizi IT e i workflow operativi.

AIOps utilizza le funzionalità di big data, analytics e apprendimento automatico per:

  • Inserire e aggregare i volumi enormi (e sempre crescenti) di dati generati da componenti IT, richieste delle applicazioni e strumenti di monitoraggio delle prestazioni e sistemi di gestione di ticket di servizio in uno stack tecnologico aziendale.
  • Scorporare in modo intelligente i segnali dal "rumore" per identificare eventi e modelli significativi correlati alle prestazioni delle applicazioni e a problemi di disponibilità.
  • Diagnosticare le cause principali e segnalarle alle aree IT e DevOps per una rapida risposta agli incidenti e correzione o, talvolta, per risolvere automaticamente i casi senza l'intervento umano.

Integrando strumenti manuali e distinti, in un'unica piattaforma intelligente e automatizzata, dedicata alle operazioni IT (ITOPs), l'AIOps consente ai team assegnati di rispondere in modo più celere, persino proattivo, a rallentamenti e periodi di interruzione, con visibilità e contesto end-to-end.

L'AIOPS supporta le aziende nel colmare il divario che separa, da un lato, un landscape IT eterogeneo, dinamico e difficile da monitorare, nonché team IT isolati, e, dall'altro, le aspettative degli utenti per quanto riguarda le prestazioni e la disponibilità delle app. Con la proliferazione di iniziative di trasformazione digitale in tutti i settori aziendali, molti esperti vedono nelle AIOps il futuro della gestione delle operazioni IT.

Componenti AIOps

L'AIOps può incorporare una serie di strategie e funzionalità di AI, tra cui l'output e l'aggregazione dei dati, gli algoritmi, l'orchestrazione e la visualizzazione.

Gli algoritmi codificano le competenze IT, la logica aziendale e gli obiettivi, consentendo alle piattaforme AIOps di dare priorità agli eventi di sicurezza e di prendere decisioni sulle prestazioni. Gli algoritmi costituiscono la base dell'apprendimento automatico (ML) e consentono alle piattaforme di stabilire le linee di riferimento e di adattarsi ai cambiamenti dei dati ambientali.

Il machine learning utilizza algoritmi e tecniche, come il rinforzo supervisionato e non e il deep learning, per aiutare i sistemi ad apprendere da grandi set di dati e adattarsi alle nuove informazioni. Nell'AIOps, l'apprendimento automatico (ML) aiuta con il rilevamento delle anomalie, l'analisi delle cause principali (RCA), la correlazione degli eventi e l'analisi predittiva.

I programmi AIOps raccolgono dati da vari componenti di rete e fonti di dati. Le analytics interpretano i dati non elaborati per creare nuovi dati e metadati che aiutano sia i sistemi che i team a individuare le tendenze, isolare i problemi, prevedere le richieste di capacità e gestire gli eventi.

Le funzionalità di automazione degli strumenti AIOps consentono ai sistemi AIOps di agire in base a insight in tempo reale. Ad esempio, l'analytics predittiva possono prevedere un aumento del traffico di dati e attivare un workflow di automazione per allocare storage aggiuntivo secondo necessità (in linea con le regole algoritmiche).

Gli strumenti di visualizzazione dei dati in AIOps presentano i dati attraverso dashboard, report e grafici, in modo che i team IT possano monitorare i cambiamenti e prendere decisioni al di là delle funzionalità del software AIOps.

Le ultime notizie nel campo della tecnologia, supportate dalle analisi degli esperti

Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Come funziona l'AIOps?

L'AIOps utilizza una piattaforma big data per aggregare in un unico luogo i dati dell'ITOps, i team e gli strumenti, solitamente isolati. Questi dati possono includere:

  • Dati cronologici riguardanti prestazioni ed eventi
  • Eventi operativi in tempo reale
  • Log di sistema e metriche
  • Dati di rete, inclusi pacchetti dati
  • Dati correlati a incidenti e creazione di ticket
  • Dati relativi alla domanda delle applicazioni
  • Dati di infrastruttura

Le piattaforme AIOps applicano quindi analisi mirate e strumenti di apprendimento automatico per:

  • Separare gli avvisi di eventi significativi dal "rumore". AIOps analizza i dati ITOps e separa i segnali, differenziando gli eventi anomali dal rumore (tutto il resto) e identificando i modelli di dati.
  • Identificare le cause principali e proporre soluzioni. AIOps è in grado di correlare eventi anomali con altri dati di eventi in diversi ambienti per individuare la causa di un'interruzione o di un problema di prestazioni e suggerire soluzioni.
  • Automatizzare le risposte, compresa la risoluzione proattiva e in tempo reale. Come minimo, gli strumenti AIOps possono instradare automaticamente gli avvisi e le soluzioni consigliate ai team IT appropriati e persino creare team di risposta in base alla natura del problema e alla soluzione. In molti casi, possono anche elaborare i risultati dell'apprendimento automatico e attivare risposte automatiche del sistema per affrontare i problemi non appena si presentano (e spesso, prima che gli utenti se ne accorgano).
  • Impari continuamente, per migliorare la gestione dei problemi futuri. I modelli di AI possono aiutare i sistemi a comprendere e adattarsi ai cambiamenti nell'ambiente (ad esempio, quando un team DevOps predispone una nuova infrastruttura o riorganizza quella esistente).
Mixture of Experts | 12 dicembre, episodio 85

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Implementazione dell'AIOps

Il percorso di adozione dell'AIOps si differenzia da un'organizzazione all'altra. Una volta che i leader aziendali hanno elaborato una strategia AIOps, possono iniziare a incorporare strumenti che aiutano i team IT a osservare, prevedere e rispondere rapidamente ai problemi IT. 

Quando si scelgono gli strumenti per migliorare AIOps, molti team prendono in considerazione le seguenti funzioni:

  • Observability: l'observability è la misura in cui è possibile comprendere lo stato interno o la condizione di un sistema complesso basato solo sulla conoscenza dei suoi output esterni. Quanto più un sistema è osservabile, tanto più velocemente e accuratamente i team possono occuparsi dei problemi di prestazione individuati che portano alle cause principali, il tutto senza ulteriori test o codifiche.

    Gli strumenti di observability leader offrono una visibilità approfondita dei moderni servizi e applicazioni aziendali distribuiti per un'identificazione e una risoluzione dei problemi più rapide e automatizzate.

    Nell'IT e nel cloud computing, l'observability utilizza strumenti e pratiche software avanzati per aggregare, correlare e analizzare flussi costanti di dati sulle prestazioni provenienti da applicazioni distribuite e dall'hardware e dalle reti su cui vengono eseguite. L'observability offre processi più efficaci di monitoraggio, risoluzione dei problemi e debug delle app e della rete in modo che i sistemi continuino a soddisfare le aspettative di esperienza degli utenti, i service level agreements (SLA) e altri requisiti aziendali.

  • Analytics predittiva: l'analisi predittiva è una branca dell'analisi avanzata che effettua previsioni sui risultati futuri utilizzando dati storici, modelli statistici, tecniche di data mining e apprendimento automatico. Nell’AIOps, i team utilizzano l'analytics predittiva per individuare dei modelli nei dati e identificare rischi e opportunità.

    Le aziende moderne sono sommerse da dati provenienti da diversi archivi in tutta l'organizzazione. L'analytics predittiva utilizza strumenti quali modelli di logistica e regressione linearereti neurali e decision trees per ottenere insight fruibili da enormi quantità di dati aziendali e formulare previsioni su futuri eventi di sistema.

  • Risposta proattiva: alcune soluzioni AIOps rispondono in modo proattivo a eventi imprevisti (come rallentamenti e periodi di interruzione), centralizzando in tempo reale la gestione delle prestazioni delle applicazioni e delle risorse.

    Inserendo metriche delle prestazioni delle applicazioni in algoritmi predittivi, i team sono in grado di identificare modelli e tendenze che coincidono con problemi IT diversi. Inoltre, grazie alla loro capacità di prevedere i problemi IT prima che si verifichino, gli strumenti AIOps possono automatizzare la risoluzione per affrontare tempestivamente i problemi del sistema.

    Le tecnologie di automazione della risposta agli incidenti sono parte integrante della gestione efficace dei sistemi IT. Possono aiutare le aziende a migliorare sia l'esperienza del client che quella del cliente e migliorare significativamente le metriche chiave delle prestazioni, come il tempo medio di rilevamento (MTTD). Inoltre, i sistemi AIOps forniscono una rete di sicurezza per i team operativi IT, risolvendo problemi che potrebbero essere risolti con la sola supervisione umana.

Confronto tra strumenti AIOps indipendenti dal dominio e incentrati sul dominio

Le piattaforme AIOps possono fornire alle organizzazioni diversi livelli di automazione, a seconda delle esigenze IT e della strategia AIOps.

Con un approccio indipendente dal dominio, il software AIOPs raccoglie dati da un'ampia gamma di fonti per risolvere i problemi nei vari domini operativi (networking, storage e sicurezza, per esempio). Questi strumenti offrono una visione completa e olistica delle prestazioni complessive, aiutando le organizzazioni ad affrontare problemi che riguardano più aree.

Tuttavia, potrebbero non fornire gli insight dettagliati di cui i team IT hanno bisogno per affrontare i punti critici specifici o per soddisfare le esigenze uniche del settore. L'ampia natura degli strumenti indipendenti dal dominio significa che eccellono nell'offrire una panoramica generale, ma potrebbero non essere in grado di fornire soluzioni mirate di gestione degli incidenti per sfide più complesse.

Gli strumenti AIOps incentrati sul dominio si concentrano su un dominio specifico, che si tratti di un ambiente IT o di un settore particolare. Sebbene questi strumenti non coprano l'intero panorama IT, sono altamente specializzati, con modelli AI addestrati su set di dati specifici del loro dominio. Questa specializzazione consente loro di fornire informazioni e soluzioni precise.

Ad esempio, in un contesto di rete, uno strumento incentrato sul dominio può identificare con precisione la causa di un collo di bottiglia comprendendo i protocolli e i modelli di rete standard. Grazie al proprio addestramento specializzato e alla sua focalizzazione, è in grado di stabilire se il rallentamento è dovuto a un attacco DDoS (Distributed Denial of Service) o a una semplice configurazione errata del sistema.

Indipendentemente dal tipo di strumento scelto da un'organizzazione, è importante che i team:

  • Addestrino i modelli AI utilizzando set di dati completi e rappresentativi per ottenere affidabilità e precisione ottimali.
  • Utilizzino modelli AI trasparenti ed equi, in modo che gli stakeholder possano comprendere il processo decisionale basato sull'AI.
  • Formino i team IT a utilizzare strumenti e insight dettagliati in modo efficace per una transizione AIOps più fluida.
  • Assegnino a un essere umano la supervisione e la convalida delle conclusioni del modello AI, per responsabilizzare i team e i sistemi.

AIOps vs. DevOps

Sia AIOps che DevOps sono metodologie progettate per migliorare le operazioni IT, ma si concentrano su diversi aspetti del ciclo di vita del software.

DevOps mira a integrare i team operativi e di sviluppo per promuovere la collaborazione e l'efficienza durante tutto il processo di sviluppo del software. Semplifica e automatizza i processi di codifica, test e distribuzione e accelera i processi di integrazione continua e distribuzione continua (CI/CD), consentendo rilasci di software più rapidi e affidabili.

DevOps utilizza anche strumenti come l'infrastructure as code e piattaforme di collaborazione per abbattere i silo tra i team e assicurarsi che gli aggiornamenti software possano essere forniti rapidamente, senza compromettere la qualità.

Mentre DevOps si concentra sull'accelerazione e il perfezionamento dello sviluppo e della distribuzione del software, AIOps utilizza l'AI per ottimizzare le prestazioni degli ambienti IT aziendali, garantendo che i sistemi funzionino in modo fluido ed efficiente. Le piattaforme AIOps utilizzano l'apprendimento automatico (ML) e l'analisi dei big data per analizzare grandi quantità di dati operativi e aiutare i team IT a rilevare e risolvere i problemi in modo proattivo.

Se utilizzati in tandem, i servizi AIOps e DevOps possono aiutare le aziende a creare un approccio complementare e completo alla gestione dell'intero ciclo di vita del software.

Casi d'uso AIOps

I servizi AIOps possono aiutare le aziende ad affrontare diversi casi d'uso, tra cui:

Analisi della causa principale

Le analisi delle cause principali (RCA) determinano la causa principale dei problemi per porvi rimedio con soluzioni appropriate. La RCA aiuta i team a evitare il lavoro controproducente di trattare i sintomi di un problema anziché la causa principale.

Ad esempio, una piattaforma AIOps può individuare la fonte di un'interruzione di rete per risolverla immediatamente e impostare misure di sicurezza per evitare che si verifichi lo stesso problema in futuro.

Rilevamento delle anomalie

Gli strumenti AIOps possono setacciare grandi quantità di dati storici e scoprire punti di dati atipici all'interno di un set di dati. Questi outlier aiutano i team a individuare e prevedere gli eventi problematici (le violazioni dei dati, per esempio) e a evitare le conseguenze potenzialmente costose di tali eventi (come ad esempio danni d'immagine, multe normative e calo della fiducia dei consumatori).

Monitoraggio delle prestazioni

Le applicazioni moderne sono spesso separate da più livelli di astrazione, il che rende difficile capire quali server on-premise sottostanti, risorse di storage e di rete supportano quali applicazioni.L'AIOps aiuta a colmare questa lacuna.

Funge da strumento di monitoraggio per l'infrastruttura cloud, la virtualizzazione e i sistemi di storage, segnalando metriche quali utilizzo, disponibilità e tempi di risposta. Inoltre, AIOps utilizza funzionalità di correlazione degli eventi per consolidare e aggregare le informazioni in modo che gli utenti possano consumare e comprendere le informazioni più facilmente.

Adozione e migrazione al cloud

Per la maggior parte delle organizzazioni, l'adozione del cloud è graduale, non globale. Ciò si traduce spesso in ambienti multicloud ibridi (che includono molte parti interconnesse che si basano su tecnologie come API e microservizi) con dipendenze multiple che possono cambiare troppo rapidamente e frequentemente per essere documentate. Offrendo una visibilità cristallina su queste interdipendenze, l'AIOps può ridurre drasticamente i rischi operativi associati alla migrazione al cloud e agli approcci all'hybrid cloud.

Adozione di DevOps

DevOps accelera lo sviluppo dando ai team di sviluppo più potere per il provisioning e la riconfigurazione dell'infrastruttura IT, ma i team devono comunque gestire l'architettura. AIOps fornisce la visibilità e l'automazione di cui i team IT hanno bisogno per supportare DevOps senza un'eccessiva supervisione umana.

Vantaggi dell'AIOps

Il vantaggio principale dell'AIOps è che consente ai team ITOps di identificare, affrontare e risolvere rallentamenti e interruzioni più rapidamente di quanto non si possa fare manualmente analizzando gli avvisi provenienti da più strumenti e componenti. Ciò consente alle aziende di raggiungere:

Tempo medio di riparazione (MTTR) più rapido

Eliminando il rumore delle operazioni IT e correlando i dati operativi di più ambienti IT, l'AIOps può identificare le cause principali e proporre soluzioni in modo più rapido e accurato di quanto sia possibile per un essere umano. L'identificazione accelerata dei problemi e i processi di risoluzione degli incidenti consentono alle organizzazioni di fissare e raggiungere obiettivi MTTR prima impensabili.

Ridurre i costi operativi

L'identificazione automatica dei problemi operativi e gli script di risposta riprogrammati riducono i costi operativi e favoriscono un'allocazione delle risorse più precisa. Inoltre, riduce il workload del personale IT e libera le risorse del personale per lavori più innovativi e complessi, migliorando l'esperienza dei dipendenti.

Migliore observability e collaborazione

Le integrazioni all'interno degli strumenti di monitoraggio AIOps facilitano una collaborazione più efficace tra i team DevOps, ITOps, di governance e sicurezza. E una migliore visibilità, comunicazione e trasparenza consentono a questi team di migliorare il processo decisionale e rispondere più velocemente ai problemi.

Gestione predittiva degli ITOP

Grazie alle funzionalità integrate di analytics predittiva, le piattaforme AIOps imparano costantemente a identificare e stabilire la priorità degli avvisi più urgenti. Ciò aiuta i team IT a risolvere potenziali problemi prima che causino tempi di inattività non pianificati, interruzioni e sospensioni del servizio.

Soluzioni correlate
IBM Turbonomic

Scala automaticamente l'infrastruttura IT esistente per prestazioni più elevate a costi inferiori.

Esplora IBM Turbonomic
Soluzioni AIOps

Scopri come l'AI per le operazioni IT fornisce gli insight necessari per favorire eccezionali prestazioni di business.

Esplora le soluzioni AIOps
Servizi di consulenza per l'automazione

Vai oltre la semplice automazione delle attività per gestire processi di alto profilo, rivolti ai clienti e in grado di generare entrate con adozione e scalabilità integrate.

Scopri i servizi di consulenza per l'automazione
Fai il passo successivo

Scopri come l'AI per le operazioni IT fornisce gli insight necessari per ottenere prestazioni aziendali eccezionali.

Scopri Turbonomic Esplora le soluzioni AIOps