Automazione basata su AI nella più grande rete 5G degli Stati Uniti
In che modo T-Mobile usa AIOps per ottimizzare efficienza e affidabilità

Nell'aprile 2020, T-Mobile ha fatto un balzo in avanti che ha trasformato il mercato delle telecomunicazioni negli Stati Uniti. La società ha acquisito Sprint, iniziando una fusione che ha formato la più grande rete 5G della nazione.

Naturalmente, l’espansione comportava anche rischi significativi. In un mercato delle telecomunicazioni intensamente competitivo, i clienti non hanno offerto alcun periodo di tolleranza per la fusione. T-Mobile aveva bisogno di integrare due reti di grandi dimensioni continuando a fornire al tempo stesso un'affidabilità e una qualità del servizio costanti su tutta la linea.

La realizzazione dipende dalla gestione della rete. T-Mobile utilizza gli strumenti di IBM Cloud Pak® for Watson AIOps per integrare la gestione, trasformando due grandi reti in una sola e utilizzando l'automazione basata su AI per massimizzare l'affidabilità e l'efficienza.

Un numero enorme di errori

 

Quando T-Mobile ha acquisito Sprint, ha dovuto correlare circa 3 milioni di errori aggiuntivi al giorno

Tempo di elaborazione ridotto

 

Il tempo medio di elaborazione degli errori con IBM Cloud Pak for Watson AIOps è di 19 secondi, di meno rispetto ai precedenti 5 minuti

Abbiamo elaborato il 90% del volume totale degli allarmi attraverso una scala pari a un decimo di quella del sistema di produzione mirato. Tutti gli allarmi SNMP stavano arrivando attraverso un singolo probe SNMP senza ritardi o errori, mentre l'altro sistema di gestione che era presente nella rete richiedeva dieci gateway SNMP per lo stesso volume e riscontrava molteplici errori e/o ritardi nell'elaborazione. Tom Higdon Principal Event Management Architect T-Mobile
Massimizzare la qualità nonostante il doppio della complessità

“La gestione della rete è una componente fondamentale della qualità del servizio che forniamo alle persone e alle aziende che utilizzano la rete T-Mobile”, come afferma Tom Higdon, Principal Event Management Architect di T-Mobile. “La gestione della rete è il modo in cui ci si assicura che tutti gli eccellenti servizi di cui disponiamo siano effettivamente disponibili per i clienti e funzionino come dovrebbero.”

E quando si gestisce una delle reti di comunicazione più grandi del mondo, anche la gestione della rete risulta estremamente complessa. Come spiega Higdon: “Non si tratta semplicemente della rete wireless, perché la rete wireless dipende da altre reti e infrastrutture di supporto: data center e apparecchiature, applicazioni e servizi basati su IP, siti cellulari e di commutazione e tutte le apparecchiature coinvolte.”

Quando T-Mobile ha acquisito Sprint, la portata e la complessità sono sostanzialmente raddoppiate. “Il primo giorno della fusione”, spiega Higdon, “la portata di ciò che dovevamo gestire è cresciuta fino a sfiorare il mezzo milione di dispositivi monitorati, il che ha portato a circa tre milioni di nuovi errori al giorno da correlare.”

Inoltre, le due reti disponevano di sistemi di gestione distinti e in scadenza. “Ciò ha aumentato la complessità dell'integrazione, perché avevamo sistemi che esistevano da più di 10 anni”, dice Higdon. I sistemi prevedevano due piattaforme di gestione principali separate, una basata su soluzioni IBM® Netcool® (ora integrata in IBM Cloud Pak for Watson AIOps) e l'altra basata su una soluzione di gestione di terze parti, oltre a una serie di strumenti di monitoraggio multivendor che alimentavano le suddette piattaforme principali.

Con l'obiettivo di fornire le massime prestazioni di rete, T-Mobile ha cercato il modo migliore per identificare gli elementi attivabili tra milioni di errori giornalieri. L'azienda cercava inoltre di aumentare l'automazione, rendendo la gestione della rete sempre più efficiente e la rete stessa sempre più affidabile.

Flessibilità ed efficienza nella gestione della rete

Come racconta Higdon: “Quasi immediatamente dopo la fusione, abbiamo visto che IBM stava investendo nella sua suite di prodotti e che voleva una vera e propria collaborazione con noi, in modo che potessimo entrambi evolverci e avere successo. Quindi alcuni differenziatori tecnici e non tecnici hanno iniziato a manifestarsi. Ciò ci ha portato alla decisione di procedere con la soluzione Watson AIOps.”

La priorità immediata era l'integrazione delle diverse piattaforme di gestione dei malfunzionamenti. Era un compito arduo che doveva essere svolto rapidamente. Fortunatamente, Higdon e i suoi colleghi hanno scoperto che le soluzioni IBM erano abbastanza flessibili da incorporare i dati degli altri strumenti di gestione e monitoraggio. “Ci siamo integrati rapidamente e con successo. È una delle primissime cose che abbiamo fatto come nuova attività”, afferma Higdon. “I connettori e gli adattatori della suite di prodotti IBM sono stati implementati e configurati rapidamente, con personalizzazioni minime, per iniziare a ottenere tali dati, arricchendo le nostre informazioni su errori ed eventi. Questo ci ha permesso di unire i nostri team operativi di rete.”

Durante la messa in funzione della piattaforma di gestione della rete unificata per il rilascio in produzione, T-Mobile ha ottenuto notevoli guadagni in termini di efficienza. “Abbiamo elaborato il 90% del volume totale degli allarmi attraverso una scala pari a un decimo di quella del sistema di produzione mirato. Tutti gli allarmi SNMP stavano arrivando attraverso un singolo probe SNMP senza ritardi o errori, mentre l'altro sistema di gestione che era presente nella rete richiedeva dieci gateway SNMP per lo stesso volume e riscontrava molteplici errori e/o ritardi nell'elaborazione.”

 

Accelerazione degli insight attivabili

Con la fusione delle operazioni tra le piattaforme acquisite e quelle originali, Higdon e il suo team si concentrano ora sull'ulteriore razionalizzazione della gestione, sulla riduzione del “rumore” delle normali operazioni di rete e sulla creazione di percorsi più rapidi per il rilevamento e la risoluzione dei problemi o, idealmente, per la loro prevenzione. “Creiamo e implementiamo quelli che chiamo framework di natura generica, che ci aiutano ad affrontare più tipi di problemi e ottenere i risultati adeguati”, afferma Higdon. Ad esempio, Higdon illustra un framework di correlazione degli allarmi core senza cavi, implementato di recente. “Le correlazioni possono essere eseguite quasi istantaneamente e questo è un elemento di differenziazione. Stiamo parlando di non dover tornare indietro e scansionare migliaia di errori ogni minuto. È tutto istantaneo.”

E creare tali framework è relativamente facile, secondo Higdon. “Gli strumenti di Watson AIOps sono flessibili, con adattatori che aiutano a creare questi framework. Questo è uno dei maggiori punti di forza. Non è richiesta una codifica estesa, sono necessari alcuni adattamenti ma tendono a essere molto semplici. La soluzione fornisce modi per interagire genericamente con moltissime cose diverse. Fornisce capacità interne che possono essere facilmente adattate per soddisfare le nostre esigenze.”

Higdon e il suo team stanno già assistendo a notevoli accelerazioni nella fornitura di informazioni fruibili agli utenti: “Abbiamo progettato la nostra implementazione Watson AIOps per fornire una completa ridondanza locale e geografica a tutti i livelli. Inoltre, abbiamo ridimensionato il sistema di destinazione in modo che sia in grado di elaborare i volumi di errore richiesti con ritardi minimi. Durante l'elaborazione del 90% del volume totale degli errori utilizzando componenti AIOps minimi, abbiamo notato che il tempo medio che trascorre dal verificarsi dell'errore (attraverso il sistema con tutto l'arricchimento, la correlazione e/o la soppressione) fino alla visualizzazione dell'utente è di 19 secondi. I sistemi legacy impiegavano quasi cinque minuti.”

Prossimi passi: automazione a loop chiuso con l'AI

Ora, T-Mobile sta testando in che modo le capacità di intelligenza artificiale e apprendimento automatico di IBM Watson AIOps potrebbero aiutare a ottenere una velocità di ancora maggiore, rafforzando ulteriormente l’affidabilità della rete.

“Vogliamo che l'AI ci fornisca informazioni. Potrebbero essere informazioni su quale dovrebbe essere la soglia da adottare per il conteggio delle correlazioni o sull'eventuale presenza di una relazione per noi non palese; cose che noi, come esseri umani, non potremmo cogliere senza dedicarci molto tempo ed energia.

L'obiettivo della gestione della rete è passare dalla gestione reattiva a quella proattiva e infine alla gestione predittiva. Higdon intende utilizzare AIOps per fare un altro passo avanti e raggiungere l'automazione a loop chiuso. “Ecco dove alla fine stiamo cercando di arrivare: fare in modo che gli strumenti acquisiscano enormi quantità di dati, li interpretino, formulino raccomandazioni e possibilmente arrivino anche a un'orchestrazione o automazione basata sull'intento.”

Questo offrirà un vantaggio prezioso con una rete di tali dimensioni e in un settore così competitivo. “Devo aumentare la capacità. Ho gli strumenti per passare queste informazioni a una piattaforma di automazione intelligente che effettuerà il cambiamento. Tutto senza intervento umano. Questo è il nostro piano, il loop chiuso, è lì che stiamo ancora puntando in questo momento.”

Logo T-mobile
Informazioni su T-Mobile

T-Mobile (link esterno a ibm.com) è uno dei fornitori di comunicazioni mobili leader e in più rapida crescita al mondo. Filiale di Deutsche Telekom AG con sede a Bonn, in Germania, T-Mobile serve consumatori e clienti aziendali in Europa, negli Stati Uniti e nei Caraibi. Nel 2020, ha aggiunto 5,5 milioni di clienti e ha raggiunto ricavi per 68,4 miliardi di dollari.

Fai il passo successivo

Per saperne di più sulle soluzioni IBM presentate in questa storia, contatta il tuo rappresentante IBM o un business partner IBM.

Leggi il PDF Visualizza alti casi d'uso Costruire il motore di un'economia in crescita

Costruire il motore di un'economia in crescita

Leggi il case study
Legale

© Copyright IBM Corporation 2021. IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

Prodotto negli Stati Uniti d'America, novembre 2021.

IBM, il logo IBM, ibm.com, IBM Cloud Pak e Netcool sono marchi di International Business Machines Corp., registrati in diverse giurisdizioni del mondo. Altri nomi di prodotti e servizi potrebbero essere marchi registrati di IBM o di altre aziende. Un elenco aggiornato dei marchi IBM è disponibile sul web all'indirizzo ibm.com/trademark.

Le informazioni contenute nel presente documento sono aggiornate alla data della prima pubblicazione e possono essere modificate da IBM senza preavviso. Non tutte le offerte sono disponibili in ogni Paese in cui opera IBM.

Gli esempi citati relativi a dati di prestazione e clienti sono presentati unicamente a scopo illustrativo. Gli attuali risultati in termini di performance possono variare a seconda delle specifiche configurazioni e delle condizioni operative. LE INFORMAZIONI RIPORTATE NEL PRESENTE DOCUMENTO SONO DA CONSIDERARSI “NELLO STATO IN CUI SI TROVANO”, SENZA GARANZIE, ESPLICITE O IMPLICITE, IVI INCLUSE GARANZIE DI COMMERCIABILITÀ, DI IDONEITÀ A UN PARTICOLARE SCOPO E GARANZIE O CONDIZIONI DI NON VIOLAZIONE. I prodotti IBM sono coperti da garanzia in accordo con termini e condizioni dei contratti sulla base dei quali vengono forniti.