KI-gestützte Automatisierung im größten 5G-Netzwerk der USA
So verwendet T-Mobile AIOps, um Effizienz und Zuverlässigkeit zu maximieren

Im April 2020 hat T-Mobile einen Wettbewerbssprung nach vorne gemacht, der den Telekommunikationsmarkt in den USA verändert hat. Das Unternehmen erwarb Sprint und startete eine Fusion, die das größte 5G-Netzwerk des Landes bildete.

Natürlich war die Erweiterung auch mit erheblichen Risiken verbunden. Im intensiv umkämpften Telekommunikationsmarkt gewährten die Kunden keine Schonfrist für die Fusion. T-Mobile musste zwei große Netze integrieren und gleichzeitig durchgängig einen einheitlich zuverlässigen und hochwertigen Service aufrechterhalten.

Die Umsetzung hängt vom Netzwerkmanagement ab. T-Mobile verwendet Tools von IBM Cloud Pak® for Watson AIOps, um das Management zu integrieren, zwei riesige Netzwerke zu einem zu machen und KI-gestützte Automatisierung zu nutzen, um sowohl Zuverlässigkeit als auch Effizienz zu maximieren.

Riesige Anzahl von Fehlern

 

Als T-Mobile Sprint erwarb, musste das Unternehmen etwa 3 Millionen zusätzliche Fehler pro Tag korrelieren

Kürzere Verarbeitungszeit

 

Die durchschnittliche Fehlerverarbeitungszeit mit IBM Cloud Pak for Watson AIOps beträgt 19 Sekunden (vorher 5 Minuten).

Wir bearbeiteten 90 % des gesamten Alarmvolumens durch ein Zehntel der Größenordnung des anvisierten Produktionssystems. Alle SNMP-Alarme kamen über eine einzige SNMP-Sonde ohne Verzögerungen oder Ausfälle, während das andere Managementsystem im Netz zehn SNMP-Gateways für dasselbe Volumen benötigte und mehrere Ausfälle und/oder Verarbeitungsverzögerungen aufwies. Tom Higdon Principal Event Management Architect T-Mobile
Maximierung der Qualität trotz doppelter Komplexität

„Das Netzwerkmanagement ist ein wichtiger Bestandteil der Servicequalität, die wir den Menschen und Unternehmen bieten, die das T-Mobile-Netz nutzen“, sagt Tom Higdon, Principal Event Management Architect bei T-Mobile. „Mit Netzwerkmanagement stellen Sie sicher, dass all die großartigen Dienste, die Sie haben, auch tatsächlich für Kunden verfügbar sind und so funktionieren, wie sie sollten.“

Und wenn Sie eines der größten Kommunikationsnetzwerke der Welt betreiben, ist das Netzwerkmanagement ebenfalls äußerst komplex. Higdon erklärt: „Es ist nicht einfach das drahtlose Netzwerk, denn das drahtlose Netzwerk hängt von anderen unterstützenden Netzwerken und Infrastrukturen ab: Ihren Rechenzentren und IP-basierten Geräten und Anwendungen und Diensten, Mobilfunkstandorten und Switch-Standorten und allen beteiligten Geräten.“

Als T-Mobile Sprint übernahm, verdoppelten sich Umfang und Komplexität im Grunde. „Am ersten Tag der Fusion“, so Higdon, „wuchs der Umfang dessen, was wir für das Netzwerkmanagement bereitstellen mussten, um fast eine halbe Million Geräte, die überwacht werden mussten, was zu etwa drei Millionen neuen Fehlern pro Tag führte, die es zu korrelieren galt.“

Darüber hinaus verfügten die beiden Netzwerke über unterschiedliche, ausgereifte Managementsysteme. „Das erhöhte die Komplexität der Integration, da wir Systeme hatten, die jeweils schon seit mehr als zehn Jahren existierten“, erklärt Higdon. Die Systeme umfassten zwei separate Kernverwaltungsplattformen - eine auf der Grundlage von IBM® Netcool®-Lösungen (jetzt in IBM Cloud Pak für Watson AIOps integriert), die andere auf der Grundlage einer Verwaltungslösung eines Drittanbieters - sowie eine Reihe von Überwachungswerkzeugen verschiedener Hersteller, die in die Kernplattformen eingespeist wurden.

T-Mobile ist bestrebt, die bestmögliche Netzleistung zu erzielen, und suchte nach der besten Methode, um in den Millionen von täglichen Fehlern umsetzbare Elemente zu identifizieren. Das Unternehmen möchte außerdem mehr Automatisierung einbauen, um das Netzwerkmanagement noch effizienter und das Netzwerk selbst immer zuverlässiger zu machen.

Flexibilität und Effizienz im Netzwerkmanagement

„Fast unmittelbar nach der Fusion“, erzählt Higdon, „sahen wir, dass IBM in seine Produktpalette investierte und eine echte Partnerschaft mit uns anstrebte, damit wir uns beide weiterentwickeln und erfolgreich sein konnten. So begannen sich sowohl technische als auch nicht-technische Unterscheidungsmerkmale zu zeigen. Das hat uns zu der Entscheidung geführt, mit der AIOps-Lösung von Watson weiterzumachen.“

Die unmittelbare Priorität war die Integration der unterschiedlichen Fehlermanagementplattformen. Es war eine gewaltige Aufgabe, die schnell erledigt werden musste. Glücklicherweise stellten Higdon und seine Kollegen fest, dass die IBM-Lösungen flexibel genug waren, um Daten aus den anderen Management- und Überwachungstools zu integrieren. „Wir haben uns schnell erfolgreich integriert. Es ist eines der ersten Dinge, die wir als neues Unternehmen gemacht haben“, sagt Higdon. „Die Konnektoren und Adapter in der IBM-Produktsuite konnten schnell und mit minimalen Anpassungen eingesetzt und konfiguriert werden, um diese Daten zu erhalten und unsere Fehler- und Ereignisinformationen zu erweitern. Dadurch konnten wir unsere Netzbetriebsteams zusammenlegen.

Bei der Bereitstellung der zusammengeführten Netzwerkmanagement-Plattform für die Serienversion erzielte T-Mobile dramatische Effizienzsteigerungen. „Wir bearbeiteten 90 % des gesamten Alarmvolumens durch ein Zehntel der Größenordnung des anvisierten Produktionssystems.“ Alle SNMP-Alarme gingen ohne Verzögerungen oder Ausfälle über eine einzige SNMP-Sonde ein, während das andere im Netzwerk vorhandene Managementsystem zehn SNMP-Gateways für das gleiche Volumen benötigte und mehrere Ausfälle und/oder Verarbeitungsverzögerungen aufwies.“

 

Erhebliche Beschleunigung umsetzbarer Erkenntnisse

Nach der Zusammenlegung der Betriebsabläufe zwischen der übernommenen und der ursprünglichen Plattform konzentrieren sich Higdon und sein Team nun auf die weitere Rationalisierung des Managements, die Verringerung des „Rauschens“ des regulären Netzwerkbetriebs und die Schaffung der schnellsten Wege zur Erkennung und Lösung von Problemen bzw. im Idealfall zur Vermeidung. „Wir erstellen und implementieren so genannte Rahmenwerke, die allgemeiner Natur sind und uns helfen, verschiedene Arten von Problemen anzugehen und die richtigen Ergebnisse zu erzielen“, sagt Higdon. Higdon beschreibt beispielsweise ein kürzlich implementiertes Wireless-Core-Alarm-Korrelations-Framework. „Korrelationen können nahezu augenblicklich durchgeführt werden. Das ist ein Alleinstellungsmerkmal. Wir reden davon, nicht jede Minute zurückgehen und Tausende von Fehlern scannen zu müssen. Das geht ganz schnell.“

Und solche Rahmenbedingungen zu schaffen, ist laut Higgon relativ einfach. „Die Tools unter Watson AIOps sind wieder flexibel, mit Adaptern, die bei der Erstellung dieser Frameworks helfen.“ Das ist eine der größten Stärken. Dazu sind keine umfangreichen Programmierarbeiten erforderlich. Einige Anpassungen sind erforderlich, aber sie sind in der Regel sehr einfach. Die Lösung bietet Möglichkeiten, allgemein mit vielen, vielen verschiedenen Dingen zu sprechen. Es bietet interne Funktionen, die leicht an unsere Bedürfnisse angepasst werden können.“

Higdon und sein Team stellen bereits fest, dass sich die Bereitstellung verwertbarer Erkenntnisse für die Benutzer drastisch beschleunigt hat: „Wir haben unsere Watson AIOps-Bereitstellung so konzipiert, dass sie auf allen Ebenen vollständige lokale und geografische Redundanz bietet. Darüber hinaus haben wir das Zielsystem so skaliert, dass es die erforderlichen Fehlermengen mit minimalen Verzögerungen verarbeiten kann. Bei der Verarbeitung von 90 % des gesamten Fehlervolumens mit minimalen AIOps-Komponenten haben wir festgestellt, dass die durchschnittliche Zeit vom Auftreten des Fehlers - durch das System mit allen Anreicherungen, Korrelationen und/oder Unterdrückungen - bis zur Anzeige durch den Benutzer 19 Sekunden beträgt. Bei älteren Systemen waren es eher fünf Minuten.“

Nächste Schritte: Closed-Loop-Automatisierung mit KI

Jetzt testet T-Mobile, wie die KI- und Machine-Learning-Funktionen von IBM Watson AIOps zu einer noch besseren Reaktionsfähigkeit beitragen und die Zuverlässigkeit des Netzes weiter erhöhen können.

„Wir sind auf der Suche nach der KI, die uns Informationen liefert. Es könnte Intelligenz in der Form sein, wie hoch mein Schwellenwert für die Korrelationszählung sein sollte, oder gibt es hier eine Beziehung, die für uns nicht offensichtlich ist? Dinge, die wir als Menschen ohne viel Zeit und Energie nicht wahrnehmen würden.“

Das Ziel des Netzwerkmanagements besteht darin, von reaktivem zu proaktivem und schließlich zu prädiktivem Management überzugehen. Higdon möchte mit AIOps einen weiteren Schritt gehen und eine Automatisierung im geschlossenen Regelkreis erreichen. „Das ist das Ziel, das wir letztendlich anstreben. Die Tools sollen große Datenmengen erfassen, diese Daten sinnvoll nutzen, Empfehlungen aussprechen und möglicherweise sogar eine absichtsbasierte Orchestrierung oder Automatisierung erreichen.“

Dies ist ein wertvoller Vorteil eines Netzes dieser Größe in einer so wettbewerbsintensiven Branche. „Ich muss die Kapazität erhöhen. Ich habe die Tools, die diese Informationen an eine intelligente Automatisierungsplattform weiterleiten, die die Änderung bewirken wird. Alles ohne menschliches Eingreifen. Das ist unser Plan, dieser geschlossene Kreislauf, auf den wir im Moment noch zusteuern.“

Logo von T-mobile
Über T-Mobile

T-Mobile (Link befindet sich außerhalb von ibm.com) ist einer der weltweit führenden und am schnellsten wachsenden Mobilfunkanbieter. T-Mobile ist eine Tochtergesellschaft der Deutschen Telekom AG mit Sitz in Bonn und betreut Privat- und Unternehmenskunden in Europa, den USA und der Karibik. Im Jahr 2020 gewann das Unternehmen 5,5 Millionen Nettokunden hinzu und erzielte einen Umsatz von 68,4 Milliarden US-Dollar.

Gehen Sie den nächsten Schritt

Wenn Sie mehr über die in diesem Artikel vorgestellten IBM Lösungen erfahren möchten, wenden Sie sich bitte an Ihren IBM Ansprechpartner oder IBM Business Partner.

PDF lesen Weitere Anwendungsfälle anzeigen Aufbau des Motors einer rasanten Wirtschaft

Aufbau des Motors einer rasanten Wirtschaft

Kundenreferenz lesen
Rechtshinweise

© Copyright IBM Corporation 2021 IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

Hergestellt in den Vereinigten Staaten von Amerika, November 2021.

IBM, das IBM Logo, ibm.com, IBM Cloud Pak und Netcool sind Marken der International Business Machines Corp. und in vielen Ländern weltweit eingetragen. Weitere Produkt‐ und Servicenamen können Marken von IBM oder anderen Unternehmen sein. Eine aktuelle Liste der IBM-Marken ist im Web unter ibm.com/trademark verfügbar.

Das vorliegende Dokument ist ab dem Datum der Erstveröffentlichung aktuell und kann jederzeit von IBM geändert werden. Nicht alle Angebote sind in allen Ländern verfügbar, in denen IBM tätig ist.

Die genannten Leistungsdaten und Kundenbeispiele dienen ausschließlich zur Veranschaulichung. Tatsächliche Leistungsergebnisse hängen von den jeweiligen Konfigurationen und Betriebsbedingungen ab. DIE INFORMATIONEN IN DIESEM DOKUMENT WERDEN OHNE JEGLICHE AUSDRÜCKLICHE ODER STILLSCHWEIGENDE GARANTIE ZUR VERFÜGUNG GESTELLT, EINSCHLIESSLICH DER GARANTIE DER MARKTGÄNGIGKEIT, DER EIGNUNG FÜR EINEN BESTIMMTEN ZWECK UND DER GARANTIE ODER BEDINGUNG DER NICHTVERLETZUNG VON RECHTEN. Die Garantie für Produkte von IBM richtet sich nach den Geschäftsbedingungen der Vereinbarungen, unter denen sie bereitgestellt werden.