Im April 2020 machte T-Mobile einen Wettbewerbssprung, der den Telekommunikationsmarkt in den USA veränderte. Das Unternehmen hat Sprint übernommen und damit einen Unternehmenszusammenschluss eingeleitet, der das größte 5G-Netz des Landes geschaffen hat.

Natürlich brachte die Expansion auch erhebliche Risiken mit sich. Auf dem hart umkämpften Telekommunikationsmarkt gab es von Kundenseite keine Schonfrist für den Unternehmenszusammenschluss. T-Mobile musste zwei große Netze integrieren und gleichzeitig eine gleichbleibend hohe Zuverlässigkeit und Servicequalität gewährleisten.

Die Umsetzung dieser Punkte hängt von der Netzmanagement ab. T-Mobile verwendet Tools von IBM® Cloud Pak for Watson AIOps, um das Management zu integrieren, zwei riesige Netze in ein einziges zu verwandeln und mit KI-basierter Automatisierung sowohl die Zuverlässigkeit als auch die Effizienz zu maximieren.

Als T-Mobile Sprint übernahm, musste das Unternehmen etwa

3 Millionen

zusätzliche Fehler pro Tag korrigieren

Durchschnittliche Fehlerbearbeitungszeit mit IBM Cloud Pak for Watson AIOps:

19 Sekunden

statt ehemals 5 Minuten

Qualitätsmaximierung trotz doppelter Komplexität

„Netzmanagement ist ein extrem wichtiger Bestandteil der Servicequalität, die wir den Menschen und den Unternehmen bereitstellen, die das T-Mobile Netz nutzen“, so Tom Higdon, Principal Event Management Architect von T-Mobile. „Mit Netzmanagement lässt sich sicherstellen, dass alle Ihre großen Services den Kunden auch tatsächlich zur Verfügung stehen und so funktionieren, wie sie sollen.“

Und wenn Sie eines der größten Kommunikationsnetze der Welt betreiben, ist das Netzmanagement auch extrem komplex. Wie Higdon erklärt: „Es ist nicht bloß das mobile Netz, denn das mobile Netz hängt von anderen unterstützenden Netzen und Infrastruktur ab: von Ihren Rechenzentren und IP-basierten Geräten und Anwendungen und Services, den Funkzellenstandorten und Switch-Sites und allen Geräten, die involviert sind.“

Als T-Mobile Sprint übernahm, verdoppelten sich de facto Umfang und Komplexität. „Am ersten Tag des Unternehmenszusammenschlusses“, so Higdon, „wuchs der Umfang dessen, was wir für das Netzmanagement bereitstellen mussten, um fast eine halbe Million Geräte, die überwacht werden mussten, was zu etwa drei Millionen neuen Fehlern pro Tag führte, die es zu korrelieren galt.“

Darüber hinaus verfügten die beiden Netze über unterschiedliche, ausgereifte Managementsysteme. „Das erhöhte die Komplexität der Integration, da wir Systeme hatten, die jeweils seit mehr als 10 Jahren bestanden“, erklärt Higdon. Die Systeme umfassten zwei separate Kernverwaltungsplattformen – eine auf der Grundlage von IBM® Netcool-Lösungen (jetzt in IBM Cloud Pak for Watson AIOps integriert), die andere auf der Grundlage einer Verwaltungslösung eines Drittanbieters – sowie eine Reihe von Überwachungstools von verschiedenen Anbietern, die in die Kernplattformen eingespeist wurden.

T-Mobile ist bestrebt, die bestmögliche Netzleistung zu erzielen, und suchte daher nach der besten Methode, um in den Millionen von täglichen Fehlern umsetzbare Elemente zu identifizieren. Das Unternehmen strebt außerdem eine stärkere Automatisierung an, um das Netzmanagement noch effizienter und das Netz selbst noch zuverlässiger zu machen.

Eingangsbereich und Schaufensterdisplay von T-Mobile

Flexibilität und Effizienz im Netzmanagement

„Fast unmittelbar nach dem Unternehmenszusamenschluss“, so Higdon, „sahen wir, dass IBM in seine Produktsuite investierte und eine echte Partnerschaft mit uns anstrebte, damit wir uns beide weiterentwickeln und erfolgreich sein konnten. So begannen sich einige technische und nicht-technische Unterscheidungsmerkmale herauszukristallisieren. Das hat uns zu der Entscheidung geführt, mit der Watson AIOps-Lösung weiterzumachen.“

Unmittelbare Priorität hatte die Integration der unterschiedlichen Fehlermanagementplattformen. Es war eine gewaltige Aufgabe, die schnell erledigt werden musste. Glücklicherweise stellten Higdon und seine Kollegen fest, dass die IBM Lösungen flexibel genug waren, um Daten aus den anderen Management- und Überwachungstools einzubeziehen. „Die Integration verlief schnell und erfolgreich. Sie war eine der ersten Aufgaben, die wir als neues Unternehmen angegangen sind", so Higdon. „Die Connectors und Adapter in der IBM Produktsuite konnten mit minimalen Anpassungen schnell implementiert und konfiguriert werden, um diese Daten abrufen zu können und unsere Fehler- und Ereignisinformationen zu erweitern. Dadurch konnten wir unsere Teams für Netzbetrieb zusammenführen.“

Bei der Bereitstellung der fusionierten Netzmanagementplattform für die Produktionsfreigabe erzielte T-Mobile enorme Effizienzsteigerungen. „Wir haben 90 % des gesamten Alarmvolumens über ein Zehntel des angestrebten Produktionssystems abgewickelt. Alle SNMP-Alarme kamen über eine einzige SNMP-Sonde ohne Verzögerungen oder Ausfälle, während das andere Managementsystem im Netz zehn SNMP-Gateways für das gleiche Volumen benötigte und mehrere Ausfälle und/oder Verarbeitungsverzögerungen aufwies.“

Sendemast im Sonnenuntergang

Enorme Beschleunigung umsetzbarer Erkenntnisse

Nach der Zusammenführung der Betriebsabläufe zwischen der übernommenen und der ursprünglichen Plattform konzentrieren sich Higdon und sein Team nun auf die weitere Optimierung des Managements, die Verringerung des „Rauschens“ des regulären Netzbetriebs und die Schaffung der schnellsten Wege zur Erkennung und Lösung von Problemen bzw. im Idealfall zu deren Vermeidung. „Wir erstellen und implementieren sogenannte Frameworks, die generischer Art sind und uns helfen, verschiedene Arten von Problemen anzugehen und die richtigen Ergebnisse zu erzielen“, so Higdon. Higdon beschreibt zum Beispiel ein kürzlich implementiertes Framework für die Korrelation von Alarmen im mobilen Kern. „Korrelationen können fast sofort durchgeführt werden. Das ist ein Unterscheidungsmerkmal. Wir müssen nicht mehr zurück und jede Minute Tausende von Fehlern überprüfen. Es geht sofort.“

Und die Erstellung solcher Frameworks ist laut Higdon relativ einfach. „Die Tools von Watson AIOps sind flexibel und verfügen über Adapter, die bei der Erstellung dieser Frameworks helfen. Das ist eine der größten Stärken. Es ist keine umfangreiche Codierung erforderlich. Es sind zwar einige Anpassungen erforderlich, aber die sind in der Regel sehr einfach zu bewerkstelligen. Die Lösung bietet Möglichkeiten zur generischen Kommunikation mit jeder Menge verschiedener Dinge. Sie bietet ein internes Leistungsspektrum, das leicht an unsere Bedürfnisse angepasst werden kann.“

Higdon und sein Team stellen bereits fest, dass sich die Bereitstellung umsetzbarer Erkenntnisse für die Benutzer enorm beschleunigt hat: „Wir haben unsere Watson AIOps-Bereitstellung so konzipiert, dass sie auf allen Ebenen vollständige lokale und geografische Redundanz bietet. Außerdem haben wir das Zielsystem so skaliert, dass es in der Lage ist, das erforderliche Fehlervolumen mit minimalen Verzögerungen zu verarbeiten. Bei der Verarbeitung von 90 % des gesamten Fehlervolumens mit einem Minimum an AIOps-Komponenten haben wir festgestellt, dass die durchschnittliche Zeit vom Auftreten des Fehlers – durch das System mit allen Aufbereitungen, Korrelationen und/oder Unterdrückungen – bis zur Anzeige durch den Benutzer 19 Sekunden beträgt. Bei bestehenden Systemen waren es eher fünf Minuten.“

T-Mobile-Beraterin im Gespräch mit einem Kunden in einer Filiale

Nächster Schritt: KI im geschlossenen Automatisierungskreislauf

Derzeit testet T-Mobile, wie die KI- und Machine-Learning-Funktionen von IBM Watson AIOps zu einer noch besseren Reaktionsfähigkeit beitragen und die Zuverlässigkeit des Netzes weiter erhöhen können.

„Wir erwarten von der KI, dass sie uns mit Informationen versorgt. Es könnten Informationen der Art sein, wie hoch mein Schwellenwert für die Korrelationszählung sein sollte oder ob es hier eine Beziehung gibt, die wir nicht erkennen können. Also Dinge, die wir als Menschen ohne großen Zeit- und Energieaufwand nicht erkennen können.“

Das Ziel beim Netzmanagement ist es, von reagierendem zu proaktivem und schließlich zu prädiktivem Management überzugehen. Higdon möchte mit AIOps noch einen Schritt weiter gehen und einen geschlossenen Automatisierungskreislauf erreichen. „Das ist das Ziel, das wir letztendlich anstreben. Die Tools sollen große Datenmengen erfassen, diese Daten sinnvoll nutzen, Empfehlungen geben und möglicherweise sogar eine gezielte Orchestrierung oder Automatisierung erreichen.“

Dies ist ein großer Vorteil eines so großen Netzes in einer derart wettbewerbsintensiven Branche. „Ich muss die Kapazität erhöhen. Ich habe die Tools, um diese Informationen an eine intelligente Automatisierungsplattform weiterzugeben, die dann die Änderung vornimmt. Und das alles voll automatisch. Das ist unser Plan, dieser geschlossene Kreislauf, auf den wir im Moment noch hinarbeiten.“

T-Mobile-Logo

Informationen zu T-Mobile

T-Mobile (externer Link) ist einer der weltweit führenden und am schnellsten wachsenden Mobilfunkanbieter. T-Mobile, eine Tochtergesellschaft der Deutschen Telekom AG mit Hauptsitz in Bonn, bedient Privat- und Geschäftskunden in Europa, den USA und der Karibik. Im Jahr 2020 konnte das Unternehmen 5,5 Millionen neue Kunden gewinnen und einen Umsatz von 68,4 Milliarden US-Dollar erzielen.

Lösungskomponente
IBM® Cloud Pak for Watson AIOps

© Copyright IBM Corporation 2021. IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

Produziert in den Vereinigten Staaten von Amerika, November 2021.

IBM, das IBM Logo, ibm.com, IBM Cloud Pak und Netcool sind Marken der International Business Machines Corporation in den USA und/oder anderen Ländern. Weitere Produkt- und Servicenamen können Marken von IBM oder anderen Unternehmen sein. Eine aktuelle Liste der IBM Marken finden Sie im Web unter www.ibm.com/legal/copytrade.

Die in diesem Dokument enthaltenen Informationen sind zum Datum der Erstveröffentlichung des Dokuments aktuell und können von IBM jederzeit geändert werden. Nicht alle Angebote sind in jedem Land verfügbar, in dem IBM tätig ist.

Leistungsdaten und Kundenbeispiele dienen nur zur Veranschaulichung. Die tatsächlichen Ergebnisse beim Leistungsverhalten sind abhängig von der jeweiligen Konfiguration und den Betriebsbedingungen. Die Angaben in diesem Dokument stellen keine zugesicherten Eigenschaften dar. IBM ist berechtigt, die Eigenschaften jederzeit zu ändern. Angaben zur Verfügbarkeit, Vertragsbedingungen und Preise erhalten Sie bei den IBM Geschäftsstellen und/oder den IBM Business Partnern. Für IBM Produkte gelten die Gewährleistungen, die in den Vereinbarungen vorgesehen sind, unter denen sie erworben werden.