En avril 2020, T-Mobile a fait un bond en avant qui a transformé le marché des télécommunications aux États-Unis. La société a fait l'acquisition de Sprint, à l'issue d'une fusion qui a formé le plus grand réseau 5G du pays.

Bien sûr, l'expansion a également porté un risque important. Dans le marché de télécommunications très concurrentiel, les clients n'ont offert aucun délai de grâce pour la fusion. T-Mobile doit intégrer deux grands réseaux tout en continuant à assurer une fiabilité et une qualité de service constantes sur toute la ligne.

La réalisation de ce processus dépend de la gestion du réseau. T-Mobile utilise des outils de IBM Cloud Pak® for Watson AIOps pour intégrer la gestion, transformant deux vastes réseaux en un seul et en utilisant l'automatisation optimisée par l'IA pour maximiser la fiabilité et l'efficacité.

Lorsque T-Mobile a acquis Sprint, il a dû corréler environ

3 millions

de pannes supplémentaires par jour

Temps moyen de traitement des pannes avec IBM Cloud Pak for Watson AIOps :

19 secondes

au lieu de 5 minutes

Maximiser la qualité en dépit du double de la complexité

"La gestion du réseau est une composante majeure de la qualité du service que nous offrons aux gens et aux entreprises qui utilisent le réseau T-Mobile", explique Tom Higdon, architecte principal de la gestion des événements de T-Mobile. "La gestion du réseau est la façon dont vous vous assurez que tous les excellents services dont vous disposez sont effectivement disponibles pour les clients et fonctionnent comme ils le devraient.

Et lorsque vous exécutez l'un des plus grands réseaux de communications au monde, la gestion des réseaux est également extrêmement complexe. Comme l'explique Higdon, "Ce n'est pas simplement le réseau sans fil, parce que le réseau sans fil dépend d'autres réseaux et infrastructures de support : les centres de données et les équipements IP, les applications et les services, les sites de cellules et les sites de commutation ainsi que tous les équipements concernés."

Lorsque T-Mobile a acquis Sprint, la portée et la complexité ont pratiquement doublé. "Le premier jour de la fusion," dit Higdon, "la portée de ce dont nous avions besoin pour assurer la gestion du réseau a augmenté de près d'un demi-million de dispositifs à surveiller, ce qui a créé environ trois millions de nouvelles pannes par jour à corréler."

En outre, les deux réseaux avaient des systèmes de gestion distincts et matures. "Cela a accru la complexité de l'intégration parce que nous avions des systèmes qui existaient depuis plus de 10 ans", explique M. Higdon. Les systèmes comprenaient deux plateformes de gestion centrales distinctes – l'une basée sur les solutions IBM® Netcool® (désormais intégrée à IBM Cloud Pak for Watson AIOps), l'autre basée sur une solution de gestion tierce – ainsi qu'un ensemble d'outils de surveillance multifournisseurs alimentant les plateformes centrales.

Soucieux de fournir des performances de réseau optimales, T-Mobile a cherché le meilleur moyen d'identifier les éléments exploitables parmi les millions de pannes quotidiennes. L'entreprise cherche également à renforcer l'automatisation, afin de rendre la gestion du réseau toujours plus efficace et le réseau lui-même toujours plus fiable.

Affichage de la porte et de la fenêtre de la vitrine T-Mobile

Flexibilité et efficacité dans la gestion des réseaux

"Presque immédiatement après la fusion," raconte Higdon, "nous avons vu qu'IBM investissait dans sa suite de produits et qu'elle voulait un véritable partenariat avec nous, afin que nous réussissons tous les deux à évoluer. Des différentiels techniques et non techniques ont donc commencé à se manifester. Cela nous a conduits à la décision d'aller de l'avant avec la solution Watson AIOps."

La priorité immédiate a été d'intégrer les plateformes disparates de gestion des pannes. C'était une tâche décourageante qu'il fallait accomplir rapidement. Heureusement, M. Higdon et ses collègues ont constaté que les solutions IBM étaient suffisamment souples pour intégrer les données provenant des autres outils de gestion et de surveillance. "Nous avons rapidement réussi l'intégration. C'est l'une des toutes premières choses que nous avons faites en tant que nouvelle entreprise", explique M. Higdon. "Les connecteurs et les adaptateurs de la suite de produits IBM ont pu être rapidement déployés et configurés, avec un minimum de personnalisation, pour commencer à obtenir ces données et enrichir nos informations sur les pannes et les événements. Cela nous a permis de fusionner nos équipes d'opérations de réseau."

Lors de la mise en œuvre de la plateforme de gestion de réseau fusionnée, T-Mobile a réalisé des gains d'efficacité spectaculaires. "Nous avons traité 90 % du volume total d'alarmes en utilisant un dixième de l'échelle du système de production visé. Toutes les alarmes SNMP arrivaient par une seule sonde SNMP sans délai ni défaillance, alors que l'autre système de gestion existant sur le réseau nécessitait dix passerelles SNMP pour le même volume et connaissait de multiples pannes et/ou délais de traitement."

Tour de communication avec pour toile de fond le ciel au coucher du soleil

Une accélération spectaculaire des connaissances exploitables

Les opérations entre les plateformes acquises et d'origine ayant été fusionnées, M. Higdon et son équipe s'attachent désormais à rationaliser davantage la gestion, à réduire le "bruit" des opérations régulières du réseau et à créer les voies les plus rapides vers la détection et la résolution des problèmes ou, idéalement, la prévention. "Nous créons et mettons en œuvre ce que j'appelle des cadres de travail de nature générique, qui nous aident à traiter plusieurs types de problèmes et à obtenir les résultats appropriés", explique M. Higdon. Par exemple, Higdon décrit un cadre de corrélation d'alarmes de noyau sans fil récemment mis en œuvre. "Les corrélations peuvent être effectuées presque instantanément. C'est un facteur de différenciation. Il s'agit de ne pas avoir à revenir en arrière et à scanner des milliers de pannes chaque minute. C'est instantané.”

Et créer de tels cadres est relativement facile, selon Higdon. "Les outils flexibles de Watson AIOps s'avèrent encore une fois indispensables, avec des adaptateurs pour aider à créer ces cadres. C'est l'une de leur plus grandes forces. Cela ne nécessite pas beaucoup de codage. Certaines adaptations sont nécessaires, mais elles tendent à être très simples. La solution permet de parler de manière générique d'un très grand nombre de choses différentes. Elle offre des capacités internes qui peuvent être facilement adaptées pour répondre à nos besoins."

Higdon et son équipe constatent déjà des accélérations spectaculaires dans la fourniture de connaissances exploitables aux utilisateurs : "Nous avons conçu notre déploiement Watson AIOps pour fournir une redondance locale et géographique complète à tous les niveaux. En outre, nous avons réduit le système cible de manière à ce qu'il soit capable de traiter les volumes de pannes requis avec un minimum de retard. En traitant 90 % du volume total de défauts à l'aide de composants AIOps minimaux, nous avons constaté que le temps moyen entre l'apparition de la panne – à travers le système avec tous les enrichissements, corrélations et/ou suppressions – et l'affichage par l'utilisateur est de 19 secondes. Avec les systèmes existants, l'opération prenait plutôt cinq minutes."

Représentant de T-Mobile parlant au client à l'intérieur du magasin

Étapes suivantes : automatisation en boucle fermée avec IA

T-Mobile teste maintenant comment l'IA et les capacités d'apprentissage automatique d'IBM Watson AIOps pourraient aider à atteindre une réactivité encore plus grande, renforçant encore la fiabilité du réseau.

"Nous sommes à la recherche de l'IA pour nous fournir des renseignements. Il pourrait s'agir de renseignements sous la forme du seuil que je devrais atteindre pour le taux de corrélation, ou y a-il une relation qui n'est pas évidente pour nous ? Des choses que nous, en tant qu'humains, ne pourrions pas comprendre sans y consacrer beaucoup de temps et d'énergie."

L'objectif de la gestion du réseau est de passer de la gestion réactive à proactive et éventuellement à la gestion prédictive. Higdon a l'air d'utiliser AIOps pour faire une autre étape et réaliser une automatisation en boucle fermée. "En définitive, c'est ce que nous essayons de faire. Les outils permettent d'obtenir des quantités massives de données, de rendre compte de ces données, de formuler des recommandations et même d'arriver à une orchestration ou à une automatisation fondée sur une intention."

Ce sera un avantage précieux pour un réseau de cette taille, dans un secteur si compétitif. "J'ai besoin d'augmenter la capacité. J'ai les outils nécessaires pour transmettre cette information à une plateforme d'automatisation intelligente qui va effectuer le changement. Tout cela sans intervention humaine. C'est notre plan, cette boucle fermée, c'est ce vers quoi nous tendons en ce moment."

Logo T-mobile

À propos de T-Mobile

T-Mobile (lien externe) est l'un des fournisseurs de communications mobiles les plus importants et à la croissance la plus rapide au monde. Filiale de Deutsche Telekom AG, dont le siège est à Bonn, en Allemagne, T-Mobile dessert des clients particuliers et professionnels en Europe, aux États-Unis et dans les Caraïbes. En 2020, elle a gagné 5,5 millions de clients nets et réalisé un chiffre d'affaires de 68,4 milliards de dollars.

Composant de la solution
IBM Cloud Pak® for Watson AIOps

© Copyright IBM Corporation 2021. IBM Corporation, IBM Cloud, New Orchard Road, Armonk, NY 10504

Produit aux États-Unis, novembre 2021.

IBM, le logo IBM, ibm.com, IBM Cloud Pak et Netcool sont des marques d'International Business Machines Corp. dans de nombreux pays. Les autres noms de produits et de services peuvent être des marques d'IBM ou d'autres sociétés. La liste actualisée de toutes les marques d'IBM est disponible sur le Web à l'adresse suivante : www.ibm.com/legal/copytrade.

Le présent document contient des informations qui étaient en vigueur et valides à la date de la première publication, et qu'IBM peut mettre à jour à tout moment. Toutes les offres mentionnées ne sont pas distribuées dans tous les pays où IBM exerce son activité.

Les données de performances et les exemples de clients ne sont présentés qu'à des fins d'illustration. Les performances réelles peuvent varier en fonction des configurations et des conditions d'exploitation spécifiques. LES INFORMATIONS CONTENUES DANS LE PRÉSENT DOCUMENT SONT FOURNIES « EN L'ÉTAT », SANS AUCUNE GARANTIE EXPLICITE OU IMPLICITE. IBM DÉCLINE NOTAMMENT TOUTE RESPONSABILITÉ RELATIVE À CES INFORMATIONS EN CAS DE CONTREFAÇON AINSI QU'EN CAS DE DÉFAUT D'APTITUDE À L'EXÉCUTION D'UN TRAVAIL DONNÉ. Les produits IBM sont garantis conformément aux dispositions des contrats au titre desquels ils sont fournis.