Em abril de 2020, a T-Mobile deu um salto competitivo que transformou o mercado de telecomunicações nos EUA. A empresa adquiriu a Sprint, iniciando uma fusão que resultou na maior rede 5G do país.

É claro que a expansão também apresentava grandes riscos. No mercado de telecomunicações altamente competitivo, os clientes não deram um período de trégua para a fusão. Era necessário para a T-Mobile integrar duas grandes redes e, ao mesmo tempo, continuar a oferecer confiabilidade e qualidade de serviço consistente em todos os setores.

Tudo isso depende do gerenciamento de rede. A T-Mobile está usando ferramentas do IBM Cloud Pak® for Watson AIOps para integrar o gerenciamento, transformando duas amplas redes em uma e usando a automação habilitada por IA para aumentar a confiabilidade e a eficiência.

Quando a T-Mobile adquiriu a Sprint, teve que correlacionar aproximadamente

3 milhões

de falhas adicionais por dia

Tempo médio de processamento de falhas com o IBM Cloud Pak for Watson AIOps:

19 segundos

de 5 minutos

Maximizando a qualidade mesmo com o dobro da complexidade

"O gerenciamento de rede é um componente essencial da qualidade do serviço que entregamos para as pessoas e as empresas que usam a rede T-Mobile", afirma Tom Higdon, Principal Event Management Architect da T-Mobile. "O gerenciamento de rede é a maneira de assegurar que todos os serviços que você oferece estão realmente disponíveis para os clientes e que estão sendo executados da maneira que deveriam".

E quando você administra uma das maiores redes de comunicação do mundo, o gerenciamento da rede também é extremamente complexo. De acordo com Higdon, "Não é simplesmente uma rede wireless, porque a rede wireless depende de outras redes e infraestruturas de apoio: seus data centers e equipamentos baseados em IP e aplicativos e serviços, sites de celulares e sites de comutação e todos os equipamentos envolvidos".

Quando a T-Mobile adquiriu a Sprint, o escopo e a complexidade basicamente dobraram. "No primeiro dia da fusão", diz Higdon, "o escopo do que precisávamos para fornecer gerenciamento de rede apresentou um crescimento muito próximo de meio milhão de dispositivos sendo monitorados, o que gerou cerca de três milhões de novas falhas por dia a serem correlacionadas".

Além disso, as duas redes tinham sistemas de gerenciamento distintos e maduros. "Isso aumentou a complexidade para a integração, porque tínhamos sistemas que existiam há mais de 10 anos cada um", explica Higdon. Os sistemas envolviam duas plataformas de gerenciamento fundamentais, uma baseada em soluções IBM® Netcool® (agora integrada ao IBM Cloud Pak for Watson AIOps) e a outra baseada em uma solução de gerenciamento de terceiros, além de um sistema de múltiplos fornecedores de ferramentas de monitoramento alimentando as plataformas principais.

Com foco em proporcionar o melhor desempenho de rede, a T-Mobile buscou a melhor maneira de identificar itens acionáveis dentro dos milhões de falhas diárias. A empresa também buscou implementar mais automação, tornando o gerenciamento de rede cada vez mais eficiente, e a própria rede cada vez mais confiável.

Porta da fachada da loja da T-Mobile e a vitrine

Flexibilidade e eficiência no gerenciamento de rede

"Quase imediatamente após a fusão", relembra Higdon, "notamos que a IBM estava investindo em sua suíte de produtos e que a IBM estava buscando uma verdadeira parceria com a gente, para que ambos pudéssemos evoluir e ter êxito. Por isso, alguns diferenciais técnicos e não técnicos, começaram a serem revelados. Isso nos levou à decisão de seguir em frente com a solução Watson AIOps".

A prioridade imediata era integrar as diferentes plataformas de gerenciamento de falhas. Era uma tarefa difícil que precisava ser feita rapidamente. Felizmente, Higdon e seus colegas descobriram que as soluções da IBM eram flexíveis o suficiente para incorporar dados das outras ferramentas de gerenciamento e monitoramento. " Nós fizemos a integração rapidamente com sucesso. É uma das primeiras coisas que fizemos como um novo negócio", afirma Higdon. "Os conectores e adaptadores da suíte de produtos IBM puderam ser implementados e configurados rapidamente, com customizações mínimas, para começar a acessar esses dados, enriquecendo nossas informações de falha e de eventos. Isso nos permitiu unir nossas equipes de operações de rede".

Ao preparar a plataforma de gerenciamento de rede após a fusão para a sua liberação para produção, a T-Mobile alcançou ganhos significativos de eficiência. "Nós processamos 90% do volume total de alarme usando um décimo da escala do sistema de produção alvo. Todos os alarmes SNMP estavam chegando por meio de uma única análise SNMP sem atrasos ou falhas, enquanto o outro sistema de gerenciamento que existia na rede exigia dez gateways SNMP para o mesmo volume e teve diversas falhas e/ou atraso de processamento".

Torre de comunicação e plano de fundo com céu ensolarado

Acelerando significativamente a geração de insights acionáveis

Com as operações usando as plataformas adquiridas e originais juntas, Higdon e sua equipe passaram a se concentrar em agilizar ainda mais o gerenciamento, reduzindo o "ruído" das operações normais da rede e criando caminhos mais rápidos para emitir detecção e resolução ou, idealmente, prevenção. "Nós criamos e implementamos o que eu chamo de frameworks que são inerentemente genéricos, que nos ajudam a abordar diversos tipos de questões e obter os respectivos resultados", diz Higdon. Por exemplo, Higdon descreve um framework de correlação de alarme wireless recentemente implementado. "As correlações podem ser realizadas quase instantaneamente. Isso é um diferencial. Estamos falando de não ter que voltar fazer varreduras de milhares de falhas a cada minuto. É automático".

E criar tais frameworks é relativamente fácil, de acordo com Higdon. "As ferramentas do Watson AIOps, novamente, são flexíveis e contam com adaptadores para ajudar a criar esses frameworks. Essa é uma das principais vantagens. Não é necessário criar um código extenso. Algumas adaptações são necessárias, mas tendem a ser muito diretas. A solução proporciona formas de integrar com muitas, muitas coisas diferentes. Ela fornece recursos internos que podem ser facilmente adaptados para atender às nossas necessidades."

Higdon e sua equipe já estão observando avanços significativos na entrega de insights acionáveis aos usuários: "Nós projetamos nossa implementação do Watson AIOps para fornecer redundância total local e regional em todos os níveis. Além disso, escalamos o sistema de destino para ser capaz de processar volumes de falha necessários com atrasos mínimos. Ao processar 90% do volume total de falhas usando componentes mínimos de AIOps, observamos que o tempo médio desde a ocorrência da falha, em todo o sistema com todo o enriquecimento, correlação e/ou supressão, até a exibição do usuário é de 19 segundos. Os sistemas legados processaram em cerca de cinco minutos."

Representante da T-Mobile conversando com cliente dentro da loja

Próximas etapas: ciclo de automação com a IA

Agora, a T-Mobile está testando como os recursos de IA e machine learning do IBM Watson AIOps poderiam ajudar a alcançar uma capacidade de resposta ainda maior, fortalecidos pela confiabilidade da rede.

"Estamos buscando a IA para fornecer inteligência de volta para nós. Poderia ser inteligência na forma do que deveria o meu limite ser para contagem de correlação, ou existe um relacionamento aqui que não é aparente para nós? Coisas que nós como humanos poderíamos não identificar sem tempo e energia necessários."

O objetivo do gerenciamento de rede é mudar de reativo para proativo e, eventualmente, para o gerenciamento preditivo. Higdon busca usar o AIOps para avançar mais e alcançar a automação de ciclo fechado. "É nesse ponto que queremos chegar. Use as ferramentas para obter grandes volumes de dados, analise esses dados, faça recomendações e, possivelmente, aplique uma orquestração ou automação baseada em intenção."

Essa será uma vantagem valiosa para uma rede deste tamanho e em uma indústria tão competitiva. "Preciso aumentar a capacidade. As minhas ferramentas transmitem essa informação para uma plataforma de automação inteligente que aplica a mudança. E tudo isso é feito sem intervenção humana. Esse é o nosso plano, o ciclo fechado, e estamos dedicando todos os nossos esforços para alcançá-lo."

Logotipo da T-Mobile

Sobre a T-Mobile

A T-Mobile (link externo) é um dos principais e mais rápidos provedores de serviços de comunicações móveis em crescimento do mundo. Uma subsidiária da Deutsche Telekom AG com sede em Bonn, na Alemanha, a T-Mobile atende consumidores e clientes corporativos na Europa, Estados Unidos e Caribe. Em 2020, somou 5,5 milhões de clientes e alcançou USD 68,4 bilhões em receita.

Componente da solução
IBM Cloud Pak® for Watson AIOps

© Copyright IBM Corporation 2021. IBM Brasil Ltda, Hybrid Cloud, Rua Tutóia, 1157, CEP 04007-900, São Paulo-SP

Produzido nos Estados Unidos da América, novembro de 2021.

IBM, o logotipo da IBM, ibm.com, IBM Cloud Pak e Netcool são marcas comerciais da International Business Machines Corp., registradas em muitas jurisdições no mundo todo. Outros nomes de produtos e de serviços podem ser marcas registradas da IBM ou de outras empresas. Uma lista atual de marcas comerciais da IBM está disponível na web em www.ibm.com/legal/copytrade.

Este documento foi atualizado a partir da data inicial da publicação e pode ser modificado pela IBM a qualquer momento.Nem todas as ofertas estão disponíveis em todos os países nos quais a IBM opera.

Os dados de desempenho e exemplos do cliente citados são apresentados somente para fins ilustrativos. Os resultados de desempenho podem variar dependendo de condições de operação e configurações específicas. AS INFORMAÇÕES PRESENTES NESSE DOCUMENTO SÃO FORNECIDAS “NO ESTADO EM QUE SE ENCONTRAM”, SEM GARANTIAS DE QUALQUER TIPO, EXPRESSAS OU IMPLÍCITAS, INCLUSO SEM GARANTIAS DE COMERCIALIZAÇÃO, ADEQUAÇÃO A UM DETERMINADO FIM E QUALQUER GARANTIA OU CONDIÇÃO DE NÃO VIOLAÇÃO.Os produtos IBM possuem garantias de acordo com os termos e condições dos contratos aos quais estão sujeitos.