Há muito tempo, Lot e a equipe da Electrolux enfrentam esses dois desafios usando as soluções IBM Netcool como plataforma global integrada de gerenciamento de operações de TI. E, assim como a Electrolux encontra continuamente novas maneiras de aprimorar seus eletrodomésticos, Lot e sua equipe agora estão adotando recursos de automação orientados por IA da evolução atual da plataforma IBM Netcool, o IBM Cloud Pak for Watson AIOps.
Ele vê potencial para ganhar eficiência crítica usando o aprendizado de máquina para automatizar o que é conhecido em TI como correlação de eventos. “Eventos” são dados sobre o funcionamento de uma infinidade de elementos no ambiente de TI. Eles abrangem uma gama muito ampla de fenômenos, e a grande maioria dos eventos não indica problemas reais. A correlação de eventos significa agrupar eventos relacionados em "instâncias" para obter uma visão muito mais clara de onde estão os problemas reais.
Lot dá um exemplo básico: "Imagine que alguém, sem querer, desconecta um roteador de rede que está conectado a dez computadores. Isso cria 11 eventos diferentes, mas há apenas um problema real: o roteador precisa ser reconectado.” Esses 11 eventos são, na verdade, apenas uma instância. “Mas isso é apenas uma gota no oceano”, diz Lot. “Temos cerca de 100.000 eventos por dia.” Quanto mais rápido os gerentes de operações de TI, como Lot, puderem visualizar as instâncias em vez dos eventos, mais rápido eles poderão identificar os problemas reais e resolvê-los. Lot descreve isso de forma clara: "Nesse oceano, é importante saber exatamente qual gota de veneno você precisa extrair para salvar sua vida.
No entanto, a correlação de eventos geralmente exige uma equipe de pessoas que passam muito tempo analisando alarmes de eventos manualmente para encontrar correlações. "Em um ano", afirma, "corrigimos o mesmo tipo de problema 1.000 vezes. E tivemos pessoas que passaram uma hora gerenciando essas atividades manualmente." Agora, implementando regras baseadas em especialistas em IA, a Electrolux pode automatizar e acelerar muito esse trabalho.
A Electrolux está apenas começando a incorporar esse tipo de automação com inteligência artificial, mas Lot vê como um passo muito importante. "Avaliar a diferença entre eventos e incidentes é o primeiro passo para uma gestão completa das operações de IA e, provavelmente, é o que pode trazer retorno mais rápido sobre o investimento em tecnologias de autoaprendizado".
Não se trata apenas de resultados financeiros. Em vez de deslocar a inteligência humana, Lot vê o potencial da IA para promover a especialização dos funcionários. "Precisamos investir na mudança de ideias. Temos que explicar por que devemos retirar atividades manuais de operadores que realizam essas atividades tão bem." Ao automatizar uma tarefa braçal que consome 1.000 horas por ano, não só a Electrolux pode recuperar grande parte desse tempo, mas a especialização dos operadores pode ser aplicada a tarefas mais valiosas e de nível superior. Por exemplo: identificar novos critérios de correlação que podem ser atendidos com a solução Watson AIOps ou refinar regras e ações com base nas condições locais. Ela cria um círculo virtuoso, diz Lot: a automação economiza tempo que pode ser realocada para enriquecer a automação. Enquanto isso, os operadores podem enriquecer suas própria especializações.
Para o futuro, Lot está explorando a conteinerização da solução de monitoramento. Ao trabalhar com a IBM, ele recentemente concluiu um ambiente de desenvolvimento na plataforma de contêiner Red Hat OpenShift da solução IBM Cloud Pak, e agora ele e sua equipe estão testando os recursos de AIOps Watson como soluções de contêiner no OpenShift. O ambiente de monitoramento atual é amplamente implementado no local, mas Lot acredita que a implementação de versões em contêiner na plataforma de nuvem Microsoft Azure da Electrolux pode ser uma maneira mais eficiente e eficaz de fornecer atualizações de monitoramento e novos recursos em todo o cenário heterogêneo.