Acelerando a pesquisa e inovação
Como o NCHC usa AIOps para melhorar os serviços de rede pública e prevenir proativamente interrupções
Na sala de conferências, o engenheiro-chefe apresenta a um conselho de cientistas uma nova abordagem revolucionária para o desenvolvimento de inteligência artificial e redes neurais.
 A TV na parede mostra suas conquistas.

A velocidade da pesquisa é importante. Durante a pandemia de COVID-19, ela foi a diferença entre vida e morte para milhões.

Em Taiwan, onde a resposta à pandemia foi excepcionalmente eficaz na limitação de surtos e mortes, o Centro Nacional de Computação de Alto Desempenho (NCHC) ajuda a acelerar a pesquisa e inovação em todo o país, fornecendo acesso a supercomputadores e análises e facilitando redes nacionais para compartilhamento de dados e colaboração.

Embora o NCHC apoie pesquisas em todas as disciplinas, a urgência da pandemia inspirou o lançamento de sucessivos programas "Tech v Virus", que convocam universidades, organizações de pesquisa, empresas e startups a encontrar novas maneiras de combater a propagação do coronavírus SARS-CoV-2. Uma descoberta de alto perfil até agora é um estetoscópio que visualiza a respiração do paciente, ajudando médicos e enfermeiros a reduzir o contato próximo com pacientes potencialmente infectados — reduzindo assim o risco de transmissão. Outra é um mapa da evolução do gene da COVID-19, ajudando a prever rotas de propagação.

Para apoiar esforços como esses, e centenas de outros em todos os campos, o NCHC quer garantir que a pesquisa se mova o mais rápido possível. É por isso que continua evoluindo sua série de supercomputadores Taiwania, que inclui um dos 50 computadores mais poderosos do mundo. É por isso que oferece serviços de IA — incluindo ferramentas baseadas no IBM Cloud Pak for Data. E é por isso que o NCHC recentemente trabalhou com o IBM Garage para implementar a solução IBM Cloud Pak for Watson AIOps, aplicando automação baseada em IA para maximizar a resiliência e o desempenho.

MTTD reduzido

 

Redução de 55% no tempo médio de detecção (MTTD) de problemas que afetam o serviço

Previsibilidade

 

Identifica possíveis interrupções 25 horas antes do que antes

Ao alimentar dados estruturados e não estruturados no componente AI Manager da solução, o NCHC e a equipe do IBM Garage foram capazes de treinar modelos de IA para gerenciar automaticamente e proativamente problemas e incidentes.
Redução da complexidade das operações de TI

Taiwan tem várias grandes redes públicas de computação que se espalham pelo país e permitem que os pesquisadores compartilhem informações e colaborem. Algumas das redes são especializadas para a academia, algumas para o governo e outras para a indústria. Mas cada vez mais, especialmente em resposta à pandemia da COVID-19, as iniciativas de pesquisa têm exigido esforços interdisciplinares e colaboração entre redes. O compartilhamento rápido de informações entre as redes públicas é crucial.

Assim, o NCHC iniciou uma nova iniciativa: construir uma troca de tráfego de rede central. Mas juntar as redes apresentou uma nova camada de desafios. As diferentes redes foram equipadas com uma variedade de ferramentas de monitoramento e fontes e formatos de registro de dados. A complexidade complicou o gerenciamento, o que impediu o NCHC de filtrar rapidamente os alarmes para detectar problemas significativos e evitar interrupções. As interrupções, por sua vez, impediriam o compartilhamento de dados e a colaboração entre as redes.

Para cumprir o propósito do intercâmbio central — acelerar a colaboração em pesquisa em todo o país — o NCHC precisava de uma maneira de reduzir a complexidade do gerenciamento de operações de TI. Virou-se para AIOps.

Manutenção preditiva com AIOps

Como parte de sua busca por uma solução, o NCHC trabalhou com o IBM Garage para realizar um teste de conceito (POC) baseado no software IBM Cloud Pak for Watson AIOps.

O objetivo do POC era avaliar o impacto real da solução potencial. O NCHC forneceu dados operacionais e registros de rede de cenários da vida real — onde alguns equipamentos de rede estavam falhando e poderiam causar interrupções, por exemplo.

As equipes do NCHC e da IBM usaram então o IBM Cloud Pak for Watson AIOps como um integrador central da diversa gama de ferramentas de operações de TI da central de troca de rede, produzindo uma visão abrangente de toda a infraestrutura. E, alimentando dados estruturados e não estruturados no componente AI Manager da solução, o NCHC e a equipe do IBM Garage foram capazes de treinar modelos de IA para gerenciar automaticamente e de forma proativa problemas e incidentes.

Os resultados foram excelentes. As equipes obtiveram um tempo médio de 55% menor para detectar problemas (MTTD) que afetariam o serviço.

Baseado no sucesso do POC, o NCHC e a equipe do IBM Customer Success Manager implementaram o IBM Cloud Pak for Watson AIOps no ambiente de produção da central de troca. O NCHC agora usa os seguintes componentes do IBM Cloud Pak for Watson AIOps:

  • AI Manager: para ingerir dados estruturados e não estruturados e treinar modelos de IA para gerenciar proativamente problemas e incidentes. Todos os alertas gerados pelo AI Manager são publicados como uma história em uma interface ChatOps que a equipe do NCHC usa como a única fonte de verdade para monitorar a central de troca.
  • Event Manager: para importar todos os registros de dispositivos de rede via um programa em lote pré-definido e para reduzir o ruído da rede com o agrupamento de eventos, o que reduzirá significativamente os custos operacionais.
  • Metric Manager: para ingerir todos os dados de métricas de dispositivos de rede, como uso de CPU, memória e disco, e fornecer uma visão holística dos status dos dispositivos.

 

 

Promover a descoberta e a inovação contínuas

A redução do MTTD significa que o NCHC pode detectar possíveis interrupções 25 horas antes do que antes — ajudando o NCHC a ver e resolver as interrupções antes que elas ocorram.

Até agora, esses resultados impressionantes surgiram em resposta a problemas comuns e conhecidos. O NCHC sabe que problemas únicos e inesperados surgirão e fornecerão novos testes para a solução, mas a organização espera resultados semelhantes. Em última análise, o NCHC espera que sua adoção de AIOps ajude a manter os canais de informação abertos para que projetos de pesquisa de Taiwan tenham os dados críticos de que precisam para continuar progredindo em direção à descoberta e inovação.

Logotipo da NCHC
Sobre o Centro Nacional de Computação de Alto Desempenho (NCHC)

Com a missão de promover a descoberta científica e a inovação tecnológica, o NCHCExternal Link (link fora de ibm.com) de Taiwan oferece às agências governamentais do país, instituições de ensino superior e indústrias serviços de supercomputação, redes de alta qualidade, armazenamento de alta eficiência, análise de big data e simulações de engenharia científica. O NCHC tem sede na cidade de Hsinchu.

Dê o próximo passo

Para saber mais sobre as soluções IBM apresentadas nesta história, entre em contato com seu representante da IBM ou com os parceiros de negócios da IBM.

Ver mais estudos de caso Entre em contato com a IBM TIME DotCom

Criando o motor de uma economia em expansão

 

Leia o estudo de caso
T-Mobile

Automação baseada em IA na maior rede 5G dos EUA

Leia o estudo de caso
Electrolux

Descubra como uma empresa inovadora aplica a AIOps na empresa global

Leia o estudo de caso
Legal

© Copyright IBM Corporation 2022. IBM corporation, New orchard road, Armonk, NY 10504

Produzido nos Estados Unidos da América, março de 2022.

IBM, o logotipo IBM, ibm.com, IBM Cloud Pak e IBM Garage são marcas comerciais da International Business Machines Corp., registradas em diversas jurisdições em todo o mundo. Outros nomes de produtos e serviços podem ser marcas comerciais da IBM ou de outras empresas. Uma lista atual de marcas comerciais da IBM está disponível na Web em ibm.com/legal/copyright-trademark.

Este documento é atual na data de sua publicação inicial, podendo ser alterado pela IBM a qualquer momento. Nem todas as ofertas estão disponíveis em todos os países em que a IBM opera.

Os dados de desempenho e exemplos de clientes citados são apresentados apenas para fins ilustrativos. Os resultados reais de desempenho podem variar de acordo com configurações e condições operacionais específicas. AS INFORMAÇÕES CONTIDAS NESTE DOCUMENTO SÃO FORNECIDAS NO ESTADO EM QUE SEM ENCONTRAM, SEM QUALQUER GARANTIA, EXPRESSA OU IMPLÍCITA, INCLUINDO SEM QUAISQUER GARANTIAS DE COMERCIALIZAÇÃO, ADEQUAÇÃO A DETERMINADO FIM E QUALQUER GARANTIA OU CONDIÇÃO DE NÃO INFRAÇÃO. Os produtos IBM têm garantia de acordo com os termos e condições dos contratos sob os quais são fornecidos.