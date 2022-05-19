Quando 10 segundos se tornariam importantes? Quando se trata de desempenho da aplicação.
Para aplicações de microsserviços nativas da nuvem, 10 segundos é um tempo realmente longo.
As coisas que podem acontecer com suas aplicações em 10 segundos são inesgotáveis e a maioria não é boa.
Mas, antes de nos aprofundarmos nos detalhes sobre o que pode acontecer com suas aplicações, vamos analisar alguns eventos do mundo real que mostram o que pode acontecer em 10 segundos:
Gostamos particularmente do exemplo do Usain Bolt porque essa distância é um longo caminho para ser executado em menos de 10 segundos.
Para desempenho e disponibilidade de aplicação nativa da nuvem, 10 segundos é uma infinidade. As transações estão percorrendo a internet, mantendo o comércio bem lubrificado.
O que pode acontecer em 10 segundos se algo der errado? Bem, milhares de transações podem sofrer atrasos ou falhas e não serem concluídas.
Com esse tipo de problema, a receita pode cair devido à perda de vendas. Os clientes abandonarão os carrinhos de compras e seu site e encontrarão outro lugar para comprar o que desejam. E a imagem da sua marca pode sofrer.
Por que, então, seria aceitável que as ferramentas de observabilidade capturem métricas lentamente ou, pior ainda, que extraiam e agreguem métricas e rastreios? Como uma plataforma como essa pode ser vista como equivalente a uma plataforma de observabilidade, como a plataforma IBM Instana, que reúne e contextualiza informações na velocidade dos microsserviços modernos. Eles permitem que os problemas descritos acima permaneçam por um longo período de tempo até que as informações necessárias para remediar o problema estejam disponíveis.
Para a PRISA Tecnologia, o desempenho é fundamental. Quando eles encontram um problema de desempenho, isso tem um impacto imediato e prejudicial no desempenho da empresa e na percepção do consumidor sobre sua marca.
"Uma diferença de um segundo na exibição de conteúdo faz uma enorme diferença para a experiência da nossa audiência." – Jorge Tomé Hernando, Diretor de Arquitetura de TI, Operações, Segurança e Local de Trabalho, PRISA Tecnologia
Os principais concorrentes de observabilidade da plataforma Instana amostram métricas em intervalos de 10 segundos ou agregam métricas em intervalos de um minuto ou mais, em comparação com o intervalo de métrica ultrapreciso de um segundo da plataforma Instana. A plataforma Instana também entrega notificação de um problema dentro de três segundos. Essa resposta é ilustrada no diagrama de lacunas de detecção de observabilidade mostrado aqui.
Você pode realmente se dar ao luxo de esperar 10 segundos ou até um minuto para que sua plataforma de observabilidade lhe diga que há um problema? Com triagem manual, talvez. Mas com a remediação automatizada ou mesmo semiautomatizada você não pode.
Para todas as aplicações, velocidade e confiabilidade são as metas. Para alcançar melhor desempenho e confiabilidade da aplicação, a estratégia de que “um humano sempre precisa resolver um problema (MTTR)” precisa mudar. A intervenção humana para corrigir as correções sobrecarregará os recursos humanos e restringirá o ritmo da mudança. Também reduzirá os indicadores de nível de serviço (SLIs).
"Com o Instana, nosso objetivo diário é garantir uma expectativa de latência. Nosso objetivo para chamadas de serviço é concluir em menos de 250 milissegundos. Então, não é apenas para simulações de incêndio. No dia a dia, podemos melhorar o desempenho e isso nos leva a atingir esse objetivo de 250 ms. A Instana torna isso possível.” – Bryce Hendrix, Arquiteto Líder de Plataforma, Dealerware
Para melhor desempenho com maior disponibilidade, o AIOps automatizado é o caminho a seguir. O AIOps automatizado fornece automação adicional combinada com o AIOps, que é um caminho a seguir para alcançar níveis mais altos de desempenho e disponibilidade. Como? Permitindo que AIOps automatizados resolvam problemas que a máquina pode corrigir perfeitamente muito mais rápido do que um humano. Há muitos problemas relacionados à alocação de recursos de infraestrutura e outros que a máquina pode remediar e prevenir antes mesmo que um humano possa intervir.
Esses benefícios significam que todos os problemas de aplicação podem ser resolvidos com AIOps automatizado? Claro que não.
Há muitos problemas lógicos complexos que apenas a triagem humana pode resolver, como problemas de código e afins. No entanto, há também muitas questões em que o AIOps automatizado é mais rápido, mais eficiente e deve ser a preferência para remediação de problemas.
Considere o tempo médio para prevenção (MTTP), que é classificado como a quantidade de tempo que a observabilidade mais AIOps leva para evitar que um problema afete negativamente as aplicações e a infraestrutura de nuvem híbrida.
O AIOps automatizado adiciona uma nova opção à sequência de remediação de problemas de aplicações. O diagrama anterior ilustra que o continuum começa com a remediação totalmente automatizada de problemas até o MTTR humano.
No continuum, a observabilidade é o ponto de partida para todos os tipos de remediação. Quanto mais tempo demora para um problema ser detectado pela plataforma de observabilidade, mais tempo demora para iniciar o processo de remediação. Essa lacuna no tempo significa que, quando AIOps automatizado é adicionado, a diferença entre a detecção de um segundo e a detecção de 10 segundos ou mais se torna enorme. Se sua aplicação pode se dar ao luxo de esperar mais de 10 segundos para que um problema seja detectado, por que usar AIOps automatizado?
A remediação automatizada de AIOps é a onda do futuro. É a próxima etapa lógica para melhorar o desempenho e a resiliência da aplicação. Os problemas de desempenho da infraestrutura geralmente superam os problemas de código de microsserviços e continuarão a fazê-lo no futuro.
O novo padrão de ouro para detecção e remediação de problemas de aplicações será a observabilidade automatizada somada a AIOps. Eles serão usados em conjunto para ajudar a garantir que as questões não se tornem problemas maiores.
Se você quiser obter todos os benefícios da remediação automatizada de AIOps, precisará de métricas e rastreios de alta frequência ultraprecisos para alimentar o mecanismo de AIOps. E você pode obtê-las por uma fração do custo das tecnologias de observabilidade mais lentas.
Na verdade, muita coisa pode acontecer em 10 segundos. Com métricas em tempo real e AIOps automatizado, você pode garantir que os problemas ruins não aconteçam com suas aplicações.
