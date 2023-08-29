As oito principais métricas de APM que as equipes de TI usam para monitorar suas aplicações

Uma experiência do cliente (CX) superior é construída com base em métricas precisas e oportunas de monitoramento de desempenho das aplicações (APM). Se você não souber qual é o problema ou onde estão as oportunidades, não será possível fazer o ajuste fino de seus aplicativos ou sistema para melhorar a experiência do cliente.

As soluções de APM normalmente fornecem um dashboard centralizado para agregar métricas e insights de desempenho em tempo real a serem analisados e comparados. Elas também estabelecem linhas de base para alertar os administradores de sistemas sobre desvios que indicam problemas de desempenho reais ou potenciais. As equipes de TI, DevOps e engenheiros de confiabilidade do site podem, então, identificar e lidar com os problemas das aplicações com rapidez.

O monitoramento do desempenho de aplicações é a fase inicial da gerenciamento de desempenho de aplicações. O monitoramento rastreia o desempenho das aplicações e permite o gerenciamento desse aplicativo. Uma solução de APM traz aos administradores as ferramentas de instrumentação necessárias para coletar dados rapidamente e realizar análises de causa raiz; eles então isolam, solucionam e resolvem esse problema.

Principais métricas do APM a serem monitoradas

Há uma série de métricas à sua escolha, mas recomendamos o foco nessas oito métricas para aproveitar ao máximo os benefícios em sua organização de TI.

1. Pontuações do Apdex e SLA

Vamos começar com as pontuações do índice de desempenho das aplicações (Apdex) e do contrato de nível de serviço (SLA), pois elas são a base de uma experiência superior do cliente. As velocidades e feeds que você medirá são os aspectos específicos que devem somar para o desempenho rápido, mas são o meio, não o fim. Clientes satisfeitos são seu objetivo, levando ao aumento das vendas.

As pontuações do Apdex e do SLA são a maneira mais popular de visualizar o monitoramento da experiência do usuário final. A pontuação do Apdex rastreia o desempenho relativo de um aplicativo especificando uma meta para o tempo que uma solicitação ou transação da web normalmente leva. Os SLAs são as métricas do seu contrato com o cliente e qualquer coisa abaixo do SLA definido corre o risco de reduzir a experiência do cliente (e possivelmente as penalidades predefinidas).

2. Disponibilidade de aplicações (também conhecida como monitoramento de tempo de atividade ou de desempenho da web)

Esta é a métrica mais básica: as luzes estão acesas? Você está monitorando e medindo se sua aplicação está online e disponível. A maioria das empresas usa isso para medir a conformidade com o contrato de nível de serviço (SLA). O tempo de atividade geralmente é uma abreviação para avaliar a confiabilidade e a integridade geral do sistema. O downtime excessivo pode afetar negativamente a satisfação do usuário nas organizações que oferecem serviços online. Para uma aplicação da web, você pode verificar a disponibilidade com uma verificação HTTP simples e agendada regularmente.

3. Uso da CPU (também conhecido como uso de recursos)

Um alto percentual de capacidade da CPU sendo usada por uma aplicação pode ser um sinal de um problema de desempenho. Um aumento repentino no uso da CPU pode resultar em tempos de resposta mais lentos. As flutuações na demanda por um aplicativo também podem ser uma indicação de que você precisa adicionar mais instâncias da aplicação. Como regra geral, se o uso da CPU exceder 70% por mais de 30% do tempo, você pode estar ficando sem capacidade de CPU.

O uso de recursos também pode incluir o uso de memória e disco. O rastreamento de RAM ajuda a identificar vazamentos de memória que podem levar a falhas ou à necessidade de mais memória. As métricas de uso de disco podem ajudar a evitar que um aplicativo fique sem armazenamento persistente, o que pode causar falhas. O alto uso de discos também pode ser um sinal de armazenamento de dados de back-end ineficiente ou políticas de retenção de dados com falha.

4. Taxas de erros

Seu software de métricas de APM deve monitorar as aplicações para registrar a porcentagem de solicitações que resultam em falhas. Isso ajuda a identificar e priorizar a resolução de problemas que afetam a experiência do usuário. Erros de aplicação podem incluir erros do servidor, uma resposta 404 ou tempo limite em um aplicativo da web. Você pode configurar sua solução APM para enviar notificações quando uma taxa de erro ultrapassar um parâmetro definido. Por exemplo, envie um alerta quando 2,5% das 25 solicitações anteriores tiverem resultado em erros.

5. Coleta de lixo

A coleta de lixo (GC) pode melhorar o desempenho identificando e eliminando o uso pesado de memória contínuo de Java ou outras linguagens. A boa notícia é que a automação de GC recupera a memória dedicada a objetos ou dados não utilizados ou redundantes que não estão mais sendo usados por uma aplicação. Objetos ou dados não utilizados são excluídos e objetos ativos são copiados para um pool de memória de geração posterior. Essa é uma métrica que você deve manter no meio. Se a GC for executado com muita frequência, poderá exigir muita sobrecarga; mas se a GC não for executado com frequência suficiente, seu sistema poderá ficar com pouca memória.

6. Número de instâncias

O rastreamento de instâncias permite que você escale a aplicação para atender à demanda real do usuário, com base em quantas instâncias de aplicativo ou de servidor estão em execução a qualquer momento. Isso pode ser especialmente importante para aplicações na nuvem. O auto-scaling pode ajudar você a garantir que aplicações modernas se dimensionem para atender à demanda e economizar orçamento durante os horários de baixa. Isso também pode criar desafios de monitoramento de infraestrutura. Por exemplo, se o seu aplicativo escalar automaticamente com o uso da CPU, talvez você nunca veja o uso da CPU aumentar — em vez disso, você pode ver o número de instâncias do servidor aumentar muito, junto com sua conta de hospedagem.

7. Taxas de solicitação

Você pode medir o tráfego recebido por uma aplicação para identificar quaisquer reduções, aumentos significativos ou usuários coincidentes. Correlacionar as taxas de solicitação com outras métricas de desempenho das aplicações ajudará você a entender a escalabilidade de suas aplicações de software. O software APM também pode monitorar o tráfego para identificar anomalias. O monitoramento do usuário mostrando um aumento inesperado nas solicitações pode ser um ataque de denial-of-service (DoS). Um grande número de solicitações do mesmo usuário pode ser uma indicação de que a conta foi hackeada. Mesmo as solicitações excepcionalmente baixas podem ser ruins: a inatividade ou a ausência de tráfego pode significar uma falha em praticamente qualquer parte do seu sistema.

8. Tempos de resposta (também conhecidos como duração)

Ao rastrear o tempo médio de resposta a uma solicitação (ou seja, quanto tempo leva para uma aplicação retornar uma solicitação de recursos), você pode avaliar o desempenho do aplicativo. Essas solicitações podem incluir transações iniciadas pelos usuários finais, como uma solicitação para carregar uma página da web, ou podem incluir solicitações internas de uma parte da sua aplicação para outra, como um processo ou microsserviço que solicita dados do disco ou da memória. O tempo total de resposta inclui o tempo de resposta do servidor (o tempo que o servidor leva para processar uma solicitação) mais a latência da rede (o tempo total que a solicitação leva para se mover pela rede).

Uma métrica relacionada é o tempo de carregamento da página, que mede o tempo que uma página da web leva para ser carregada em um navegador. O acompanhamento do tempo de carregamento da página permite que as ferramentas de monitoramento de desempenho das aplicações identifiquem os problemas que causam o carregamento lento de páginas e, em seguida, melhorem a experiência digital. Carregamentos lentos de páginas podem significar abandono de páginas e perda de negócios. As soluções de APM podem ser definidas para uma linha de base de desempenho para essa métrica e, em seguida, alertar você quando esse benchmark não for atingido.

Métricas adicionais das aplicações

Se você procura um conjunto mais abrangente de métricas relacionadas ao monitoramento de desempenho das aplicações, talvez queira considerar as seguintes métricas:

  • Consultas ao banco de dados: mede o número de consultas solicitadas a um banco de dados por uma aplicação. Suas ferramentas de APM podem, então, ajudar a identificar consultas lentas ou ineficientes que podem estar retardando o desempenho geral de sua aplicação.
  • E/S (entrada/saída): a E/S mostra a taxa na qual os aplicativos leem ou escrevem dados. Você pode acompanhar o desempenho da mídia de armazenamento persistente (como HDD ou SSD) e as taxas de E/S para memória ou discos virtuais.
  • Uso de rede: o uso da rede representa a largura de banda total da rede utilizada por uma aplicação. O aumento do uso da rede pode indicar problemas de desempenho que retardam o tempo de resposta da aplicação ou criam gargalos.
  • Disponibilidade dos nós: uma medida semelhante ao número de instâncias é a disponibilidade dos nós, mas ela é específica da nuvem. Quando você implementa aplicativos em um cluster do Kubernetes, o número de nós disponíveis e que respondem (do total de nós em um cluster) pode ajudar a identificar problemas na sua infraestrutura. As métricas de gastos com nuvem também podem ser importantes, oferecendo visibilidade em tempo real dos custos da nuvem, com o acompanhamento de chamadas de APIs, tempo de execução de máquinas virtuais (VMs) baseadas na nuvem e taxas totais de saída de dados.
  • Rendimento: rendimento é o volume de dados que pode ser transferido entre um aplicativo e usuários ou outros sistemas. Pode ser usado para determinar se um aplicativo é capaz de lidar com o volume de tráfego esperado.
  • Rastreamento de transações: fornece uma imagem de transações únicas realizadas por uma aplicação. Os dados capturados podem incluir chamadas de banco de dados, chamadas externas e chamadas de função — monitorando a solicitação de transação do início ao fim.
  • Volume de transações: o volume de transações mede o número de transações processadas por uma aplicação. Isso permite que as ferramentas de APM identifiquem problemas com escalabilidade e planejamento de capacidade.

Comece a usar sua solução de APM

O IBM Instana Observability fornece observabilidade em tempo real que todos (e qualquer um) podem usar. Ele oferece time to value rápido, ao mesmo tempo em que garante que sua estratégia de observabilidade possa acompanhar a complexidade dinâmica dos ambientes de hoje e de amanhã. Desde dispositivos móveis até mainframes, o Instana é compatível com mais de 250 tecnologias e continua crescendo.

 
