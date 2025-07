As métricas fornecem insights quantitativos sobre o desempenho do sistema, ao medir vários parâmetros da rede. Elas ajudam as equipes a entender "o que" dos problemas do sistema. Tipos de métricas:

Métricas de host: uso de memória, disco e CPU

uso de memória, disco e CPU Métricas de desempenho de rede: tempo de atividade, latência, taxa de transferência

tempo de atividade, latência, taxa de transferência Métricas de aplicativos: tempos de resposta, taxas de solicitação e de erro

tempos de resposta, taxas de solicitação e de erro Métricas do pool de servidores: total de instâncias, número de instâncias em execução

total de instâncias, número de instâncias em execução Métricas de dependências externas: disponibilidade, status do serviço

Métricas comuns (como uso de memória e latência) alinham-se intuitivamente à integridade do sistema. No entanto, muitas outras métricas e indicadores-chave de desempenho (KPI) podem revelar problemas no sistema. Por exemplo, os cabos do sistema operacional (SO) esgotados podem tornar o sistema mais lento e, frequentemente, exigem uma reinicialização para restaurar a funcionalidade.

As métricas frequentemente são agregadas para fornecer uma visão resumida que usa dashboards e outras visualizações (como gráficos de séries temporais) para ajudar os desenvolvedores a avaliar rapidamente a integridade geral do sistema, analisar tendências de dados e responder a problemas de rede. Elas também informam decisões sobre escalonamento e alocação de recursos, tornando as métricas essenciais para um planejamento de capacidade e gerenciamento de carga eficazes.

É crítico que as equipes selecionem cuidadosamente quais métricas rastrear e as analisem continuamente, pois algumas métricas podem ajudá-las a prever possíveis problemas antes que ocorram.

As equipes podem estabelecer limites de métricas que, quando violados, acionam alertas para notificar a equipe de TI sobre problemas atuais ou iminentes. As métricas também permitem que as ferramentas de observabilidade detectem problemas (como vazamento no identificador do SO) que se acumulam ao longo do tempo, começando muito antes de interromperem a experiência do cliente.

No entanto, as métricas frequentemente fornecem um contexto limitado e, portanto, em geral exigem correlação com logs e rastreios para dar aos desenvolvedores uma compreensão abrangente dos eventos do sistema. Métricas de alta resolução também geram enormes quantidades de dados, que podem ser difíceis de armazenar e gerenciar de forma eficiente. Portanto, a observabilidade frequentemente requer soluções de armazenamento de alta qualidade a longo prazo que possam lidar com dados de métricas e ajudar a garantir que permaneçam disponíveis para análise.