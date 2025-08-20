Publicado: 15 de agosto de 2023
Colaborador: Michael Goodwin
Latência é uma medida de atraso em um sistema. A latência de rede é a quantidade de tempo que leva para os dados viajarem de um ponto a outro através de uma rede. Uma rede com alta latência terá tempos de resposta mais lentos, enquanto uma rede de baixa latência terá tempos de resposta mais rápidos.
Embora, em princípio, os dados devam atravessar a internet quase à velocidade da luz, na prática, os pacotes de dados se movem pela internet a uma taxa um pouco mais lenta devido a atrasos causados pela distância, infraestrutura da internet e outras variáveis.1A soma desses atrasos de tempo compreende a latência de uma rede.
Manter uma rede de baixa latência é importante porque a latência afeta diretamente a produtividade, a colaboração, o desempenho das aplicações e a experiência do usuário.
Quanto maior a latência (e quanto mais lentos forem os tempos de resposta), mais essas áreas sofrem. A baixa latência é especialmente crucial à medida que as empresas buscam a transformação digital e se tornam cada vez mais dependentes de aplicações e serviços baseados em nuvem dentro da Internet das coisas.
Vamos começar com um exemplo óbvio. Se a alta latência da rede causar desempenho inadequado das aplicações ou tempos de carregamento lentos para seus clientes, eles provavelmente buscarão soluções alternativas. Agora, mais do que nunca, usuários individuais e empresariais esperam um desempenho extremamente rápido.
Se sua organização usa aplicações empresariais que dependem de dados em tempo real extraídos de diferentes fontes para fazer recomendações de recursos, a alta latência pode criar ineficiências. Essas ineficiências podem impactar negativamente o desempenho e o valor das aplicações.
Todas as empresas preferem baixa latência. No entanto, em setores e casos de uso que dependem de dados de sensores ou de computação de alto desempenho, como fabricação automatizada, operações remotas habilitadas por vídeo (pense em câmeras usadas em cirurgias), transmissão ao vivo ou negociação de alta frequência, a baixa latência é essencial para o sucesso do empreendimento.
A alta latência também pode causar gastos desnecessários. Digamos que você deseja melhorar o desempenho das aplicações e da rede aumentando ou realocando seus gastos com recursos de computação, armazenamento e rede. Se você não resolver os problemas de latência existentes, pode acabar com uma conta maior sem perceber melhoria no desempenho, produtividade ou satisfação do cliente.
A latência da rede é medida em milissegundos, calculando o intervalo de tempo entre o início de uma operação de envio de um sistema de origem e a conclusão da operação de recebimento correspondente pelo sistema-alvo.2
Uma maneira simples de medir a latência é executando um comando "ping", que é uma ferramenta de diagnóstico de rede usada para testar a conexão entre dois dispositivos ou servidores. Durante esses testes de velocidade, a latência é frequentemente referida como uma taxa de ping.
Nesse teste, um pacote de solicitação de eco do Protocolo de Mensagens de Controle da Internet (ICMP) é enviado a um servidor-alvo e retornado. Um comando ping calcula o tempo que leva para o pacote viajar da origem ao destino e vice-versa. Esse tempo total de viagem é referido como tempo de viagem de ida e volta (RTT), equivalente a aproximadamente o dobro da latência, já que os dados devem viajar até o servidor e voltar.
O ping não é considerado uma medição exata de latência nem um teste ideal para detectar problemas de latência de rede direcional. Essa limitação ocorre porque os dados podem percorrer diferentes caminhos de rede e encontrar cenários variados em cada trecho da viagem.
Latência, largura de banda e rendimento estão relacionadas e, às vezes, confundidas como sinônimos, mas na verdade referem-se a recursos distintos da rede. Como mencionamos, latência é a quantidade de tempo que leva para um pacote de dados viajar entre dois pontos em uma conexão de rede.
Largura de banda é uma medida do volume de dados que pode passar por uma rede em um determinado momento. É medida em unidades de dados por segundo, como megabits por segundo (mbps) ou gigabits por segundo (gbps).
Essa medição é o que você está acostumado a ouvir de seu provedor de serviços ao escolher opções de conexão para sua casa. Isso é uma fonte de grande confusão, pois largura de banda não é uma medida de velocidade, mas de capacidade.
Embora uma alta largura de banda possa facilitar uma alta velocidade de internet, esse recurso também depende de fatores como latência e rendimento.
Rendimento é uma medida da quantidade média de dados que realmente passa por uma rede em um período específico, levando em conta o impacto da latência.
Ele reflete o número de pacotes de dados que chegam com sucesso e a quantidade de perda de pacotes de dados. Geralmente, é medido em bits por segundo, ou às vezes, dados por segundo.
Outro fator no desempenho da rede é o jitter. Jitter refere-se à variação na latência dos fluxos de pacotes em uma rede. Uma latência consistente é preferível a um alto jitter, que pode contribuir para a perda de pacotes — pacotes de dados que são descartados durante a transmissão e nunca chegam ao seu destino.
Uma maneira simplificada e útil de lembrar a relação entre latência, largura de banda e rendimento é que largura de banda é a quantidade de dados que poderia viajar por uma rede, rendimento é a medida de quanto realmente é transferido por segundo e latência é o tempo que leva para fazer isso.
Visualizar a jornada que os dados fazem do cliente para o servidor e vice-versa ajuda a entender a latência e os vários fatores que contribuem para ela. As causas comuns de latência da rede são:
Simplificando, quanto maior a distância entre o cliente que inicia uma solicitação e o servidor que responde, maior a latência.
A diferença entre um servidor em Chicago e um servidor em Nova York respondendo a uma solicitação de um usuário em Los Angeles pode ser de apenas alguns milissegundos. Mas, nesse jogo, isso é muito importante, pois esses milissegundos se acumulam.
A seguir, considere o meio através do qual seus dados estão viajando. Trata-se de uma rede de cabos de fibra óptica (geralmente com menor latência), uma rede sem fio (geralmente com maior latência) ou uma complexa teia de redes com múltiplos meios, como é frequentemente o caso?
O meio utilizado para a viagem dos dados afeta a latência. Assim como o número de vezes que os dados devem passar por dispositivos de rede, como roteadores, para migrar de um segmento de rede para o próximo — saltos de rede — antes de alcançar seu destino. Quanto maior o número de saltos, maior a latência.
O tamanho dos pacotes de dados, bem como o volume geral de dados em uma rede, afetam a latência.
Pacotes maiores demoram mais para serem transmitidos e, se o volume de dados exceder a capacidade computacional da infraestrutura da rede, é provável que você enfrente gargalos e aumento da latência.
Servidores, roteadores, hubs, switches e outros hardwares de rede desatualizados ou com recursos insuficientes podem causar tempos de resposta mais lentos.
Por exemplo, se os servidores estiverem recebendo mais dados do que podem lidar, os pacotes serão atrasados, resultando em carregamentos de páginas, velocidades de download e desempenho de aplicações mais lentos.
Ativos de páginas como imagens e vídeos com tamanhos de arquivo grandes, recursos que bloqueiam a renderização e caracteres desnecessários no código fonte podem contribuir para uma maior latência.
Às vezes, a latência é causada por fatores do lado do usuário, como largura de banda insuficiente, conexões ruins de internet ou equipamentos desatualizados.
Para reduzir a latência na sua rede, você pode começar com esta avaliação de rede:
Vamos começar com a questão da distância. Onde estão localizados seus usuários? E onde estão os servidores que respondem às solicitações deles?
Ao distribuir seus servidores e bancos de dados geograficamente mais próximos de seus usuários, você pode reduzir a distância física que os dados precisam percorrer e diminuir o roteamento ineficiente e os saltos de rede.
Uma maneira de distribuir dados globalmente é com uma Content Delivery Network, ou CDN. Usar uma rede de servidores distribuídos permite armazenar conteúdo mais próximo dos usuários finais, reduzindo a distância que os pacotes de dados precisam percorrer. Mas e se você quiser ir além de apenas servir conteúdo em cache?
Edge computing é uma estratégia útil, que permite às organizações estender seu ambiente de nuvem do data center principal para locais físicos mais próximos de seus usuários e dados. Por meio da edge computing, as organizações podem executar aplicações mais próximas dos usuários finais e reduzir a latência.
Uma sub-rede é essencialmente uma rede menor dentro de sua rede. A sub-rede agrupa pontos finais que frequentemente se comunicam entre si, o que pode reduzir o roteamento ineficiente e diminuir a latência.
As ferramentas tradicionais de monitoramento não são rápidas ou detalhadas o suficiente para identificar e contextualizar proativamente problemas de desempenho nos ambientes complexos de hoje.
Para se antecipar aos problemas, você pode usar uma solução como a plataforma Instana Observability, que proporciona observabilidade e mapeamento de dependências em tempo real de ponta a ponta. Esses recursos permitem que as equipes identifiquem, contextualizem, lidem com e previnam problemas de desempenho de aplicações, que contribuem para a latência da rede.
Se as cargas de trabalho não possuem os recursos de computação, armazenamento e rede apropriados, a latência aumenta, e o desempenho sofre. Tentar resolver esse problema por meio de superprovisionamento é ineficiente e esbanjador, e tentar igualar manualmente a demanda dinâmica com recursos em infraestruturas modernas complexas é uma tarefa impossível.
Uma solução de gerenciamento de recursos de aplicações, como a plataforma IBM Turbonomic, que analisa continuamente a utilização de recursos e o desempenho de aplicações e componentes de infraestrutura em tempo real, pode ajudar a resolver problemas de recursos e reduzir a latência.
Por exemplo, se a plataforma detectar uma aplicação com alta latência devido à contenção de recursos em um servidor, ela pode reduzir a latência. A plataforma reduz a latência alocando automaticamente os recursos necessários para a aplicação ou movendo-a para um servidor menos congestionado.
Testes como o comando ping podem proporcionar uma medição simples da latência da rede, mas são insuficientes para identificar problemas, muito menos lidar com eles. Você pode usar uma solução de gerenciamento de desempenho da rede, como o IBM SevOne NPM, que fornece uma plataforma unificada para ajudar suas equipes a identificar, lidar com e prevenir problemas de desempenho da rede e reduzir a latência.
Certifique-se de que você esteja usando hardware, software e configurações de rede atualizados e que sua infraestrutura possa lidar com o que você está solicitando dela. Realizar verificações e manutenções regulares na sua rede também ajudará a reduzir problemas de desempenho e latência.
Os desenvolvedores podem tomar medidas para garantir que a construção de páginas não aumente a latência, como otimizar vídeos, imagens e outros ativos de páginas para carregamento mais rápido e por meio de minificação de código.
A plataforma IBM Instana Observability proporciona monitoramento de desempenho de aplicações aprimorado, com visibilidade full stack automatizada, granularidade de 1 segundo e notificação em 3 segundos.
A plataforma de otimização de custos de nuvem híbrida Turbonomic permite que você automatize continuamente ações críticas em tempo real, que fornecem proativamente o uso mais eficiente de recursos de computação, armazenamento e rede para seus aplicativos em cada camada do stack.
Projetado para redes modernas, o IBM SevOne Network Performance Management (NPM) ajuda você a identificar, abordar e prevenir proativamente problemas de desempenho da rede com observabilidade de rede híbrida.
O IBM Instana fornece observabilidade em tempo real que todos e qualquer um podem usar. Ele proporciona um rápido time to value enquanto verifica se sua estratégia de observabilidade pode acompanhar a complexidade dinâmica dos ambientes atuais e futuros. Do celular ao mainframe, o Instana é compatível com mais de 250 tecnologias e está crescendo.
1"Internet at the Speed of Light", (link externo a ibm.com), Yale.edu, 3 de maio de 2022
2"Effect of the network on performance", IBM.com, 3 de março de 2021