O que é latência?

Programadores de computador trabalhando em um escritório moderno

Autores

Michael Goodwin

Staff Editor, Automation & ITOps

IBM Think

O que é latência?

Latência é uma medida de atraso em um sistema. A latência de rede é a quantidade de tempo que leva para os dados viajarem de um ponto a outro através de uma rede. Uma rede com alta latência terá tempos de resposta mais lentos, enquanto uma rede de baixa latência terá tempos de resposta mais rápidos.

Embora, em princípio, os dados devam atravessar a internet quase à velocidade da luz, na prática, os pacotes de dados migrar pela internet a uma taxa um pouco mais lenta devido a atrasos causados pela distância, infraestrutura da internet, tamanho dos pacotes de dados, congestionamento da rede e outras variáveis.1 A soma desses atrasos de tempo compreende a latência de uma rede.

As organizações podem reduzir a latência e melhorar a produtividade e a experiência do usuário ao:

  • Usar redes de entrega de conteúdo, edge computing e sub-redes para distribuir dados e rotear tráfego

  • Manter uma infraestrutura capaz e atualizada

  • Usar soluções de gerenciamento de desempenho de aplicações, alocação de recursos e posicionamento de cargas de trabalho
Vista aérea de rodovias

Fique por dentro da nuvem 


Receba o boletim informativo semanal do Think para ver orientações especializadas sobre a otimização das configurações multinuvem na era da IA.

Por que a latência da rede é importante?

Manter uma rede de baixa latência é importante porque a latência afeta diretamente a produtividade, a colaboração, o desempenho das aplicações e a experiência do usuário. Quanto maior a latência (e quanto mais lentos forem os tempos de resposta), mais essas áreas sofrem. A baixa latência é especialmente crucial à medida que as empresas buscam a transformação digital e se tornam cada vez mais dependentes de aplicações e serviços baseados em nuvem dentro da Internet das coisas.

Vamos começar com um exemplo óbvio. Se a alta latência da rede causar desempenho inadequado das aplicações ou tempos de carregamento lentos para os clientes de uma organização, eles provavelmente buscarão soluções alternativas. Agora, mais do que nunca, usuários individuais e empresariais esperam um desempenho extremamente rápido. Se sua organização usa aplicações empresariais que dependem de dados em tempo real extraídos de diferentes fontes para fazer recomendações de recursos, a alta latência pode criar ineficiências. Essas ineficiências podem impactar negativamente o desempenho e o valor das aplicações.

Todas as empresas preferem baixa latência. No entanto, em setores e casos de uso que dependem de dados de sensores ou de computação de alto desempenho, como fabricação automatizada, operações remotas habilitadas por vídeo (pense em câmeras usadas em cirurgias), transmissão ao vivo ou negociação de alta frequência, a baixa latência é essencial para o sucesso do empreendimento.

A alta latência também pode causar gastos desnecessários. Digamos que uma organização queira melhorar o desempenho das aplicações e da rede aumentando ou realocando os gastos com recursos de computação, armazenamento e rede. Se não resolver os problemas de latência existentes, a organização pode acabar com uma conta maior sem perceber melhoria no desempenho, produtividade ou satisfação do cliente.

NS1 Connect

IBM® NS1 connect

Fortaleça a resiliência de sua rede com o IBM NS1 Connect. Neste vídeo, discutimos o valor do IBM NS1 Connect para resiliência e desempenho de aplicações.

Como a latência é medida?

A latência da rede é medida em milissegundos, calculando o intervalo de tempo entre o início de uma operação de envio de um sistema de origem e a conclusão da operação de recebimento correspondente pelo sistema-alvo.2

Uma maneira simples de medir a latência é executando um comando "ping", que é uma ferramenta de diagnóstico de rede usada para testar a conexão entre dois dispositivos ou servidores. Durante esses testes de velocidade, a latência é frequentemente referida como uma taxa de ping.

Nesse teste, um pacote de solicitação de eco do Protocolo de Mensagens de Controle da Internet (ICMP) é enviado a um servidor-alvo e retornado. Um comando ping calcula o tempo que leva para o pacote viajar da origem ao destino e vice-versa. Esse tempo total de viagem é referido como tempo de viagem de ida e volta (RTT), equivalente a aproximadamente o dobro da latência, já que os dados devem viajar até o servidor e voltar. O ping não é considerado uma medição exata de latência nem um teste ideal para detectar problemas de latência de rede direcional. Essa limitação ocorre porque os dados podem percorrer diferentes caminhos de rede e encontrar cenários variados em cada trecho da viagem.

Latência, largura de banda e rendimento

Latência, largura de banda e rendimento estão relacionadas e, às vezes, confundidas como sinônimos, mas na verdade referem-se a recursos distintos da rede. Como mencionamos, latência é a quantidade de tempo que leva para um pacote de dados viajar entre dois pontos em uma conexão de rede.

Largura de banda

Largura de banda é uma medida do volume de dados que pode passar por uma rede em um determinado momento. É medida em unidades de dados por segundo, como megabits por segundo (mbps) ou gigabits por segundo (gbps). Largura de banda é o que você está acostumado a ouvir de seu provedor de serviços ao escolher opções de conexão para sua casa. Isso é uma fonte de grande confusão, pois largura de banda não é uma medida de velocidade, mas de capacidade. Embora uma alta largura de banda possa facilitar uma alta velocidade de internet, esse recurso também depende de fatores como latência e rendimento.

Rendimento

Rendimento é uma medida da quantidade média de dados que realmente passa por uma rede em um período específico, levando em conta o impacto da latência. Ele reflete o número de pacotes de dados que chegam com sucesso e a quantidade de perda de pacotes de dados. Geralmente, é medido em bits por segundo, ou às vezes, dados por segundo.

Jitter

Outro fator no desempenho da rede é o jitter. Jitter refere-se à variação na latência dos fluxos de pacotes em uma rede. Uma latência consistente é preferível a um alto jitter, que pode contribuir para a perda de pacotes — pacotes de dados que são descartados durante a transmissão e nunca chegam ao seu destino.

Uma maneira simplificada e útil de lembrar a relação entre latência, largura de banda e rendimento é que largura de banda é a quantidade de dados que poderia viajar por uma rede, rendimento é a medida de quanto realmente é transferido por segundo e latência é o tempo que leva para fazer isso.

O que causa a latência da rede?

Visualizar a jornada que os dados fazem do cliente para o servidor e vice-versa ajuda a entender a latência e os vários fatores que contribuem para ela. As causas comuns de latência da rede incluem:

Distância que os dados devem percorrer

Simplificando, quanto maior a distância entre o cliente que inicia uma solicitação e o servidor que responde, maior a latência. A diferença entre um servidor em Chicago e um servidor em Nova York respondendo a uma solicitação de um usuário em Los Angeles pode ser de apenas alguns milissegundos. Mas, nesse jogo, isso é muito importante, pois esses milissegundos se acumulam.

Meio de transmissão e saltos de rede

A seguir, considere o meio através do qual os dados estão viajando. Trata-se de uma rede de cabos de fibra óptica (geralmente com menor latência), uma rede sem fio (geralmente com maior latência) ou uma complexa teia de redes com múltiplos meios, como é frequentemente o caso?

O meio utilizado para a transmissão de dados afeta a latência. Assim como o número de vezes que os dados devem passar por dispositivos de rede, como roteadores, para migrar de um segmento de rede para o próximo — saltos de rede — antes de alcançar seu destino. Quanto maior o número de saltos, maior a latência.

Tamanho dos pacotes de dados e congestionamento da rede

O tamanho dos pacotes de dados, bem como o volume geral de dados em uma rede, afetam a latência. Pacotes maiores demoram mais para serem transmitidos e, se o volume de dados exceder a capacidade computacional da infraestrutura da rede, é provável que ocorram gargalos e aumento da latência.

Desempenho do hardware

Servidores, roteadores, hubs, switches e outros hardwares de rede desatualizados ou com recursos insuficientes podem causar tempos de resposta mais lentos. Por exemplo, se os servidores estiverem recebendo mais dados do que podem lidar, os pacotes serão atrasados, resultando em carregamentos de páginas, velocidades de download e desempenho de aplicações mais lentos.

Construção de páginas da web

Ativos de páginas como imagens e vídeos com tamanhos de arquivo grandes, recursos que bloqueiam a renderização e caracteres desnecessários no código fonte podem contribuir para uma maior latência.

Fatores do lado do usuário

Às vezes, a latência é causada por fatores do lado do usuário, como largura de banda insuficiente, conexões ruins de internet ou equipamentos desatualizados.

Como reduzir a latência?

Para reduzir a latência de rede, uma organização pode começar com esta avaliação de rede:

- Nossos dados estão viajando pela rota mais curta e eficiente?

- Nossas aplicações têm os recursos necessários para um desempenho ideal?

- Nossa infraestrutura de rede está atualizada e é adequada para o trabalho?

Distribuir dados globalmente

Vamos começar com a questão da distância. Onde os usuários estão localizados? E onde estão os servidores que respondem às solicitações deles? Ao distribuir servidores e bancos de dados geograficamente mais próximos dos usuários, uma organização pode reduzir a distância física que os dados precisam percorrer e diminuir o roteamento ineficiente e os saltos de rede.

Uma maneira de distribuir dados globalmente é com uma rede de entrega de conteúdo, ou CDN. O uso de uma rede de servidores distribuídos permite que uma organização armazene conteúdo mais próximo dos usuários finais, reduzindo a distância que os pacotes de dados precisam percorrer. Mas e se uma organização quiser ir além de apenas servir conteúdo em cache?

Edge computing é uma estratégia útil, que permite às organizações estender seu ambiente de nuvem do data center principal para locais físicos mais próximos de seus usuários e dados. Por meio da edge computing, as organizações podem executar aplicações mais próximas dos usuários finais e reduzir a latência.

Sub-redes

Uma sub-rede é essencialmente uma rede menor dentro de uma rede maior. A sub-rede agrupa pontos finais que frequentemente se comunicam entre si, o que pode reduzir o roteamento ineficiente e diminuir a latência.

Utilizar uma solução de gerenciamento de desempenho de aplicações

As ferramentas tradicionais de monitoramento não são rápidas ou detalhadas o suficiente para identificar e contextualizar proativamente problemas de desempenho nos ambientes complexos de hoje. Para se anteciparem aos problemas, as organizações podem utilizar soluções avançadas que proporcionam observabilidade e mapeamento de dependências em tempo real de ponta a ponta. Esses recursos permitem que as equipes identifiquem, contextualizem, lidem com e previnam problemas de desempenho de aplicações, que contribuem para a latência da rede.

Otimizar a alocação de recursos e o posicionamento das cargas de trabalho

Se as cargas de trabalho não possuem os recursos de computação, armazenamento e rede apropriados, a latência aumenta, e o desempenho sofre. Tentar resolver esse problema por meio de superprovisionamento é ineficiente e esbanjador, e tentar igualar manualmente a demanda dinâmica com recursos em infraestruturas modernas complexas é uma tarefa impossível.

Uma solução de gerenciamento de recursos de aplicações (ARM) que analisa continuamente a utilização de recursos e o desempenho de aplicações e componentes de infraestrutura em tempo real pode ajudar a resolver problemas de recursos e reduzir a latência.

Por exemplo, se uma plataforma ARM detectar uma aplicação com alta latência devido à contenção de recursos em um servidor, ela pode alocar automaticamente os recursos necessários para a aplicação ou migrá-la para um servidor menos congestionado. Essas ações automatizadas ajudam a reduzir a latência e melhorar o desempenho.

Monitorar o desempenho da rede

Testes como o comando ping podem proporcionar uma medição simples da latência da rede, mas são insuficientes para identificar problemas, muito menos lidar com eles. As organizações podem usar uma solução de gerenciamento de desempenho de rede que fornece uma plataforma unificada para ajudar as equipes a identificar, lidar com e prevenir problemas de desempenho de rede e reduzir a latência.

Manter uma infraestrutura capaz e atualizada

As equipes de TI podem garantir que estejam usando hardware, software e configurações de rede atualizados e que a infraestrutura da organização possa lidar com as demandas atuais. Realizar verificações e manutenções regulares na rede também pode ajudar a reduzir problemas de desempenho e latência.

Otimizar ativos de páginas e codificação

Os desenvolvedores podem tomar medidas para garantir que a construção de páginas não aumente a latência, como otimizar vídeos, imagens e outros ativos de páginas para carregamento mais rápido e por meio de minificação de código.

Soluções relacionadas
IBM Cloud Pak for Network Automation 

O IBM Cloud Pak for Network Automation é um pacote de nuvem que permite a automação e a orquestração das operações de infraestrutura de rede.

Explore o Cloud Pak Automation
Soluções de rede

As soluções de rede em nuvem da IBM oferecem conectividade de alto desempenho para otimizar suas aplicações e estimular o crescimento dos negócios.

Explore as soluções de rede da nuvem
Serviços de suporte a redes

Consolide o suporte ao datacenter com o IBM Technology Lifecycle Services para rede em nuvem e muito mais.

Serviços de rede em nuvem
Dê o próximo passo

Prepare a sua empresa com gerenciamento de DNS de ponta e soluções de rede na nuvem. Aumente a confiabilidade das suas aplicações e otimize o desempenho da rede com os principais serviços da IBM.

Explore as soluções de rede da nuvem Conheça os serviços de DNS gerenciados
Notas de rodapé

1Internet at the Speed of Light”, Yale.edu, 3 de maio de 2022.

2Effect of the network on performance”, IBM.com, 3 de março de 2021.