O failover de DNS é uma técnica de roteamento automatizado que redireciona o tráfego de servidores com falha ou inacessíveis para servidores operacionais e disponíveis.
Normalmente fornecidos por provedores de DNS autoritativos baseados em nuvem, os serviços de failover usam verificações de integridade e nós de monitoramento para avaliar a integridade do servidor DNS. Se um servidor responder adequadamente aos nós de monitoramento durante uma verificação de integridade, as consultas do usuário serão encaminhadas e resolvidas por esse servidor. Se, no entanto, o servidor estiver indisponível (devido a um host que não responde ou a uma interrupção do servidor), os serviços de failover lidarão com seu endereço IP e redirecionarão o tráfego de rede para um novo endereço IP com um servidor em funcionamento.
O failover funciona por meio do sistema de nomes de domínio (DNS), que converte nomes de domínio legíveis por humanos em endereços IP legíveis por computador que os dispositivos usam para identificar uns aos outros na rede.
Em uma infraestrutura de DNS tradicional, os nomes de domínio direcionam o tráfego para endereços IP que contêm os recursos corretos para lidar com as consultas do usuário. Quando um usuário insere um nome de domínio, seu computador se comunica com um resolvedor de DNS. O resolvedor atravessa o DNS para lidar com um servidor de nomes autoritativo (normalmente, o servidor DNS primário ), que contém o endereço IP do site solicitado. O servidor então converte nomes de domínio em endereços IP correspondentes e envia as informações consultadas de volta ao usuário.
De muitas maneiras, os servidores de DNS de failover não são essenciais para a função de rede em uma infraestrutura tradicional; o DNS poderá executar tarefas de resolução de consultas quando apenas os servidores primários estiverem disponíveis. No entanto, os servidores de backup mantêm cópias sincronizadas dos registros DNS em caso de falha dos servidores primários, tornando-os essenciais para o failover do DNS. Sem servidores de failover, todo o DNS falharia se os servidores principais ficassem inativos ou se tornassem inacessíveis.
Dessa forma, os serviços de failover de DNS são vitais para manter redes de computação resilientes, redundantes e de alta disponibilidade.
O DNS foi projetado com uma estrutura de banco de dados hierárquica e distribuída que facilita uma abordagem mais dinâmica para a resolução de nomes de domínio, capaz de acompanhar o ritmo de uma rede de computadores em rápida expansão. É coloquialmente chamada de “lista telefônica da internet”, mas uma analogia mais adequada é que o DNS gerencia nomes de domínio da mesma forma que os smartphones gerenciam contatos.
Os smartphones eliminam a necessidade de os usuários memorizarem números de telefone individuais, armazenando-os em listas de contatos pesquisáveis com facilidade. Da mesma forma, o DNS permite que os usuários se conectem a sites usando nomes de domínio da internet em vez de endereços IP. Em vez de ter que lembrar o servidor da web em "93.184.216.34", os usuários podem simplesmente acessar a página "www.exemplo.com".
Quando um domínio é registrado, seus registros de servidor de nomes são criados e armazenados em um servidor DNS primário. O servidor DNS primário contém a versão original de leitura/gravação do arquivo de zona e vários tipos de registros de recursos (incluindo registros A, registros AAAA, registros MX, registros CNAME e outros tipos) que mapeiam e roteiam os dados apropriados de volta para o usuário.
Os servidores DNS de backup, ou servidores de failover, mantêm replicas de somente leitura do arquivo de zona. Eles funcionam como servidores DNS secundários que somente lidam com solicitações durante downtime do servidor primário ou quando o servidor primário está sobrecarregado.
Embora os servidores DNS primários sejam fundamentais para a forma como o DNS opera, eles também representam um ponto único de falha. Se eles falharem e não houver servidores de backup designados para assumir a carga de trabalho, todo o processo de resolução de DNS poderá sofrer. Por outro lado, os servidores de backup não podem existir sem um servidor DNS primário, mas, se houver uma falha no servidor primário, os servidores de backup gerenciarão protocolos de failover e garantirão que as consultas dos usuários sejam resolvidas até que o servidor primário seja restaurado.
Atualmente, a maioria dos principais provedores de DNS gerenciado oferece IPs de servidor de nomes para uso e, por trás de cada um desses IPs, há um pool de servidores DNS distribuídos geograficamente que encaminham solicitações usando Anycast. Ao contrário da dinâmica de comunicação um-para-um associada ao DNS convencional, o DNS Anycast encaminha as solicitações do usuário para uma rede de resolvedores (em vez de um único resolvedor) e para o servidor disponível mais próximo para resolução, otimizando as funcionalidades de balanceamento de carga e a resiliência geral da rede.
Os protocolos de failover de DNS podem variar significativamente entre as redes, mas geralmente envolvem alguns processos importantes.
Os sistemas DNS devem realizar verificações de integridade contínuas para determinar o status e o desempenho do provedor de serviços de Internet (ISP), todos os endpoints de rede API e os servidores IP principais. As verificações de integridade podem incluir pings do Control Message Protocol (ICMP) no nível de rede, verificações de HTTP/HTTPS para avaliar servidores da web no nível de aplicação, verificações do Transmission Control Protocol (TCP) e do User Datagram Protocol (UDP) no nível da porta e quaisquer outros scripts personalizados que uma empresa deseja executar.
Os administradores normalmente personalizam os critérios de falha com base nas necessidades das aplicações e na criticidade da missão dos serviços. Independentemente dos critérios, se os nós detectarem uma falha (em que o servidor primário não responde ou retorna erros), ele aciona um evento de failover e envia notificações de falha.
Os nós de monitoramento então dinamicamente lidam com o endereço IP indisponível e migrar o nome do host para um backup (ou CNAME), de modo que os roteadores direcionem as consultas DNS para um endereço IP secundário até que os servidores primários sejam restaurados. O DNS de failover também ajusta os valores de tempo de vida (TTL) e os tempos de cache de DNS para garantir que as alterações se propaguem rapidamente para resolvedores de DNS em toda a rede e que os usuários tenham experiência mínima, se houver, de downtime.
Quando os servidores primários são restaurados e podem ser aprovados nas verificações de integridade, o sistema se prepara para o failback, em que as configurações de DNS e os processos de resolução revertem para lidar com o endereço IP primário. Os nós de monitoramento supervisionam o processo para evitar flipping (alternação frequente entre servidores primários e de backup) e continuam a realizar verificações de integridade para manter a rede funcionando de forma ideal.
Muitas empresas também implementam estratégias de failover avançadas, como failover multirregional (em que políticas de roteamento em várias regiões direcionam os usuários para o servidor mais próximo ou com melhor desempenho) e DNS Anycast (em que o mesmo endereço IP é transmitido de vários locais e as solicitações são roteadas para o melhor servidor com base na topologia de rede).
Além disso, os serviços de failover de DNS podem facilitar o DNS round-robin, que distribui o tráfego uniformemente em cada servidor e ajuda a evitar ataques de distributed denial-of-service (DDoS). E soluções de failover híbridos , que combinam DNS de failover com outras soluções de rede de alta disponibilidade (balanceamento de carga de servidor global (GSLB) e redes de entrega de conteúdo (CDNs), por exemplo) podem otimizar o gerenciamento de tráfego, minimizar a latência e acomodar cenários de failover mais complexos.
