La conmutación por error de DNS es una técnica de enrutamiento automatizado que redirige el tráfico de servidores averiados o inalcanzables a servidores operativos y disponibles.
Los servicios de conmutación por error, normalmente proporcionados por proveedores de DNS autoritativo basados en la nube, utilizan nodos de monitorización y comprobaciones de estado para evaluar el estado de los servidores DNS. Si un servidor responde adecuadamente a los nodos de monitorización durante una comprobación de estado, las consultas de los usuarios se enrutan a ese servidor y las resuelven. Sin embargo, si el servidor no está disponible (debido a un host que no responde o a una interrupción del servidor), los servicios de conmutación por error retiran su dirección IP y redirigen el tráfico de red a una nueva dirección IP con un servidor en funcionamiento.
La conmutación por error funciona a través del sistema de nombres de dominio (DNS), que convierte nombres de dominio legibles por humanos en direcciones IP que los dispositivos utilizan para identificarse entre sí en la red.
En una infraestructura DNS tradicional, los nombres de dominio dirigen el tráfico a las direcciones IP que contienen los recursos correctos para dar dirección a las consultas de los usuarios. Cuando un usuario introduce un nombre de dominio, su ordenador se comunica con un solucionador de DNS. El solucionador recorre el DNS para llegar a un servidor de nombres autoritativo (normalmente, el servidor DNS principal), que contiene la dirección IP del sitio web solicitado. A continuación, el servidor convierte los nombres de dominio en las direcciones IP correspondientes y envía la información consultada al usuario.
En muchos sentidos, los servidores DNS de conmutación por error no son esenciales para el funcionamiento de la red en una infraestructura tradicional; el DNS puede realizar tareas de resolución de consultas cuando solo hay servidores primarios disponibles. Sin embargo, los servidores de copia de seguridad mantienen copias sincronizadas de los registros DNS en caso de que los servidores principales fallen, lo que los hace esenciales para la conmutación por error del DNS. Sin servidores de conmutación por error, todo el DNS fallaría si los servidores principales se cayeran o se volvieran inaccesibles.
Como tal, los servicios de conmutación por error del DNS son vitales para mantener redes informáticas resilientes, redundantes y de alta disponibilidad.
El DNS se diseñó con una estructura de base de datos jerárquica y distribuida que facilita un enfoque más dinámico de la resolución de nombres de dominio, que podría seguir el ritmo de una red de ordenadores en rápida expansión. Se le llama coloquialmente la “guía telefónica de Internet”, pero una analogía más adecuada es que el DNS gestiona los nombres de dominio de forma muy parecida a como los smartphones gestionan los contactos.
Los móviles eliminan la necesidad de que los usuarios recuerden números de teléfono individuales almacenándolos en listas de contactos de fácil búsqueda. Del mismo modo, el DNS permite a los usuarios conectarse a sitios web utilizando nombres de dominio de Internet en lugar de direcciones IP. En lugar de tener que recordar el servidor web en "93.184.216.34", los usuarios pueden ir a la página web "www.example.com".
Cuando se registra un dominio, sus registros de servidor de nombres se crean y almacenan en un servidor DNS primario. El servidor DNS principal contiene la versión original de lectura/escritura del archivo de zona y varios tipos de registros de recursos (incluidos registros A, registros AAAA, registros MX, registros CNAME y otros tipos) que asignan y enrutan los datos apropiados al usuario.
Los servidores DNS de copia de seguridad, o servidores de conmutación por error, contienen réplicas de solo lectura del archivo de zona. Funcionan como servidores DNS secundarios que solo gestionan las solicitudes durante el tiempo de inactividad del servidor principal o cuando el servidor principal está sobrecargado.
Aunque los servidores DNS primarios son fundamentales para el funcionamiento del DNS, también representan un único punto de fallo. Si fallan y no hay servidores de respaldo designados para asumir la carga de trabajo, todo el proceso de resolución de DNS puede verse afectado. A la inversa, los servidores de copia de seguridad no pueden existir sin un servidor DNS primario, pero si se produce una interrupción del servidor primario, los servidores de copia de seguridad gestionan los protocolos de conmutación por error y se aseguran de que las consultas de los usuarios se resuelvan hasta que se restablezca el servidor primario.
Hoy en día, la mayoría de los principales proveedores de DNS gestionado ofrecen direcciones IP de servidores de nombres para su uso y, detrás de cada una de esas direcciones IP, hay un conjunto de servidores DNS distribuidos geográficamente que enrutan las solicitudes utilizando Anycast. A diferencia de la dinámica de comunicación uno a uno asociada con el DNS convencional, el DNS Anycast enruta las solicitudes de los usuarios a una red de solucionadores (en lugar de un único solucionador) y al servidor disponible más cercano para su resolución, optimizando las características de equilibrio de carga y la resiliencia general de la red.
Los protocolos de conmutación por error del DNS pueden variar significativamente de una red a otra, pero suelen implicar unos pocos procesos clave.
Los sistemas DNS deben realizar comprobaciones de estado continuas para determinar el estado y el rendimiento del proveedor de servicios de Internet (ISP), todos los endpoints de la red API y los servidores IP principales. Las comprobaciones de estado pueden incluir pings del Protocolo de mensajes de control de Internet (ICMP) a nivel de red, comprobaciones HTTP/HTTPS para evaluar los servidores web a nivel de aplicación, comprobaciones del Protocolo de control de transmisión (TCP) y del Protocolo de datagramas de usuario (UDP) a nivel de puerto y cualquier otro script personalizado que una empresa desee ejecutar.
Los administradores suelen personalizar los criterios de fallo en función de las necesidades de las aplicaciones y de la criticidad de los servicios. Independientemente de los criterios, si los nodos de monitorización detectan un fallo (cuando el servidor principal no responde o devuelve errores), se activa un evento de conmutación por error y se envían notificaciones de fallo.
A continuación, los nodos de monitorización retiran dinámicamente la dirección IP no disponible y mueven el nombre de host a una IP de copia de seguridad (o CNAME) para que los enrutadores dirijan las consultas DNS a una dirección IP secundaria hasta que se restablezcan los servidores primarios. El DNS por conmutación por error también ajusta los valores de tiempo de vida (TTL) y los tiempos de caché DNS para asegurar que los cambios se propaguen rápidamente a los solucionadores DNS en toda la red y que los usuarios tengan una experiencia mínima, si es que alguno, de tiempo de inactividad.
Cuando los servidores primarios se restauran y pueden pasar las comprobaciones de estado, el sistema se prepara para la conmutación por recuperación, en el que la configuración DNS y los procesos de resolución vuelven a la dirección IP primaria. Los nodos de monitorización controlan el proceso para evitar el flapping (cambio frecuente entre servidores primarios y secundarios) y continúan realizando comprobaciones de estado para mantener la red funcionando de manera óptima.
Muchas empresas también implementan estrategias avanzadas de conmutación por error, como la conmutación por error multirregional (en la que las políticas de enrutamiento entre varias regiones dirigen a los usuarios al servidor más cercano o con mejor rendimiento) y el DNS Anycast (en el que la misma dirección IP se transmite desde varias ubicaciones y las solicitudes se enrutan al mejor servidor en función de la topología de la red).
Además, los servicios de conmutación por error de DNS pueden facilitar el DNS por turnos, que distribuye el tráfico de manera uniforme en cada servidor y ayuda a prevenir ataques denegación de servicio distribuido (DDoS). Y las soluciones híbridas de conmutación por error, que combinan DNS de conmutación por error con otras soluciones de red de alta disponibilidad (equilibrio global de carga de servidores (GSLB) y redes de entrega de contenido (CDN), por ejemplo) pueden optimizar la gestión del tráfico, minimizar la latencia y adaptarse a escenarios de conmutación por error más complejos.
