Introducción a IBM Netezza Replication Services 2.0.0.0S

Los nodos Netezza Performance Server (NPS) son sistemas redundantes y tolerantes a fallos. La adición de IBM® Netezza® Replication Services para la recuperación de desastres mejora la tolerancia a fallos ampliando la redundancia a través de redes de área local y amplia.

IBM Netezza Replication Services protege contra la pérdida de datos sincronizando los datos de un sistema primario (el nodo primario) con los datos de uno o varios nodos de destino (réplicas). Estos nodos forman un conjunto de replicación.

Cuando la replicación está activa, Replication Services captura todas las transacciones SQL que cambian datos en las bases de datos replicadas en el nodo NPS primario y guarda esas transacciones en un registro de replicación. Ejemplos de estas transacciones son las que insertan, borran o actualizan datos, las que ejecutan o actualizan funciones o las que añaden, borran o actualizan información sobre usuarios. El contenido del registro de replicación se transmite automáticamente a todos los nodos de réplica NPS del conjunto de replicación. Cada réplica reproduce las transacciones en sus bases de datos replicadas, lo que da como resultado un contenido idéntico al del primario.

Tener un nodo primario y una o más réplicas puede proporcionar disponibilidad de datos incluso si un nodo NPS está fuera de línea o inalcanzable. Los nodos réplica actúan como "warm standbys" en caso de fallo del sistema o parada programada del primario. Si se pierden datos en un nodo NPS, por ejemplo debido a una interrupción de la red o a múltiples fallos de hardware, el conjunto de replicación tiene suficientes copias redundantes para recuperarlos (se necesita al menos una copia sana). Dado que cada nodo NPS del conjunto de replicación almacena una copia de los datos y del registro de replicación, si un nodo resulta dañado y se pierden sus datos locales, los datos más recientes se encuentran en el registro de replicación o en uno o varios de los nodos NPS Netezza. Por tanto, si falla un nodo, el procesamiento de los datos replicados puede continuar en otro nodo con una pérdida de datos limitada.

El enfoque de replicación para la recuperación de desastres tiene un beneficio adicional. Dado que varias copias de la base de datos se distribuyen entre varios nodos Netezza NPS, la configuración admite más consultas SQL que se ejecutan contra los mismos datos. Los nodos de réplica también proporcionan acceso concurrente de BI e informes a almacenes de datos sincronizados, lo que permite la distribución, el equilibrio y la optimización de la carga de trabajo.

Dado que en el nodo Netezza NPS no se realiza ninguna transformación ni ninguna otra operación que requiera un uso intensivo de la CPU (por ejemplo, procesamiento de registros, transferencias de datos intrasitio o negociación de red TCP/IP), el uso de recursos de replicación es muy bajo.

La siguiente figura muestra una implementación de IBM Netezza Replication Services.
Figura 1. Entorno de replicación
En la implementación de ejemplo que se muestra en el diagrama. hay un nodo primario, normalmente en un centro de datos local. Todas las escrituras (cargas, SQL y datos de las aplicaciones de análisis e informes) se envían a la instancia de NPS en el nodo primario. Las cargas proceden de ficheros y de un sistema ETL. SQL consiste en actualizaciones globales esporádicas. La instancia NPS en el nodo primario se comunica con un RQM de replicación a través de una LAN. Todas las escrituras del gestor de colas de replicación del nodo primario fluyen hacia el gestor de colas de replicación del nodo réplica a través de una WAN. El gestor de colas de replicación del nodo réplica está conectado a la instancia NPS del nodo réplica a través de una LAN. La réplica puede estar en un sitio local o remoto.