Ampliación de Netezza Performance Server para Cloud Pak for Data System

Opciones de despliegue: Netezza Performance Server para Cloud Pak for Data System

Amplíe su Netezza Performance Server for Cloud Pak for Data System para almacenar más datos y soportar un mayor paralelismo para procesar consultas en muchas SPU (Snippet Processing Units).

Ampliación con Netezza Performance Server

La ampliación de un Cloud Pak for Data System que ejecuta Netezza Performance Server consta de dos partes principales:
Ampliación de hardware/plataforma
Añadir y conectar físicamente armarios que contengan SPU adicionales y configurar estos nodos.
Ampliación del software
Actualización de los metadatos de topología del sistema Netezza Performance Server para representar las SPU adicionales, sus discos NVMe conectados y el número y la ubicación de las rebanadas de datos adicionales.

Redistribución de datos - Panorama general

La redistribución de datos es el proceso de tomar las filas existentes y distribuirlas en el nuevo conjunto de rebanadas de datos basándose en el método de distribución de cada tabla para procesar correctamente las consultas. Netezza Performance Server 11.2.1.11 admite la redistribución tanto offline como online. Elija uno de estos dos métodos de redistribución tras la ampliación.

Como se indica en Claves de distribución, el rendimiento de las consultas y las cargas de trabajo en Netezza Performance Server se ve afectado en gran medida por los métodos de distribución de varias tablas sobre las rebanadas de datos que residen en los discos SPU. El método de distribución para una tabla determinada puede ser aleatorio o hash, siendo este último el método hashing de las filas de la tabla en un conjunto de hasta cuatro columnas de clave de distribución especificadas por el usuario.

Cuando se amplía Netezza Performance Server, los segmentos de datos existentes actualmente en los discos de las SPU existentes permanecerán en su lugar, y se añadirán nuevos segmentos de datos en los discos de las nuevas SPU. El número de estos nuevos segmentos de datos será de 96 por recinto (4 nodos) o 192 por par de recintos (8 nodos).

Antes de la expansión, las filas de la tabla se distribuyen utilizando sus métodos de distribución y claves sobre el número original de rebanadas de datos antes de expandir un sistema Netezza Performance Server. Tras la ampliación del hardware y el software con unidades de procesamiento de fragmentos (SPU) adicionales, el sistema contará con un mayor número de fragmentos de datos. Pero las filas de cada tabla se distribuyen en el número original de rebanadas de datos.

Netezza Performance Server versión 11.2.1.11 soporta dos métodos de redistribución de datos después de la expansión:
Fuera de línea
En las versiones de Netezza Performance Server anteriores a 11.2.1.11, la ampliación de Netezza Performance Server Server la realizaba un ingeniero de soporte IBM IBM, en colaboración con el cliente. Hay algunos pasos previos y posteriores a la ampliación, pero los pasos centrales de ampliación y redistribución del software se integraron en un único programa nzredrexpand. Este estilo de redistribución de datos (tras la ampliación del software) se denomina offline, ya que se realiza mientras Netezza Performance Server no está disponible para las aplicaciones cliente. Para más detalles, consulte Redistribución de datos sin conexión.
En línea

La redistribución de datos en línea en Netezza Performance Server 11.2.1.11 aborda el prolongado tiempo de inactividad experimentado por las aplicaciones cliente. El tiempo de inactividad se soluciona abriendo el acceso a los datos tras la ampliación del software y permitiendo que la redistribución de datos se realice de forma asíncrona en los momentos y con los límites de recursos WLM (gestión de la carga de trabajo) de su elección.

El enfoque de redistribución offline existente sigue estando disponible, para los casos en los que el tiempo de inactividad previsto Netezza Performance Server sea aceptable. El usuario puede elegir la ampliación en este punto, si opta por realizar él mismo la redistribución en línea tras la ampliación del hardware o si desea proceder a la redistribución fuera de línea de forma automática e inmediata tras la ampliación. Para más detalles, consulte Redistribución de datos - En línea.

Una vez elegido el método de redistribución y después de haber instalado y conectado físicamente los nuevos armarios Cloud Pak for Data System, se procederá a la ampliación de la plataforma Cloud Pak for Data System y a la ampliación del software Netezza Performance Server. Platform Expansion aprovisionará los nuevos nodos de hardware Cloud Pak for Data System en las nuevas carcasas como nodos Netezza Performance Server "SPU". Software Expansión:
  • Actualice la información de configuración y topología Netezza Performance Server para representar las SPU adicionales, sus discos NVMe conectados y el número y la ubicación de las rebanadas de datos adicionales.
  • Opcionalmente, si eligió la redistribución fuera de línea, redistribuya todas las tablas mientras Netezza Performance Server sigue sin estar disponible para las cargas de trabajo de los clientes.