Descarga de datos en la nube: AWS S3 e IBM Cloud Object Storage

Opciones de despliegue: IBM Netezza Dispositivo IBM Netezza Dispositivo

Puede descargar datos de tablas de bases de datos en un archivo de almacenamiento en la nube. Esta operación de descarga no elimina filas de la base de datos, sino que almacena los datos descargados en una tabla externa adecuada para volver a cargarlos en una base de datos.

Acerca de esta tarea

Puede descargar datos en cualquiera de las plataformas de nube compatibles, que incluyen AWS S3 e IBM Cloud Object Storage. Puede descargar todos los tipos de datos (incluido Unicode) y tipos de archivos (formatos descomprimidos y comprimidos).

La descarga del formato de longitud fija no se admite.

Para crear una tabla externa, debe ser el usuario admin o tener el privilegio de administración CREATE EXTERNAL TABLE. También debe tener permiso para escribir en la vía de acceso del objeto de datos.

Procedimiento

  1. Cree una tabla externa mediante el comando CREATE EXTERNAL TABLE.
    CREATE EXTERNAL TABLE TABLE SAMEAS TABLE USING (
    DATAOBJECT DATAOBJECT
    REMOTESOURCE REMOTESOURCE
    DELIM DELIM
    UNIQUEID UNIQUEID
    ACCESSKEYID ACCESSKEYID
    SECRETACCESSKEY SECRETACCESSKEY
    DEFAULTREGION DEFAULTREGION
    BUCKETURL BUCKETURL
    ENDPOINT ENDPOINT
    MULTIPARTSIZEMB MULTIPARTSIZEMB 
    );
    Ejemplo:
    CREATE EXTERNAL TABLE emp_backup SAMEAS emp USING (
    DATAOBJECT ('/employee_data.dat')
    REMOTESOURCE 'S3' 
    DELIM '|' 
    UNIQUEID 'samplebackup' 
    ACCESSKEYID 'xxxxx'
    SECRETACCESSKEY 'xxxxx'
    DEFAULTREGION 'ap-geo' 
    BUCKETURL 'my.backup.bucket' 
    ENDPOINT 's3.us-east.cloud-object-storage.appdomain.cloud' 
    MULTIPARTSIZEMB '50'
    );

    La especificación de archivo DATAOBJECT debe hacer referencia a un archivo válido en la plataforma Cloud. Para la opción REMOTESOURCE, utilice s3.

    Esta tabla enumera todos los parámetros adicionales, que son necesarios si desea utilizar la opción REMOTESOURCE.
    Opción Distribución Descripción
    UNIQUEID Opcional El espacio de nombres, que se utiliza para agrupar los datos en el cubo de la nube.
    ACCESOKEYID Obligatorio Clave generada en AWSIBM Cloud Object Storage.
    SECRETACCESSKEY Obligatorio Clave de acceso secreta generada en AWSIBM Cloud Object Storage.
    DEFAULTREGION Obligatorio Región del grupo.
    BUCKETURL Obligatorio Nombre del grupo.
    MULTIPARTSIZEMB Opcional El valor predeterminado es 105. Este valor está en MB. Indica el tamaño de cada parte en una carga de varias partes. (Se puede cargar un máximo de 105 MB de memoria intermedia en una solicitud).
    Consejo: Utilice valores como 50 MB y superiores. Si utilizas 10 MB, es posible que tengas problemas con el software.
    ENDPOINT Opcional para AWS

    Obligatorio para IBM Cloud Object Storage

    T región URL para acceder a su cubo.
  2. Inserte los datos de la tabla en el host de Netezza Performance Server en la tabla externa.
    INSERT INTO TABLE SELECT * FROM TABLE;
    Ejemplo:
    INSERT INTO emp_backup SELECT * FROM emp;