Scaricare i dati nel cloud: AWS S3 e IBM Cloud Object Storage

Opzioni di distribuzione: Netezza Performance Server for Cloud Pak for Data SystemNetezza Performance Server for Cloud Pak for Data

È possibile scaricare i dati dalle tabelle del database in un file su cloud storage. L'operazione di scarico non rimuove le righe dal database, ma memorizza i dati scaricati in una tabella esterna adatta al caricamento in un database.

Informazioni su questa attività

È possibile scaricare i dati su una qualsiasi delle piattaforme cloud supportate, tra cui AWS S3 e IBM Cloud Object Storage. È possibile scaricare tutti i tipi di dati (compresi gli Unicode) e i tipi di file (formati decompressi e compressi).

Lo scarico per il formato a lunghezza fissa non è supportato.

Per creare una tabella esterna, è necessario essere l'utente admin o avere il privilegio di amministrazione CREATE EXTERNAL TABLE. È inoltre necessario avere l'autorizzazione a scrivere nel percorso dell'oggetto dati.

Procedura

  1. Creare una tabella esterna lanciando il comando CREATE EXTERNAL TABLE.
    CREATE EXTERNAL TABLE TABLE SAMEAS TABLE USING (
    DATAOBJECT DATAOBJECT
    REMOTESOURCE REMOTESOURCE
    DELIM DELIM
    UNIQUEID UNIQUEID
    ACCESSKEYID ACCESSKEYID
    SECRETACCESSKEY SECRETACCESSKEY
    DEFAULTREGION DEFAULTREGION
    BUCKETURL BUCKETURL
    ENDPOINT ENDPOINT
    MULTIPARTSIZEMB MULTIPARTSIZEMB 
    );
    Esempio:
    CREATE EXTERNAL TABLE emp_backup SAMEAS emp USING (
    DATAOBJECT ('/employee_data.dat')
    REMOTESOURCE 'S3' 
    DELIM '|' 
    UNIQUEID 'samplebackup' 
    ACCESSKEYID 'xxxxx'
    SECRETACCESSKEY 'xxxxx'
    DEFAULTREGION 'ap-geo' 
    BUCKETURL 'my.backup.bucket' 
    ENDPOINT 's3.us-east.cloud-object-storage.appdomain.cloud' 
    MULTIPARTSIZEMB '50'
    );

    La specifica del file DATAOBJECT deve fare riferimento a un file valido sulla piattaforma cloud. Per l'opzione REMOTESOURCE, utilizzare s3.

    Questa tabella elenca tutti i parametri aggiuntivi necessari per utilizzare l'opzione REMOTESOURCE.
    Opzione Distribuzione Descrizione
    uniqueId Facoltativo Lo spazio dei nomi, utilizzato per raggruppare i dati nel bucket del cloud.
    ACCESSO Obbligatorio Chiave generata su AWSIBM Cloud Object Storage.
    CHIAVE DI ACCESSO SEGRETA Obbligatorio Chiave di accesso segreta generata su AWSIBM Cloud Object Storage.
    REGIONE DEFAULT Obbligatorio Regione del secchio.
    BUCKETURL Obbligatorio Nome del secchio.
    MULTIPARTSIZEMB Facoltativo Il valore predefinito è 105. Questo valore è espresso in MB. Indica la dimensione di ciascuna parte in un caricamento multiparte. (È possibile caricare fino a 105 MB di buffer in una sola richiesta).
    Suggerimento: utilizzare valori come 50 MB o superiori. Se si utilizzano 10 MB, si potrebbero riscontrare problemi di software.
    Endpoint Opzionale per AWS

    Obbligatorio per IBM Cloud Object Storage

    URL della regione per accedere al proprio bucket.
  2. Inserire i dati dalla tabella sull'host Netezza Performance Server nella tabella esterna.
    INSERT INTO TABLE SELECT * FROM TABLE;
    Esempio:
    INSERT INTO emp_backup SELECT * FROM emp;