Caricamento dei dati dal cloud: Azure Blob Storage

Opzioni di distribuzione: Netezza Performance Server for Cloud Pak for Data SystemNetezza Performance Server for Cloud Pak for Data

È possibile caricare dati da tabelle esterne sul cloud in una tabella del database Netezza Performance Server su un sistema host Netezza Performance Server.

Prima di iniziare

  • Se si desidera che la tabella del database contenga solo i record della tabella esterna, assicurarsi che la tabella del database sia vuota prima di caricare i dati.
  • Se si carica da una tabella esterna in una tabella del database non vuota, il caricamento ha successo, ma i nuovi record vengono aggiunti a quelli esistenti.

Informazioni su questa attività

È possibile caricare i dati da Azure Blob Storage. È possibile caricare tutti i tipi di dati (compresi gli Unicode) e i tipi di file (formati decompressi e compressi).

Per creare una tabella esterna, è necessario essere l'utente admin o avere il privilegio di amministrazione CREATE EXTERNAL TABLE. È inoltre necessario avere l'autorizzazione a leggere dal percorso dell'oggetto dati.

Procedura

  1. Creare una tabella esterna lanciando il comando CREATE EXTERNAL TABLE con l'opzione REMOTESOURCE.
    CREATE EXTERNAL TABLE TABLE SAMEAS TABLE USING (
    DATAOBJECT DATAOBJECT
    REMOTESOURCE REMOTESOURCE
    DELIM DELIM
    UNIQUEID UNIQUEID
    AZACCOUNT AZACCOUNT
    AZKEY AZKEY
    AZREGION AZREGION
    AZCONTAINER AZCONTAINER
    AZBLOCKSIZEMB AZBLOCKSIZEMB
    AZMAXBLOCKS AZMAXBLOCKS
    AZLOGLEVEL AZLOGLEVEL 
    );
    Esempio:
    CREATE EXTERNAL TABLE emp_backup SAMEAS emp USING (
    DATAOBJECT ('/tmp/emp.dat')
    REMOTESOURCE 'AZURE'
    DELIM '|'
    UNIQUEID 'samplebackup'
    AZACCOUNT 'xxxxx'
    AZKEY 'xxxxx'
    AZREGION 'eastus2'
    AZCONTAINER' myContainer'
    AZBLOCKSIZEMB '50'
    AZMAXBLOCKS '1000'
    AZLOGLEVEL 'DEBUG’ 
    );
    La specifica del file DATAOBJECT deve fare riferimento a un file valido sulla piattaforma cloud. Per l'opzione REMOTESOURCE, utilizzare AZURE.

    Se non si specifica un'origine remota, il sistema cerca un file di origine sull'host dell'appliance.

    Questa tabella elenca tutti i parametri aggiuntivi, necessari se si desidera utilizzare l'opzione REMOTESOURCE AZURE.

    Opzione Distribuzione Descrizione
    uniqueId Facoltativo Lo spazio dei nomi, utilizzato per raggruppare i dati nel bucket del cloud.
    AZACCOUNT Obbligatorio Il nome dell'account di archiviazione Azure.
    AZBLOBTYPE Facoltativo Il tipo di blob. Il valore predefinito è BLOCK. I valori validi sono BLOCK e PAGE.
    AZKEY Obbligatorio La chiave Azure per accedere al proprio account.
    AZCONTAINER Obbligatorio Il nome del contenitore Azure.
    AZREGIONE Obbligatorio su 11.2.2.X

    Non supportato su 11.2.1.X

    Il nome della regione dell'account di archiviazione Azure. Per un elenco delle regioni, eseguire il seguente comando:
    az account list-locations --query [].[name] -o table
    AZMAXBLOCCHI Facoltativo Indica il numero massimo di blocchi consentiti in un blob. Il valore predefinito Š 10000.
    AZBLOCKSIZEMB Facoltativo Il valore predefinito è 25; massimo 100. Questo valore è espresso in MB. Indica la dimensione di un blocco. I dati vengono scritti sul cloud in blocchi. I blocchi vengono aggiunti per formare un blob.
    LIVELLO AZLOG Facoltativo L'impostazione predefinita è INFO. Si tratta di un livello di log per controllare la verbosità del log. Altri valori validi sono DEBUG, WARNING e ERROR.
  2. Inserire i dati della tabella esterna nella tabella dell'host Netezza Performance Server.
    INSERT INTO TABLE SELECT * FROM TABLE;
    Esempio:
    INSERT INTO emp SELECT * FROM emp_backup;