Carregando dados da nuvem: Azure Blob Storage

Opções de implantação: Netezza Performance Server para Cloud Pak for Data SystemNetezza Performance Server para Cloud Pak for Data

Você pode carregar dados de tabelas externas na nuvem para uma tabela de banco de dados do Netezza Performance Server em um sistema host do Netezza Performance Server.

Antes de iniciar

  • Para que a tabela de banco de dados contenha apenas os registros da tabela externa, certifique-se de que ela esteja vazia antes de carregar os dados.
  • Se você carregar a partir de uma tabela externa para uma tabela de banco de dados que não está vazia, o carregamento é concluído com sucesso, mas os novos registros são anexados aos registros existentes.

Sobre esta tarefa

Você pode carregar dados do Azure Blob Storage. Você pode carregar todos os tipos de dados (inclusive Unicode) e tipos de arquivos (formatos descompactados e compactados).

Para criar uma tabela externa, deve-se ser o usuário administrador ou ter o privilégio de administração CREATE EXTERNAL TABLE. Você também precisa ter permissão para ler a partir do caminho do objeto de dados.

Procedimento

  1. Crie uma tabela externa emitindo o comando CREATE EXTERNAL TABLE com a opção REMOTESOURCE.
    CREATE EXTERNAL TABLE TABLE SAMEAS TABLE USING (
    DATAOBJECT DATAOBJECT
    REMOTESOURCE REMOTESOURCE
    DELIM DELIM
    UNIQUEID UNIQUEID
    AZACCOUNT AZACCOUNT
    AZKEY AZKEY
    AZREGION AZREGION
    AZCONTAINER AZCONTAINER
    AZBLOCKSIZEMB AZBLOCKSIZEMB
    AZMAXBLOCKS AZMAXBLOCKS
    AZLOGLEVEL AZLOGLEVEL 
    );
    Exemplo:
    CREATE EXTERNAL TABLE emp_backup SAMEAS emp USING (
    DATAOBJECT ('/tmp/emp.dat')
    REMOTESOURCE 'AZURE'
    DELIM '|'
    UNIQUEID 'samplebackup'
    AZACCOUNT 'xxxxx'
    AZKEY 'xxxxx'
    AZREGION 'eastus2'
    AZCONTAINER' myContainer'
    AZBLOCKSIZEMB '50'
    AZMAXBLOCKS '1000'
    AZLOGLEVEL 'DEBUG’ 
    );
    A especificação do arquivo DATAOBJECT deve referir-se a um arquivo válido na plataforma de nuvem. Para a opção REMOTESOURCE, use AZURE.

    Se você não especificar uma origem remota, o sistema procurará um arquivo de origem no host do appliance.

    Esta tabela lista todos os parâmetros adicionais necessários se você quiser usar a opção REMOTESOURCE AZURE.

    Opção Distribuição Descrição
    uniqueId Opcional O namespace, que é usado para agrupar dados no bucket da nuvem.
    AZACCOUNT Obrigatório O nome da conta de armazenamento Azure.
    AZBLOBTYPE Opcional O tipo da bolha. O valor padrão é BLOCK. Os valores válidos são BLOCK e PAGE.
    AZKEY Obrigatório A chave Azure para acessar sua conta.
    AZCONTAINER Obrigatório O nome do contêiner Azure.
    AZREGION Obrigatório na versão 11.2.2.X

    Não é compatível com a versão 11.2.1.X

    O nome da região de sua conta de armazenamento Azure. Para obter uma lista de suas regiões, execute o seguinte comando:
    az account list-locations --query [].[name] -o table
    AZMAXBLOCKS Opcional Indica o número máximo de blocos permitidos em um blob de blocos. O padrão é 10000.
    AZBLOCKSIZEMB Opcional O padrão é 25; máximo de 100. Esse valor está em MB. Indica o tamanho de um bloco. Os dados são gravados na nuvem em blocos. Os blocos são anexados para formar um blob.
    AZLOGLEVEL Opcional O padrão é INFO. Esse é um nível de registro para controlar a verbosidade do registro. Outros valores válidos são DEBUG, WARNING e ERROR.
  2. Inserir dados da tabela externa na tabela do host Netezza Performance Server.
    INSERT INTO TABLE SELECT * FROM TABLE;
    Exemplo:
    INSERT INTO emp SELECT * FROM emp_backup;