Configurazione del set di dati

Imparare a configurare i set di dati da analizzare.

Set di dati di esempio

I set di dati standard per l'estrazione dei dati sono utilizzati nel set di documenti Netezza Performance Server Analytics per fornire esempi di come varie funzioni e stored procedure si comportano durante il normale funzionamento. I set di dati vengono utilizzati anche per capire come i vari componenti del prodotto potrebbero essere utilizzati in scenari reali.

I seguenti set di dati di esempio utilizzati nella documentazione non sono inclusi in Netezza Performance Server Analytics e devono essere scaricati da Internet e installati su Netezza Performance Server da un amministratore prima di poter essere utilizzati. I dati non possono essere utilizzati direttamente dai file di set di dati scaricati, quindi è stato fornito uno script per creare le tabelle necessarie a contenere i dati, manipolare i dati scaricati e caricare i dati per l'uso sul sistema. Sebbene non sia necessario, per utilizzare gli esempi di documentazione è necessario acquisire i seguenti set di dati:
Nome dataset URL e file da scaricare
Vendita ala dettaglio

URL: fimi.ua.ac.be/data/

File: 'retail.dat.gz (fare clic sul collegamento .gz)

CensusIncome

URL: archive.ics.uci.edu/ml/databases/census-income/

File: census.tar.gz

WineQuality

URL: archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/

File: winequality-white.csv

Adulti

URL: archive.ics.uci.edu/ml/machine-learning-databases/adult

File: adult.data

Soia

URL: archive.ics.uci.edu/ml/machine-learning-databases/soybean

File: soybean-large.data e 'soybean-large.test

Iris

URL: archive.ics.uci.edu/ml/machine-learning-databases/iris/

File: iris.data

Installazione di set di dati di esempio

  1. Scaricare ogni file del set di dati su un computer locale. Se un file è impacchettato (ad esempio, un file con l'estensione " .gz è impacchettato), non lo si deve decomprimere.
  2. Accedere all'host come utente 'nz.
  3. Creare una directory in cui memorizzare i set di dati scaricati, ad esempio:
    /nz/export/ae/utilities/bin/testData
  4. Trasferire i file del set di dati nella nuova directory. Non modificare i nomi dei file.
  5. Navigare nella seguente directory:
    /nz/export/ae/utilities/bin
  6. Eseguite lo script di installazione immettendo uno dei seguenti comandi:
    • Se i file del set di dati di esempio si trovano nella directory '/nz/export/ae/utilities/bin/testData:
      ./loadTestTables.sh
    • Se i file del set di dati campione si trovano in una directory diversa:
      ./loadTestTables.sh path_to_directory
      A causa della grande quantità di dati contenuti nei file, lo script potrebbe essere eseguito per diversi minuti. Questo è normale.
    • Al termine dello script, i file temporanei creati dallo script vengono eliminati automaticamente. Tuttavia, i file di dati scaricati e i file di registro non vengono eliminati e rimangono sull'host. Se non si desidera conservarle, eliminarle manualmente.

Se lo script viene rieseguito, tutti i dati del campione vengono eliminati dal database e le tabelle corrispondenti vengono eliminate. Quindi, le tabelle vengono ricreate e i dati del campione originale vengono reinseriti.

Netezza Performance Server Gestore di cartucce (nzcm)

La gestione delle cartucce per Netezza Performance Server Analytics viene eseguita tramite l'utility Netezza Performance Server Cartridge Manager (nzcm). Utilizzare nzcm per installare, disinstallare, registrare, disregistrare e amministrare in altro modo le cartucce.

Installazione di nzcm

Netezza Performance Server Analytics viene distribuito come raccolta di cartucce sotto forma di file .nzc. È necessario estrarre questi file dal pacchetto completo di Netezza Performance Server Analytics. È possibile estrarre e accedere alle cartucce e al Netezza Performance Server Cartridge Manager (nzcm) tramite l'utilità di installazione di Netezza Performance Server Analytics.

Sull'host dell'appliance, eseguire le seguenti operazioni:
  1. Accedere all'host come utente 'nz.
  2. Andate alla directory che contiene il seguente file:
    nz-analytics-vversion.zip
  3. Eseguire il comando riportato di seguito:
    unzip nz-analytics-vversion.zip
    Per estrarre il file è necessario utilizzare l'utility 'unzip; non è possibile utilizzare 'gunzip. Questo comando crea una directory con il nome 'nzcmrepo sotto la directory in cui sono stati estratti i file.
  4. Andare alla sottodirectory nzcmrepo, tipicamente /nz/var/inza/nzcmrepo/var/inza/nzcmrepo.
  5. Individuare il file 'nzcm per determinare il numero di release. Il nome del file è 'nzcm-<version>.
  6. Decomprimere il file.
    tar -xf nzcm-<version>
  7. Una volta decompresso, andare alla directory 'nzcm:
    cd /nz/var/inza/nzcmrepo/nzcm-<<version>
  8. Installare 'nzcm:
    ./install.sh

    Lo script installa 'nzcm nella cartella '/nz/var/nzcm e il repository viene configurato automaticamente.

  9. Come indicato dall'output dello script 'install.sh, eseguire:
    source ~/.bashrc
  10. Eseguire il seguente comando per passare alla directory di destinazione:
    cd /nz/var/inza/nzcmrepo
  11. Confermare che la directory di destinazione è vuota.
  12. Decomprimere le cartucce e i file di gruppo:
    cp -f *.nzc /nz/var/nzcm/nzcmrepo/
    cp -f *.grp /nz/var/nzcm/nzcmrepo/
    Questo installa il 'nzcm.