Konfiguration von Datasets
Erfahren Sie, wie Sie die zu analysierenden Datensätze konfigurieren.
Beispiele für Datasets
Standard-Data-Mining-Datensätze werden im Netezza Performance Server Analytics-Dokumentensatz verwendet, um Beispiele dafür zu liefern, wie verschiedene Funktionen und gespeicherte Prozeduren im Normalbetrieb funktionieren. Die Datensätze geben auch Aufschluss darüber, wie die verschiedenen Komponenten des Produkts in realen Szenarien eingesetzt werden könnten.
| Datensatzname | URL und Dateien für den Download |
|---|---|
| Einzelhandel | URL: fimi.ua.ac.be/data/ Datei: ' |
| CensusIncome | URL: archive.ics.uci.edu/ml/databases/census-income/ Datei: ' |
| WineQuality | URL: archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/ Datei: ' |
| Erwachsener | URL: archive.ics.uci.edu/ml/machine-learning-databases/adult Datei: ' |
| Soybean | URL: archive.ics.uci.edu/ml/machine-learning-databases/soybean Dateien: |
| Iris | URL: archive.ics.uci.edu/ml/machine-learning-databases/iris/ Datei: ' |
Beispieldatasets installieren
- Laden Sie jede Datasetdatei auf eine lokale Maschine herunter. Wenn eine Datei gepackt ist (z. B. eine Datei mit der Erweiterung .gz), müssen Sie sie nicht entpacken.
- Melden Sie sich beim Host als Benutzer "
nzan. - Erstellen Sie ein Verzeichnis, in dem die heruntergeladenen Dateien gespeichert werden sollen, z. B.:
/nz/export/ae/utilities/bin/testData - Übertragen Sie die Datasetdateien in das neu erstellte Verzeichnis. Ändern Sie die Dateinamen nicht.
- Navigieren Sie zum folgenden Verzeichnis:
/nz/export/ae/utilities/bin - Führen Sie das Installationsscript aus, indem Sie einen der folgenden Befehle eingeben:
- Wenn sich die Beispieldatasetdateien im Verzeichnis /nz/export/ae/utilities/bin/testData befinden:
./loadTestTables.sh - Wenn sich die Beispieldatasetdateien in einem anderen Verzeichnis befinden:
Aufgrund der großen Datenmengen, die die Dateien enthalten, nimmt die Ausführung des Scripts möglicherweise mehrere Minuten in Anspruch. Dies ist normal../loadTestTables.sh path_to_directory - Wenn das Script beendet wurde, werden die vom Script erstellten temporären Dateien automatisch gelöscht. Die heruntergeladenen Datendateien und die Protokolldateien werden jedoch nicht gelöscht, sondern verbleiben auf dem Host. Wenn Sie sie nicht beibehalten wollen, löschen Sie sie manuell.
- Wenn sich die Beispieldatasetdateien im Verzeichnis /nz/export/ae/utilities/bin/testData befinden:
Wenn das Script erneut ausgeführt wird, werden alle Beispieldaten aus der Datenbank gelöscht und die entsprechenden Tabellen werden gelöscht. Anschließend werden die Tabellen erneut erstellt und die ursprünglichen Beispieldaten werden erneut eingefügt.
Netezza Performance Server Cartridge Manager (nzcm)
Die Cartridge-Verwaltung für Netezza Performance Server Analytics erfolgt über das Dienstprogramm Netezza Performance Server Cartridge Manager (nzcm). Verwenden Sie nzcm zum Installieren, Deinstallieren, Registrieren, Deregistrieren und Verwalten von Cartridges.
NPS Cartridge Manager (nzcm) installieren
Netezza Performance Server Analytics wird als eine Sammlung von Cartridges in Form von .nzc-Dateien verteilt. Sie müssen diese Dateien aus dem vollständigen Netezza Performance Server Analytics-Paket extrahieren. Sie können die Cartridges und den Netezza Performance Server Cartridge Manager (nzcm) über das Netezza Performance Server Analytics Installationsprogramm extrahieren und darauf zugreifen.
- Melden Sie sich beim Host als Benutzer "
nzan. - Wechseln Sie in das Verzeichnis, das die folgende Datei enthält:
nz-analytics-vversion.zip - Führen Sie den folgenden Befehl
aus:
Zum Extrahieren der Datei muss das Dienstprogramm " unzip verwendet werden; " gunzip kann nicht verwendet werden. Mit diesem Befehl wird ein Verzeichnis mit dem Namen nzcmrepo unter dem Verzeichnis erstellt, in dem die Dateien extrahiert wurden.unzip nz-analytics-vversion.zip - Wechseln Sie in das Unterverzeichnis nzcmrepo, normalerweise /nz/var/inza/nzcmrepo/var/inza/nzcmrepo.
- Suchen Sie die Datei "
nzcm, um die Versionsnummer zu ermitteln. Die Datei wird in der Form "nzcm-<version>benannt. - Dekomprimieren Sie die Datei.
tar -xf nzcm-<version> - Wechseln Sie nach dem Dekomprimieren in das Verzeichnis "
nzcm:cd /nz/var/inza/nzcmrepo/nzcm-<<version> - Installieren Sie '
nzcm:./install.shDas Skript installiert "
nzcmin das Verzeichnis " /nz/var/nzcm und das Repository wird automatisch konfiguriert. - Führen Sie das Skript " install.sh " aus, wie es die Ausgabe vorgibt:
source ~/.bashrc - Geben Sie den folgenden Befehl aus, um in das Zielverzeichnis zu wechseln:
cd /nz/var/inza/nzcmrepo - Stellen Sie sicher, dass das Zielverzeichnis leer ist.
- Dekomprimieren Sie die Cartridges und Gruppendateien:
Dadurch wird "cp -f *.nzc /nz/var/nzcm/nzcmrepo/ cp -f *.grp /nz/var/nzcm/nzcmrepo/nzcminstalliert.