データ・セット構成
分析するデータセットの設定方法を学ぶ。
サンプル・データ・セット
Netezza Performance ServerAnalyticsドキュメントセットでは、標準的なデータマイニングデータセットを使用して、さまざまな関数とストアドプロシージャが通常操作でどのように動作するかの例を示します。 データセットはまた、製品のさまざまなコンポーネントが実際のシナリオでどのように使用されるかについての洞察としても使用される。
データ・セット名 | ダウンロードする URL およびファイル |
---|---|
小売 | URL: fimi.ua.ac.be/data/ ファイル: ' |
CensusIncome | URL: archive.ics.uci.edu/ml/databases/census-income/ ファイル: |
WineQuality | URL: archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/ ファイル: |
大人 | URL: archive.ics.uci.edu/ml/machine-learning-databases/adult ファイル: |
大豆 | URL: archive.ics.uci.edu/ml/machine-learning-databases/soybean ファイル |
Iris | URL: archive.ics.uci.edu/ml/machine-learning-databases/iris/ ファイル: |
サンプル・データ・セットのインストール
- 各データ・セット・ファイルをローカル・マシンにダウンロードします。 ファイルが圧縮されている場合 (例えば、拡張子が .gz のファイルは圧縮されています) は、解凍しないでください。
- ユーザー「
nz
」としてホストにログインする。 - ダウンロードしたデータ・セットを保管するディレクトリーを作成します。以下に例を示します。
/nz/export/ae/utilities/bin/testData
- データ・セット・ファイルを新しく作成したディレクトリーに転送します。 ファイル名は変更しないでください。
- 次のディレクトリーにナビゲートします。
/nz/export/ae/utilities/bin
- 以下のいずれかのコマンドを入力して、インストール・スクリプトを実行します。
- サンプル・データ・セット・ファイルがディレクトリー /nz/export/ae/utilities/bin/testData にある場合は、次のようになります。
./loadTestTables.sh
- サンプル・データ・セットが別のディレクトリーにある場合は、次のようになります。
ファイルに含まれる大量のデータが原因で、スクリプトの実行に数分かかる場合があります。 それは正常です。./loadTestTables.sh path_to_directory
- スクリプトが終了すると、スクリプトによって作成された一時ファイルは自動的に削除されます。 しかし、ダウンロードされたデータファイルとログファイルは削除されず、ホスト上に残る。 これらのファイルを残さない場合は、手動で削除します。
- サンプル・データ・セット・ファイルがディレクトリー /nz/export/ae/utilities/bin/testData にある場合は、次のようになります。
スクリプトを再実行すると、すべてのサンプル・データがデータベースから削除され、対応する表がドロップされます。 その後、表が再作成され、元のサンプル・データが再挿入されます。
Netezza Performance Server(nzcm)
Netezza Performance ServerAnalyticsのカートリッジ管理には、Netezza Performance ServerCartridge Manager (nzcm) ユーティリティを使用します。 nzcmを使用して、カートリッジのインストール、アンインストール、登録、登録解除、その他の管理を行う。
nzcm のインストール
Netezza Performance ServerAnalyticsは、.nzcファイル形式のカートリッジのコレクションとして配布されます。 これらのファイルはNetezza Performance ServerAnalyticsパッケージ全体から抽出する必要があります。 Netezza Performance ServerAnalyticsインストール・ユーティリティを使用して、カートリッジとNetezza Performance ServerCartridge Manager (nzcm) を抽出してアクセスできます。
- ユーザー「
nz
」としてホストにログインする。 - 以下のファイルがあるディレクトリに移動する:
nz-analytics-vversion.zip
- 以下のコマンドを実行します。
The unzip utility must be used to extract the file; gunzip cannot be used. このコマンドにより、ファイルが抽出されたディレクトリーの下に、nzcmrepo という名前のディレクトリーが作成されます。unzip nz-analytics-vversion.zip
- nzcmrepoサブディレクトリ(通常は/nz/var/inza/nzcmrepo)に移動する/var/inza/nzcmrepo.
nzcm
ファイルを探してリリース番号を確認する。 ファイル名は「nzcm-<version>
である。- ファイルを解凍する。
tar -xf nzcm-<version>
- 解凍したら、「
nzcm
ディレクトリに行く:cd /nz/var/inza/nzcmrepo/nzcm-<<version>
- インストール '
nzcm
:./install.sh
スクリプトは'
nzcm
を'/nz/var/nzcmディレクトリにインストールし、リポジトリは自動的に設定される。 - install.shスクリプトの出力の指示に従い、実行する:
source ~/.bashrc
- 以下のコマンドを発行して、ターゲット・ディレクトリーに移動します。
cd /nz/var/inza/nzcmrepo
- ターゲット・ディレクトリーが空であることを確認します。
- カートリッジとグループファイルを解凍する:
これは「cp -f *.nzc /nz/var/nzcm/nzcmrepo/ cp -f *.grp /nz/var/nzcm/nzcmrepo/
nzcm
インストールする。