レッスン 1: ウェアハウジング・プロジェクトおよびブランク・データ・マイニング・フローの作成

このレッスンでは、Design Studio で、プロジェクトおよびブランク・マイニング・フローを作成します。

このタスクについて

始める前に

最初に、 GSDB サンプル・データベースのセットアップで説明されている前提条件を満たす必要があります。

注: このチュートリアルのステップは、新しいバージョンのサンプル・データベースとデータを処理するように設計されています。 GSDB サンプル・データベースを使用するこのチュートリアルまたは別のチュートリアルを、本人または他のユーザーが以前学習したことがある場合は、スクリプトをもう一度実行してサンプル・データベースをリセットする必要があります。

概要

ブランク・マイニング・フローおよびそのフローを含むデータウェアハウジング・プロジェクトを作成してから、マイニング・フローの設計を始める必要があります。

このレッスン内のタスク

Design Studio の始動およびデータベースへの接続

Design Studio でマイニング・フローを設計します。 ライブ・データベースに対してフローを設計できるように、モデル化するトランザクション・データが入った GSDB データベースに接続します。

このタスクについて

手順

Design Studio を始動し、GSDB データベースに接続するには、次のようにします。

プロシージャー

  1. Design Studio を開き、新規ワークスペースを指定します。
    1. 「スタート」 > 「プログラム」 を開き、 Db2®でデータウェアハウジング用のプログラムにナビゲートして、 ISWCOPY01 > 「Design Studio」を選択します。

      ISWCOPY01 という値はデフォルトのディレクトリー名です。ご使用のインストール済み環境では異なる可能性があります。

    2. ワークスペースの新規ディレクトリーを指定して、 「OK」をクリックします。 例えば、次のようになります。
      C:\workspaces\miningtutorial
    ワークスペースは、作業するブランク領域を提供します。 このワークスペースにはプロジェクトまたはオブジェクトは存在しません。 後からこのレッスンでプロジェクトを作成します。
  2. Design Studio を開いた後、 「ようこそ」 ページが表示された場合は、 「ようこそ」 タブを閉じます。
  3. 「データ・ソース・エクスプローラー」 ビューが表示されていることを確認します。
    • ウィンドウ > ビューの表示 > 「データ・ソース・エクスプローラー」をクリックします。
    左下ペインに「Data Source Explorer」が開きます。
    データ・ソース・エクスプローラー

    「Data Source Explorer」には、データベースに作成した接続がリストされています。 物理データ・モデルを作成するには GSDB データベースへの接続が必要です。

  4. GSDB データベースへの接続が存在する場合は、 データ・ソース・エクスプローラーからデータベースに接続します。
    1. データ・ソース・エクスプローラーで、 GSDB データベースを右クリックし、 「接続」をクリックします。
    2. プロンプトが出されたら、 Db2 ユーザー ID とパスワードを入力します。
    GSDB データベースに接続されます。
  5. GSDB データベースへの接続が存在しない場合は、接続を作成します。
    ヒント: このステップは、ステップ 4 を実行できなかった場合にのみ実行してください。
    1. 「新規接続」 ウィザードを開きます。
      • 「Data Source Explorer」「データベース接続」フォルダーを右クリックし、「新規」をクリックします。
    2. 「新規接続」 ウィザードのフィールドに入力します。
      フィールド 設定
      データベース・マネージャーの選択 Db2
      JDBC ドライバー (JDBC driver) 使用するデータベースに適切なドライバーを指定します。
      データベース
      GSDB
      ホスト
      • GSDB データベースが Design Studio と同じコンピューター上にある場合。
        localhost
      • GSDB データベースがリモート・コンピューター上にある場合は、リモート・ホストの名前を入力します。
      ポート番号 Db2のポート番号を入力します。
      クライアント認証を使用する 選択しない。
      ユーザー ID GSDB データベースのユーザー名を入力します。
      注: マイニング・チュートリアルを完了するには、GSDB データベースに対する Db2 管理者特権が必要です。
      パスワード GSDB データベースのパスワードを入力します。
    3. 「終了」をクリックします。
      GSDB データベースへの接続が構成されました。
    GSDB データベースに接続されます。

結果:

「Design Studio」が始動し、GSDB データベースに接続しました。

データベースをマイニング可能にする

GSDB データベースをマイニング可能にする必要があります。 GSDB データベースを使用可能にすることによって、データベースでマイニング操作を実行するストアード・プロシージャーを追加します。

このタスクについて

手順

データベースをマイニング可能にするには、次のようにします。

プロシージャー

  1. 「データ・ソース・エクスプローラー」「データベース接続」 ツリーを展開します。
  2. GSDB データベース接続を展開します。
  3. GSDB データベースを右クリックし、 「データ・マイニング用にデータベースを使用可能にする」をクリックします。
    ヒント: データベースでマイニングが既に有効になっている場合は、開いた確認ウィンドウで 「いいえ」 をクリックできます。

結果:

データベースがマイニング用に使用可能になりました。 次に、新規データウェアハウジング・プロジェクトを作成します。

新規プロジェクトの作成

マイニング・フローを含むデータウェアハウジング・プロジェクトを作成する必要があります。

このタスクについて

手順

新規プロジェクトを作成するには、次のようにします。

プロシージャー

  1. 「ファイル」 > 「新規」 > 「データウェアハウジング・プロジェクト」をクリックします。
  2. プロジェクト名を入力します。
    Warehouse Mining Tutorial
  3. 「終了」をクリックします。

結果:

「Data Project Explorer」ビューに新規プロジェクトが表示されます。 新規プロジェクトにブランク・マイニング・フローを作成できます。
注: 「データ・プロジェクト・エクスプローラー」 ビューは、Design Studio の左上のペインにあります。

新規マイニング・フローの作成

フローの設計に使用するブランク・マイニング・フローを作成する必要があります。

このタスクについて

手順

マイニング・フローを作成するには、次のようにします。

プロシージャー

  1. 「データ・プロジェクト・エクスプローラー」 ビューで、新規データウェアハウジング・プロジェクトを展開します。
    ヒント: Data Warehousing パースペクティブを使用すると、 「データ・プロジェクト・エクスプローラー」 ビューが Design Studio の左上ペインに表示されます。
  2. プロジェクトの 「マイニング・フロー」 フォルダーを右クリックし、 新規 > 「マイニング・フロー」をクリックします。
  3. 以下の表に示す設定を指定して、 「新規マイニング・フロー」 ウィザードを完了します。
    ページ ステップ
    新規データ・マイニング・フロー
    1. 新規マイニング・フローの次の名前を入力します。
      Market_basket_analysis
    2. データベースに対する作業 (オンライン)を選択します。
    接続の選択 データベースのリストから GSDB を選択します。
    データベースのユーザー ID とパスワードを入力するプロンプトが出る場合があります。
  4. 「データ・プロジェクト・エクスプローラー」 でプロジェクトの下にある 「マイニング・フロー」 フォルダーを展開して、新しいブランク・マイニング・フローを表示します。

結果:

これで、演算子の配置を開始できるブランク・マイニング・フローが作成されました。

次のステップ

次のレッスンでは、単純なデータ・マイニング・フローを設計し、それによって生成されるマイニング・モデルを検討します。