このチュートリアルでは、クラスタリング・マイニング関数を紹介します。
サンプル・データには、銀行の顧客に関するレコードが含まれます。
クラスタリング関数は、顧客セグメントの検索に使用されます。
このチュートリアルでは、クラスタリング・データ・マイニング関数を使用して、顧客データに関する顧客セグメンテーションを実行する方法を示します。
- 次のようにして、新規データウェアハウジング・プロジェクトを作成します。
- Design Studio のツールバーで、「新規」アイコンをクリックします。
- 「ウィザードの選択」ウィンドウで、を選択してから、「次へ」をクリックします。
- 「プロジェクト名」フィールドに MiningTutorials と入力して「終了」をクリックします。
- MiningTutorials プロジェクトで、クラスタリング・セグメンテーション分析用の新規マイニング・フローを作成します。
- MiningTutorial プロジェクトを開き、「マイニング・フロー」フォルダーを右クリックして、を選択します。
「新規データ・フロー」ウィンドウが開きます。
- 「マイニング・フローの名前」フィールドに CustomerSegmentation と入力して、「次へ」をクリックします。
- 接続のリストから DWESAMP を選択し、「終了」をクリックします。
マイニング・フロー CustomerSegmentation が MiningTutorial プロジェクトの「マイニング・フロー」フォルダーに追加されます。
- 以下のようにして演算子をMining エディター・キャンバスに追加します。
- キャンバス上に、表のソース演算子を配置します。
「データベース表の選択」ウィンドウが開きます。
- BANK スキーマを展開し、CUSTOMERS 表を選択してから、「終了」をクリックします。
- 表のソース演算子で、プラス (+) アイコンをクリックして、表の列を表示します。 このチュートリアルでは、分析される Db2® 表には、銀行の顧客ごとの年齢や性別などの人口統計属性情報が含まれています。
- クラスター機能演算子を、表のソース演算子の右側に配置します。
クラスター機能演算子は、類似の顧客のグループ (顧客セグメントまたはクラスター) を計算します。
- 表のソース演算子の出力ポートをクリックし、接続をクラスター機能演算子の入力ポートにドラッグして、キャンバスの演算子を接続します。
- 以下のようにして、ビジュアライザー 演算子をキャンバスに追加し、クラスタリング・モデルのグラフィカル・ビューを作成します。
- キャンバス上のクラスター機能演算子の右側に、ビジュアライザー演算子を配置します。
- クラスター機能演算子のモデル・ポートをクリックし、接続をビジュアライザー演算子のモデル・ポートにドラッグして、キャンバスの演算子を接続します。
- クラスター機能演算子のプロパティーを編集します。
- キャンバスで、クラスター機能演算子を選択します。
クラスター機能演算子の「プロパティー」ビューが表示されます。
- 「プロパティー」ページで、「モデル名」をクリックします。
- 「モデル名」フィールドに、新規モデルのモデル名として CustomerSegments と入力します。
- マイニング・フローを実行します。
- Design Studio のツールバーで、「マイニング・フローの実行」アイコンをクリックします。
「フロー実行」ウィンドウが表示されます。
- 「フロー実行」ウィンドウでデフォルト値を受け入れて、「実行」をクリックします。
「マイニング・フロー実行状況」ウィンドウが開きます。
これによりプロセスが記述されますが、その内容は Intelligent Miner® がレコードをクラスターに割り当て、結果オブジェクトを作成し、Clustering Visualizer を呼び出すというものです。
完了時に、Clustering Visualizer が開きます。
デフォルトでは、「グラフィックス」ビューが表示されます。
行ごとに 1 つの顧客セグメントがこのビューに表示されます。
- 「グラフィックス」ビューのクラスター名をダブルクリックし、特定のクラスターにドリルダウンします。
例えば、クラスター 1 をダブルクリックすると、通常はクラスター 1 の顧客が独身で国際的なクレジット・カードがないことなどが分かります。
- 「テキスト」をクリックすると、顧客セグメントごとのテキスト形式の説明が表示されます。
- ここで Clustering Visualizer を閉じることができます。
クラスタリング・モデルが DWESAMP データベースの「データ・マイニング・モデル」フォルダーに保管されます。
スコアリング・マイニング・フロー中でこのモデルを使用して、他の顧客のクラスター ID を計算することができます。
このクラスター ID を使用して、特定の顧客セグメントをターゲットとするメール・キャンペーン用の顧客のサブセットを選択することもできます。