フィールド作成ノード

IBM® SPSS® Modeler の強力な機能の 1 つとして、データ値を変更して、既存のデータから新しいフィールドを作成できることがあげられます。長期間にわたるデータ・マイニング・プロジェクトでは、Web ログ・データから顧客 ID を抽出したり、トランザクション・データや人口統計データから顧客の生涯価値を作成するような、新しいデータの作成が一般的に行われます。これらの変換はすべて、さまざまなフィールド設定ノードを使用して行うことができます。

さまざまなノードで、新規フィールドを作成することができます。

フィールド作成ノードで、1 つまたは複数の既存フィールドから、データ値を変更するか、新しいフィールドを作成します。これで、 タイプ式、フラグ、名義、ステート、カウント、および条件式の各フィールドが作成されます。
データ分類ノードにより、あるカテゴリー値のセットが別のセットに変換されます。データ分類は、カテゴリーを再編成したり、分析用のデータをグループ化しなおす場合に役立ちます。
データ分割ノードで、既存の 1 つまたは複数の連続型 (数値範囲) フィールドの値に基づいて、自動的に新しい名義型 (セット型) フィールドを作成します。例えば、連続型収入フィールドを、平均からの偏差による収入グループを含む、新しいカテゴリー・フィールドに変換することができます。新規フィールドのビンを作成すると、分割点に基づいてフィールド作成ノードを生成することができます。
フラグ設定ノードで、1 つ以上の名義型フィールドに定義されたカテゴリー値に基づいた、複数のフラグ型フィールドが派生します。
再構成ノードで、名義型またはグラグ型フィールドを、これから別のフィールドの値で埋めることができるフィールドのグループへ変換します。例えば、creditcash、および debit の値の payment type という名前のフィールドがある場合、3 つの新しいフィールド (creditcashdebit) が作成されます。その各々には、実際の支払の値を含めることができます。
時系列ノードにより、以前レコードのフィールドのデータを含む、新規フィールドが作成されます。時系列ノードは、多くの場合、時系列データなどの継続的なデータに使用されます。時系列ノードを使用する前に、ソート・ノードを使用して、データをソートしておくこともできます。

フィールド作成ノードの使用

フィールド作成ノードを使用して、1 つまたは複数の既存フィールドから、6 種類の新規フィールドを作成することができます。

  • 式: 新規フィールドは任意の CLEM 式の結果です。
  • フラグ型: 新規フィールドは、指定した条件を示すフラグ型です。
  • 名義: 新規フィールドは名義型であり、そのメンバーは指定した値のグループです。
  • 状態。新規フィールドは、2 つの状態 (ステート) のどちらかです。これら 2 つの状態は指定した条件によって切り替えられます。
  • 度数: 新規フィールドは、条件を満たした回数を基準に決まります。
  • 条件式: 新規フィールドは、条件の値に応じて、2 つの式のどちらかの値になります。

これらのノードには、それぞれの「フィールド作成ノード」ダイアログ・ボックスに、特別な一連のオプションが用意されています。これらのオプションは、以降の各項目で説明しています。