グラフからのノードの生成

IBM® SPSS® Modeler のグラフで提供される最も強力な機能の 1 つは、グラフまたはグラフ内で選択した要素からノードを生成する機能です。例えば、時系列グラフから、データを選択するか領域を指定し、効果的にデータの「サブセットを作成」することで、フィールド作成 (設定とフラグ) ノードと条件抽出ノードを生成することができます。例えば、強力なこの機能を使用し、外れ値を識別してそれを除外することができます。

バンドを描画すると、フィールド作成ノードも生成できます。2 つの尺度軸を持つグラフでは、グラフ内に描画された領域からフィールド作成ノードまたは条件抽出ノードを生成できます。マークされた要素を持つグラフでは、これらの要素からフィールド作成ノード、条件抽出ノードを作成でき、またフィルター・ノードを作成できる場合もあります。バランス・ノード生成は、度数の分布を示すグラフで可能です。

図 1. 生成メニューを表示したグラフ
生成メニューを表示したグラフ

ノードを生成すると、ストリーム領域に直接配置され、ノードを既存のストリームに接続できます。条件抽出ノード、フィールド作成ノード、バランス・ノード、フィルター・ノード、データ分類ノードはグラフから生成できます。

条件抽出ノード

条件抽出ノードを生成して、領域内のレコードの追加および領域外または下流の処理の逆となる全レコードの除外を検定できます。

  • バンドの場合: 該当するバンド内のレコードを追加または除外する条件抽出ノードを生成できます。条件抽出ノードで使用するバンドを選択する必要があるため、「バンドのみの条件抽出ノード」 はコンテキスト・メニューでのみ使用できます。
  • 領域の場合: 該当する領域内のレコードを追加または除外する条件抽出ノードを生成できます。
  • マークされた要素の場合: マークされた要素または Web グラフのリンクに対応するレコードを取得する条件抽出ノードを生成できます。

フィールド作成ノード

フィールド作成ノードは、領域、バンド、およびマークされた要素から生成できます。すべてのグラフで、フィールド作成ノードを作成できます。評価グラフの場合、モデル選択のダイアログ・ボックスが表示されます。Web グラフの場合、「フィールド作成ノード (「AND」)」「フィールド作成ノード (「OR」)」を指定できます。

  • バンドの場合:「バンドの編集」ダイアログ・ボックスにカテゴリー名として表示されたバンド名を使用して、軸上にマークされた各区分のカテゴリーを作成するフィールド作成ノードを生成できます。
  • 領域の場合: 領域内のレコードには T に設定、全領域外のレコードには F に設定されるフラグを持つ in_region というフラグ型フィールドを作成するフィールド作成ノード (「フィールド作成ノード (フラグ型)」) を生成できます。また、領域 と呼ばれる各レコードの新しいフィールドを含む、各領域の値を持つセットを作成するフィールド作成ノード (「フィールド作成ノード (セット型)」) も生成できます。そのフィールド作成ノードではレコードが分類される領域の名前を値として取得します。どの領域にも属さないレコードの場合は、デフォルトの領域名が表示されます。値の名前は、「領域の編集」ダイアログ・ボックスに表示された領域名となります。
  • マークされた要素の場合 :マークされたすべての要素は、それ以外のすべてのレコードはであるフラグを集計するフィールド作成ノードを生成できます。

バランス・ノード

バランス・ノードを生成して、共通する値の頻度を減らす (「バランス ノード (減少)」 メニュー・オプションの使用)、またはあまり出現しない値の発生を増加させる (「バランス ノード (増加)」 メニュー・オプションの使用) など、データの不均衡を修正できます。バランス・ノードの生成は、ヒストグラム、点グラフ、集計グラフ、度数の棒グラフ、度数の円グラフ、および線グラフなど、度数の分布を示すグラフで有効です。

フィルター・ノード

フィルター・ノードを生成して、グラフ内でマークされたラインまたはノードに基づいてフィールドの名前を変更またはフィルタリングできます。評価グラフの場合、最良の適合線はフィルター・ノードを生成しません。

データ分類ノード

データ分類ノードを生成して、値を再分類できます。このオプションは、分布図に使用されます。グループ中の選択内容に応じて (Ctrl +「テーブル」タブでグループを選択)、表示されたフィールドの特定の値を再分類するグループのデータ分類ノードを生成できます。また、のデータ分類ノードを生成して、各種会社の金融データを分析のために結合するためにデータを標準的な値のセットに再分類するなど、多数の値からなる既存のセットにデータを再分類できます。

: 値があらかじめ定義されている場合、IBM SPSS Modeler にフラット・ファイルとして読み込み、棒グラフを使用してすべての値を表示できます。次に、このフィールドのデータ分類 (値) ノードをチャートから直接生成します。これにより、すべての対象値を分類ノードの「新しい値」列 (ドロップダウン・リスト) に分類します。

データ分類ノードのオプションを設定すると、テーブルにより、以下のように古いセット値から指定の新しい値への明確なマッピングを実行できます。
  • 元の値: 選択したフィールドの既存の値が表示されます。
  • 新しい値: 新しいカテゴリー値を入力するか、またはドロップダウン・リストから選択します。分布図からの値を使用して、データ分類ノードを自動的に生成する場合、これらの値はドロップダウン・リストに含まれます。これにより、既存の値を既知の値のセット素早くに関連付けることができます。例えば、ネットワークやロケールに基づいて、医療機関は異なる方法で診断をグループ化することがあります。合併または買収の後、すべての機関は新規のみならず既存のデータさえも一貫した方法で分類することが要求されます。長いリストから各対象値を手作業で入力しなくても、値の基本リストから IBM SPSS Modeler に読み込み、「診断」 フィールドの分布図を実行し、分布図から直接このフィールドのデータ分類ノード (値) を生成できます。このプロセスにより、「新しい値」ドロップダウン・リストのすべての対象「診断」値が利用可能になります。

データ分類ノードについて詳しくは、データ分類ノードのオプション設定を参照してください。

グラフからのノードの生成

グラフ出力ウィンドウの「ノードの生成」メニューを使用してノードを生成できます。生成されたノードはストリーム領域に配置されます。このノードを使用するには、これを既存のストリームと接続します。

グラフからノードを生成する手順は、次のとおりです。

  1. 探索モードであることを確認します。メニューから、「表示」>「探索モード」を選択します。
  2. 検証モードのツールバーで、「領域」ボタンをクリックします。
  3. ノードの定義に必要なバンド、領域、およびマークされた要素を定義します。
  4. 「ノード生成」メニューから、作成するノードの種類を選択します。作成できるノードのみが有効です。

: 代わりに、右クリックした後、コンテキスト・メニューから該当する生成オプションを選択して、グラフから直接ノードを生成することもできます。