値の代入
検査レポートは各フィールドの完全なレコードの割合を有効値、ヌル値、空白値の数とともに一覧表示します。必要時にこのオプションを選択して、特定のフィールドに欠損値を代入し、スーパー・ノードを生成してこれらの変換に適用することができます。
- 「欠損値の代入」 列では、欠損値が存在した場合に代入する値の種類を指定します。このオプションを選択して、空白値、ヌル値または両方を代入し、代入する値を選択するユーザー設定条件や式を指定します。
IBM® SPSS® Modeler の欠損値には、次の 2 種類があります。
- ヌル値またはシステム欠損値 : これらの値は、データベースまたはソース・ファイルに空白のまま残された文字列以外の値であり、入力ノードまたはデータ型ノードで特に「欠損値」として定義されていません。システム欠損値は $null$値として表示されます。空の文字列が特定のデータベースでヌルとして処理される場合でも、IBM SPSS Modeler では空の文字列をヌルとは見なさないことに注意してください。
- 空文字列と空白文字 : 空文字の値と空白文字(表示されない文字による文字列)をヌル値の重複レコードとして処理します。空白の文字列は、ほとんどの目的に対してホワイト スペースとして扱われます。例えば、オプションを選択して入力またはデータ型ノードで空白文字を空白値として扱う場合、この設定は空白の文字列も同様に適用します。
- 空白値またはユーザー定義の欠損値: これらは、入力ノードまたはデータ型ノード内で欠損値として明示的に定義されている
unknown、99、–1などの値です。オプションでヌルと空白文字を「空白」として処理することもできます。そうすることによって、特別な処理のためにフラグを付けたり、ほとんどの計算から除外することができるようになります。例えば、@BLANK関数を使用して、これらの値を他の欠損値と共に空白値として処理することができます。
- 「方法」 の列では、使用する方法を指定します。
次の方法で、欠損値の代入ができます。
固定: 固定値で置き換えます (指定のフィールド計測、範囲の中間または一定数)。
無作為 : 正常または均一分布に基づいたランダム値で置き換えます。
式 : ユーザー設定の式を指定することができます。例えば、値をグローバルの設定ノードで作成されたグローバル変数と置き換えることができます。
アルゴリズム: C&R Tree アルゴリズムの基づいたモデルによって予測された値で置き換えます。この方法で代入された各フィールドに対し、空白値やヌル値をモデルで予測された値と置き換える置換ノードとともに、個別の C&R Tree モデルが作成されます。フィルター・ノードを使用して、モデルが生成した予測値を削除します。
- 欠損値スーパー・ノードを生成するには、メニューから次の通り選択します。
「欠損値スーパーノード」ダイアログ・ボックスが表示されます。
- 「すべてのフィールド」 または 「選択されたフィールドのみ」 を選択し、必要があれば標本サイズを指定します。(指定のサンプルは割合で、デフォルトで全レコードの 10% がサンプルとなります。)
- 「OK」 をクリックして、生成されたスーパーノードをストリーム領域に追加します。
- スーパーノードをストリームに接続させ、変換を適用させます。
スーパーノード内では、モデル・ナゲット、置換、およびフィルター・ノードの組み合わせが必要に応じて使用されます。スーパーノードを編集して 「ズーム・イン」 をクリックして、どのように動作するか確認することができます。また、スーパーノード内の特定ノードを追加、編集、削除して、動作を調整することができます。