「値」ダイアログ・ボックスの使用
「データ型」タブの 「値」 または 「欠損値」 列をクリックすると、事前定義された値のドロップダウン・リストが表示されます。このリストの「指定...」オプションを選択すると個別のダイアログ ボックスが表示され、選択したフィールドの値の読み込み、指定、ラベル付け、処理のオプションを設定できます。
コントロールの大半は、すべての種類のデータに共通しています。ここでは、これらの共通のコントロールを説明していきます。
尺度現在選択されている測定の尺度を表示します。データ利用目的に応じて設定を変更することができます。例えば、day_of_week というフィールドに個別の曜日を表す数字が格納されている場合に、各カテゴリーを個別に調査する棒グラフ・ノードを作成するために、名義型データに変更することができます。
ストレージ ストレージ タイプが判明している場合に、そのタイプを表示します。ストレージ・タイプは、選択した尺度の影響は受けません。ストレージ・タイプを変更するには、可変長ファイル入力ノードまたは固定長ファイル入力ノードの「データ」タブを使用するか、または置換ノードの変換関数を使用します。
モデル・フィールド モデル・ナゲットのスコアリングの結果として生成されたフィールドの場合、モデル・フィールドの詳細も表示することができます。詳細には、モデル作成時のフィールドの役割 (予測値、確率、傾向など) や対象フィールド名も含まれています。
値 選択したフィールドの値を決める方法を選択します。ここで選択した内容は、「データ型ノード」ダイアログ・ボックスの 「値」 列で行った選択内容に優先します。値の読み込みに関する選択項目には、次のようなものがあります。
- データから読み込み ノードの実行時に値を読み込む場合に選択します。このオプションは、「<読み込み>」と同じです。
- 通過 現在のフィールドのデータを読み込まない場合に選択します。このオプションは「<通過>」と同じです。
- 値とラベルの指定 このオプションは選択したフィールドの値とラベルを指定するために使用します。このオプションは、値の検査とともに使用して、
現在のフィールドに対する知識に基づく値を指定します。このオプションを選択すると、フィールドの種類に応じた独自のコントロールが有効になります。値とラベルのオプションは、以降の各項目で個別に説明しています。注: 測定の尺度が「データ型不明」または <デフォルト> であるフィールドの場合、値やラベルを指定することはできません。
- データから値を拡張 現在のデータに、ここで入力した値を追加する場合に選択します。例えば、
field_1の範囲が (0,10) の場合に、値の範囲として (8,16) を入力した場合、元の最小値を削除せずに 16 を追加して範囲が拡張されます。新しい範囲は (0,16) になります。このオプションを選択すると、自動入力オプションが自動的に「<読み込み+>」になります。
リストの最大長 地理空間または集合のいずれかの尺度を持つデータのみに使用できます。リストの最大長を設定するには、リストに入れることができる要素の数を指定します。
最大文字列長 データ型不明のデータのみに使用できます。このフィールドは、SQL を生成してテーブルを作成するときに使用します。データの最大文字列の値を入力します。これにより、テーブルに生成される列が、その文字列に対して十分な大きさになります。文字列長の値が使用不可の場合は、デフォルトの文字列サイズが使用されます。このサイズは、データに対して適切でない場合があります (例えば、値が小さすぎる場合は、テーブルにデータを書き込むときにエラーが発生する場合があります。また、値が大きすぎる場合は、パフォーマンスに悪影響が及ぶ場合があります)。
値の検査 値が指定した連続型、フラグ型、または名義型の規則にしたがっているかどうかの検査方法を選択します。このオプションは、「データ型ノード」ダイアログ・ボックスの 「検査」 列に対応しており、ここでの設定内容がダイアログ・ボックスでの設定に優先されます。「値とラベルを指定」オプションとともに使用すると、 値の検査によりデータ内の値を必要な値に一致させることができます。例えば、値に 1,0 と指定した後、検査オプションを使用して、1 と 0 以外のすべての値を持つレコードを破棄することができます。
空白を定義 選択すると、データの欠損値や空白を宣言するために使用する以下のコントロールがアクティブになります。
- 欠損値 このテーブルを使用して、99 や 0 などの特定の値を空白として定義します。この値は、フィールドのストレージ・タイプに適当なものでなければなりません。
- 範囲 欠損値の範囲を指定する場合に使用します (1 歳から 17 歳、65 歳超など)。境界値が空欄のままの場合、その範囲は無制限になります。例えば、下限に 100 が指定されていて上限がない場合、100 以上のすべての値は欠‘¹値になります。各境界値は範囲に含まれます。例えば、下限が 5 で上限が 10 の範囲は、範囲定義に 5 と 10 も含まれます。欠損値範囲は、任意のストレージ・タイプに対して定義できます。これには、日付/時刻および文字列も含まれます (値が範囲内かどうかを決定するために、アルファベット順のソート順序が使用されます)。
- ヌル/空白文字 システムのヌル値 (データ内では
$null$と表示されます) と空白文字 (表示可能な文字を含まない文字列値) を空白として指定することもできます。注: 内部で別に格納され、特定のケースで別に処理されるにもかかわらず、データ型ノードも空白文字列のような空の文字列を分析のために扱います。
$null$ として空白をコード化するには、置換ノードを使用します。 説明 このテキスト ボックスを使用してフィールド ラベルを指定します。ラベルは、「ストリームのプロパティー」ダイアログ ボックスでの選択内容に応じて、 グラフ、テーブル、出力、モデル ブラウザーなどのさまざまな場所に表示されます。