Excel 入力ノード

Excel 入力ノードでは、Microsoft Excel から .xlsx ファイル形式でデータをインポートできます。

ファイルの種類。インポートする Excel ファイルを選択します。

インポート・ファイル。インポートするスプレッドシートの名前と場所を指定します。

名前付き範囲を使用。Excel ワークシート内で定義された名前付きのセルの範囲を指定できるようになります。省略記号ボタン (「...」) をクリックして、利用できる範囲のリストから選択します。名前付きの範囲が使用されると、その他のワークシートとデータ範囲の設定が以後適用不能になり、結果として無効になります。

ワークシートを選択。インデックスまたは名前のどちらかで、インポートするワークシートを指定します。

インデックスごと。インポートするワークシートのインデックス値を、最初のワークシートの 0 から始まり、2 番目のワークシートは 1 というように指定します。
名前ごと。省略記号ボタン (「...」) をクリックして、利用できるワークシートのリストから選択します。

ワークシートの範囲。最初の空白でない行から、または明示したセルの範囲のデータをインポートできます。

範囲の始点は最初に値を含む行。最初の空白でないセルに位置決めして、これをデータ範囲の左上隅として使用します。
セルの明示的な範囲。行と列で明示した範囲を指定できるようになります。例えば、Excel の範囲 A1:D5 を指定するには、最初のフィールドで A1 と、2 番目のフィールドで D5 (または、R1C1 および R5C4) と入力します。指定した範囲内のすべての行が、空白行も含めて、返されます。

空白行。複数の空白行があると、そこで「読み込みの停止」することを選択するか、その空白行も含めてワークシートの最後まですべてのデータを読み込むために「空白行を返す」を選択することができます。

最初の行に列名を指定。指定された範囲の最初の行がフィールド (列) 名として使用されることを示します。選択されないと、フィールド名が自動的に生成されます。

列およびデータ型についてスキャンする行。列タイプおよびストレージ・タイプを判別するために IBM® SPSS® Modeler で Excel データのより多くの行をスキャンする場合は、この値を大きくすることができます。デフォルトは 200 行です。なお、この設定はパフォーマンスに影響する可能性があります。

フィールドのストレージと尺度

Excel から値を読み込むときに、数値のストレージ付きのフィールドの尺度は連続型として読み取られ、文字列フィールドは名義型として読み取られます。「データ型」タブで尺度 (連続型と名義型) を変更できますが、ストレージは自動的に決定されます。ただし、必要に応じて、置換ノードまたはフィールド作成ノードで to_integer などの変換関数を使用して、ストレージを変更することもできます。詳しくは、フィールドのストレージと形式の設定のトピックを参照してください。

デフォルトでは、数値と文字列値の混在は数字として読み込まれます。つまり、すべての文字列値は、IBM SPSS Modeler 内でヌル (システム欠損値) に設定されます。Excel とは異なり、IBM SPSS Modeler ではフィールド内でのストレージ・タイプの混在が許可されていないため、この現象が発生します。これを避けるには、Excel スプレッドシート内でセルの形式を手動で「テキスト」に設定します。そのようにすると、すべての値 (数字も含めて) が文字列として読み込まれます。