Excel 來源節點
使用 Excel 來源節點可從 Microsoft Excel 以 .xlsx 檔案格式匯入資料。
檔案類型。 選取要匯入的 Excel 檔案類型。
匯入檔案。 指定要匯入的試算表檔案的名稱和位置。
使用已命名範圍。選中此選項可以指定在 Excel 工作表中定義的單元的指定範圍。按一下省略按鈕 ( ... ) 從可用範圍清單中進行選擇。如果使用指定範圍,則其他工作表和資料範圍設定將不再可用並最終被停用。
選擇工作表。 依索引或者依名稱指定要匯入的工作表。
- 依據索引。 指定要匯入的工作表的指標值,開頭的 0 表示第一個工作表,1 表示第二個工作表,依此類推。
- 依名稱。指定要匯入的工作表的名稱。按一下省略按鈕 ( ... ) 從可用工作表清單中進行選擇。
工作表中的範圍。可以第一個非空白列作為開始匯入資料,也可通過單元的明確地範圍匯入資料。
- 範圍從第一個非空白的列啟動。找到第一個非空白 Cell,並用作資料範圍的左上角。
- 單元的明確地範圍。選中此選項可按列和欄指定明確地範圍。例如,若要指定 Excel 範圍 A1:D5,您可以在第一個欄位中輸入 A1,在第二個欄位中輸入 D5(或分別輸入 R1C1 和 R5C4)。指定範圍內的所有列都將傳回,包含空白列。
在空白列中。如果遇到多個空白列,則可選擇停止讀取,或選擇傳回空白列以繼續讀取所有資料(包含空白列)直到工作表的末尾。
第一列包含直欄名稱。表示指定範圍中的第一列應作為欄位(欄)名使用。如果未選取此選項,那麼將自動產生欄位名稱。
直欄及類型的掃描行數。如果您想要 IBM® SPSS® Modeler 掃描更多列的 Excel 資料,以確定直欄類型和儲存類型,您可以增加此值。預設值為 200 列。請注意,此設定可能會影響效能。
欄位儲存和測量層次
從 Excel 中讀取值時,依預設將按連續的測量層次讀取以數值型儲存的欄位,按列名讀取以字串儲存的欄位。可以在「類型」標籤上手動變更測量層次(連續和列名),但儲存類型是自動決定的(雖然必要時可在「填入器」節點或衍生節點中使用轉換函數,例如 to_integer,來變更此類型)。請參閱設定欄位儲存類型和格式主題,以取得更多資訊。
依預設,將按數值類型讀取以數值和字串值混合儲存的欄位,這意味著在 IBM SPSS Modeler 中所有字串值都將被設定為無效(系統遺漏值)值。這是因為與 Excel 不同,IBM SPSS Modeler 不容許欄位中存在混合的儲存類型。要避免此問題,可以在 Excel 試算表中手動將 Cell 格式設定為文字,這樣將按字串讀取所有的值(包括數字)。