Excel 源节点

Excel 源节点允许您从 Microsoft Excel 导入 .xlsx 文件格式的数据。

文件类型。选择要导入的 Excel 文件类型。

导入文件。指定要导入的电子表格文件的名称和位置。

使用指定的范围。选中此选项可以指定在 Excel 工作表中定义的单元格的指定范围。单击省略按钮 (...) 从可用范围列表中进行选择。如果使用指定范围,则其他工作表和数据范围设置将不再可用并最终被禁用。

选择工作表。按索引或者按名称指定要导入的工作表。

  • 按索引。指定要导入的工作表的索引值,开头的 0 表示第一个工作表,1 表示第二个工作表,依此类推。
  • 按名称。指定要导入的工作表的名称。单击省略按钮 (...) 从可用工作表列表中进行选择。

工作表范围。可以第一个非空行作为开始导入数据,也可通过单元格的显式范围导入数据。

  • 范围从第一个非空行开始。找到第一个非空单元格,并将此单元格作为数据范围的左上角单元格。
  • 单元格的显式范围。选中此选项可按行和列指定显式范围。例如,要指定 Excel 范围 A1:D5,您可以在第一个字段中输入 A1,在第二个字段中输入 D5,(或,R1C1R5C4)。指定范围内的所有行都将返回,包括空行。

在空行中。如果遇到多个空行,则可选择停止读取,或选择返回空行以继续读取所有数据(包括空行)直到工作表的末尾。

第一行存在列名称。表示指定范围中的第一行应作为字段(列)名使用。如果未选中此选项,那么将自动生成字段名称。

列和类型的扫描行数。如果希望 IBM® SPSS® Modeler 扫描更多 Excel 数据行以确定列类型和存储类型,那么可以增大此值。缺省值是 200 行。请注意,此设置可能会影响性能。

字段存储和测量级别

从 Excel 中读取值时,缺省情况下将按连续的测量级别读取以数值存储的字段,按名义读取以字符串存储的字段。可以在“类型”选项卡上手动更改测量级别(连续和名义),但存储类型是自动确定的(虽然必要时可在过滤节点或导出节点中使用转换函数,例如 to_integer,来更改此类型)。有关更多信息,请参阅设置字段存储类型和格式主题。

缺省情况下,将按数字类型读取以数字和字符串值混合存储的字段,这意味着在 IBM SPSS Modeler 中所有字符串值都将被设置为空(系统缺失)值。这是因为与 Excel 不同,IBM SPSS Modeler 不允许字段中存在混合的存储类型。要避免此问题,可以在 Excel 电子表格中手动将单元格格式设置为 文本 ,这样将按字符串读取所有的值(包括数字)。