设置“变量文件”节点的选项

请在““变量文件”节点”对话框的“文件”选项卡上设置选项。

文件 指定文件名。可以输入文件名或单击省略按钮 ( ... ) 来选择文件。您一旦选择了文件,文件路径就会显示,并且文件内容将与定界符一起显示在下面的面板中。

您可以复制所显示的来自数据源的样本文本,并将其粘贴到下列控件中:EOL 注释字符和用户指定的定界符。使用 Ctrl-C 和 Ctrl-V 进行复制和粘贴。

从文件中读取文件名 此选项在缺省情况下处于选中状态,用于将数据文件中的第一行作为列的标签进行处理。如果第一行不是标题,则取消选中此选项,针对数据集中的字段数为每个字段自动分配一个一般名称,例如 Field1, Field2

指定字段数。指定每个记录中的字段数。只要记录以新行结束,就可以自动检测字段数。也可以手动设置字段数。

跳过标题字符。指定要忽略第一个记录的开头处的多少个字符。

EOL 注解字符。指定字符(例如 # 或 !)表示数据中的注解。无论这些字符之一出现在数据文件的何处,从该字符起直到下一个新行字符(不包括)之前的所有字符都将被忽略。

去除开头和结尾的空格。选中选项可废弃导入字符串中开头和结尾的空格。

注: 在使用与不使用 SQL 回送的字符串之间的对比可能生成存在尾部空格的不同结果。

无效字符。选择丢弃以删除数据源中的无效字符。选择 替换为 用指定的符号(仅含一个字符)替换无效字符。无效字符为空字符或指定的编码方法中不存在的任何字符。

编码。指定使用的文本编码方法。您可以选择系统缺省值、流缺省值或 UTF-8。

  • 系统缺省值在 Windows 控制面板中指定,如果以分布式模式运行,则在服务器计算机上指定。
  • 流缺省值在“流属性”对话框中指定。

小数符号 请选择数据源中使用的小数分隔符类型。流缺省值是从流属性对话框的“选项”选项卡中选择的字符。否则,在此对话框中选择句号 (.)逗号 (,) 作为小数分隔符读取所有的数据。

行定界符是换行符 要将换行符用作行定界符,而非用作字段分隔符,请选中此选项。例如,如果由于行中的分隔符数为奇数而导致换行,那么此选项非常有用。请注意,选择此选项表示您将无法选择“分隔符”列表中的换行

注: 如果选中此选项,那么将去除数据行末尾的所有空白值。

定界符。通过使用针对此控件列出的复选框,可以指定哪些字符(例如逗号 (,))定义文件中的字段边界。也可以为使用多个定界符的记录指定一个以上的定界符,例如“, |”。缺省的定界符是逗号。

注: 如果还将逗号定义为小数分隔符,那么此处的缺省设置不会起作用。如果逗号既是字段定界符又是小数分隔符,则可在定界符列表中选择 其他 。然后在输入字段中手动指定逗号。

选择 允许使用多个空白定界符 可将多个相邻的空白定界符字符看作一个定界符。例如,如果在一个数据值之后隔四个空格又有一个数据值,则这组数据将被看作是两个而不是五个字段。

要在其中扫描列和类型的行数 请指定要在其中扫描所指定数据类型的行数和列数。

自动识别日期和时间 要使 IBM® SPSS® Modeler 能够自动尝试将数据条目识别为日期或时间,请选中此复选框。例如,这意味着 07-11-1965 之类的条目将被识别为日期,而 02:35:58 之类的条目将被识别为时间;然而,不明确的条目(例如 07111965 或 023558)由于数字之间没有分隔符而将显示为整数。

注: 为了避免使用来自先前 IBM SPSS Modeler 版本的数据文件时出现潜在的数据问题,缺省情况下,对于在 V13 以前的版本中保存的信息,未选中此复选框。

将方括号视为列表 如果选中此复选框,那么会将括在左右方括号之间的数据视为单个值,即使该内容包含逗号和双引号之类的定界字符也是如此。例如,这可能包括两个或三个维度地理空间数据,在这些数据中,括在方括号内的坐标作为单个列表项进行处理。有关更多信息,请参阅将地理空间数据导入到“变量文件”节点中

引号。通过使用下拉列表,可以指定导入时如何处理单引号和双引号。可以选择 丢弃 所有引号,选择 包含为文本 将这些引号包括在字段值内,或选择 成对丢弃 匹配成对引号然后删除它们。如果引号不匹配,则将收到错误消息。选择 丢弃 成对丢弃 都会将字段值(不带引号)按一个字符串存储。
注: 使用成对丢弃时,将保留空格。使用丢弃时,将移除引号内外结尾的空格(例如:'" ab c" , "d ef " , " gh i " ' 将变成 'ab c, d ef, gh i')。使用包含为文本时,引号将视为常规符号,因此将自然去除开头和结尾的空格。

在此对话框中操作的任何时刻,都可单击刷新以从数据源重新加载字段。在更改到源节点的数据连接时,或在对话框的选项卡之间进行操作时,此操作都非常有用。