设置“变量文件”节点的选项

请在““变量文件”节点”对话框的“文件”选项卡上设置选项。

文件指定文件名。可以输入文件名或单击省略按钮 ( ... ) 来选择文件。您一旦选择了文件，文件路径就会显示，并且文件内容将与定界符一起显示在下面的面板中。

您可以复制所显示的来自数据源的样本文本，并将其粘贴到下列控件中：EOL 注释字符和用户指定的定界符。使用 Ctrl-C 和 Ctrl-V 进行复制和粘贴。

从文件中读取文件名此选项在缺省情况下处于选中状态，用于将数据文件中的第一行作为列的标签进行处理。如果第一行不是标题，则取消选中此选项，针对数据集中的字段数为每个字段自动分配一个一般名称，例如 Field1, Field2 。

指定字段数。指定每个记录中的字段数。只要记录以新行结束，就可以自动检测字段数。也可以手动设置字段数。

跳过标题字符。指定要忽略第一个记录的开头处的多少个字符。

EOL 注解字符。指定字符（例如 # 或 !）表示数据中的注解。无论这些字符之一出现在数据文件的何处，从该字符起直到下一个新行字符（不包括）之前的所有字符都将被忽略。

去除开头和结尾的空格。选中选项可废弃导入字符串中开头和结尾的空格。

注：在使用与不使用 SQL 回送的字符串之间的对比可能生成存在尾部空格的不同结果。

无效字符。选择丢弃以删除数据源中的无效字符。选择替换为用指定的符号（仅含一个字符）替换无效字符。无效字符为空字符或指定的编码方法中不存在的任何字符。

编码。指定使用的文本编码方法。您可以选择系统缺省值、流缺省值或 UTF-8。

系统缺省值在 Windows 控制面板中指定，如果以分布式模式运行，则在服务器计算机上指定。
流缺省值在“流属性”对话框中指定。

小数符号请选择数据源中使用的小数分隔符类型。流缺省值是从流属性对话框的“选项”选项卡中选择的字符。否则，在此对话框中选择句号 (.) 或逗号 (,) 作为小数分隔符读取所有的数据。

行定界符是换行符要将换行符用作行定界符，而非用作字段分隔符，请选中此选项。例如，如果由于行中的分隔符数为奇数而导致换行，那么此选项非常有用。请注意，选择此选项表示您将无法选择“分隔符”列表中的换行。

注：如果选中此选项，那么将去除数据行末尾的所有空白值。

定界符。通过使用针对此控件列出的复选框，可以指定哪些字符（例如逗号 (,)）定义文件中的字段边界。也可以为使用多个定界符的记录指定一个以上的定界符，例如“, |”。缺省的定界符是逗号。

注：如果还将逗号定义为小数分隔符，那么此处的缺省设置不会起作用。如果逗号既是字段定界符又是小数分隔符，则可在定界符列表中选择其他。然后在输入字段中手动指定逗号。

选择允许使用多个空白定界符可将多个相邻的空白定界符字符看作一个定界符。例如，如果在一个数据值之后隔四个空格又有一个数据值，则这组数据将被看作是两个而不是五个字段。

要在其中扫描列和类型的行数请指定要在其中扫描所指定数据类型的行数和列数。

自动识别日期和时间要使 IBM® SPSS® Modeler 能够自动尝试将数据条目识别为日期或时间，请选中此复选框。例如，这意味着 07-11-1965 之类的条目将被识别为日期，而 02:35:58 之类的条目将被识别为时间；然而，不明确的条目（例如 07111965 或 023558）由于数字之间没有分隔符而将显示为整数。

注：为了避免使用来自先前 IBM SPSS Modeler 版本的数据文件时出现潜在的数据问题，缺省情况下，对于在 V13 以前的版本中保存的信息，未选中此复选框。

将方括号视为列表如果选中此复选框，那么会将括在左右方括号之间的数据视为单个值，即使该内容包含逗号和双引号之类的定界字符也是如此。例如，这可能包括两个或三个维度地理空间数据，在这些数据中，括在方括号内的坐标作为单个列表项进行处理。有关更多信息，请参阅将地理空间数据导入到“变量文件”节点中。

引号。通过使用下拉列表，可以指定导入时如何处理单引号和双引号。可以选择丢弃所有引号，选择包含为文本将这些引号包括在字段值内，或选择成对丢弃匹配成对引号然后删除它们。如果引号不匹配，则将收到错误消息。选择丢弃和成对丢弃都会将字段值（不带引号）按一个字符串存储。

注：使用成对丢弃时，将保留空格。使用丢弃时，将移除引号内外结尾的空格（例如：'" ab c" , "d ef " , " gh i " ' 将变成

'ab c, d ef, gh
i'

）。使用包含为文本时，引号将视为常规符号，因此将自然去除开头和结尾的空格。

在此对话框中操作的任何时刻，都可单击刷新以从数据源重新加载字段。在更改到源节点的数据连接时，或在对话框的选项卡之间进行操作时，此操作都非常有用。