设置“变量文件”节点的选项
请在““变量文件”节点”对话框的“文件”选项卡上设置选项。
文件 指定文件名。可以输入文件名或单击省略按钮 ( ... ) 来选择文件。您一旦选择了文件,文件路径就会显示,并且文件内容将与定界符一起显示在下面的面板中。
您可以复制所显示的来自数据源的样本文本,并将其粘贴到下列控件中:EOL 注释字符和用户指定的定界符。使用 Ctrl-C 和 Ctrl-V 进行复制和粘贴。
从文件中读取文件名 此选项在缺省情况下处于选中状态,用于将数据文件中的第一行作为列的标签进行处理。如果第一行不是标题,则取消选中此选项,针对数据集中的字段数为每个字段自动分配一个一般名称,例如 Field1, Field2 。
指定字段数。指定每个记录中的字段数。只要记录以新行结束,就可以自动检测字段数。也可以手动设置字段数。
跳过标题字符。指定要忽略第一个记录的开头处的多少个字符。
EOL 注解字符。指定字符(例如 # 或 !)表示数据中的注解。无论这些字符之一出现在数据文件的何处,从该字符起直到下一个新行字符(不包括)之前的所有字符都将被忽略。
去除开头和结尾的空格。选中选项可废弃导入字符串中开头和结尾的空格。
无效字符。选择丢弃以删除数据源中的无效字符。选择 替换为 用指定的符号(仅含一个字符)替换无效字符。无效字符为空字符或指定的编码方法中不存在的任何字符。
编码。指定使用的文本编码方法。您可以选择系统缺省值、流缺省值或 UTF-8。
- 系统缺省值在 Windows 控制面板中指定,如果以分布式模式运行,则在服务器计算机上指定。
- 流缺省值在“流属性”对话框中指定。
小数符号 请选择数据源中使用的小数分隔符类型。流缺省值是从流属性对话框的“选项”选项卡中选择的字符。否则,在此对话框中选择句号 (.) 或逗号 (,) 作为小数分隔符读取所有的数据。
行定界符是换行符 要将换行符用作行定界符,而非用作字段分隔符,请选中此选项。例如,如果由于行中的分隔符数为奇数而导致换行,那么此选项非常有用。请注意,选择此选项表示您将无法选择“分隔符”列表中的换行。
定界符。通过使用针对此控件列出的复选框,可以指定哪些字符(例如逗号 (,))定义文件中的字段边界。也可以为使用多个定界符的记录指定一个以上的定界符,例如“, |”。缺省的定界符是逗号。
选择 允许使用多个空白定界符 可将多个相邻的空白定界符字符看作一个定界符。例如,如果在一个数据值之后隔四个空格又有一个数据值,则这组数据将被看作是两个而不是五个字段。
要在其中扫描列和类型的行数 请指定要在其中扫描所指定数据类型的行数和列数。
自动识别日期和时间 要使 IBM® SPSS® Modeler 能够自动尝试将数据条目识别为日期或时间,请选中此复选框。例如,这意味着 07-11-1965 之类的条目将被识别为日期,而 02:35:58 之类的条目将被识别为时间;然而,不明确的条目(例如 07111965 或 023558)由于数字之间没有分隔符而将显示为整数。
将方括号视为列表 如果选中此复选框,那么会将括在左右方括号之间的数据视为单个值,即使该内容包含逗号和双引号之类的定界字符也是如此。例如,这可能包括两个或三个维度地理空间数据,在这些数据中,括在方括号内的坐标作为单个列表项进行处理。有关更多信息,请参阅将地理空间数据导入到“变量文件”节点中。
'" ab c" , "d ef " , " gh i " ' 将变成 'ab c, d ef, gh
i')。使用包含为文本时,引号将视为常规符号,因此将自然去除开头和结尾的空格。在此对话框中操作的任何时刻,都可单击刷新以从数据源重新加载字段。在更改到源节点的数据连接时,或在对话框的选项卡之间进行操作时,此操作都非常有用。