从文本文件读取数据

文本文件表示另一个公共数据源。许多电子表格程序和数据库都可采用多种文本文件格式的一种来保存其内容。逗号分隔文件或制表符分隔文件是指使用逗号或制表符来指示每个变量的数据行。在此示例中,数据是以制表符分隔的。

  1. 从菜单中选择:

    文件 > 导入数据 > 文本数据

  2. 转至 Samples\English 文件夹并选择 demo.txt

    文本导入向导将指导您完成有关如何解释指定文本文件的定义过程。

    图 1. 文本导入向导:第 1步,共 6 步
    文本导入向导:第 1步,共 6 步
  3. 在第 1 步中,可以选择预定义的格式或在向导中创建新格式。选择
  4. 单击下一步继续。

    正如前面所述,此文件使用制表符分隔格式。并且,变量名是在此文件的顶行中定义的。

  5. 在向导的步骤 2 中,选择分隔以指示文件具有分隔格式结构。
  6. 选择以指示文件在文件顶部包含变量名称。
  7. 单击下一步继续。
  8. 在步骤 3 中,输入 2 作为数据第一个个案的开始行号(因为变量名称位于第一行)。
  9. 将此步骤中的其余数据保留为缺省值,然后单击下一步以继续操作。

    第 4 步中的“数据预览”可提供一种快速的方式来确保文件被正确读取。

  10. 选择制表符,然后取消选择分隔符的其他选项。缺省情况下选择空格,因为文件包含空格。对于此文件,空格是数据值的一部分,而非定界符。您需要取消选择空格以正确读取文件。
  11. 选择除去字符串值的前导空格。字符串值开头的空格影响在表达式中对字符串值求值的方式。在此文件中,Gender 的某些值具有不属于值的前导空格。如果未除去这些空格,那么值“ f”将被视为与“f”不同的值。
    图 2. 文本导入向导:第 4 步,共 6 步
    文本导入向导:第 4步,共 6 步,选择定界符并除去前导空格
  12. 单击下一步继续。

    由于为了符合命名规则,变量名称可能已修改,所以使用步骤 5 可以编辑任何不合意的名称。

    还可在此处定义数据类型。例如,您可以将 Income 更改为美元货币格式。

    要更改数据类型:

  13. 数据预览中,选择 Income
  14. 从“数据格式”下拉列表中选择美元
    图 3. 更改数据类型
    已选择 Income 变量的“文本导入向导”第 5 步。对于变量的数据格式,选择了 Dollar。

    变量 MaritalStatus 包含字符串和数字值。不到 5% 的值是字符串。对于 确定自动数据格式的百分比值使用缺省设置 95%,变量将被视为数字值并且字符串值将设置为系统缺失。如果没有数据格式满足百分比值,那么变量将被视为字符串变量。如果将设置更改为 100,那么将保留所有值,但是所有数字值将被视为字符串。

  15. 单击下一步继续。
  16. 保留最后一步中的缺省选择,然后单击完成以导入数据。