UNICODE 子命令

SET UNICODE NO|YES 控制用于确定用于读写数据文件和语法文件的编码的缺省行为。

否。 使用当前语言环境设置来确定用于读写数据和命令语法文件的编码。 这称为 代码页方式。 别名为 OFF 有关当前语言环境设置的信息,请参阅 LOCALE 子命令 (SET 命令)

是。 使用 Unicode 编码 (UTF-8) 来读写数据和命令语法文件。 这称为 Unicode 方式。 别名为 ON。 这是缺省值。

  • 仅当没有打开的数据源时,才能更改 UNICODE 设置。
  • UNICODE 设置在会话之间持久存在,并在显式更改之前保持有效。

对于 Unicode 方式和 Unicode 文件有许多重要的影响:

  • 在 16.0之前的发行版中不应使用以 Unicode 编码保存的数据和语法文件。
  • 以 Unicode 方式读取代码页数据文件时,所有字符串变量的限定宽度扩大为原来的三倍。 您可以使用 ALTER TYPE 来自动调整所有字符串变量的宽度。
  • GET 命令确定来自文件本身的 IBM® SPSS® Statistics 数据文件的文件编码,而不考虑当前方式设置 (并且代码页文件中定义的字符串变量宽度在 Unicode 方式下增加了两倍)。请参阅主题 GET 以获取更多信息。
  • 对于语法文件,在执行包含 SET UNICODE的命令块 之后 将更改编码。 例如,如果您当前处于代码页方式,那么在切换到 Unicode 之前,必须从包含本地编码无法识别的 Unicode 字符的后续命令单独运行 SET UNICODE=YES