语法文件中的字符集编码

语法文件的字符集编码可以是 Unicode 或代码页编码。Unicode 文件可以包含许多不同字符集中的字符。代码页文件限制为在特定语言或语言环境中受支持的字符。例如,采样西欧编码的代码页文件不能包含日语或中文字符。

读取语法文件

要正确地读取语法文件,语法编辑器需要知道文件的字符编码。

  • 包含 Unicode UTF-8 字节顺序标记的文件将作为 Unicode UTF-8 编码进行读取,而无论您选择的是哪种编码。此字节顺序标记位于文件开头,但未显示出来。
  • 缺省情况下,未包含任何编码信息的文件将作为 Unicode UTF-8(在 Unicode 方式下)或当前语言环境字符编码(在代码页方式下)进行读取。要覆盖缺省行为,请选择 Unicode (UTF-8)本地编码
  • 如果语法文件顶部包含代码页编码标识,那么按照声明将处于启用状态。从 R23 开始,将自动在以代码页编码进行保存的语法文件中插入注释。例如,文件的第一行可能如下所示:
    * Encoding: en_US.windows-1252.
    如果您选择了按照声明,那么该编码将用于读取文件。

保存语法文件

缺省情况下,语法文件将以 Unicode UTF-8(在 Unicode 方式下)或当前语言环境字符编码(在代码页方式下)进行保存。要覆盖缺省行为,请在“将语法另存为”对话框中选择 Unicode (UTF-8)本地编码

  • 如果您保存新的语法文件或者以其他编码保存文件,那么文件顶部将插入一个标识编码的注释。如果编码注释已存在,它将被替换掉。
  • 如果您在保存语法文件后未将其关闭就再次保存,那么该文件将以同一编码进行保存。