Codificación del juego de caracteres en archivos de sintaxis

La codificación del juego de caracteres de un archivo de sintaxis puede ser Unicode o una codificación de juego de caracteres. Un archivo Unicode puede contener caracteres de muchos juegos de caracteres diferentes. Los archivos de la página de códigos están restringidos a caracteres soportados en un idioma o entorno local específico. Por ejemplo, un archivo de página de códigos en una codificación de Europa occidental no puede contener caracteres japoneses ni chinos.

Lectura de archivos de sintaxis

Para leer archivos de sintaxis correctamente, el editor de la sintaxis debe saber la codificación de caracteres del archivo.

  • Los archivos con una marca de orden de byte UTF-8 Unicode se leen como codificación UTF-8 Unicode, independientemente de cualquier selección de codificación que realice. Esta marca de orden de byte está al principio del archivo, pero no se visualiza.
  • De forma predeterminada, los archivos sin información de codificación se leen como UTF-8 Unicode en el modo Unicode o la codificación de caracteres del entorno local actual en el modo de página de códigos. Para alterar temporalmente el comportamiento predeterminado, seleccione Unicode (UTF-8) o Codificación local.
  • Como declarado está habilitado si el archivo de sintaxis contiene un identificador de codificación de página de códigos en la parte superior del archivo. A partir del release 23, se inserta automáticamente un comentario en archivos de sintaxis que se guardan en la codificación de página de códigos. Por ejemplo, la primera línea del archivo podría ser:
    * Encoding: en_US.windows-1252.
    Si selecciona Como declarado, dicha codificación se utiliza para leer el archivo.

Almacenamiento de archivos de sintaxis

De forma predeterminada, los archivos de sintaxis se guardan como Unicode UTF-8 en el modo Unicode o la codificación de caracteres del entorno local actual en el modo de página de códigos. Para alterar temporalmente el comportamiento predeterminado, seleccione Unicode (UTF-8) o Codificación local en el diálogo Guardar sintaxis como.

  • Si guarda un archivo de sintaxis nuevo o guarda el archivo en una codificación diferente, se inserta un comentario en la parte superior del archivo que identifica la codificación. Si ya está presente un comentario de codificación, se sustituye.
  • Si guarda un archivo de sintaxis y, después, lo vuelve a guardar sin cerrarlo, se guarda en la misma codificación.