Utilización de caracteres no ASCII

Para utilizar caracteres no ASCII, Python requiere la codificación y descodificación explícitas de las cadenas en Unicode. En IBM® SPSS Modeler, se presupone que los scripts Python están codificados UTF-8, la cual es una codificación Unicode estándar que da soporte a caracteres no ASCII. El script siguiente se compilará porque SPSS Modeler ha establecido el compilador Python en UTF-8.

Ejemplo de script con caracteres japoneses. El nodo creado tiene una etiqueta incorrecta.

Sin embargo, el nodo resultante tendrá una etiqueta incorrecta.

Node label containing non-ASCII characters, displayed incorrectly — Figura 1. Etiqueta del nodo que contiene caracteres no ASCII, visualiza incorrectamente

La etiqueta es incorrecta porque Python ha convertido el propio literal de serie en una cadena ASCII.

Python permite que los literales de cadenas Unicode se especifiquen añadiendo un prefijo con el carácter u antes del literal de cadena:

Ejemplo de script con caracteres japoneses. El nodo creado tiene la etiqueta correcta.

Esto crear una cadena Unicode y la etiqueta aparecerá correctamente.

Node label containing non-ASCII characters, displayed correctly — Figura 2. Etiqueta de nodo que contiene caracteres no ASCII, visualizados correctamente

La utilización de Python y Unicode es un tema de gran volumen que no entra dentro del ámbito de este documento. Existen muchas publicaciones y recursos en línea disponibles que describen detalladamente este tema.