Utilisation des caractères non ASCII

Pour utiliser des caractères non ASCII, Python requiert un encodage et un décodage explicites des chaînes en Unicode. Dans SPSS Modeler, les scripts Python sont supposés être codés en UTF-8, qui est un codage Unicode standard prenant en charge les caractères non ASCII. Le script suivant sera compilé car le compilateur Python a été défini sur UTF-8 par SPSS Modeler.

Exemple de script illustrant des caractères japonais. Le noeud créé a un libellé incorrect.

Cependant, le noeud résultant contient un libellé incorrect.

Figure 1 : Libellé de noeud contenant des caractères non ASCII affiché incorrectement

Le libellé est incorrect car le littéral chaîne a lui-même été converti en une chaîne ASCII par Python.

Python permet de spécifier des littéraux chaîne Unicode en ajoutant un préfixe de caractères avant le littéral chaîne:

Exemple de script illustrant des caractères japonais. Le noeud créé possède le libellé correct.

Une chaîne Unicode est créée et le libellé s'affiche correctement.

Figure 2. Libellé de noeud contenant des caractères non ASCII affiché correctement

L'utilisation de Python et d'Unicode est un vaste sujet qui dépasse la portée de ce document. De nombreux ouvrages et de nombreuses ressources en lignes traitant en détail de ce sujet sont à votre disposition.