使用非 ASCII 字元

要使用非 ASCII 字元,Python 需要明確地將字串編碼和解碼為 Unicode。在 IBM® SPSS® Modeler 中,假定 Python Script 採用 UTF-8 進行編碼,這是支援非 ASCII 字元的標準 Unicode 編碼。下列 Script 將執行編譯,這是因為 SPSS Modeler 已將 Python 編譯器設定為 UTF-8。

顯示日文字元的 Scripting 範例。所建立的節點將具有不正確的標籤。

但是,產生的節點將具有不正確的標籤。

圖 1. 錯誤顯示的包含非 ASCII 字元的節點標記
Node label containing non-ASCII characters, displayed
incorrectly

標籤不正確,因為 Python 已將字串文字自身轉換為 ASCII 字串。

Python 通過在字串文字前新增 u 字元字首來支援指定 Unicode 字串文字:

顯示日文字元的 Scripting 範例。所建立的節點將具有正確的標籤。

這將建立 Unicode 字串,並且將正確顯示標籤。

圖 2. 正確顯示的包含非 ASCII 字元的節點標記
Node label containing non-ASCII characters, displayed
correctly

使用 Python 和 Unicode 是一個非常大的主題,它超出了本文件的範圍。提供了多數對此主題進行了更詳細介紹的書籍和線上資源。