ASCII가 아닌 문자 사용

ASCII가 아닌 문자를 사용하려면 Python에서 문자열을 유니코드로 명시적으로 인코딩 및 디코딩해야 합니다. SPSS Modeler에서 Python 스크립트는 비ASCII 문자를 지원하는 표준 유니코드 인코딩인 UTF-8로 인코딩되는 것으로 가정합니다. Python 컴파일러가 SPSS Modeler에 의해 UTF-8 로 설정되었기 때문에 다음 스크립트가 컴파일됩니다.

일본어 문자를 표시하는 스크립팅 예제입니다. 작성된 노드에 올바르지 않은 레이블이 있습니다.

그러나 결과 노드에 올바르지 않은 레이블이 있습니다.

그림 1. ASCII가 아닌 문자를 포함하는 노드 레이블이 올바르지 않게 표시됨

문자열 리터럴 자체가 Python에 의해 ASCII 문자열로 변환되었기 때문에 레이블이 올바르지 않습니다.

Python 을 사용하면 문자열 리터럴 앞에 문자 접두부를 추가하여 유니코드 문자열 리터럴을 지정할 수 있습니다.

일본어 문자를 표시하는 스크립팅 예제입니다. 작성된 노드에 올바른 레이블이 있습니다.

이것은 유니코드 문자열을 작성하며 레이블이 올바르게 나타납니다.

그림 2. ASCII가 아닌 문자를 포함하는 노드 레이블이 올바르게 표시됨

Python 및 유니코드를 사용하는 것은 이 문서의 범위를 벗어난 큰 주제입니다. 이 주제를 상세하게 다루는 많은 서적 및 온라인 자원이 사용 가능합니다.