Compatibilidad con Unicode en IBM SPSS Modeler

IBM® SPSS Modeler es totalmente compatible con Unicode, tanto en IBM SPSS Modeler como IBM SPSS Modeler Server. Esto posibilita el intercambio de datos con otras aplicaciones que admiten Unicode, incluidas las bases de datos multilingües, sin pérdida de información que pudiera haberse originado por la conversión desde o a una combinación de codificación específicas de la configuración regional.

IBM SPSS Modeler almacena los datos Unicode internamente y puede leer y escribir datos multilingües almacenados como Unicode en bases de datos sin peligro de pérdida.
IBM SPSS Modeler puede leer y escribir archivo de texto codificados con UTF-8. La importación y exportación de archivos de texto se configura de forma predeterminada con codificación regional, pero admite UTF-8 como alternativa. Esta configuración se puede especificar en los nodos de importación y exportación de archivos, pero también se puede cambiar la configuración predeterminada en el cuadro de diálogo de propiedades de la ruta. Consulte Configuración de opciones generales de las rutas para obtener más información.
Estadísticas, SAS y los archivos de datos de texto almacenados en la codificación de configuración regional se convertirán a UTF-8 en la importación y de lo harán de nuevo al exportar. Al escribir en cualquier archivo, si hay caracteres Unicode que no existen en el conjunto de caracteres de la configuración regional, esto se sustituye previa aparición de una advertencia. Esto debería ocurrir únicamente en el caso en que los datos se hayan importado de un origen de datos compatible con Unicode (una base de datos o un archivo de texto UTF-8) que contenga caracteres de un conjunto de caracteres de una o varias configuraciones regionales diferentes.
Las imágenes de IBM SPSS Modeler Solution Publisher tienen codificación UTF-8 y son totalmente intercambiables entre plataformas y configuraciones regionales.

Acerca de Unicode

El propósito del estándar Unicode es proporcionar una forma coherente de codificar texto multilingüe para que se pueda visualizar correctamente a través de diferentes fronteras, configuraciones locales y aplicaciones. El estándar Unicode, ahora en su versión 4.0.1, define un conjunto de caracteres formado por un superconjunto de todos los conjuntos de caracteres de uso común en el mundo actual en el que se asigna a cada carácter un nombre y punto de código exclusivo. Los caracteres y sus puntos de codificación son idénticos a los del conjunto de caracteres universales UCS (del inglés Universal Character Set) definidos por ISO-10646. Si desea obtener más información, consulte la página de inicio de Unicode.