Sous-commande ENCODING (commande GET SAS)
La sous-commande ENCODING spécifie le codage de caractères du fichier de données SAS.
- Le codage doit être correctement identifié ou le fichier ne peut pas être lu.
- S'il existe des fichiers de formats, le codage du fichier de formats doit être identique à celui du fichier de données. Pour plus d'informations, voir la rubrique Sous-commande FORMATS (commande GET SAS) .
- La sous-commande est suivie d'un signe égal facultatif et d'une valeur de codage entre guillemets.
- La valeur entre guillemets peut être l'une des valeurs de la colonne Codage de la table de codage de caractères ou "UTF-8" pour le codage Unicode UTF-8 .
- Le codage par défaut est "Locale", qui correspond au codage de l'environnement local IBM® SPSS® Statistics en cours. Pour plus d'informations, voir la rubrique Sous-commande LOCALE (commande SET) .
Exemple
GET SAS DATA='/data/elect.sas7bdat'
/ENCODING='Windows-1252'.
| Jeu de caractères | Encodage |
|---|---|
| IBM SPSS Statistics Paramètres régionaux | Env. local |
| Environnement local du système d'exploitation | Système |
| occidental | ISO-8859-1 |
| occidental | ISO-8859-15 |
| occidental | IBM850 |
| occidental | Windows-1252 |
| Celtique | ISO-8859-14 |
| Grec | ISO-8859-7 |
| Grec | Windows-1253 |
| Scandinavie | ISO-8859-10 |
| Baltique | Windows-1257 |
| Europe centrale | IBM852 |
| Europe centrale | ISO-8859-2 |
| alphabet cyrillique | IBM855 |
| alphabet cyrillique | ISO-8859-5 |
| alphabet cyrillique | Windows-1251 |
| Cyrillique / Russe | CP-866 |
| Chinois simplifié | GBK |
| Chinois simplifié | ISO-2022-CN |
| Chinois traditionnel | Big5 |
| Chinois traditionnel | EUC-TW |
| Japonais | EUC-JP |
| Japonais | ISO-2022-JP |
| Japonais | Shift-JIS |
| Coréen | EUC-KR |
| Thaï | Windows-874 |
| Turc | IBM857 |
| Turc | ISO-8859-9 |
| Arabe | Windows-1256 |
| Arabe | IBM864 |
| Hébreu | ISO-8859-8 |
| Hébreu | Windows-1255 |
| Hébreu | IBM862 |