Jeux de codes pour le support multiculturel

Editer en ligne

La globalisation d' AIX® est basée sur l'hypothèse que tous les jeux de codes peuvent être divisés en n'importe quel nombre de jeux de caractères.

Pour comprendre les jeux de codes, il est d'abord nécessaire de comprendre les jeux de caractères. Un jeu de caractères est une collection de caractères prédéfinis basée sur les besoins spécifiques d'une ou plusieurs langues sans tenir compte des valeurs de codage utilisées pour représenter les caractères. Le choix du jeu de codes à utiliser dépend des exigences de traitement des données de l'utilisateur. Un jeu de caractères particulier peut être codé à l'aide de différents schémas de codage. Par exemple, le jeu de caractères ASCII définit l'ensemble des caractères trouvés dans la langue anglaise. Le jeu de caractères JIS (Japanese Industrial Standard) définit l'ensemble des caractères utilisés dans la langue japonaise. Les jeux de caractères anglais et japonais peuvent être codés à l'aide de différents jeux de codes.

Une page de codes est similaire à un jeu de codes, avec la limitation qu'une spécification de page de codes est basée sur une matrice de 16 colonnes par 16 lignes. L'intersection de chaque colonne et ligne définit un caractère codé.

Tenez compte des éléments suivants lorsque vous utilisez des jeux de codes :

Ne supposez pas que la taille de tous les caractères est de 8 bits ou 1 octet. Les caractères peuvent être de 1, 2, 3, 4 octets ou plus.
Ne supposez pas le codage d'un jeu de codes.
Ne codez pas en dur les noms des jeux de codes, des environnements locaux ou des polices car cela peut avoir une incidence sur la portabilité.

Les jeux de codes suivants sont pris en charge :

La prise en charge des jeux de codes standard de l'industrie est fournie. La famille de jeux de codes ISO8859 fournit une gamme de prise en charge de jeux de codes à un octet qui comprend :
- Latin-1
- Latin-2
- Latin-4
- Cyrillique
- Arabe
- Grec
- Hébreu
- Turc
Les jeux de codes standard de l'industrie suivants sont disponibles :
- Le jeu de codes IBM-eucJP est le jeu de codes standard de l'industrie utilisé pour prendre en charge l'environnement local japonais.
- Le jeu de codes IBM-eucKR est le jeu de codes standard de l'industrie utilisé pour prendre en charge les pays utilisant le coréen.
- Le jeu de codes IBM-eucTW est le jeu de codes standard de l'industrie utilisé pour prendre en charge les pays utilisant le chinois traditionnel.
- Le jeu de codes IBM-eucCN est le jeu de codes standard de l'industrie utilisé pour prendre en charge les pays utilisant le chinois simplifié.
- Le jeu de codes UTF-8 est un format de transformation universel d'Unicode/ISO10646 utilisé pour prendre en charge plusieurs langues à la fois (notamment le chinois simplifié, le chinois traditionnel et les caractères chinois utilisés en japonais et en coréen).
Le jeu de codes standard ISO8859-15 est une norme de remplacement pour le jeu de codes ISO8859-1 existant et actuellement utilisé par les environnements locaux d'Europe occidentale, des Etats-Unis et du Canada. Le besoin d'un autre jeu de codes a résulté de l'introduction de l'unité monétaire euro et de la nécessité pour les pays européens de pouvoir effectuer des transactions commerciales en utilisant l'euro. En outre, ISO8859-15 contient 7 caractères supplémentaires pour les langues française et finnoise.
Une prise en charge est également fournie pour les jeux de codes sur ordinateur personnel (PC) IBM-856, IBM-943 et IBM-1046. IBM-856 est un jeu de codes à un octet utilisé pour prendre en charge les pays utilisant l'hébreu. IBM-943 est un jeu de codes multi-octets utilisé pour prendre en charge l'environnement local japonais. IBM-1046 est un jeu de codes à un octet utilisé pour prendre en charge les pays utilisant l'arabe.
IBM-1129 est un jeu de codes à un octet utilisé pour prendre en charge le vietnamien.
TIS-620 est un jeu de codes à un octet utilisé pour prendre en charge le thaï.
IBM-1124 est un jeu de codes à un octet utilisé pour prendre en charge l'ukrainien.
Le support Unicode complet est fourni par le jeu de codes UTF-8 pour les langues et territoires Tous pris en charge par AIX. Le jeu de codes UTF-8 est un format de transformation universel d'Unicode/ISO10646 utilisé pour prendre en charge plusieurs langues à la fois. Le jeu de codes UTF-8 fournit la solution la plus complète pour une utilisation dans des environnements dans lesquels plusieurs langues et alphabets doivent être traités. Le jeu de codes Unicode/UTF-8 fournit également une prise en charge complète de la monnaie européenne commune (euro).
La prise en charge du jeu de codes IBM-1252 est fournie en tant qu'option de compatibilité pour les utilisateurs qui ont besoin d'un environnement de jeu de codes à un octet contenant le symbole monétaire de l'euro. La structure du jeu de codes IBM-1252 est identique à celle du jeu de codes standard de l'industrie ISO8859-1, sauf que des caractères graphiques supplémentaires sont ajoutés dans la plage de caractères de contrôle ISO de 0x80 à 0x9F. Le symbole monétaire de l'euro est situé à la valeur hexadécimale valTXx80 dans le jeu de codes IBM-1252.