Numéros de page de code et d'identifiant de jeu de caractères codés (CCSID) pour les données graphiques Unicode

Au sein d' IBM®, la page de code UTF-16 a été enregistrée comme page de code 1200, avec un jeu de caractères en expansion. Lorsque de nouveaux caractères sont ajoutés à une page de code, le numéro de la page de code ne change pas. La page de code 1200 fait toujours référence à la version actuelle d'Unicode.

Une version spécifique de la norme Unicode, telle que définie par Unicode 2.0 et ISO/IEC 10646-1, a également été enregistrée par IBM sous le numéro CCSID 13488. Ce CCSID a été utilisé en interne par Db2® pour stocker les données des chaînes graphiques dans les bases de données IBM eucJP (Japon) et IBM eucTW (Taïwan). Le CCSID 13488 et la page de code 1200 se réfèrent tous deux à l' UTF-16 et sont traités de la même manière, à l'exception de la valeur de leur espace "double-octet" (DBCS) :
CP/CCSID Espace à un octet (SBCS) Espace à double octet (DBCS)
1200 N/A U+0020
13488 N/A U+3000
Note : Dans une base de données Unicode, U+3000 n'a pas de signification particulière.

Les mêmes tables de conversion sont utilisées pour la page de code 1200 et le CCSID 13488.

Au sein d' IBM, l' UTF-8 a été enregistré en tant que CCSID 1208 avec un jeu de caractères croissant (parfois également appelé page de code 1208). Au fur et à mesure que de nouveaux caractères sont ajoutés à la norme, ce numéro (1208) ne changera pas.

Le numéro de page de code MBCS est 1208. Il s'agit du numéro de page de code de la base de données et de la page de code des données de la chaîne de caractères au sein de la base de données. Le numéro de page de code à deux octets pour l' UTF-16 est 1200, ce qui correspond à la page de code des données de la chaîne graphique dans la base de données.