Schéma de codage Extended UNIX Code (EUC)
Le schéma de codage EUC définit un ensemble de règles de codage pouvant prendre en charge un à quatre jeux de caractères. Les règles de codage sont basées sur la définition ISO2022 pour le codage des données 7 bits et 8 bits. Le schéma de codage EUC utilise des caractères de contrôle pour identifier certains jeux de caractères. Le tableau suivant présente la structure de base de tous les codages EUC.
| Code EUC | Codage de caractères |
|---|---|
| CS0 | 0xxxxxxx |
| CS1 | 1xxxxxxx
1xxxxxxx 1xxxxxxxx 1xxxxxxx 1xxxxxxxx 1xxxxxxx ... |
| CS2 | 10001110 1xxxxxxx
10001110 1xxxxxxx 1xxxxxxxx 10001110 1xxxxxxx 1xxxxxxxx 1xxxxxxxx ... |
| CS3 | 10001111 1xxxxxxx
10001111 1xxxxxxx 1xxxxxxxx 10001111 1xxxxxxx 1xxxxxxxx 1xxxxxxxx ... |
Le terme EUC désigne ces règles de codage générales. Un jeu de codes basé sur EUC est conforme aux règles de codage EUC mais identifie également les jeux de caractères spécifiques associés aux instances spécifiques. Par exemple, IBM-eucJP pour le japonais fait référence au codage des caractères de la norme industrielle japonaise selon les règles de codage EUC.
Le premier jeu (CS0) contient toujours un jeu de caractères ISO646. Tous les autres jeux doivent avoir le bit le plus significatif (MSB) défini sur 1 et peuvent utiliser n'importe quel nombre d'octets pour coder les caractères. En outre, tous les caractères d'un jeu doivent avoir les éléments suivants :
- Le même nombre d'octets pour coder tous les caractères
- La même largeur d'affichage de colonne (nombre de colonnes sur un terminal à largeur fixe)
Tous les caractères du troisième jeu (CS2) sont toujours précédés du caractère de contrôle SS2 (code de contrôle monocaractère 2, 0x8e). Les jeux de codes conformes à EUC n'utilisent pas le caractère de contrôle SS2 autrement que pour identifier le troisième jeu.
Tous les caractères du quatrième jeu (CS3) sont toujours précédés du caractère de contrôle SS3 (code de contrôle monocaractère 3, 0x8f). Les jeux de codes conformes à EUC n'utilisent pas le caractère de contrôle SS3 autrement que pour identifier le quatrième jeu.