Coded character sets for XML documents
XML PARSE prend en charge les documents XML dans les éléments de données nationaux, dans les éléments de données alphanumériques et dans les fichiers IFS avec UCS-2 et les CCSID mono-octet. Les documents des éléments de données nationaux doivent être codés à l'aide du CCSID Unicode UCS-2 spécifié dans l'option de compilation CCSID national ou l'option NTLCCSID PROCESS. Les documents des éléments de données alphanumériques doivent être codés à l'aide de l'un des CCSID EBCDIC mono-octet explicitement pris en charge et figurant dans les CCSID EBCDIC pris en charge pour les documents XML (tableau 1) ou de l'un des CCSID ASCII figurant dans les CCSID ASCII pris en charge pour les documents XML (tableau 2).
| CCSID | Description |
|---|---|
| 1140, 37 | États-Unis, Canada, etc. CCSID étendu du pays de l'euro (ECECP), CCSID étendu du pays |
| 1141, 273 | Autriche, Allemagne ECECP, CECP |
| 1142, 277 | Danemark, Norvège ECECP, CECP |
| 1143, 278 | Finlande, Suède ECECP, CECP |
| 1144, 280 | Italie ECECP, CECP |
| 1145, 284 | Espagne, Amérique latine (espagnol) ECECP, CECP |
| 1146, 285 | Royaume-Uni ECECP, CECP |
| 1147, 297 | France ECECP, CECP |
| 1148, 500 | EECP international, CECP |
| 1149, 871 | Islande ECECP, CECP |
| CCSID | Description |
|---|---|
| 813 | ISO 8859-7 Grec / Latin |
| 819 | ISO 8859-1 Latin 1 / Systèmes ouverts |
| 920 | ISO 8859-9 Latin 5 (ECMA-128, Turquie TS-5881) |
Lorsque vous analysez des documents XML ASCII, les fragments de document transmis à la procédure de traitement dans le registre spécial XML-TEXT sont codés en ASCII. Les opérations de l 'ILE COBOL telles que le déplacement et la comparaison reposant sur le codage EBCDIC ou sur des caractères nationaux pour fonctionner correctement, vous devez convertir les fragments de document avant de les utiliser. Pour ce faire, lorsque le document XML se trouve dans un programme COBOL, il faut d'abord convertir le CCSID ASCII du document XML en caractères nationaux à l'aide de l'instruction MOVE. Ensuite, si nécessaire, convertissez le résultat des caractères nationaux en EBCDIC à l'aide de l'instruction MOVE.
Les documents XML d'un programme COBOL encodés dans d'autres CCSID peuvent être analysés en les convertissant en caractères nationaux à l'aide de l'instruction MOVE. Les différents éléments de texte de document transmis à la procédure de traitement dans le registre spécial XML-NTEXT peuvent ensuite être convertis en CCSID d'origine, si nécessaire, à l'aide de l'instruction MOVE.
- Caractères précédant le caractère'<' au début de chaque enregistrement xml doit être supprimé.
- La fin de chaque ligne du fichier IFS ne doit comporter qu'une CR (retour chariot) et non pas un LF (saut de ligne).
- Convertissez des documents XML en CCSID UCS-2 spécifié dans l'option de compilation CCSID national ou NTLCCSID PROCESS, ou convertissez des documents XML en CCSID du travail.
- Modifiez manuellement la déclaration de codage dans le document XML pour spécifier le CCSID réel du document.
Voir le Guide du programmeur de l'ILE COBOL pour plus de détails sur la spécification de l'encodage du document et sur la façon dont l'analyseur détermine l'encodage.