Soporte de Unicode en Db2

Unicode es un esquema de codificación universal para caracteres escritos y texto que permite el intercambio de datos a nivel internacional. Unicode proporciona un estándar de conjunto de caracteres que se puede utilizar en todo el mundo.

Unicode utiliza un esquema de codificación que proporciona puntos de código para aproximadamente 100 000 caracteres. Una extensión llamada UTF-16 permite codificar hasta un millón de caracteres más. Unicode ofrece la posibilidad de codificar todos los caracteres utilizados en los idiomas escritos del mundo. Unicode trata los caracteres alfabéticos, ideográficos y símbolos de forma equivalente porque especifica un valor numérico y un nombre para cada uno de sus caracteres. Unicode incluye signos de puntuación, símbolos matemáticos, símbolos técnicos, formas geométricas y dingbats.

Db2 proporciona los siguientes formatos de codificación Unicode:

UTF-8: Formato de transformación Unicode, formato de codificación de 8 bits diseñado para facilitar su uso con los sistemas existentes basados en ASCII.
UTF-16: Formato de transformación Unicode, formato de codificación de 16 bits diseñado para proporcionar valores de código para más de un millón de caracteres y un superconjunto de UCS-2. UCS-2 es un conjunto de caracteres universal y está codificado en 2 octetos, lo que significa que los caracteres se representan en 16 bits por carácter.

CCSID de Unicode: El campo CCSID de Unicode del panel DSNTIPF está rellenado previamente con 1208. Db2 elige los CCSID para valores de doble byte y de byte único (1200 para DBCS y 367 para SBCS). CCSID 1200 corresponde a UTF-16 y CCSID 367 es para ASCII de 7 bits.