Db2 での Unicode サポート

Unicode は、書かれた文字およびテキストの汎用コード化スキームで、国際的なデータの交換を 可能にします。 Unicode は、世界中で使用できる文字セット標準を提供します。

Unicode は、約 100,000 文字のコード・ポイントを提供するコード化スキームを使用します。 UTF-16 と呼ばれる拡張機能を使用すると、さらに 100 万文字にも及ぶエンコードが可能になります。 Unicode は、全世界の書き言葉で使用 されるすべての文字をエンコードできる機能を提供します。 Unicode は、文字の 1 つ 1 つに数値と名前を 指定するので、英字、表意文字、および記号が同等に扱われます。 Unicode には、句読記号、算術記号、技術記号 、幾何学図形、段落を示す黒丸も含まれます。

Db2は、以下の Unicode エンコード形式を提供します。

  • UTF-8: UTF (Unicode Transformation Format) の 8 ビット・エンコード方式。これは、既存の ASCII ベースの システムで使いやすいように設計されたものです。
  • UTF-16: UTF の 16 ビット・エンコード形式。これは、100 万を超える文字と UCS-2 のスーパーセットの コード値を提供するように設計されたものです。 UCS-2 は汎用文字セットであり、2 オクテット (1 文字が 16 ビットで表現されることを意味します) でコード化されています。

Unicode CCSID: パネル DSNTIPF の「Unicode CCSID」フィールドには、 あらかじめ 1208 が入力されています。 Db2 ダブルバイトおよびシングルバイトの値のCCSIDを選択します(DBCSの場合は1200、SBCSの場合は367)。 CCSID 1200 は UTF-16 に対応し、CCSID 367 は 7 ビット ASCII 用 のものです。