IBM-eucCN

用于简体中文的 EUC 是一种由含有 1 或 2 个字节的字符组成的编码。 该 EUC 编码基于 ISO2022、中华人民共和国定义的 GB2312 以及厂家唯一的多字节字符定义。

当前的 GB2312 定义了 6763 个简体中文字符和 682 个符号。 IBM-eucCN 所依据的概念是一个由 94x94 个字符组成的平面。 这些字符的编码值范围是从 0xa1a1 到 0xfefe。

GB2312 映射到 EUC 的 CS1。 具体地说,IBM-eucCN 由以下字符集组成:

字符集 描述
ISO0646-IRV 7 位 ASCII 字符集,图形左部
GB2312.1980 含有 7445 个字符。 它占据的位置是从 0xa1a1 到 0xfedf(某些用户定义的字符分散在 0xa1a1 到 0xfedf)。
IBM-udcCN 分散于 GB 中。 它占据 0xa1a1 到 0xfedf 的位置。 实际值为:
a2a1 -- a2b0    a1e3 -- a2e4  a1ef -- a2f0
a2fd -- a1fe    a4f4 -- a4fe  a5f7 -- a5fe
a6b9 -- a6c0    a6d9 -- a6fe  a7c2 -- a7d0
a7f2 -- a7fe    a8bb -- a8c4  a8ea -- a9a3
a9f0 -- affe    a7fa -- d7fe  f8a1 -- fedf
IBM-sbdCN 分散于 GB 中。 它占据 0xfee0 到 0xfefe 的位置。