IBM-eucCN
用于简体中文的 EUC 是一种由含有 1 或 2 个字节的字符组成的编码。 该 EUC 编码基于 ISO2022、中华人民共和国定义的 GB2312 以及厂家唯一的多字节字符定义。
当前的 GB2312 定义了 6763 个简体中文字符和 682 个符号。 IBM-eucCN 所依据的概念是一个由 94x94 个字符组成的平面。 这些字符的编码值范围是从 0xa1a1 到 0xfefe。
GB2312 映射到 EUC 的 CS1。 具体地说,IBM-eucCN 由以下字符集组成:
| 字符集 | 描述 |
|---|---|
| ISO0646-IRV | 7 位 ASCII 字符集,图形左部 |
| GB2312.1980 | 含有 7445 个字符。 它占据的位置是从 0xa1a1 到 0xfedf(某些用户定义的字符分散在 0xa1a1 到 0xfedf)。 |
| IBM-udcCN | 分散于 GB 中。 它占据 0xa1a1 到 0xfedf 的位置。 实际值为: |
| IBM-sbdCN | 分散于 GB 中。 它占据 0xfee0 到 0xfefe 的位置。 |