单字节代码集和多字节代码集

单字节编码方式足以表示英语字符集,因为英语字符的数量不大。 为了支持更大量的文字符号,比如日语和中文,有必要提供更多包含多字节编码的代码集。 所有受支持的单字节或多字节代码集都包含 ASCII 字符集。 因此,处理多字节代码集的程序必须处理含一个或更多字节的字符编码。

单字节代码集的示例是 ISO-8859 系列代码集。 多字节代码集的示例是 IBM-eucJP 和 IBM-943 代码集。 单字节代码集有至多 256 个字符,而多字节代码集可拥有的字符超过 256 个(理论上没有限制)。