多字节字符代码数据表示法

多字节字符码是数据的外部表示,它和字符是从键盘输入还是从磁盘文件中输入无关。 在同一个代码集中,表示一个字符的多字节码的字节数可能不尽相同。 必须使用多文化支持字符处理函数来确保代码集无关性。

例如,一个代码集可能指定了以下字符编码:
C  = 0x43
*  = 0x81 0x43
*C = 0x81 0x43& 0x43

搜索 C(不考虑多字节字符) 的程序会找到 *C 字符串的第二个字节,并假定它找到了 C ,但实际上它找到了 * (星号) 字符的第二个字节。