无状态代码集和转换器
本节将讨论无状态代码集和转换器。
无状态代码集是可归于以下某一类型的那些代码集:
- 单字节代码集,比如 ISO8859 系列(ISO8859-1、ISO8859-2 等等)
- 多字节代码集,比如 IBM-eucJP(日语)、IBM-932(Shift-JIS)。
请注意,只有当不同的代码集表示相同的字符时,转换才有意义。
代码集转换最简单的类型可以在单字节代码集转换器中找到,比如 ISO8859-1 转 IBM-850 的转换器。 这些单字节转换器的基础是简单的基于表的转换。 多字节字符编码的转换(比如 IBM-eucJP 转 IBM-932)通常是基于某种算法,而不是表,因为这样的表可能非常长。