字符数据的转换
标记的字符数据表示体系结构 (CDRA) 系统确保您可以以可预测,可重复的方式转换字符数据。
转换涉及将分配给一个代码页中的一个或多个字符的代码点转换为另一个代码页中的相应代码点。 转换可能导致单个字符映射到字符序列,或者导致字符序列映射到单个字符。 不应将转换等同于从一种语言转换为另一种语言。
转换方法
以下方法用于转换:
- 往返转换。 所有字符数据的完整性从源编码字符集标识 (CCSID) 保持到目标 CCSID 并返回到源。
执行往返转换时,您可能会看到目标 CCSID 中显示的字符的不正确表示。 但是,将保留完整性。 当将字符转换回源 CCSID 时,它们将重新获得其原始十六进制值和表示法。
- 强制子集匹配转换 (替换)。 源 CCSID 和目标 CCSID 中都存在的字符保持其完整性。 替换源 CCSID 中但不在目标 CCSID 中的字符。 替换值也称为替换字符。 对于 EBCDIC 编码,它们在大多数显示站上显示为实心块。 对于 ASCII 编码,这些替换字符的显示方式不同。
当转换回源 CCSID 时,此替换是永久的,因为无法检索原始十六进制值。
要获取导致替换字符的 CCSID 转换的列表,请参阅可能使用替换表的缺省转换。
- 语言转换。 也称为最佳转换,从源代码页到目标代码页进行部分映射。 保留目标 CCSID 和源 CCSID 中的字符的完整性。 不在目标 CCSID 中的字符被映射为该字符从文化角度最易被接受的代用字符。
例如,源 CCSID 可能支持 A 严重字符 (
)。 目标 CCSID 可能不支持此字符。 在转换过程中,最能被语言接受的字符 (拉丁文大写 A) 被替换为 A 坟墓。 在转换之后,未包括在目标 CCSID 中的字符将作为语言上最可接受的替换字符提供给用户。 此替换是永久的。 任何字符完整性方面的损失都是永久的。通过应用程序编程接口 (API) ,语言转换可以从任何受支持的单字节 CCSID 到任何其他受支持的单字节 CCSID。