UTF-8 交换转换器

本节将讨论以双向方式为每一种代码集和 UTF-8 提供的转换。

UTF-8 是通用多字节编码。 每一种代码集和 UTF-8 之间的转换都以双向提供。

UTF-8 转换通常使用 Universal_UCS_Conv 和 /usr/lib/nls/loc/uconv/UTF-8 转换器进行。

转换器 描述
ISO8859-1 UTF-8 <-> ISO Latin-1
ISO8859-2 UTF-8 <-> ISO Latin-2
ISO8859-3 UTF-8 <-> ISO Latin-3
ISO8859-4 UTF-8 <-> ISO 波罗的海
ISO8859-5 UTF-8 <-> ISO 西里尔文
ISO8859-6 UTF-8 <-> ISO 阿拉伯语
ISO8859-7 UTF-8 <-> ISO 希腊语
ISO8859-8 UTF-8 <-> ISO 希伯来语
ISO8859-9 UTF-8 <-> ISO 土耳其语
JISX0201.1976-0 UTF-8 <-> 日语 JISX0201-0
JISX0208.1983-0 UTF-8 <-> 日语 JISX0208-0
CNS11643.1986-1 UTF-8 <-> 中文 CNS11643-1
CNS11643.1986-2 UTF-8 <-> 中文 CNS11643-2
KSC5601.1987-0 UTF-8 <-> 韩语 KSC5601-0
IBM-eucCN UTF-8 <-> 简体中文 EUC
IBM-eucJP UTF-8 <-> 日本 EUC
IBM-eucKR UTF-8 <-> 韩国 EUC
IBM-eucTW UTF-8 <-> 繁体中文 EUC
IBM-udcJP UTF-8 <-> 日语用户自定义字符
IBM-udcTW UTF-8 <-> 繁体中文用户自定义字符
IBM-sbdTW UTF-8 <-> 繁体中文 - 专用字符 IBM
UCS-2 UTF-8 <—> UCS-2
IBM-437 UTF-8 <-> 美国 PC 数据代码
IBM-850 UTF-8 <-> PC 数据代码 Latin-1
IBM-852 UTF-8 <-> PC 数据代码 Latin-2
IBM-857 UTF-8 <-> 土耳其 PC 数据代码
IBM-860 UTF-8 <-> 葡萄牙语 PC 数据代码
IBM-861 UTF-8 <-> 冰岛 PC 数据代码
IBM-863 UTF-8 <-> 法属加拿大 PC 数据代码
IBM-865 UTF-8 <-> 北欧 PC 数据代码
IBM-868 UTF-8 <-> 乌尔都语 IBM-868
IBM-869 UTF-8 <-> 希腊文 PC 数据代码
IBM-918 UTF-8 <-> 乌尔都语 IBM-918
IBM-921 UTF-8 <-> 波罗的海多语言数据代码
IBM-922 UTF-8 <-> 爱沙尼亚数据代码
IBM-932 UTF-8 <-> 日文 PC 数据代码
IBM-943 UTF-8 <-> 日文 PC 数据代码
IBM-934 UTF-8 <-> 韩国 PC 数据代码
IBM-935 UTF-8 <-> 简体中文 EBCDIC
IBM-936 UTF-8 <-> 中华人民共和国 PC 数据代码
IBM-938 UTF-8 <-> 台湾 PC 数据代码
IBM-942 UTF-8 <-> 扩展日文 PC 数据代码
IBM-944 UTF-8 <-> 韩国 PC 数据代码
IBM-946 UTF-8 <-> 中华人民共和国 SAA 数据代码
IBM-948 UTF-8 <-> 繁体中文 PC 数据代码
IBM-1006 UTF-8 <-> 乌尔都语 IBM-1006
IBM-1124 UTF-8 <-> 乌克兰 PC 数据代码
IBM-1129 UTF-8 <-> 越南语 PC 数据代码
TIS-620 UTF-8 <-> 泰国 PC 数据代码
IBM-037 UTF-8 <-> 美国、加拿大 EBCDIC
IBM-273 UTF-8 <-> 德国、奥地利 EBCDIC
IBM-277 UTF-8 <-> 丹麦、挪威 EBCDIC
IBM-278 UTF-8 <-> 芬兰、瑞典 EBCDIC
IBM-280 UTF-8 <-> 意大利 EBCDIC
IBM-284 UTF-8 <-> 西班牙、拉丁美洲 EBCDIC
IBM-285 UTF-8 <-> 英国 EBCDIC
IBM-297 UTF-8 <-> 法国 EBCDIC
IBM-500 UTF-8 <-> 国际 EBCDIC
IBM-875 UTF-8 <-> 希腊语 EBCDIC
IBM-930 UTF-8 <-> 日语片假名-汉字 EBCDIC
IBM-933 UTF-8 <-> 韩文 EBCDIC
IBM-937 UTF-8 <-> 繁体中文 EBCDIC
IBM-939 UTF-8 <-> 日语拉丁汉字 EBCDIC
IBM-1026 UTF-8 <-> 土耳其 EBCDIC
IBM-1112 UTF-8 <-> 波罗的海多语种 EBCDIC
IBM-1122 UTF-8 <-> 爱沙尼亚 EBCDIC
IBM-1124 UTF-8 <-> 乌克兰语 EBCDIC
IBM-1129 UTF-8 <-> 越南语 EBCDIC
IBM-1381 UTF-8 <-> 简体中文 PC 数据代码
GB18030 UTF-8<—> 简体中文
TIS-620 UTF-8 <-> 泰国 EBCDIC