UTF-8 交换转换器
本节将讨论以双向方式为每一种代码集和 UTF-8 提供的转换。
UTF-8 是通用多字节编码。 每一种代码集和 UTF-8 之间的转换都以双向提供。
UTF-8 转换通常使用 Universal_UCS_Conv 和 /usr/lib/nls/loc/uconv/UTF-8 转换器进行。
| 转换器 | 描述 |
|---|---|
| ISO8859-1 | UTF-8 <-> ISO Latin-1 |
| ISO8859-2 | UTF-8 <-> ISO Latin-2 |
| ISO8859-3 | UTF-8 <-> ISO Latin-3 |
| ISO8859-4 | UTF-8 <-> ISO 波罗的海 |
| ISO8859-5 | UTF-8 <-> ISO 西里尔文 |
| ISO8859-6 | UTF-8 <-> ISO 阿拉伯语 |
| ISO8859-7 | UTF-8 <-> ISO 希腊语 |
| ISO8859-8 | UTF-8 <-> ISO 希伯来语 |
| ISO8859-9 | UTF-8 <-> ISO 土耳其语 |
| JISX0201.1976-0 | UTF-8 <-> 日语 JISX0201-0 |
| JISX0208.1983-0 | UTF-8 <-> 日语 JISX0208-0 |
| CNS11643.1986-1 | UTF-8 <-> 中文 CNS11643-1 |
| CNS11643.1986-2 | UTF-8 <-> 中文 CNS11643-2 |
| KSC5601.1987-0 | UTF-8 <-> 韩语 KSC5601-0 |
| IBM-eucCN | UTF-8 <-> 简体中文 EUC |
| IBM-eucJP | UTF-8 <-> 日本 EUC |
| IBM-eucKR | UTF-8 <-> 韩国 EUC |
| IBM-eucTW | UTF-8 <-> 繁体中文 EUC |
| IBM-udcJP | UTF-8 <-> 日语用户自定义字符 |
| IBM-udcTW | UTF-8 <-> 繁体中文用户自定义字符 |
| IBM-sbdTW | UTF-8 <-> 繁体中文 - 专用字符 IBM |
| UCS-2 | UTF-8 <—> UCS-2 |
| IBM-437 | UTF-8 <-> 美国 PC 数据代码 |
| IBM-850 | UTF-8 <-> PC 数据代码 Latin-1 |
| IBM-852 | UTF-8 <-> PC 数据代码 Latin-2 |
| IBM-857 | UTF-8 <-> 土耳其 PC 数据代码 |
| IBM-860 | UTF-8 <-> 葡萄牙语 PC 数据代码 |
| IBM-861 | UTF-8 <-> 冰岛 PC 数据代码 |
| IBM-863 | UTF-8 <-> 法属加拿大 PC 数据代码 |
| IBM-865 | UTF-8 <-> 北欧 PC 数据代码 |
| IBM-868 | UTF-8 <-> 乌尔都语 IBM-868 |
| IBM-869 | UTF-8 <-> 希腊文 PC 数据代码 |
| IBM-918 | UTF-8 <-> 乌尔都语 IBM-918 |
| IBM-921 | UTF-8 <-> 波罗的海多语言数据代码 |
| IBM-922 | UTF-8 <-> 爱沙尼亚数据代码 |
| IBM-932 | UTF-8 <-> 日文 PC 数据代码 |
| IBM-943 | UTF-8 <-> 日文 PC 数据代码 |
| IBM-934 | UTF-8 <-> 韩国 PC 数据代码 |
| IBM-935 | UTF-8 <-> 简体中文 EBCDIC |
| IBM-936 | UTF-8 <-> 中华人民共和国 PC 数据代码 |
| IBM-938 | UTF-8 <-> 台湾 PC 数据代码 |
| IBM-942 | UTF-8 <-> 扩展日文 PC 数据代码 |
| IBM-944 | UTF-8 <-> 韩国 PC 数据代码 |
| IBM-946 | UTF-8 <-> 中华人民共和国 SAA 数据代码 |
| IBM-948 | UTF-8 <-> 繁体中文 PC 数据代码 |
| IBM-1006 | UTF-8 <-> 乌尔都语 IBM-1006 |
| IBM-1124 | UTF-8 <-> 乌克兰 PC 数据代码 |
| IBM-1129 | UTF-8 <-> 越南语 PC 数据代码 |
| TIS-620 | UTF-8 <-> 泰国 PC 数据代码 |
| IBM-037 | UTF-8 <-> 美国、加拿大 EBCDIC |
| IBM-273 | UTF-8 <-> 德国、奥地利 EBCDIC |
| IBM-277 | UTF-8 <-> 丹麦、挪威 EBCDIC |
| IBM-278 | UTF-8 <-> 芬兰、瑞典 EBCDIC |
| IBM-280 | UTF-8 <-> 意大利 EBCDIC |
| IBM-284 | UTF-8 <-> 西班牙、拉丁美洲 EBCDIC |
| IBM-285 | UTF-8 <-> 英国 EBCDIC |
| IBM-297 | UTF-8 <-> 法国 EBCDIC |
| IBM-500 | UTF-8 <-> 国际 EBCDIC |
| IBM-875 | UTF-8 <-> 希腊语 EBCDIC |
| IBM-930 | UTF-8 <-> 日语片假名-汉字 EBCDIC |
| IBM-933 | UTF-8 <-> 韩文 EBCDIC |
| IBM-937 | UTF-8 <-> 繁体中文 EBCDIC |
| IBM-939 | UTF-8 <-> 日语拉丁汉字 EBCDIC |
| IBM-1026 | UTF-8 <-> 土耳其 EBCDIC |
| IBM-1112 | UTF-8 <-> 波罗的海多语种 EBCDIC |
| IBM-1122 | UTF-8 <-> 爱沙尼亚 EBCDIC |
| IBM-1124 | UTF-8 <-> 乌克兰语 EBCDIC |
| IBM-1129 | UTF-8 <-> 越南语 EBCDIC |
| IBM-1381 | UTF-8 <-> 简体中文 PC 数据代码 |
| GB18030 | UTF-8<—> 简体中文 |
| TIS-620 | UTF-8 <-> 泰国 EBCDIC |