次の表は、file.encoding に指定可能な値と、それに最も近い IBM® i コード化文字セット識別コード (CCSID) の関係を示したものです。
file.encoding サポートについて詳しくは、Oracle が提供する「Supported encodings」 を参照してください。
file.encoding | CCSID | 説明 |
---|---|---|
ASCII | 367 | 情報交換用米国標準コード |
Big5 | 950 | 8 ビット ASCII 中国語 (繁体字) BIG-5 |
Big5_HKSCS | 950 | Big5_HKSCS |
Big5_Solaris | 950 | Solaris zh_TW.BIG5 ロケール用の 7 つの追加の繁体字マッピングを含む Big5 |
CNS11643 | 964 | 中国語 (繁体字) の中国文字セット |
Cp037 | 037 | IBM EBCDIC 米国、カナダ、オランダ、... |
Cp273 | 273 | IBM EBCDIC ドイツ、オーストリア |
Cp277 | 277 | IBM EBCDIC デンマーク、ノルウェー |
Cp278 | 278 | IBM EBCDIC フィンランド、スウェーデン |
Cp280 | 280 | IBM EBCDIC イタリア |
Cp284 | 284 | IBM EBCDIC ラテンアメリカ・スペイン語 |
Cp285 | 285 | IBM EBCDIC 英国 |
Cp297 | 297 | IBM EBCDIC フランス |
Cp420 | 420 | IBM EBCDIC アラビア語 |
Cp424 | 424 | IBM EBCDIC ヘブライ語 |
Cp437 | 437 | 8 ビット ASCII US PC |
Cp500 | 500 | IBM EBCDIC 国際 |
Cp737 | 737 | 8 ビット ASCII ギリシャ語 MS-DOS |
Cp775 | 775 | 8 ビット ASCII バルト語 MS-DOS |
Cp838 | 838 | IBM EBCDIC タイ語 |
Cp850 | 850 | 8 ビット ASCII Latin-1 多国語 |
Cp852 | 852 | 8 ビット ASCII Latin-2 |
Cp855 | 855 | 8 ビット ASCII キリル文字使用言語 |
Cp856 | 0 | 8 ビット ASCII ヘブライ語 |
Cp857 | 857 | 8 ビット ASCII Latin-5 |
Cp860 | 860 | 8 ビット ASCII ポルトガル語 |
Cp861 | 861 | 8 ビット ASCII アイスランド語 |
Cp862 | 862 | 8 ビット ASCII ヘブライ語 |
Cp863 | 863 | 8 ビット ASCII カナダ |
Cp864 | 864 | 8 ビット ASCII アラビア語 |
Cp865 | 865 | 8 ビット ASCII デンマーク、ノルウェー |
Cp866 | 866 | 8 ビット ASCII キリル文字使用言語 |
Cp868 | 868 | 8 ビット ASCII ウルドゥー語 |
Cp869 | 869 | 8 ビット ASCII ギリシャ語 |
Cp870 | 870 | IBM EBCDIC Latin-2 |
Cp871 | 871 | IBM EBCDIC アイスランド |
Cp874 | 874 | 8 ビット ASCII タイ語 |
Cp875 | 875 | IBM EBCDIC ギリシャ語 |
Cp918 | 918 | IBM EBCDIC ウルドゥー語 |
Cp921 | 921 | 8 ビット ASCII バルト語 |
Cp922 | 922 | 8 ビット ASCII エストニア語 |
Cp930 | 930 | IBM EBCDIC 日本語拡張カタカナ |
Cp933 | 933 | IBM EBCDIC 韓国語 |
Cp935 | 935 | IBM EBCDIC 中国語 (簡体字) |
Cp937 | 937 | IBM EBCDIC 中国語 (繁体字) |
Cp939 | 939 | IBM EBCDIC 日本語拡張ローマ字 |
Cp942 | 942 | 8 ビット ASCII 日本語 |
Cp942C | 942 | Cp942 の変種 |
Cp943 | 943 | 日本語オープン環境用混合 PC データ |
Cp943C | 943 | 日本語オープン環境用混合 PC データ |
Cp948 | 948 | 8 ビット ASCII IBM 中国語 (繁体字) |
Cp949 | 944 | 8 ビット ASCII 韓国語 KSC5601 |
Cp949C | 949 | Cp949 の変種 |
Cp950 | 950 | 8 ビット ASCII 中国語 (繁体字) BIG-5 |
Cp964 | 964 | EUC 中国語 (繁体字) |
Cp970 | 970 | EUC 韓国語 |
Cp1006 | 1006 | ISO 8 ビット ウルドゥー語 |
Cp1025 | 1025 | IBM EBCDIC キリル文字 |
Cp1026 | 1026 | IBM EBCDIC トルコ語 |
Cp1046 | 1046 | 8 ビット ASCII アラビア語 |
Cp1097 | 1097 | IBM EBCDIC ペルシア語 |
Cp1098 | 1098 | 8 ビット ASCII ペルシア語 |
Cp1112 | 1112 | IBM EBCDIC バルト語 |
Cp1122 | 1122 | IBM EBCDIC エストニア語 |
Cp1123 | 1123 | IBM EBCDIC ウクライナ |
Cp1124 | 0 | ISO 8 ビット ウクライナ |
Cp1140 | 1140 | ユーロ文字を含む Cp037 の変種 |
Cp1141 | 1141 | ユーロ文字を含む Cp273 の変種 |
Cp1142 | 1142 | ユーロ文字を含む Cp277 の変種 |
Cp1143 | 1143 | ユーロ文字を含む Cp278 の変種 |
Cp1144 | 1144 | ユーロ文字を含む Cp280 の変種 |
Cp1145 | 1145 | ユーロ文字を含む Cp284 の変種 |
Cp1146 | 1146 | ユーロ文字を含む Cp285 の変種 |
Cp1147 | 1147 | ユーロ文字を含む Cp297 の変種 |
Cp1148 | 1148 | ユーロ文字を含む Cp500 の変種 |
Cp1149 | 1149 | ユーロ文字を含む Cp871 の変種 |
Cp1250 | 1250 | MS-Win Latin-2 |
Cp1251 | 1251 | MS-Win キリル文字使用言語 |
Cp1252 | 1252 | MS-Win Latin-1 |
Cp1253 | 1253 | MS-Win ギリシャ語 |
Cp1254 | 1254 | MS-Win トルコ語 |
Cp1255 | 1255 | MS-Win ヘブライ語 |
Cp1256 | 1256 | MS-Win アラビア語 |
Cp1257 | 1257 | MS-Win バルト語 |
Cp1258 | 1251 | MS-Win ロシア語 |
Cp1381 | 1381 | 8 ビット ASCII 中国語 (簡体字) GB |
Cp1383 | 1383 | EUC 中国語 (簡体字) |
Cp33722 | 33722 | EUC 日本語 |
EUC_CN | 1383 | EUC 中国語 (簡体字) |
EUC_JP | 5050 | EUC 日本語 |
EUC_JP_LINUX | 0 | JISX 0201、0208、EUC エンコードの日本語 |
EUC_KR | 970 | EUC 韓国語 |
EUC_TW | 964 | EUC 中国語 (繁体字) |
GB2312 | 1381 | 8 ビット ASCII 中国語 (簡体字) GB |
GB18030 | 1392 | 中国語 (簡体字)、PRC 標準 |
GBK | 1386 | 8 ビット ASCII 9 中国語 (新簡体字) |
ISCII91 | 806 | インド語文字の ISCII91 エンコード |
ISO2022CN | 965 | ISO 2022 CN、中国語 (Unicode への変換のみ) |
ISO2022_CN_CNS | 965 | ISO 2022 CN 形式の CNS11643、中国語 (繁体字) (Unicode への変換のみ) |
ISO2022_CN_GB | 1383 | ISO 2022 CN 形式の GB2312、中国語 (簡体字) (Unicode からの変換のみ) |
ISO2022CN_CNS | 965 | 7 ビット ASCII 中国語 (繁体字) |
ISO2022CN_GB | 1383 | 7 ビット ASCII 中国語 (簡体字) |
ISO2022JP | 5054 | 7 ビット ASCII 日本語 |
ISO2022KR | 25546 | 7 ビット ASCII 韓国語 |
ISO8859_1 | 819 | ISO 8859-1 Latin Alphabet No. 1 |
ISO8859_2 | 912 | ISO 8859-2 ISO Latin-2 |
ISO8859_3 | 0 | ISO 8859-3 ISO Latin-3 |
ISO8859_4 | 914 | ISO 8859-4 ISO Latin-4 |
ISO8859_5 | 915 | ISO 8859-5 ISO Latin-5 |
ISO8859_6 | 1089 | ISO 8859-6 ISO Latin-6 (アラビア語) |
ISO8859_7 | 813 | ISO 8859-7 ISO Latin-7 (ギリシャ語/ラテン語) |
ISO8859_8 | 916 | ISO 8859-8 ISO Latin-8 (ヘブライ語) |
ISO8859_9 | 920 | ISO 8859-9 ISO Latin-9 (ECMA-128、トルコ語) |
ISO8859_13 | 0 | Latin Alphabet No. 7 |
ISO8859_15 | 923 | ISO8859_15 |
ISO8859_15_FDIS | 923 | ISO 8859-15、Latin alphabet No. 9 |
ISO-8859-15 | 923 | ISO 8859-15、Latin Alphabet No. 9 |
JIS0201 | 897 | 日本工業規格 X0201 |
JIS0208 | 5052 | 日本工業規格 X0208 |
JIS0212 | 0 | 日本工業規格 X0212 |
JISAutoDetect | 0 | Shift-JIS、EUC-JP、ISO 2022 JP を検出し、変換する (Unicode への変換のみ) |
Johab | 0 | 韓国構成ハングル・エンコード (全) |
K018_R | 878 | キリル語 |
KSC5601 | 949 | 8 ビット ASCII 韓国語 |
MacArabic | 1256 | Macintosh アラビア語 |
MacCentralEurope | 1282 | Macintosh Latin-2 |
MacCroatian | 1284 | Macintosh クロアチア語 |
MacCyrillic | 1283 | Macintosh キリル文字 |
MacDingbat | 0 | Macintosh Dingbat |
MacGreek | 1280 | Macintosh ギリシャ語 |
MacHebrew | 1255 | Macintosh ヘブライ語 |
MacIceland | 1286 | Macintosh アイスランド語 |
MacRoman | 0 | Macintosh Roman |
MacRomania | 1285 | Macintosh ルーマニア |
MacSymbol | 0 | Macintosh シンボル |
MacThai | 0 | Macintosh タイ |
MacTurkish | 1281 | Macintosh トルコ語 |
MacUkraine | 1283 | Macintosh ウクライナ |
MS874 | 874 | MS-Win タイ |
MS932 | 943 | Windows 日本語 |
MS936 | 936 | Windows 中国語 (簡体字) |
MS949 | 949 | Windows 韓国語 |
MS950 | 950 | Windows 中国語 (繁体字) |
MS950_HKSCS | NA | 中国香港特別行政区拡張を含む WindowsWindows 中国語 (繁体字) |
SJIS | 932 | 8 ビット ASCII 日本語 |
TIS620 | 874 | タイ工業規格 620 |
US-ASCII | 367 | 情報交換用米国標準コード |
UTF8 | 1208 | UTF-8 |
UTF-16 | 1200 | 16 ビット UCS 変換フォーマット、オプションのバイト・オーダー・マークによって示されるバイト・オーダー |
UTF-16BE | 1200 | 16 ビット Unicode 変換フォーマット、ビッグ・エンディアン・バイト・オーダー |
UTF-16LE | 1200 | 16 ビット Unicode 変換フォーマット、リトル・エンディアン・バイト・オーダー |
UTF-8 | 1208 | 8 ビット UCS 変換フォーマット |
Unicode | 13488 | UNICODE、UCS-2 |
UnicodeBig | 13488 | Unicode と同じ |
UnicodeBigUnmarked | Unicode (バイト・オーダー・マークなし) | |
UnicodeLittle | Unicode (リトル・エンディアン・バイト・オーダー) | |
UnicodeLittleUnmarked | UnicodeLittle (バイト・オーダー・マークなし) |
デフォルト値については、file.encoding のデフォルト値を参照してください。