file.encoding の値と IBM i CCSID

次の表は、file.encoding に指定可能な値と、それに最も近い IBM® i コード化文字セット識別コード (CCSID) の関係を示したものです。

file.encoding サポートについて詳しくは、Oracle が提供する「Supported encodings」Information Center 外部のリンク を参照してください。

file.encoding CCSID 説明
ASCII 367 情報交換用米国標準コード
Big5 950 8 ビット ASCII 中国語 (繁体字) BIG-5
Big5_HKSCS 950 Big5_HKSCS
Big5_Solaris 950 Solaris zh_TW.BIG5 ロケール用の 7 つの追加の繁体字マッピングを含む Big5
CNS11643 964 中国語 (繁体字) の中国文字セット
Cp037 037 IBM EBCDIC 米国、カナダ、オランダ、...
Cp273 273 IBM EBCDIC ドイツ、オーストリア
Cp277 277 IBM EBCDIC デンマーク、ノルウェー
Cp278 278 IBM EBCDIC フィンランド、スウェーデン
Cp280 280 IBM EBCDIC イタリア
Cp284 284 IBM EBCDIC ラテンアメリカ・スペイン語
Cp285 285 IBM EBCDIC 英国
Cp297 297 IBM EBCDIC フランス
Cp420 420 IBM EBCDIC アラビア語
Cp424 424 IBM EBCDIC ヘブライ語
Cp437 437 8 ビット ASCII US PC
Cp500 500 IBM EBCDIC 国際
Cp737 737 8 ビット ASCII ギリシャ語 MS-DOS
Cp775 775 8 ビット ASCII バルト語 MS-DOS
Cp838 838 IBM EBCDIC タイ語
Cp850 850 8 ビット ASCII Latin-1 多国語
Cp852 852 8 ビット ASCII Latin-2
Cp855 855 8 ビット ASCII キリル文字使用言語
Cp856 0 8 ビット ASCII ヘブライ語
Cp857 857 8 ビット ASCII Latin-5
Cp860 860 8 ビット ASCII ポルトガル語
Cp861 861 8 ビット ASCII アイスランド語
Cp862 862 8 ビット ASCII ヘブライ語
Cp863 863 8 ビット ASCII カナダ
Cp864 864 8 ビット ASCII アラビア語
Cp865 865 8 ビット ASCII デンマーク、ノルウェー
Cp866 866 8 ビット ASCII キリル文字使用言語
Cp868 868 8 ビット ASCII ウルドゥー語
Cp869 869 8 ビット ASCII ギリシャ語
Cp870 870 IBM EBCDIC Latin-2
Cp871 871 IBM EBCDIC アイスランド
Cp874 874 8 ビット ASCII タイ語
Cp875 875 IBM EBCDIC ギリシャ語
Cp918 918 IBM EBCDIC ウルドゥー語
Cp921 921 8 ビット ASCII バルト語
Cp922 922 8 ビット ASCII エストニア語
Cp930 930 IBM EBCDIC 日本語拡張カタカナ
Cp933 933 IBM EBCDIC 韓国語
Cp935 935 IBM EBCDIC 中国語 (簡体字)
Cp937 937 IBM EBCDIC 中国語 (繁体字)
Cp939 939 IBM EBCDIC 日本語拡張ローマ字
Cp942 942 8 ビット ASCII 日本語
Cp942C 942 Cp942 の変種
Cp943 943 日本語オープン環境用混合 PC データ
Cp943C 943 日本語オープン環境用混合 PC データ
Cp948 948 8 ビット ASCII IBM 中国語 (繁体字)
Cp949 944 8 ビット ASCII 韓国語 KSC5601
Cp949C 949 Cp949 の変種
Cp950 950 8 ビット ASCII 中国語 (繁体字) BIG-5
Cp964 964 EUC 中国語 (繁体字)
Cp970 970 EUC 韓国語
Cp1006 1006 ISO 8 ビット ウルドゥー語
Cp1025 1025 IBM EBCDIC キリル文字
Cp1026 1026 IBM EBCDIC トルコ語
Cp1046 1046 8 ビット ASCII アラビア語
Cp1097 1097 IBM EBCDIC ペルシア語
Cp1098 1098 8 ビット ASCII ペルシア語
Cp1112 1112 IBM EBCDIC バルト語
Cp1122 1122 IBM EBCDIC エストニア語
Cp1123 1123 IBM EBCDIC ウクライナ
Cp1124 0 ISO 8 ビット ウクライナ
Cp1140 1140 ユーロ文字を含む Cp037 の変種
Cp1141 1141 ユーロ文字を含む Cp273 の変種
Cp1142 1142 ユーロ文字を含む Cp277 の変種
Cp1143 1143 ユーロ文字を含む Cp278 の変種
Cp1144 1144 ユーロ文字を含む Cp280 の変種
Cp1145 1145 ユーロ文字を含む Cp284 の変種
Cp1146 1146 ユーロ文字を含む Cp285 の変種
Cp1147 1147 ユーロ文字を含む Cp297 の変種
Cp1148 1148 ユーロ文字を含む Cp500 の変種
Cp1149 1149 ユーロ文字を含む Cp871 の変種
Cp1250 1250 MS-Win Latin-2
Cp1251 1251 MS-Win キリル文字使用言語
Cp1252 1252 MS-Win Latin-1
Cp1253 1253 MS-Win ギリシャ語
Cp1254 1254 MS-Win トルコ語
Cp1255 1255 MS-Win ヘブライ語
Cp1256 1256 MS-Win アラビア語
Cp1257 1257 MS-Win バルト語
Cp1258 1251 MS-Win ロシア語
Cp1381 1381 8 ビット ASCII 中国語 (簡体字) GB
Cp1383 1383 EUC 中国語 (簡体字)
Cp33722 33722 EUC 日本語
EUC_CN 1383 EUC 中国語 (簡体字)
EUC_JP 5050 EUC 日本語
EUC_JP_LINUX 0 JISX 0201、0208、EUC エンコードの日本語
EUC_KR 970 EUC 韓国語
EUC_TW 964 EUC 中国語 (繁体字)
GB2312 1381 8 ビット ASCII 中国語 (簡体字) GB
GB18030 1392 中国語 (簡体字)、PRC 標準
GBK 1386 8 ビット ASCII 9 中国語 (新簡体字)
ISCII91 806 インド語文字の ISCII91 エンコード
ISO2022CN 965 ISO 2022 CN、中国語 (Unicode への変換のみ)
ISO2022_CN_CNS 965 ISO 2022 CN 形式の CNS11643、中国語 (繁体字) (Unicode への変換のみ)
ISO2022_CN_GB 1383 ISO 2022 CN 形式の GB2312、中国語 (簡体字) (Unicode からの変換のみ)
ISO2022CN_CNS 965 7 ビット ASCII 中国語 (繁体字)
ISO2022CN_GB 1383 7 ビット ASCII 中国語 (簡体字)
ISO2022JP 5054 7 ビット ASCII 日本語
ISO2022KR 25546 7 ビット ASCII 韓国語
ISO8859_1 819 ISO 8859-1 Latin Alphabet No. 1
ISO8859_2 912 ISO 8859-2 ISO Latin-2
ISO8859_3 0 ISO 8859-3 ISO Latin-3
ISO8859_4 914 ISO 8859-4 ISO Latin-4
ISO8859_5 915 ISO 8859-5 ISO Latin-5
ISO8859_6 1089 ISO 8859-6 ISO Latin-6 (アラビア語)
ISO8859_7 813 ISO 8859-7 ISO Latin-7 (ギリシャ語/ラテン語)
ISO8859_8 916 ISO 8859-8 ISO Latin-8 (ヘブライ語)
ISO8859_9 920 ISO 8859-9 ISO Latin-9 (ECMA-128、トルコ語)
ISO8859_13 0 Latin Alphabet No. 7
ISO8859_15 923 ISO8859_15
ISO8859_15_FDIS 923 ISO 8859-15、Latin alphabet No. 9
ISO-8859-15 923 ISO 8859-15、Latin Alphabet No. 9
JIS0201 897 日本工業規格 X0201
JIS0208 5052 日本工業規格 X0208
JIS0212 0 日本工業規格 X0212
JISAutoDetect 0 Shift-JIS、EUC-JP、ISO 2022 JP を検出し、変換する (Unicode への変換のみ)
Johab 0 韓国構成ハングル・エンコード (全)
K018_R 878 キリル語
KSC5601 949 8 ビット ASCII 韓国語
MacArabic 1256 Macintosh アラビア語
MacCentralEurope 1282 Macintosh Latin-2
MacCroatian 1284 Macintosh クロアチア語
MacCyrillic 1283 Macintosh キリル文字
MacDingbat 0 Macintosh Dingbat
MacGreek 1280 Macintosh ギリシャ語
MacHebrew 1255 Macintosh ヘブライ語
MacIceland 1286 Macintosh アイスランド語
MacRoman 0 Macintosh Roman
MacRomania 1285 Macintosh ルーマニア
MacSymbol 0 Macintosh シンボル
MacThai 0 Macintosh タイ
MacTurkish 1281 Macintosh トルコ語
MacUkraine 1283 Macintosh ウクライナ
MS874 874 MS-Win タイ
MS932 943 Windows 日本語
MS936 936 Windows 中国語 (簡体字)
MS949 949 Windows 韓国語
MS950 950 Windows 中国語 (繁体字)
MS950_HKSCS NA 中国香港特別行政区拡張を含む WindowsWindows 中国語 (繁体字)
SJIS 932 8 ビット ASCII 日本語
TIS620 874 タイ工業規格 620
US-ASCII 367 情報交換用米国標準コード
UTF8 1208 UTF-8
UTF-16 1200 16 ビット UCS 変換フォーマット、オプションのバイト・オーダー・マークによって示されるバイト・オーダー
UTF-16BE 1200 16 ビット Unicode 変換フォーマット、ビッグ・エンディアン・バイト・オーダー
UTF-16LE 1200 16 ビット Unicode 変換フォーマット、リトル・エンディアン・バイト・オーダー
UTF-8 1208 8 ビット UCS 変換フォーマット
Unicode 13488 UNICODE、UCS-2
UnicodeBig 13488 Unicode と同じ
UnicodeBigUnmarked   Unicode (バイト・オーダー・マークなし)
UnicodeLittle   Unicode (リトル・エンディアン・バイト・オーダー)
UnicodeLittleUnmarked   UnicodeLittle (バイト・オーダー・マークなし)

デフォルト値については、file.encoding のデフォルト値を参照してください。