単一バイトとマルチバイトのコード・セット
単一バイト・エンコード方式は、 文字数が多くないので、英語の文字を表すのに十分です。 日本語や中国語など、より大きなアルファベットをサポートするには、 マルチバイト・エンコードを含む別のコード・セットが必要になります。 サポートされている単一バイト・コード・セットとマルチバイト・コード・セットにはすべて、 単一バイト ASCII 文字セットが含まれます。 したがって、マルチバイト・コード・セットを扱うプログラムは、 1 バイト以上の文字エンコードを扱わなければなりません。
単一バイト・コード・セットの一例として、 ISO 8859 ファミリーのコード・セットがあります。 マルチバイト文字セットの例としては、IBM-eucJP および IBM-943 コード・セットがあります。 単一バイト・コード・セットは最大で 256 文字であり、 マルチバイト・コード・セットは 256 を超えます (理論的な制限はありません)。