概要
ASCII 文字エンコーディング標準は 7 ビット・バイトの文字ストリングをベースにしたもので、英語のテキストをエンコードするには十分な文字を持っていますが、それ以外の主要言語には対応していません。
ISO はラテン語ベースの各種記述システム用に、ASCII の 8 ビット拡張版を複数標準化しています。 ISO 8859 には、キリル文字、アラビア文字、ギリシャ文字、ヘブライ文字、タイ文字のセクションもあります。
- Latin-1 は西欧諸語をサポートしており、広い範囲で利用されています。
- Latin-9 は Latin-1 に少しの変更を加えたもので、ユーロ記号 (€) が含まれています。
char と varchar はLatin-9エンコーディングとして扱われる。 Latin-9 は、西欧文字データ用の 8 ビット・エンコーディング推奨標準として、Latin-1 に代わり使われるようになったものです。
Latin-9 は、フランス語、スペイン語、カタロニア語、ガリシア語、バスク語、ポルトガル語、イタリア語、アルバニア語、アフリカーンス語、オランダ語、ドイツ語、デンマーク語、スウェーデン語、ノルウェー語、フィンランド語、フェロー語、アイスランド語、アイルランド語、スコットランド語、英語など、ほとんどの西ヨーロッパ言語をカバーしていますが、ポーランド語や、チェコ語、ハンガリー語、ルーマニア語などの中央ヨーロッパ言語には対応していません。 Latin-9 でサポートされていない言語を問題なく処理するための標準が Unicode です。