アラビア語の特殊文字

一部のアラビア語文字は、さまざまなコード・ページにおいてさまざまな表現を持つため、コード・ページ変換時に特殊な処理を必要とします。

このような文字はすべてのコード・ページで表現されるわけではないため、通常の変換では置換制御文字 (SUB) で表示されます。 この場合は、データが失われています。

ラームとアリフ
この文字は、Unicode Arabic Presentation Forms-B (uFExx 範囲) に加えて、ビジュアル表現に使用されるコード・ページ 420、864、および 1046 では、単一文字として表現されます。 この文字は、Unicode Arabic u06xx 範囲に加えて、暗黙表現に使用されるコード・ページ 425、1089、および 1256 では、2 つの文字 (ラームとアリフ) として表現されます。
Seen 系文字のテール
ビジュアル表現用のコード・ページ 420、864、および 1046 では、Seen 系文字の語末形は 2 つの隣接文字 (独立形の 4 分の 3 の形状の文字とテール文字) として表現されます。 暗黙表現用のコード・ページ 425、1089、1256、および Unicode Arabic u06xx 範囲では、テール文字は表現されません。 Unicode Arabic Presentation Forms-B (uFExx 範囲) では、Seen 系文字の語末形は 1 つの文字として表現されます。
Tashkeel、またはシャッダを除く特殊発音記号文字
これらの文字はコード・ページ 420 や 864 では表現されません。 Tashkeel 文字はコード・ページ 425、1046、1089、1256、および Unicode から 420 または 864 に変換すると SUB 文字になります。
Yeh-Hamza の語末形
コード・ページ 420 および 864 には Yeh-Hamza の語末形に対する固有の文字は存在しません。 これは 2 つの文字 (Yeh の語末形と Hamza) として表現されます。 他のコード・ページ (425、1046、1089、1256、Unicode など) では、Yeh-Hamza の語末形は、ユーザーの入力 (それが 1 つのキー・ストローク (Yeh-Hamza キー) なのか 2 つのストローク (Yeh キー + Hamza キー) なのか) に基づいて 1 つの文字または 2 つの文字として表現されます。 Yeh-Hamza の語末形の文字は、前のコード・ページから 420 または 864 に変換されると、Yeh-Hamza の初期形式に変換されます。 特殊な処理プロセスによって、これを Yeh の語末形と Hamza に変換する必要があります。

そのような文字が変換時に失われずに正しく処理されるように、さまざまなアラビア語シェーピング・オプションが用意されています。