Caratteri arabi speciali

Alcuni caratteri arabi hanno rappresentazioni differenti in codepage differenti, pertanto è necessaria una gestione particolare durante la conversione della codepage.

Poiché questi caratteri non sono rappresentati in tutte le codepage, una normale conversione risulta in caratteri di controllo sostitutivi (SUB), che è una perdita di dati.

Lam-Alef
Questo carattere è rappresentato come un singolo carattere nelle codepage 420, 864 e 1046, che vengono utilizzate per la presentazione visiva in aggiunta all'Unicode Arabic Presentation Forms-B (intervallouFExx ). Questo carattere è rappresentato da due caratteri, Lam e Alef, nelle codepage 425, 1089 e 1256, che vengono utilizzati per la rappresentazione implicita in aggiunta all'intervallo Unicode Arabic u06xx .
Coda di Seen famiglia di personaggi
Le codepage visive 420, 864 e 1046 rappresentano la forma finale della famiglia di caratteri Seen come due caratteri adiacenti: la forma dei tre quarti e la coda. Le codepage implicite 425, 1089, 1256 e l'intervallo Unicode Arabic u06xx , non rappresentano il carattere Tail. In Unicode Arabic Presentation Fors-B (intervallouFExx ), il modulo finale per i caratteri nella famiglia Seen è rappresentato come un carattere.
Tashkeel o caratteri diacritici ad eccezione di Shadda
Questi caratteri non sono rappresentati nelle codepage 420 e 864. La conversione dei caratteri Tashkeel dalle codepage 425, 1046, 1089, 1256 e Unicode a 420 o 864 risulta in caratteri SUB.
Forma finale di Yeh-Hamza
Le codepage 420 e 864 non hanno caratteri unici per la forma finale di Yeh-Hamza; è rappresentato come due caratteri: la forma finale di Yeh e Hamza. In altre codepage, come 425, 1046, 1089, 1256 e Unicode, la forma finale di Yeh-Hamza è rappresentata come un carattere o due caratteri a seconda dell'input dell'utente; se si tratta di una sequenza di tasti (tasto Yeh-Hamza) o due sequenze (tasto Yeh + tasto Hamza). La conversione dalle precedenti codepage a 420 o 864 converte il carattere della forma finale di Yeh-Hamza nella forma iniziale di Yeh-Hamza; un processo di gestione speciale deve convertirlo nella forma finale di Yeh e Hamza.

Per evitare la perdita di tali caratteri durante la conversione, sono disponibili varie opzioni di forma araba per gestirli correttamente.