Caratteri arabi speciali
Alcuni caratteri arabi hanno rappresentazioni differenti in codepage differenti, pertanto è necessaria una gestione particolare durante la conversione della codepage.
Poiché questi caratteri non sono rappresentati in tutte le codepage, una normale conversione risulta in caratteri di controllo sostitutivi (SUB), che è una perdita di dati.
- Lam-Alef
- Questo carattere è rappresentato come un singolo carattere nelle codepage 420, 864 e 1046, che vengono utilizzate per la presentazione visiva in aggiunta all'Unicode Arabic Presentation Forms-B (intervallouFExx ). Questo carattere è rappresentato da due caratteri, Lam e Alef, nelle codepage 425, 1089 e 1256, che vengono utilizzati per la rappresentazione implicita in aggiunta all'intervallo Unicode Arabic u06xx .
- Coda di Seen famiglia di personaggi
- Le codepage visive 420, 864 e 1046 rappresentano la forma finale della famiglia di caratteri Seen come due caratteri adiacenti: la forma dei tre quarti e la coda. Le codepage implicite 425, 1089, 1256 e l'intervallo Unicode Arabic u06xx , non rappresentano il carattere Tail. In Unicode Arabic Presentation Fors-B (intervallouFExx ), il modulo finale per i caratteri nella famiglia Seen è rappresentato come un carattere.
- Tashkeel o caratteri diacritici ad eccezione di Shadda
- Questi caratteri non sono rappresentati nelle codepage 420 e 864. La conversione dei caratteri Tashkeel dalle codepage 425, 1046, 1089, 1256 e Unicode a 420 o 864 risulta in caratteri SUB.
- Forma finale di Yeh-Hamza
- Le codepage 420 e 864 non hanno caratteri unici per la forma finale di Yeh-Hamza; è rappresentato come due caratteri: la forma finale di Yeh e Hamza. In altre codepage, come 425, 1046, 1089, 1256 e Unicode, la forma finale di Yeh-Hamza è rappresentata come un carattere o due caratteri a seconda dell'input dell'utente; se si tratta di una sequenza di tasti (tasto Yeh-Hamza) o due sequenze (tasto Yeh + tasto Hamza). La conversione dalle precedenti codepage a 420 o 864 converte il carattere della forma finale di Yeh-Hamza nella forma iniziale di Yeh-Hamza; un processo di gestione speciale deve convertirlo nella forma finale di Yeh e Hamza.
Per evitare la perdita di tali caratteri durante la conversione, sono disponibili varie opzioni di forma araba per gestirli correttamente.