Specjalne znaki arabskie
Niektóre znaki arabskie mają różne reprezentacje w różnych stronach kodowych i dlatego wymagają specjalnej obsługi podczas konwersji strony kodowej.
Ze względu na to, że znaki te nie są reprezentowane we wszystkich stronach kodowych, normalna konwersja skutkowała zastępowaniem znaków sterujących (SUB), co oznacza utratę danych.
- Lam-Alef
- Ten znak jest reprezentowany jako pojedynczy znak w stronach kodowych 420, 864 i 1046, które są używane do wizualnej prezentacji oprócz kodu Unicode arabskiej prezentacji Forms-B (zakresuFExx ). Ten znak jest reprezentowany przez dwa znaki, Lam i Alef, w stronach kodowych 425, 1089 i 1256, które są używane do niejawnej reprezentacji oprócz kodu Unicode arabskiego u06xx .
- Tail of Seen rodziny znaków
- Wizualne strony kodowe 420, 864 i 1046 reprezentują ostateczną postać rodziny znaków Seen jako dwa sąsiadujące ze znakami: kształt trzech kwartałów i Tail. Niejawne strony kodowe 425, 1089, 1256 i arabski u06xx w kodzie Unicode nie reprezentują znaków Tail. W języku Unicode Arabski Prezentacja Forms-B (zakresuFExx ), ostateczna forma znaków w rodzinie Seen jest reprezentowana jako jeden znak.
- Taszkeel lub znaki diakrytyczne z wyjątkiem Shadda
- Znaki te nie są reprezentowane w stronach kodowych 420 i 864. Konwersja znaków Tashkeel ze stron kodowych 425, 1046, 1089, 1256 i Unicode do 420 lub 864 powoduje, że znaki SUB są poprawne.
- Ostateczny kształt Y-Hamza
- Strony kodowe 420 i 864 nie mają niepowtarzalnego charakteru ostatecznej postaci Yeh-Hamza; jest ona reprezentowana jako dwie postacie: Yeh wersja ostateczna i Hamza. W innych stronach kodowych, takich jak 425, 1046, 1089, 1256 i Unicode, ostateczny kształt Yeh-Hamza jest reprezentowany jako jeden znak lub dwa znaki w zależności od danych wejściowych użytkownika; bez względu na to, czy jest to jeden klucz udarowy (klawisz Yeh-Hamza), czy dwa pociągnięcia (klawisz Yeh + Hamza). Konwersja z poprzednich stron kodowych na 420 lub 864 konwertuje postać finałową Yeh-Hamza na formę początkową Yeh-Hamza; specjalny proces obsługi musi przekształcić go w ostateczny kształt Yeh i Hamza.
Aby uniknąć utraty takich znaków podczas konwersji, dostępne są różne opcje kształtowania się języka arabskiego w celu ich prawidłowego obsługania.