Caracteres árabes especiales

Algunos caracteres árabes tienen distintas representaciones en distintas páginas de códigos y por ello necesitan un manejo especial durante la conversión de páginas de códigos.

Dado que estos caracteres no están representados en todas las páginas de códigos, una conversión normal resulta en caracteres de control sustitutos (SUB), que es una pérdida de datos.

Lam-Alef
Este carácter se representa como un solo carácter en las páginas de códigos 420, 864 y 1046, que se utilizan para la presentación visual además de Unicode Arabic Presentation Forms-B (rango uFExx). Este carácter se representa como dos caracteres, Lam y Alef, en las páginas de códigos 425, 1089 y 1256, que se utilizan para la representación implícita además del rango u06xx de Unicode Arabic.
Tail de la familia de caracteres Seen
Las páginas de códigos visuales 420, 864 y 1046 representa el formato final de la familia de caracteres Seen como dos caracteres adyacentes: la forma de tres cuartos y Tail. Las páginas de códigos implícitas 425, 1089, 1256 y el rango u06xx Unicode Arabic no representan el carácter Tail. En Unicode Arabic Presentation Forms-B (rango uFExx), el formato final para caracteres en la familia Seen se representa como un carácter.
Tashkeel o caracteres diacrítico excepto para Shadda
Estos caracteres no están representados en las páginas de códigos 420 y 864. Los caracteres de conversión de Tashkeel de las páginas de códigos 425, 1046, 1089, 1256 y Unicode a 420 u 864 resultan en caracteres SUB.
Formato final de Yeh-Hamza
Las páginas de códigos 420 y 864 no tienen un carácter exclusivo para el formato final Yeh-Hamza; se representa como dos caracteres: formato final de Yeh y Hamza. En otras páginas de códigos, como 425, 1046, 1089, 1256 y Unicode, el formato final de Yeh-Hamza se representa como un carácter o dos caracteres en función de la entrada del usuario; si es una pulsación (tecla Yeh-Hamza) o dos pulsaciones (tecla Yeh + tecla Hamza). La conversión de las páginas de códigos anteriores en 420 u 864 convierte el carácter de formato final de Yeh-Hamza en el formato inicial de Yeh-Hamza; un proceso de manejo especial debe convertirlo en el formato final de Yeh y Hamza.

Para evitar la pérdida de dichos caracteres durante la conversión, hay varias opciones de forma de árabe disponibles para manejarlos correctamente.