Considerazioni su UTF-8 e Unicode quando si utilizzano i selettori di messaggi

I caratteri, non racchiusi tra virgolette singole, che costituiscono le parole chiave riservate di una stringa di selezione devono essere immessi in Basic Latin Unicode (che va dal carattere U+0000 a U+0007F). Non è valido utilizzare altre rappresentazioni di punti di codice di caratteri alfanumerici. Ad esempio, il numero 1 deve essere espresso come U+0031 in Unicode, non è valido per utilizzare l'equivalente cifra a larghezza intera U+FF11 o l'equivalente arabo U+0661.

I nomi delle proprietà del messaggio possono essere specificati utilizzando qualsiasi sequenza valida di caratteri Unicode. I nomi delle proprietà dei messaggi contenuti nelle stringhe di selezione codificati in UTF-8 verranno convalidati anche se contengono caratteri multi - byte. La convalida di UTF-8 a più byte è rigorosa ed è necessario assicurarsi che per i nomi delle proprietà del messaggio siano utilizzate sequenze UTF-8 valide.

Non viene eseguita alcuna elaborazione supplementare sui valori o sui nomi delle proprietà durante il confronto per l'uguaglianza. Ciò significa, ad esempio, che non avviene alcuna pre / de - composizione e alle legature non viene dato alcun significato speciale. Ad esempio, il carattere umlaut precomposto U+00FC non è considerato equivalente a U+0075 + U+0308 e la sequenza di caratteri ff non è considerata equivalente a Unicode U+FB00 (LATIN SMALL LIGATURE FF)

I dati della proprietà racchiusi tra virgolette singole possono essere rappresentati da qualsiasi sequenza di byte e non vengono convalidati.