Collation IDENTITY

La collation IDENTITY est une simple comparaison binaire des valeurs.

Les chaînes de caractères sont ordonnées par la représentation interne des données de l'ordinateur. Cela produit un résultat qui n'est significatif dans aucune langue.

La correspondance des sous-chaînes est également effectuée à l'aide de la représentation interne de la chaîne. Cela signifie que deux sous-chaînes ne seront considérées comme correspondantes que si elles sont identiques octet par octet. Les règles linguistiques et culturelles ne seront pas prises en compte.

Avantages
  • Collationnement le plus rapide possible.
Inconvénients
  • L'ordre n'est pas linguistique.
  • La correspondance des chaînes de caractères n'est pas linguistique.
  • Les types de caractères et de graphiques sont classés différemment.

La collation IDENTITY convient lorsque l'exactitude linguistique n'est pas importante pour la base de données et les applications, ou lorsque les meilleures performances sont vitales.

Exemples

Pour démontrer le comportement de cette collation, la liste suivante de mots tchèques est utilisée.
  • chleb1
  • Čech
  • C◌̌̌ech 2
  • Jana
  • hlava
  • Jaroslav
  • holub
  • cena
  • jaro
  • čas
  • c◌̌as 3

La base de données avec la collation IDENTITY a été créée à l'aide de la commande suivante : CREATE DATABASE TESTDB COLLATE USING IDENTITY.

Tri :

SELECT WORD FROM TESTDATA ORDER BY WORD

WORD
----------
C◌̌ech
Jana
Jaroslav
cena
chleb
c◌̌as
hlava
holub
jaro
Čech
čas
Dans les résultats de la commande ORDER BY, remarquez :
  • Les lettres majuscules et minuscules ne sont pas regroupées.
  • Les caractères accentués sont regroupés séparément des caractères non accentués.
  • Les caractères avec accents de combinaison sont regroupés avec les caractères non accentués.
  • Le mot chleb est incorrectement regroupé avec les mots commençant par c.

Correspondance de sous-chaînes :

SELECT WORD FROM TESTDATA WHERE WORD LIKE 'c%'  

WORD 
---------- 
cena 
chleb  
c◌̌as 
Dans les résultats de la commande LIKE, remarquez :
  • Le mot c◌̌as est sélectionné, bien qu'il commence par le caractère č et non par le caractère c.
  • Le mot chleb est sélectionné, bien que le digraphe ch ne corresponde pas linguistiquement à la lettre c.
1 En tchèque, le digraphe ch est classé séparément de la lettre c et est ordonné entre les lettres h et i.
2 En Unicode, le caractère accentué Č peut être saisi comme un seul point de code Unicode, U+010C (lettre majuscule latine C avec caron) ou comme deux points de code, U+0043 U+030C (lettre majuscule latine C, combinant le caron). Les deux représentations apparaissent de la même manière sur un écran d'ordinateur ou une impression, mais elles ont des représentations internes différentes. Pour les besoins des exemples, cependant, les caractères seront dessinés différemment ; U+010C sera dessiné comme Č et U+0043 U+030C sera dessiné comme C◌̌. Pour illustrer la combinaison des accents, les deux formes sont incluses dans la liste de mots.
3 En Unicode, le caractère accentué č peut être saisi comme un seul point de code Unicode, U+010D (lettre minuscule latine c avec caron) ou comme deux points de code, U+0063 U+030C (lettre minuscule latine c, combinant caron). Les deux représentations apparaissent de la même manière sur un écran d'ordinateur ou une impression, mais elles ont des représentations internes différentes. Pour les besoins des exemples, cependant, les caractères seront dessinés différemment ; U+010D sera dessiné comme č et U+0063 U+030C sera dessiné comme c◌̌. Pour démontrer la combinaison des accents, les deux formes sont incluses dans la liste de mots.