Intelligens egyeztetés

A diagramfelületen kereshet olyan egyedeket, amelyek az egyedtípusuk és bizonyos feltételek alapján (mint például attribútumpéldányok és adatbázistulajdonság-értékek) ugyanazokat a valós világbeli objektumokat ábrázolhatják.

Az intelligens egyeztetés előre meghatározott szabályok készletét használja annak eldöntéséhez, hogy két egyed ugyanazt a valós világbeli objektumot ábrázolja-e. Megvizsgálja az egyedeket és a társított kapcsolataikat, valamint összehasonlítja a tulajdonságértékeiket egy átfogó pontszám előállításához. Az 1-es pontszám egy gyenge egyezést jelent. A 9-es pontszám egy erős egyezést jelent. Az intelligens egyeztetés a keresési eredményeket lehetséges egyezések halmazaként jelzi - ezek az ú.n. egyeztetett készletek.

Küszöbértékek megadásával kiválaszthatja, hogy az intelligens egyeztetés milyen erősségű egyezéseket jelentsen. A választott küszöbértéktől függően kaphat kevesebb, viszont erősebb egyezéseket, vagy több, viszont gyengébb egyezéseket. Általában a diagramon a keresést egy 9-es küszöbértékkel kezdi, hogy megtalálja a legerősebb egyezéseket, majd megismétli a keresést egyre alacsonyabb küszöbértékekkel.

A küszöbérték módosításával feloszthatja az egyeztetett egyedeket pontosabb egyeztetett készletekre. Például öt egyed található egy diagramon, kettő Nem attribútuma Férfi értékre, három Nem attribútuma Nő értékre van beállítva. Minden egyednek azonos a címkéje, azonban a kis- és nagybetűk egy kicsit eltérnek. Az 1-es és 6-os küszöbérték kiválasztása különböző keresésekben ugyanazt az egyedet egyezteti mindkét keresésben, de eltérő egyeztetett készleteket eredményez, ahogy az a táblázatban is látható.
Megjegyzés: Az egyeztetéshez az egyedtípus kerül felhasználásra, de ez soha nem vonja magával a tulajdonságértékek egyeztetését. Ebben a példában a Férfi és Nő egyedtípusok Személy egyedekként vannak kezelve. A nemen alapuló összehasonlításra szolgáló intelligens egyeztetés esetén a nem tulajdonságértékeket nem attribútumként hozzá kell rendelni az egyedekhez.
Diagramon lévő egyedek Küszöbérték Egyeztetett készletek
Sam Steele (Nem attribútum: Férfi)

SAM STEELE (Nem attribútum: Nő)

sam steele (Nem attribútum: Nő)

Sam STEELE (Nem attribútum: Férfi)

Sam steele (Nem attribútum: Nő)

1 Sam Steele (5 egyed)
  • Sam Steele
  • SAM STEELE
  • sam steele
  • Sam STEELE
  • Sam steele
Sam Steele (Nem attribútum: Férfi)

SAM STEELE (Nem attribútum: Nő)

sam steele (Nem attribútum: Nő)

Sam STEELE (Nem attribútum: Férfi)

Sam steele (Nem attribútum: Nő)

6 SAM STEELE (3 egyed)
  • SAM STEELE
  • sam steele
  • Sam steele

Sam Steele (2 egyed)

  • Sam Steele
  • Sam STEELE

Intelligens egyeztetés szabályai

Az intelligens egyeztetés a következő feltételek ellenőrzésével először megállapítja, hogy az egyedek egyeztethetők-e:

  • Összehasonlítja a közös szemantika típus viselkedésű egyedeket. Például a Szervezet és a Rendvédelmi ügynökség szemantikai típusok összehasonlíthatók, mert a Rendvédelmi ügynökség a Szervezet szemantikai típus specializációja. A szervezet és Személy szemantikai típusok nem hasonlíthatók össze.
  • Összehasonlítja az egyedeket, hogy azoknak vannak-e olyan attribútumaik, amelyek tulajdonság szemantikai típusa megegyezik, vagy adatrekord-tulajdonságaik, amelyek tulajdonság szemantikai típusa megegyezik.

Ahol azonosíthatók egyedek szóba jöhető párjai, ott összehasonlítja a tulajdonságértékeiket, és ad egy pontszámot az egyezés közeliségének jelzéséhez. A pontszám kiszámításánál a következőket veszi tekintetbe:

  • Tipográfiai hibák; például Michael és Micheal.
  • Általános szinonimák; például Richard és Dick.
  • Fonetika; például Michael és Mikel.
  • Címek; például Mr, Mrs és Dr.
  • Utótagok; például OBE és Phd.
  • Numerikus tulajdonságok; például a jobb oldalról egyezteti a telefonszámokat, hogy figyelembe vegye a körzetszámokat, amelyek eltérően lehetnek formázva.

Néhány egyedtípusnak és tulajdonságnak van szemantikai viselkedése. Az ilyen típusok esetén magasabb pontszámot kapnak az azonosító tulajdonságértékek, mint például egy autó rendszáma. A kevésbé jelentős tények, mint például az autó színe, kevésbé erősek. Azok a találatok is alacsonyabb pontszámot kapnak, ahol az információk ellentmondanak egymásnak, mint például Mr D KENT és Mrs D KENT között ellentmondás van.

Megjegyzés: Nem minden tulajdonságérték rendelkezik szemantikai viselkedéssel. Ha nem rendelkeznek szemantikai viselkedéssel, akkor a szemantikai egyeztetésben az értékeik figyelmen kívül maradnak. Például a Személy tulajdonságok, amelyeknek van egyező viselkedése: Cím, Keresztnév, Középső nevek, Vezetéknév, Teljes név, Név utótag, Nem, Születési dátum, Beosztás és E-mail cím. A többi tulajdonság figyelmen kívül marad.

Egyezések adatbázis-ütközésekkel

Amikor az Analyst's Notebook alkalmazást egy másik adatbázis-alkalmazással használja, mint például az iBase vagy az IBM® i2 iBridge, az adatbázisból kinyert egyedeknek van egy társított adatbázis-azonosságuk.

Adatbázis-ütközéseket tartalmazó egyezések akkor fordulhatnak elő, amikor két egyező egyed egyetlen adatbázisból származik, amely nem támogat több adatbáziskulcsot. Ezek az egyedek egy egyeztetett készletbe kerülnek, és a készletnévhez hozzá van fűzve az Ütközés szó; például: <készletnév>: Ütközés (4 egyed). Ezek az ütköző egyedek összefésülhetők, azonban lényegi információk veszhetnek el. Az ütköző egyedek összefésülése után megmaradt információk attól függenek, hogy az egyedeknek van-e egyedi adatbáziskulcsa, és hogy az adatbázis támogat-e több adatbázis-kulcsot.