Qu'est-ce qu'un graphe de connaissances ?

Un graphe de connaissances, également appelé réseau sémantique, représente un réseau d'entités du monde réel, c'est-à-dire des objets, des événements, des situations ou des concepts, et illustre la relation entre ces entités. Ces informations sont généralement stockées dans une base de données orientée graphes et visualisées sous la forme d'une structure graphique, d'où le terme de « graphe de connaissances ».

Un graphe de connaissances se compose de trois éléments principaux : les nœuds (ou sommets), les arêtes (ou arcs) et les étiquettes. Tout objet, lieu ou personne peut être un nœud. Une arête définit la relation entre les nœuds. Par exemple, un nœud peut être un client, comme IBM, et une agence comme Ogilvy. Une arête permet de classer la relation comme une relation client entre IBM et Ogilvy.

A représente le sujet, B représente le prédicat et C représente l'objet.

Il convient également de noter que les définitions des graphes de connaissances varient et qu'il existe une étude (PDF, 183 Ko) (lien externe au site ibm.com) qui suggère qu'un graphe de connaissances ne diffère pas d'une base de connaissances ou d'une ontologie. Elle soutient plutôt que le terme a été popularisé par le "Knowledge Graph" de Google en 2012.

Les ontologies

Les ontologies sont fréquemment mentionnées dans le contexte des graphes de connaissances, mais là encore, la différence avec les graphes de connaissances fait encore débat. En définitive, les ontologies servent à créer une représentation formelle des entités dans le graphe. Elles sont généralement basées sur une taxonomie, mais comme elles peuvent contenir plusieurs taxonomies, elles conservent leur propre définition distincte. Étant donné que les graphes de connaissances et les ontologies sont représentés de manière similaire, c'est-à-dire par des nœuds et des arêtes, et qu'ils sont basés sur les triplets RDF (Resource Description Framework), ils ont tendance à se ressembler dans les visualisations.

Un exemple d'ontologie peut être l'examen d'un lieu particulier, comme le Madison Square Garden. Une ontologie distingue les événements qui se déroulent à cet endroit en fonction d'une variable telle que l'heure. Une équipe sportive, comme les New York Rangers, a une série de matchs au cours d'une saison qui se déroulent dans ce stade. Ce sont tous des matchs de hockey, et ils sont tous organisés dans le même stade. Cependant, chaque événement se distingue par sa date et son heure.

Le Web Ontology Language (OWL) est un exemple d'ontologie largement adoptée, soutenue par le World Wide Web Consortium (W3C), une communauté internationale qui défend des normes ouvertes pour la longévité de l'Internet. En définitive, cette organisation des connaissances s'appuie sur une infrastructure technologique telle que des bases de données, des API et des algorithmes d'apprentissage automatique, dont le rôle est d'aider les personnes et les services à accéder aux informations et à les traiter plus efficacement.

Fonctionnement d'un graphe des connaissances

Les graphes de connaissances sont généralement constitués d'ensembles de données provenant de diverses sources, dont la structure est souvent différente. Les schémas, les identités et le contexte coopèrent pour fournir une structure aux différentes données. Les schémas fournissent la structure du graphe de connaissances, les identités classent correctement les nœuds sous-jacents et le contexte détermine le cadre dans lequel ces connaissances existent. Ces composants permettent de distinguer les mots ayant plusieurs significations. Cela permet à des produits, comme l'algorithme du moteur de recherche de Google, de déterminer la différence entre Apple (la marque) et "apple", le mot pour pomme en anglais.

Les graphes de connaissances, qui utilisent l'apprentissage automatique, font appel au traitement automatique du langage naturel (NLP) pour construire une vue complète des nœuds, des arêtes et des étiquettes via un processus appelé enrichissement sémantique. Lorsque les données sont ingérées, ce processus permet aux graphes de connaissances d'identifier les objets individuels et de comprendre les relations entre les différents objets. Ces connaissances sont ensuite comparées et intégrées à d'autres ensembles de données pertinents et de nature similaire. Lorsqu'un graphe de connaissances est complet, il permet aux systèmes de réponse aux questions et de recherche de récupérer et de réutiliser des réponses complètes à des requêtes données. Si les produits grand public démontrent leur capacité à faire gagner du temps, les mêmes systèmes peuvent également être appliqués dans un contexte professionnel, en éliminant le travail manuel de collecte et d'intégration des données pour faciliter la prise de décision.

Les projets d'intégration des données utilisant des graphes de connaissances peuvent également favoriser la création de nouvelles connaissances, en établissant des connexions entre des points de données qui n'avaient peut-être pas été détectées auparavant.

Cas d'utilisation des graphes de connaissances

Il existe un certain nombre de graphes de connaissances populaires, destinés aux consommateurs, qui définissent les attentes des utilisateurs vis-à-vis des systèmes de recherche dans les entreprises. Voici quelques exemples de ces graphes de connaissances :

DBPedia et Wikidata sont deux graphes de connaissance différents utilisés pour les données de Wikipedia.org. DBPedia est composé de données provenant des infobox de Wikipédia, tandis que Wikidata se concentre sur les objets secondaires et tertiaires. Tous deux sont généralement publiés dans un format RDF.
Google Knowledge Graph, le graphe de connaissances de Google, est représenté par les pages de résultats des moteurs de recherche (SERP) de Google, qui fournissent des informations en fonction des recherches des internautes. Ce graphe de connaissances est composé de plus de 500 millions d'objets, provenant de données de Freebase, Wikipedia, le CIA World Factbook, et ainsi de suite.

Cependant, les graphes de connaissances ont également des applications dans d'autres secteurs, par exemple :

Distribution : Les graphes de connaissances ont été utilisés pour les stratégies de vente incitative et de vente croisée, en recommandant des produits en fonction du comportement d'achat individuel et des tendances d'achat populaires dans les groupes démographiques.
Secteur des loisirs : Les graphes de connaissances sont également utilisés par les moteurs de recommandation basés sur l'intelligence artificielle (IA) pour les plateformes de contenu, comme Netflix, le référencement SEO ou les médias sociaux. Sur la base des clics et autres comportements d'engagement en ligne, ces fournisseurs recommandent aux utilisateurs de nouveaux contenus à lire ou à regarder.
Finance : Cette technologie a également été utilisée pour les initiatives de connaissance du client (KYC) et de lutte contre le blanchiment d'argent dans le secteur de la finance. Les graphes de connaissances contribuent aux enquêtes et à la prévention de la criminalité financière, en permettant aux institutions bancaires de comprendre les flux des fonds de leur clientèle et d'identifier les clients non conformes.
Soins de santé : Les graphes de connaissance profitent également au secteur des soins de santé en organisant et en classant les relations dans la recherche médicale. Ces informations aident les prestataires à valider les diagnostics et à identifier les thérapies en fonction des besoins individuels.

Solutions connexes

IBM Cloud

IBM Cloud with Red Hat offre une sécurité, une évolutivité d'entreprise et une innovation ouverte de pointe pour libérer tout le potentiel du cloud et de l'IA.

Explorer IBM Cloud

Produits IBM Watson

Injectez l'IA dans vos applications avec Watson AI pour faire des prévisions plus précises.

Explorer les produits IBM Watson

IBM Watson Studio

Créez, exécutez et gérez des modèles d'IA. Préparez les données et construisez des modèles dans n'importe quel cloud à l'aide d'un code source ouvert ou de la modélisation visuelle. Prévoyez et optimisez vos résultats.

Explorer IBM Watson Studio

Pour aller plus loin

Vous pouvez utiliser IBM Cloud, les services Watson, Watson Studio et les technologies open source pour accompagner les initiatives de graphes de connaissances des entreprises.Construisez votre propre graphe de connaissances à partir de documents et extrayez des informations à partir du contenu textuel non structuré généré par divers domaines d'activité.

Créez un compte IBM Cloud dès aujourd'hui.