Ein Wissensgraph (Knowledge Graph), der auch als semantisches Netzwerk bezeichnet wird, stellt ein Netzwerk aus realen Entitäten – d. h. Objekten, Ereignissen, Situationen oder Konzepten – dar und veranschaulicht die Beziehungen zwischen ihnen. Diese Informationen werden in der Regel in einer Graphendatenbank gespeichert und als Graphenstruktur visualisiert, wovon sich der Begriff „Wissensgraph“ herleitet.
Ein Wissensgraph besteht aus drei Hauptkomponenten: Knoten, Kanten und Beschriftungen. Jedes Objekt, jeder Ort und jede Person kann ein Knoten sein. Eine Kante definiert die Beziehung zwischen den Knoten. Ein Knoten könnte zum Beispiel ein Kunde wie IBM und eine Agentur wie Ogilvy sein. Eine Kante würde die Beziehung als eine Kundenbeziehung zwischen IBM und Ogilvy kategorisieren.
A steht für das Subjekt, B steht für das Prädikat, C steht für das Objekt
Es ist auch zu beachten, dass die Definitionen von Wissensgraphen (Knowledge Graphs) variieren, und es gibt Untersuchungen (PDF, 183 KB) (Link befindet sich außerhalb von ibm.com), die darauf hindeuten, dass ein Wissensgraph nichts anderes ist als eine Wissensbasis oder eine Ontologie. Populär wurde der Begriff durch den Knowledge Graph von Google im Jahr 2012.
Ontologien werden ebenfalls häufig im Zusammenhang mit Wissensgraphen erwähnt, aber auch hier wird noch darüber diskutiert, wie sie sich von Wissensgraphen unterscheiden. Letztlich dienen Ontologien dazu, eine formale Darstellung der Entitäten im Graphen zu erstellen. Sie basieren in der Regel auf einer Taxonomie, aber da sie mehrere Taxonomien enthalten können, wird eine eigene Definition beibehalten. Da Wissensgraphen und Ontologien in ähnlicher Weise – d.h. durch Knoten und Kanten – dargestellt werden und auf dem RDF-Tripel (Resource Description Framework) basieren, ähneln sie sich in der Regel in der Visualisierung.
Ein Beispiel für eine Ontologie wäre, wenn wir einen bestimmten Veranstaltungsort wie den Madison Square Garden untersuchen. Eine Ontologie unterscheidet zwischen den Ereignissen an diesem Ort anhand einer Variable wie der Zeit. Eine Sportmannschaft, wie die New York Rangers, hat eine Reihe von Spielen innerhalb einer Saison, die in dieser Arena ausgetragen werden. Es handelt sich um Eishockeyspiele, die alle am selben Ort stattfinden. Jede Veranstaltung wird jedoch durch Datum und Uhrzeit unterschieden.
Die Web Ontology Language (OWL) ist ein Beispiel für eine weit verbreitete Ontologie, die vom World Wide Web Consortium (W3C) unterstützt wird, einer internationalen Vereinigung, die sich für offene Standards einsetzt, um die Weiterentwicklung des Internets zu fördern. Letztlich wird diese Organisation durch eine technologische Infrastruktur wie Datenbanken, APIs und Algorithmen des maschinellen Lernens unterstützt, die Menschen und Diensten helfen, effizienter auf Informationen zuzugreifen und sie zu verarbeiten.
Wissensgraphen setzen sich in der Regel aus Daten aus verschiedenen Quellen zusammen, die sich häufig in ihrer Struktur unterscheiden. Schemata, Identitäten und Kontext wirken zusammen, um unterschiedlichen Daten eine Struktur zu verleihen. Schemata bilden den Rahmen für den Wissensgraphen, Identitäten klassifizieren die zugrundeliegenden Knoten entsprechend und der Kontext bestimmt den Rahmen, in dem dieses Wissen vorliegt. Diese Komponenten helfen, Wörter mit mehreren Bedeutungen zu unterscheiden. Auf diese Weise können Produkte wie der Algorithmus der Google-Suchmaschine den Unterschied zwischen „Apple“ (der Marke) und „apple“ (dem englischen Wort für Apfel) feststellen.
Wissensgraphen, die mithilfe von maschinellem Lernen erstellt werden, nutzen die Verarbeitung natürlicher Sprache (NLP), um durch einen Prozess, der als semantische Anreicherung bezeichnet wird, eine umfassende Übersicht über Knoten, Kanten und Beschriftungen zu erstellen. Wenn Daten eingelesen werden, ermöglicht dieser Prozess Wissensgraphen, einzelne Objekte zu identifizieren und die Beziehungen zwischen verschiedenen Objekten zu verstehen. Dieses Arbeitswissen wird dann mit anderen relevanten und ähnlichen Daten verglichen und integriert. Sobald ein Wissensgraph vollständig ist, ermöglicht er es Systemen zur Beantwortung von Fragen und zur Suche, umfassende Antworten auf unterschiedlichste Anfragen abzurufen und wiederzuverwenden. Während bei Verbraucherprodukten die Zeitersparnis im Vordergrund steht, können dieselben Systeme auch in einem geschäftlichen Umfeld eingesetzt werden, indem sie die manuelle Datenerfassung und -integration zur Unterstützung der Entscheidungsfindung im Unternehmen überflüssig machen.
Die Aktivitäten zur Datenintegration im Zusammenhang mit Wissensgraphen können auch zur Generierung von neuem Wissen beitragen, indem sie Verbindungen zwischen Datenpunkten herstellen, die zuvor möglicherweise nicht bekannt waren.
Es gibt eine Reihe von populären, verbraucherorientierten Wissensgraphen, die die Erwartungen der Benutzer an Suchsysteme in Unternehmen bestimmen. Hierzu gehören:
Wissensgraphen finden aber auch in anderen Branchen Anwendung, z. B:
IBM Cloud mit Red Hat bietet marktführende Sicherheit, unternehmensweite Skalierbarkeit und offene Innovation, um das volle Potenzial von Cloud und KI zu erschließen.
Integrieren Sie KI mithilfe von Watson AI in Ihre Anwendungen, um genauere Vorhersagen treffen zu können.
Erstellen Sie KI-Modelle, führen Sie sie aus und verwalten Sie sie. Bereiten Sie Daten vor und erstellen Sie Modelle in jeder beliebigen Cloud mit Open-Source-Code oder visueller Modellierung. Prognostizieren und optimieren Sie Ihre Ergebnisse.