Was ist ein Wissensgraph?
Erfahren Sie mehr über Wissensgraphen, also Netzwerke semantischer Metadaten, die eine Sammlung verwandter Entitäten darstellen
Schwarzer und blauer Hintergrund
Was ist ein Wissensgraph?

Ein Wissensgraph (Knowledge Graph), der auch als semantisches Netzwerk bezeichnet wird, stellt ein Netzwerk aus realen Entitäten – d. h. Objekten, Ereignissen, Situationen oder Konzepten – dar und veranschaulicht die Beziehungen zwischen ihnen. Diese Informationen werden in der Regel in einer Graphendatenbank gespeichert und als Graphenstruktur visualisiert, wovon sich der Begriff „Wissensgraph“ herleitet.

Ein Wissensgraph besteht aus drei Hauptkomponenten: Knoten, Kanten und Beschriftungen. Jedes Objekt, jeder Ort und jede Person kann ein Knoten sein. Eine Kante definiert die Beziehung zwischen den Knoten. Ein Knoten könnte zum Beispiel ein Kunde wie IBM und eine Agentur wie Ogilvy sein. Eine Kante würde die Beziehung als eine Kundenbeziehung zwischen IBM und Ogilvy kategorisieren.

A steht für das Subjekt, B steht für das Prädikat, C steht für das Objekt

Es ist auch zu beachten, dass die Definitionen von Wissensgraphen (Knowledge Graphs) variieren, und es gibt Untersuchungen (PDF, 183 KB) (Link befindet sich außerhalb von ibm.com), die darauf hindeuten, dass ein Wissensgraph nichts anderes ist als eine Wissensbasis oder eine Ontologie. Populär wurde der Begriff durch den Knowledge Graph von Google im Jahr 2012.

Ontologien

Ontologien werden ebenfalls häufig im Zusammenhang mit Wissensgraphen erwähnt, aber auch hier wird noch darüber diskutiert, wie sie sich von Wissensgraphen unterscheiden. Letztlich dienen Ontologien dazu, eine formale Darstellung der Entitäten im Graphen zu erstellen. Sie basieren in der Regel auf einer Taxonomie, aber da sie mehrere Taxonomien enthalten können, wird eine eigene Definition beibehalten. Da Wissensgraphen und Ontologien in ähnlicher Weise – d.h. durch Knoten und Kanten – dargestellt werden und auf dem RDF-Tripel (Resource Description Framework) basieren, ähneln sie sich in der Regel in der Visualisierung.

Ein Beispiel für eine Ontologie wäre, wenn wir einen bestimmten Veranstaltungsort wie den Madison Square Garden untersuchen. Eine Ontologie unterscheidet zwischen den Ereignissen an diesem Ort anhand einer Variable wie der Zeit. Eine Sportmannschaft, wie die New York Rangers, hat eine Reihe von Spielen innerhalb einer Saison, die in dieser Arena ausgetragen werden. Es handelt sich um Eishockeyspiele, die alle am selben Ort stattfinden. Jede Veranstaltung wird jedoch durch Datum und Uhrzeit unterschieden.

Die Web Ontology Language (OWL) ist ein Beispiel für eine weit verbreitete Ontologie, die vom World Wide Web Consortium (W3C) unterstützt wird, einer internationalen Vereinigung, die sich für offene Standards einsetzt, um die Weiterentwicklung des Internets zu fördern.  Letztlich wird diese Organisation durch eine technologische Infrastruktur wie Datenbanken, APIs und Algorithmen des maschinellen Lernens unterstützt, die Menschen und Diensten helfen, effizienter auf Informationen zuzugreifen und sie zu verarbeiten.

Funktionsweise eines Wissensgraphen

Wissensgraphen setzen sich in der Regel aus Daten aus verschiedenen Quellen zusammen, die sich häufig in ihrer Struktur unterscheiden. Schemata, Identitäten und Kontext wirken zusammen, um unterschiedlichen Daten eine Struktur zu verleihen. Schemata bilden den Rahmen für den Wissensgraphen, Identitäten klassifizieren die zugrundeliegenden Knoten entsprechend und der Kontext bestimmt den Rahmen, in dem dieses Wissen vorliegt. Diese Komponenten helfen, Wörter mit mehreren Bedeutungen zu unterscheiden. Auf diese Weise können Produkte wie der Algorithmus der Google-Suchmaschine den Unterschied zwischen „Apple“ (der Marke) und „apple“ (dem englischen Wort für Apfel) feststellen.

Wissensgraphen, die mithilfe von maschinellem Lernen erstellt werden, nutzen die Verarbeitung natürlicher Sprache (NLP), um durch einen Prozess, der als semantische Anreicherung bezeichnet wird, eine umfassende Übersicht über Knoten, Kanten und Beschriftungen zu erstellen. Wenn Daten eingelesen werden, ermöglicht dieser Prozess Wissensgraphen, einzelne Objekte zu identifizieren und die Beziehungen zwischen verschiedenen Objekten zu verstehen. Dieses Arbeitswissen wird dann mit anderen relevanten und ähnlichen Daten verglichen und integriert. Sobald ein Wissensgraph vollständig ist, ermöglicht er es Systemen zur Beantwortung von Fragen und zur Suche, umfassende Antworten auf unterschiedlichste Anfragen abzurufen und wiederzuverwenden. Während bei Verbraucherprodukten die Zeitersparnis im Vordergrund steht, können dieselben Systeme auch in einem geschäftlichen Umfeld eingesetzt werden, indem sie die manuelle Datenerfassung und -integration zur Unterstützung der Entscheidungsfindung im Unternehmen überflüssig machen.

Die Aktivitäten zur Datenintegration im Zusammenhang mit Wissensgraphen können auch zur Generierung von neuem Wissen beitragen, indem sie Verbindungen zwischen Datenpunkten herstellen, die zuvor möglicherweise nicht bekannt waren.

Anwendungsfälle für Wissensgraphen

Es gibt eine Reihe von populären, verbraucherorientierten Wissensgraphen, die die Erwartungen der Benutzer an Suchsysteme in Unternehmen bestimmen. Hierzu gehören:

  • DBPedia und Wikidata sind zwei verschiedene Wissensgraphen für Daten auf Wikipedia.org. DBPedia besteht aus Daten aus den Infoboxen von Wikipedia, während Wikidata sich auf sekundäre und tertiäre Objekte konzentriert. Beide veröffentlichen in der Regel im RDF-Format.  
  • Google Knowledge Graph wird über die Ergebnisseiten der Google-Suchmaschine (SERPs) dargestellt und liefert Informationen, die auf den Suchanfragen der Nutzer basieren. Dieser Wissensgraph besteht aus über 500 Millionen Objekten, die Daten aus Freebase, Wikipedia, dem CIA World Factbook und anderen Quellen beziehen.

Wissensgraphen finden aber auch in anderen Branchen Anwendung, z. B:

  • Einzelhandel: Wissensgraphen werden für Up-Sell- und Cross-Sell-Strategien eingesetzt, indem sie Produkte auf der Grundlage des individuellen Kaufverhaltens und beliebter Kauftrends in verschiedenen demografischen Gruppen empfehlen.
  • Unterhaltung: Wissensgraphen werden auch für auf künstlicher Intelligenz (KI) basierende Empfehlungsmaschinen für Content-Plattformen wie Netflix, SEO oder soziale Medien genutzt. Auf der Grundlage des Klickverhaltens und anderer Online-Aktivitäten empfehlen diese Anbieter den Nutzern neue Inhalte zum Lesen oder Ansehen.
  • Finanzwirtschaft: Diese Technologie wird auch für Initiativen zur Feststellung der Kundenidentität (KYC) und zur Bekämpfung von Geldwäsche in der Finanzbranche eingesetzt. Dies dient zur Vorbeugung und Aufklärung von Finanzkriminalität, denn Finanzinstitute können die Geldströme nachvollziehen und Kunden identifizieren, die sich nicht an die Vorschriften halten.
  • Gesundheitswesen: Wissensgraphen sind auch für die Gesundheitsbranche von Nutzen, da sie die Beziehungen in der medizinischen Forschung organisieren und kategorisieren. Diese Informationen helfen den Anbietern bei der Validierung von Diagnosen und der Festlegung von Behandlungsplänen auf der Grundlage der individuellen Bedürfnisse.  
Zugehörige Lösungen
IBM Cloud

IBM Cloud mit Red Hat bietet marktführende Sicherheit, unternehmensweite Skalierbarkeit und offene Innovation, um das volle Potenzial von Cloud und KI zu erschließen.

IBM Cloud erkunden
IBM Watson-Produkte

Integrieren Sie KI mithilfe von Watson AI in Ihre Anwendungen, um genauere Vorhersagen treffen zu können.

IBM Watson-Produkte erkunden
IBM Watson Studio

Erstellen Sie KI-Modelle, führen Sie sie aus und verwalten Sie sie. Bereiten Sie Daten vor und erstellen Sie Modelle in jeder beliebigen Cloud mit Open-Source-Code oder visueller Modellierung. Prognostizieren und optimieren Sie Ihre Ergebnisse.

IBM Watson Studio erkunden
Machen Sie den nächsten Schritt

Sie können IBM Cloud, Watson-Services, Watson Studio und Open-Source-Technologien verwenden, um Unternehmensinitiativen für den Einsatz von Wissensgraphen zu unterstützen.Entwickeln Sie Ihren eigenen Wissensgraphen aus Dokumenten und gewinnen Sie Erkenntnisse aus unstrukturierten Textinhalten, die aus verschiedenen Geschäftsbereichen stammen.

Erstellen Sie noch heute ein IBM Cloudkonto