Was ist ein gerichteter azyklischer Graph (DAG)?

Autoren

Alice Gomstyn

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

Was ist ein gerichteter azyklischer Graph (DAG)?

Ein gerichteter azyklischer Graph (Directed Acyclic Graph, DAG) ist ein Diagrammtyp, in dem Knoten durch unidirektionale Verbindungen verbunden sind, die keine Zyklen bilden. DAGs werden verwendet, um Abhängigkeiten und Kausalzusammenhänge darzustellen.

Wie alle Diagramme können auch DAGs hilfreich sein, um Beziehungen zwischen Knoten zu visualisieren, die Daten, Aufgaben oder Ereignisse darstellen. DAGs sind jedoch nützlich, wenn es darum geht, Systeme darzustellen, in denen Ereignisse in einer bestimmten Reihenfolge ablaufen, wie z. B. ein Zeitplan von Aufgaben, die erledigt werden müssen, um ein Ziel zu erreichen.

DAGs sind auch für die Erstellung von Kausaldiagrammen wichtig: DAGs können Systeme darstellen, bei denen einige Knoten andere Knoten beeinflussen, aber die kausalen Effekte funktionieren nicht in umgekehrter Richtung. Ein grundlegendes Beispiel für solche einseitigen Beziehungen finden sich in Stammbäumen, da die DAGs aufeinanderfolgende Generationen von Eltern und Kindern abbilden.

Die Anwendung von DAGs ist in der Informatik weit verbreitet. Entwickler und Ingenieure verwenden DAGS für Datenpipelines und Datenverarbeitung, neuronale Netzwerkarchitektur, Robotertechnik und mehr.

Die neuesten Tech-News – von Experten bestätigt

Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und mehr auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.

Was sind die Komponenten eines DAG?

Um besser zu verstehen, was ein gerichteter azyklischer Graph ist, lassen Sie uns seine Komponenten aufschlüsseln:

Knoten: Knoten, auch Scheitelpunkte genannt, stellen Entitäten, Objekte oder Variablen in einem Diagramm dar. Sie werden in der Regel als Punkte oder Kreise dargestellt.

Kanten: Kanten stellen Verbindungen zwischen Entitäten dar. Sie werden als Linien dargestellt.

Gerichtete Kanten: Gerichtete Kanten stellen Verbindungen dar, die nur in eine Richtung durchlaufen werden können. Pfeile an solchen Kanten zeigen ihre Richtung an.

Gerichtete Graphen: Graphen, die ausschließlich aus gerichteten Kanten bestehen, nennt man gerichtete Graphen oder „Digraphen“. Im Gegensatz dazu handelt es sich bei Graphen ohne gerichtete Kanten um ungerichtete Graphen.

Collider: Collider sind Knoten, auf die 2 gerichtete Kanten zeigen.

Pfade: Pfade sind eine Abfolge von Kanten, die einen bestimmten Knoten mit einem anderen verbinden. Pfade, die vollständig aus gerichteten Kanten bestehen, werden als gerichtete Pfade bezeichnet. Gerichtete Pfade, die auf Kausalzusammenhänge hinweisen, werden als Kausalpfade bezeichnet.

Baum: In der Informatik ist ein Baum ein gerichteter azyklischer Graph, in dem jeder Knoten nur eine gerichtete Kante hat, die auf ihn zeigt, mit Ausnahme des Startknotens (des „Wurzelknotens“). Während die Kanten vom Wurzelknoten ausgehen, zeigen keine Kanten auf den Wurzelknoten.

Neben dem Verständnis der Teile einer DAG ist es auch wichtig, eine Komponente zu erkennen, die ihr fehlt: ein Zyklus. Das „azyklisch“ in gerichteten azyklischen Graphen bezieht sich darauf, dass es in diesen Graphen keine Zyklen oder geschlossenen Kreisläufe gibt. Mit anderen Worten: Wenn Sie bei einem Knoten in einer DAG beginnen und die nachfolgenden Knoten und Kanten durchlaufen, ist es unmöglich, zum Startknoten zurückzukehren.

AI Academy

Ist Datenverwaltung das Geheimnis generativer KI?

Erfahren Sie, warum qualitativ hochwertige Daten für den erfolgreichen Einsatz generativer KI unerlässlich sind.

Zur Episode wechseln

Graphentheoretische Konzepte, die für DAGs relevant sind

In der Graphentheorie (der Lehre von den Graphen) werden bei der Arbeit mit gerichteten azyklischen Graphen häufig mehrere Konzepte oder Verfahren angewendet. Dazu gehören:

Topologische Sortierung
Transitiver Abschluss
Transitive Reduktion

Topologische Sortierung

Eine topologische Sortierung, die auch als topologische Ordnung bezeichnet wird, ist eine Möglichkeit, die Knoten eines DAG linear zu ordnen, sodass die Knoten, die auf andere Knoten zeigen, zuerst erscheinen und Nachfolger nicht vor ihren Vorgängern angezeigt werden. Topologische Sortieralgorithmen können solche Sequenzen auf der Grundlage von DAGs erzeugen.¹

Transitiver Abschluss

In komplizierten Graphen kann es schwierig sein, zu erkennen, welche Knoten über gerichtete Pfade von anderen Knoten aus „erreichbar“ sind. Bei der transitiven Schließung werden solche indirekten Verbindungen zwischen Knoten identifiziert und grafisch dargestellt.

Wenn ein Graph beispielsweise eine gerichtete Kante hat, die die Knoten A und B verbindet, und eine weitere gerichtete Kante, die die Knoten B und C verbindet, so würde dies darauf hinweisen, dass A und C indirekt miteinander verbunden sind. Ein transitiver Abschluss würde zu einer neuen gerichteten Kante führen, die A mit C verbindet - jetzt der kürzeste Weg zwischen diesen beiden Knoten - zusätzlich zu den ursprünglichen gerichteten Kanten zwischen A und B und B und C. Wie bei der topologischen Sortierung können Algorithmen für die Berechnung des transitiven Abschlusses verwendet werden.

Transitive Reduktion

Die transitive Reduktion kann als das Gegenteil des transitiven Abschlusses betrachtet werden. Im Zusammenhang mit einem gerichteten Graphen hat die transitive Reduktion des Graphen die gleiche Anzahl von Knoten wie der ursprüngliche Graph und die Paare von Knoten, die erreichbar sind, sind die gleichen. Allerdings wird die Anzahl der Kanten in der transitiven Reduktion des Graphen minimiert.

Betrachten Sie zum Beispiel einen ursprünglichen Graphen, der eine gerichtete Kante enthält, die den Knoten A mit dem Knoten C verbindet, sowie eine Folge von gerichteten Kanten, die den Knoten A mit dem Knoten B und den Knoten B mit dem Knoten C verbinden. Eine transitive Reduktion dieses Graphen würde die Kante zwischen A und C ausschließen, während die Kanten zwischen der größeren Menge von Variablen erhalten bleiben: A und B und B und C.

Mit anderen Worten: Der längste Pfad zwischen A und C im ursprünglichen Graphen wird in den neuen Graphen aufgenommen, während der Pfad mit nur 1 Kante eliminiert wird.

Was sind die Anwendungen von DAGs in der Informatik?

Gerichtet azyklische Graphen spielen in der Informatik in einer Vielzahl von Anwendungsfällen eine wichtige Rolle:

Datenverarbeitung
Neural networks
Kausale Inferenz beim maschinellen Lernen
Robotertechnik
Compiler-Design
Blockchain

Datenverarbeitung

DAGs helfen Dateningenieuren, Datenstrukturen zu definieren und Datenflüsse zu optimieren. Plattformen zur Datenorchestrierung wie Apache Airflow verwenden beispielsweise DAGs (definiert in Python-Skripten), um Datenverarbeitungsaufgaben zu definieren und ihre Ausführungsreihenfolge in Datenpipelines und Workflows festzulegen.

In Fällen, in denen mehrere DAGs voneinander abhängen, können Orchestrierungstools Abhängigkeitsgraphen erstellen, um diese Beziehungen zu verdeutlichen.² Plattformen zur Daten-Observability können in Verbindung mit Plattformen zur Datenorchestrierung verwendet werden, um Probleme in der Datenpipeline zu erkennen und zu lösen.

Die beschleunigte Einführung von Anwendungen der generativen künstlichen Intelligenz, die auf Datenzugriff angewiesen sind, hat die Bedeutung von Datenpipelines und DAGs in der modernen Technologielandschaft verstärkt.

Neuronale Netze

Ein neuronales Netzwerk ist ein Maschinenlernprogramm, das ähnlich wie das menschliche Gehirn entscheidet, indem es Prozesse verwendet, die die Art und Weise nachahmen, wie biologische Neuronen zusammenarbeiten, um Beobachtungen zu machen und Schlussfolgerungen zu ziehen. DAGs werden verwendet, um neuronale Netzwerke abzubilden und können besonders hilfreich bei der Visualisierung von tiefen neuronalen Netzwerken mit mehreren Schichten sein.

Deep Neural Network-Diagramme mit Kreisen in Blautönen

Kausale Inferenz beim maschinellen Lernen

DAGs können eine Rolle bei den Bemühungen spielen, KI-Modellen beizubringen, kausale Beziehungen durch kausale Inferenz zu erkennen. Die kausale Inferenz ist ein Paradigma zur Bestimmung kausaler Effekte und verwendet oft DAGs. DAGs können zum Beispiel dabei helfen, „Confounder“ zu erkennen, also Variablen, die die tatsächliche Kausalität verzerren oder verschleiern. Insbesondere in der Epidemiologie entwickelt sich die mit kausalen Inferenzen angereicherte KI zu einem Instrument, das Forschern bei der Untersuchung von Krankheitsfaktoren helfen kann.³

Robotertechnik

Forscher haben vorgeschlagen, ein DAG- und großes Sprachmodell-basiertes Strukturplanungsverfahren zu verwenden, um die Leistung von zweiarmigen Robotern zu verbessern. Im vorgeschlagenen Framework erzeugt ein LLM ein DAG, das komplexe Aufgaben als Teilaufgaben darstellt, wobei die Kanten die Abhängigkeiten zwischen den Aufgaben anzeigen. Im Framework werden diese Informationen verwendet, um die Bewegungsplanung und die Koordination zwischen den 2 Armen für die Aufgabenausführung zu bestimmen.⁴

Compiler-Design

DAGs werden verwendet, um das Design von Compilern zu optimieren. Das sind Programme, die Programmiersprachen (Quellcode) in Anweisungen für Computer (Maschinencode) umwandeln. Ein DAG kann zum Beispiel dabei helfen, gemeinsame Unterausdrücke zu identifizieren, die zur Verbesserung der Effizienz eliminiert werden können.

Blockchain

Eine Blockchain, die auf einer DAG basiert, zeigt eine bessere Leistung als herkömmliche Blockchains, so die Forscher. Eine DAG-basierte Blockchain kann die parallele Verarbeitung von Transaktionen ermöglichen, wodurch sich die Rate der in einem bestimmten Zeitraum verarbeiteten Transaktionen erhöht und mehr Flexibilität und Skalierbarkeit ermöglicht wird. Solche Verbesserungen können in Bereichen wie dem Lieferkettenmanagement und der Zugangskontrolle für Internet-der-Dinge-Netzwerke Anwendung finden.^{5, 6}

IBM und Confluent liefern Echtzeitdaten für KI-Agenten

Gemeinsam wandeln IBM und Confluent kontinuierlich fließende Daten in vertrauenswürdige, gesteuerte Aktionen in hybriden Umgebungen um.

Ressourcen

3D-Rendering mehrerer nebeneinander angeordneter Symbole, darunter eine Kamera, ein Lautstärkeregler und eine Zwischenablage

KI-Agenten brauchen Daten – sind Ihre bereit?

Ihre Daten sind Ihr Wettbewerbsvorteil. Erfahren Sie in diesem kurzen Webinar, wie Sie die KI sicher nutzen und einen messbaren ROI erzielen können.

App-Symbole, die einer Kurve folgend angeordnet sind

Sind Ihre Daten bereit für generative KI?

Erkunden Sie unseren IBM Data Matters Hub, um zu erfahren, wie Sie Herausforderungen im Bereich Daten und KI wie die Integration angehen können.

Betrugsuntersuchungen mit KI optimieren und weiterentwickeln

Erfahren Sie, wie Cogniware KI-Lösungen von IBM nutzt, um die Effizienz im Bereich der Finanzkriminalität zu steigern.

Entfesseln Sie die Macht der KI für eine nahtlose Datenintegration

Erfahren Sie, warum Unternehmen einen einheitlichen Ansatz übernehmen müssen, der es ihnen ermöglicht, das gesamte Spektrum an Integrationsfunktionen über eine zentrale Oberfläche zu verwalten, sodass sie nicht mehr auf zahlreiche Tools angewiesen sind.

Den Wert von Echtzeit-Streaming-Daten für KI erschließen

Erkunden Sie, wie Sie Ihren Daten-Stack modernisieren, kostspielige Verzögerungen vermeiden und eine zukunftsfähige Grundlage sowohl für KI als auch für den täglichen Betrieb schaffen können.

How the C-suite is turning information into impact

Erkunden Sie in diesem branchenübergreifenden Bericht für Datenverantwortliche die Erkenntnisse von 1.700 CDOs.

IBM wurde in der Anbieterbewertung „Worldwide Data Integration Software Platforms 2025“ als führendes Unternehmen ausgezeichnet

Lesen Sie den Bericht „IDC MarketScape: Worldwide Data Integration Software Platforms 2025 Vendor Assessment“, um zu erfahren, warum IBM als führendes Unternehmen ausgezeichnet wurde.

Die Qualifikationslücke im Bereich Data Engineering schließen

Sehen Sie sich das Webinar an, um einen exklusiven Einblick in drei Erstellungsstile für die Datenintegration mit IBM watsonx.data sowie in die Innovationen zu erhalten, die unsere Roadmap vorantreiben.

IBM wird im Gartner Magic Quadrant für Datenintegrationstools 2025 als Leader genannt

Lesen Sie den vollständigen Bericht, um zu erfahren, warum IBM als führendes Unternehmen anerkannt ist

Verwandte Lösungen

IBM watsonx.data integration

Verwandeln Sie Rohdaten in KI-fähige Daten mit einer optimierten Benutzererfahrung für die Integration beliebiger Daten in einem beliebigen Stil

Mehr zu watsonx.data integration

Lösungen zur Datenintegration

Erstellen Sie mit IBM-Datenintegrationslösungen belastbare, leistungsstarke und kostenoptimierte Datenpipelines für Ihre generativen KI-Initiativen, Echtzeitanalysen, Lagermodernisierungen und betrieblichen Anforderungen.

Erkunden Sie die Datenintegrationslösungen

Beratungsdienste zu Daten und KI

Erfolgreiches Skalieren von KI mit der richtigen Strategie, Datensicherheit und Governance.

Beratungsservices für Daten und KI erkunden

Machen Sie den nächsten Schritt

Integrieren Sie sowohl strukturierte als auch unstrukturierte Daten mithilfe verschiedener Methoden – darunter Batch-Verarbeitung, Echtzeit-Streaming und Replikation –, damit Sie keine Zeit und kein Geld damit verschwenden, zwischen verschiedenen Tools hin- und herzuwechseln.

Fußnoten

¹„Chapter 4 – Fundamentals of algorithms.” Electronic Design Automation. 2009.

² „DAGs.“ Apache Airflow. Abgerufen am 28. Februar 2025.

³„Machine learning in causal inference for epidemiology.“ European Journal of Epidemiology. 13. November 2024

⁴ „DAG-Plan: Generating Directed Acyclic Dependency Graphs for Dual-Arm Cooperative Planning.“ arXiv.org. 30. Juni 2024.

⁵„RT-DAG: DAG-Based Blockchain Supporting Real-Time Transactions.“ IEEE. 24. Juni 2024.

⁶„DAG blockchain-based lightweight authentication and authorization scheme for IoT devices.“ Journal of Information Security and Applications. Mai 2022.

Was ist ein gerichteter azyklischer Graph (DAG)?

Was ist ein gerichteter azyklischer Graph (DAG)?

Ein gerichteter azyklischer Graph (Directed Acyclic Graph, DAG) ist ein Diagrammtyp, in dem Knoten durch unidirektionale Verbindungen verbunden sind, die keine Zyklen bilden. DAGs werden verwendet, um Abhängigkeiten und Kausalzusammenhänge darzustellen.

Die neuesten Tech-News – von Experten bestätigt

Vielen Dank! Sie haben sich angemeldet.

Was sind die Komponenten eines DAG?

Ist Datenverwaltung das Geheimnis generativer KI?

Graphentheoretische Konzepte, die für DAGs relevant sind

Topologische Sortierung

Transitiver Abschluss

Transitive Reduktion

Was sind die Anwendungen von DAGs in der Informatik?

Datenverarbeitung

Neuronale Netze

Kausale Inferenz beim maschinellen Lernen

Robotertechnik

Compiler-Design

Blockchain

Share

Ressourcen

Fußnoten