Ein Datenflussdiagramm (DFD) ist eine visuelle Darstellung des Datenflusses durch ein Informationssystem oder einen Geschäftsprozess. DFDs machen komplexe Systeme leichter verständlich und sind eine beliebte Ressourcen für Softwareentwicklung, Systemanalyse, Prozessverbesserung, Geschäftsführung und agile Softwareentwicklung.
Ein Datenflussdiagramm verwendet grafische Symbole, um die Pfade, Prozesse und Speicherorte für Daten vom Eintritt in ein System bis zum Verlassen des Systems darzustellen. Dieses visuelle Modell hilft Fachleuten dabei, Wege zu finden, um die Effizienz und Effektivität bestehender Systeme und Prozesse zu verbessern und diese neu zu gestalten.
Zum Beispiel würde ein DFD eines Versicherungsanspruchsprozesses visualisieren, wie ein Schadensfall beschaffen ist:
Analysten können den DFD untersuchen, um Engpässe im Prozess aufzudecken, Bereiche zu erkennen, in denen Betrug wahrscheinlich ist, den Stakeholdern den Prozess zu veranschaulichen und Verbesserungen am Design vorzunehmen.
In den 1970er Jahren präsentierten die Softwareingenieure Larry Constantine und Ed Yourdon Datenflussdiagramme in ihrem Buch „Structured Design“. Anstatt sich auf Softwareverfahren zu konzentrieren, basierten sie DFDs darauf, wie sich Daten innerhalb eines Softwaresystems bewegen.
Die Informatiker Tom DeMarco, Chris Gane und Trish Sarson trugen zur Verbreitung von Datenflussdiagrammen bei, indem sie standardisierte Datenflusssymbole und -notationen entwickelten, die bis heute verwendet werden.
Anfangs wurden Datenflussdiagramme hauptsächlich in der Softwareentwicklung verwendet. Nachdem sie ihren Wert für das Verständnis und die Verbesserung von Geschäftsprozessen und Workflows erkannt hatten, begannen Geschäftsleute, sie zu nutzen.
Nach der Einführung der Unified Modeling Language (UML) in den 1990er Jahren verließen sich Software-Programmierer nicht mehr ausschließlich auf Datenflussdiagramme für die Softwareentwicklung. UML-Diagramme bieten eine komplexe, detaillierte Ansicht von Strukturen und Verhaltensweisen in komplexen objektorientierten Systemen.
DFDs werden heute hauptsächlich als ergänzende Tools zu UML-Diagrammen und Flussdiagrammen eingesetzt und bieten während der Softwareentwicklung einen umfassenden Systemüberblick.
Datenflussdiagramme sind wichtig, weil sie das Verständnis des Informationsflusses durch komplexe Systeme oder Prozesse erleichtern. Durch die Visualisierung der Komponenten eines gesamten Systems können DFDs den Benutzern helfen:
Es gibt 4 Hauptkomponenten eines DFD:
Dies sind die Start- und Endpunkte für den Datenfluss in einem DFD. Externe Entitäten werden an den Edges eines DFD platziert, um die Eingabe und die Ausgabe von Informationen in das gesamte System oder den gesamten Prozess darzustellen.
Eine externe Entität kann eine Person, ein Unternehmen oder ein System sein. Ein Kunde könnte beispielsweise eine externe Entität in einem DFD sein, das den Prozess des Kaufs und des Erhalts eines Kaufbelegs modelliert. Externe Entitäten werden auch als Terminatoren, Akteure, Quellen und Senken bezeichnet.
Prozesse sind Aktivitäten, die Daten verändern oder transformieren. Diese Aktivitäten können Berechnungen, Sortierungen, Validierungen, Umleitungen oder andere Umwandlungen umfassen, die erforderlich sind, um diesen Teil des Datenflusses voranzutreiben. Zum Beispiel wäre die Überprüfung einer Kreditkartenzahlung ein Prozess, der innerhalb der DFD eines Kundenkaufs stattfindet.
Dies sind die Stellen in einem DFD, an denen Daten für die spätere Verwendung speichern werden. Datenspeicher können Datenbanken, Dokumente, Dateien oder jedes andere Repository für die Datenspeicherung darstellen. Datenspeicher in einem Produkt-Fulfillment-DFD können beispielsweise eine Kundenadressdatenbank, eine Produktbestandsdatenbank und eine Lieferplan-Tabelle umfassen.
Datenflüsse sind die Wege, die Informationen nehmen, wenn sie zwischen externen Einheiten, Prozessen und Datenspeichern übertragen werden. In einem E-Commerce-DFD wäre beispielsweise die Route, die einen Benutzer, der Anmeldedaten eingibt, mit einem Authentifizierungs-Gateway verbindet, ein Datenfluss.
Zur visuellen Darstellung von DFD-Komponenten werden standardisierte Symbole und Notationen wie Kreise, Ovale, Pfeile und Rechtecke verwendet. Es gibt zwei gängige Notationssätze, die heute in Vorlagen für Datenflussdiagramme verwendet werden: die Yourdon- und Coad-Methodik und die Gane- und Sarson-Methodik. Beide Systeme sind nach den Informatikern benannt, die sie entwickelt haben.
Die Methoden unterscheiden sich in den Symbolen, die sie zur Darstellung von Prozessen und Datenspeichern verwenden, sind aber ansonsten gleich.
Es gibt zwei Arten von DFDs, die unterschiedliche Perspektiven auf ein System oder einen Prozess bieten: logische DFDs und physische DFDs.
Ein logisches DFD bietet einen Überblick über die Datenflüsse, die zur Ausführung von Geschäfts- oder Systemprozessen erforderlich sind, ohne auf technische oder Implementierungsdetails einzugehen. Der Fokus liegt auf den Daten, die benötigt werden, und darauf, wie sie sich durch den Prozess verschieben, um das Geschäftsziel zu erreichen.
Logische DFDs können Geschäftsaktivitäten darstellen, wie z. B. die Auftragsabwicklung in einem Lager, ein Kunde, der einen Online-Einkauf tätigt, oder die Aufnahme eines Patienten in einer Gesundheitseinrichtung.
Ein physisches DFD visualisiert die Implementierung eines Systems oder Prozesses, einschließlich der erforderlichen Software, Hardware und Dateien. Physische DFDs konzentrieren sich auf die zugrunde liegenden Technologien, Verfahren und Vorgänge eines Systems oder Prozesses.
Physische DFDs werden häufig verwendet, um komplexe Systeme und Workflows darzustellen, z. B. wie eine Supply-Chain-Software den Bestand in einem Lager verwaltet oder wie elektronische Patientenakten sicher durch ein Krankenhaussystem geleitet werden.
Datenflussdiagramme werden manchmal mit mehreren DFD-Ebenen erstellt, um nach und nach mehr Details zu einem System oder Prozess anzuzeigen. Dieser mehrschichtige Ansatz beginnt mit einer einfachen, übergeordneten Ansicht und wird immer komplexer, wenn die DFDs der unteren Ebenen immer tiefer in die Prozesse und Teilprozesse eintauchen.
Ein DFD der Ebene 0 wird auch als „Kontextdiagramm“ bezeichnet und ist eine Ansicht auf hoher Ebene, die das gesamte System als einen einzigen Prozess visualisiert. Das ist die einfachste und grundlegendste der Ebenen. Sie sollte für jeden, der sie ansieht, leicht verständlich sein, unabhängig von technischen Fähigkeiten oder der beruflichen Rolle.
Eine DFD der Ebene 1 untersucht die Komponenten des übergeordneten Prozesses genauer. Was im DFD auf der Kontext-Ebene ein einzelner Prozess war, wird in Teilprozesse unterteilt, die mehr Informationen über die Funktion und die Datenflusspfade liefern.
Ebene 2 bietet noch detailliertere Informationen, indem neue Unterprozesse und ihre Interaktionen und Beziehungen zu Datenflüssen und Datenspeichern hinzugefügt werden. Diese Ebene bietet eine sehr komplexe Ansicht der internen Abläufe eines Systems oder Prozesses.
Da DFDs zugänglich und leicht verständlich sein sollen, ist es unüblich, über die Komplexität von Ebene 2 hinauszugehen. Allerdings können hochkomplexe Systeme die detaillierten Angaben eines DFD der Ebene 3 erfordern, das jeden einzelnen Aspekt eines Datenprozesses oder -systems abbildet.
Die meisten Datenflussdiagramme folgen den gleichen Grundregeln:
Erfahren Sie, wie ein offener Data-Lakehouse-Ansatz vertrauenswürdige Daten und eine schnellere Durchführung von Analysen und KI-Projekten ermöglichen kann.
Erkunden Sie den Leitfaden für Datenexperten zum Aufbau eines datengestützten Unternehmens und zur Förderung von geschäftlichen Vorteilen.
Erfahren Sie, warum KI-gestützte Datenintelligenz und Datenintegration entscheidend sind, um die Bereitschaft für strukturierte und unstrukturierte Daten zu fördern und KI-Ergebnisse zu beschleunigen.
Erhalten Sie einzigartige Einblicke in die sich entwickelnde Geschäftswelt der ABI-Lösungen und hebt die wichtigsten Ergebnisse, Annahmen und Empfehlungen für Führungskräfte im Bereich Daten und Analysen hervor.
Vereinfachen Sie den Datenzugriff und automatisieren Sie die Data Governance. Entdecken Sie die Vorteile einer Data-Lakehouse-Strategie für Ihre Datenarchitektur, einschließlich der Kostenoptimierung Ihrer Workloads und der Skalierung von KI und Analysen, mit all Ihren Daten, überall.
Erkunden Sie, wie IBM Research regelmäßig in neue Funktionen für IBM Cloud Pak® for Data integriert wird.
Entwerfen Sie eine Datenstrategie, die Datensilos beseitigt, die Komplexität reduziert und die Datenqualität verbessert, um außergewöhnliche Kunden- und Mitarbeitererfahrungen zu schaffen.
Watsonx.data ermöglicht es Ihnen, Analysen und KI mit all Ihren Daten zu skalieren, unabhängig davon, wo sie sich befinden, und zwar über einen offenen, hybriden und kontrollierten Datenspeicher.
Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting® und bauen Sie ein erkenntnisgesteuertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.