Was ist Datenvisualisierung?
Erfahren Sie, wie Datenvisualisierung das Verständnis und die Analysen verbessern kann und damit eine bessere und schnellere Entscheidungsfindung ermöglicht
IBM Planning Analytics with Watson kennenlernen
Schwarzer und blauer Hintergrund
Was ist Datenvisualisierung?

Unter Datenvisualisierung versteht man die Darstellung von Daten durch gängige Grafiken wie Diagramme, Plots, Infografiken und sogar Animationen. Diese visuellen Darstellungen von Informationen vermitteln komplexe Datenbeziehungen und datengestützte Erkenntnisse auf leicht verständliche Weise.

Datenvisualisierung kann für eine Vielzahl von Zwecken eingesetzt werden, und es ist wichtig zu wissen, dass sie nicht nur für Datenteams reserviert ist. Das Management nutzt sie auch, um Organisationsstrukturen und Hierarchien zu vermitteln, während Datenanalysten und Datenwissenschaftler sie verwenden, um Muster und Trends zu erkennen und zu erklären. Harvard Business Review (Link außerhalb von IBM) kategorisiert Datenvisualisierung in vier Hauptzwecke: Ideenentwicklung, Ideendarstellung, visuelle Erkennung und alltägliche Datenvisualisierung. Nachfolgend werden wir diese näher erläutern:

Ideenentwicklung

Die Visualisierung von Daten wird häufig eingesetzt, um die Ideenentwicklung in Teams zu fördern. Sie wird häufig bei Brainstorming- oder Design-Thinking -Sitzungen zu Beginn eines Projekts eingesetzt, um verschiedene Perspektiven zu sammeln und die gemeinsamen Anliegen des Kollektivs hervorzuheben. Auch wenn diese Visualisierungen in der Regel unausgegoren und unausgereift sind, helfen sie doch dabei, die Grundlage für das Projekt zu schaffen und sicherzustellen, dass sich das Team auf das Problem konzentriert, das es für die wichtigsten Stakeholder lösen möchte.

Ideendarstellung

Datenvisualisierung zur Veranschaulichung von Ideen hilft bei der Vermittlung einer Idee, z. B. einer Taktik oder eines Prozesses. Sie wird häufig in Lernumgebungen wie Tutorien, Zertifizierungskursen und Kompetenzzentren eingesetzt, kann aber auch zur Darstellung von Organisationsstrukturen oder Prozessen verwendet werden, um die Kommunikation zwischen den richtigen Personen für bestimmte Aufgaben zu erleichtern. Projektmanager verwenden häufig Gantt- und Wasserfalldiagramme, um Workflows zu veranschaulichen. Die Datenmodellierung nutzt Abstraktion auch, um den Datenfluss innerhalb des Informationssystem eines Unternehmens darzustellen und besser verständlich zu machen, wodurch es für Entwickler, Geschäftsanalysten, Datenarchitekten und andere einfacher wird, die Beziehungen in einer Datenbank oder einem Data Warehouse zu verstehen.

Visuelle Erkennung

Visuelle Erkennung und alltägliche Datenvisualisierung sind enger auf Datenteams abgestimmt. Während die visuelle Erkennung Datenanalysten, Datenwissenschaftlern und anderen Datenexperten dabei hilft, Muster und Trends in einem Datensatz zu erkennen, unterstützt die Datenvisualisierung im Alltag das anschließende Storytelling, nachdem eine neue Erkenntnis gefunden wurde.

Datenvisualisierung

Die Datenvisualisierung ist ein wichtiger Schritt im datenwissenschaftlichen Prozess, der Teams und Einzelpersonen dabei hilft, Kollegen und Entscheidungsträgern Daten effektiver zu vermitteln. Teams, die Berichterstellungssysteme verwalten, nutzen in der Regel definierte Vorlagenansichten zur Leistungsüberwachung. Die Datenvisualisierung ist jedoch nicht auf Dashboards für Leistungswerte beschränkt. Beim Textmining kann ein Analyst beispielsweise eine Wortwolke verwenden, um Schlüsselkonzepte, Trends und verdeckte Beziehungen in diesen unstrukturierten Daten zu erfassen. Alternativ kann er auch eine Diagrammstruktur verwenden, um die Beziehungen zwischen den Entitäten in einem Wissensdiagramm zu veranschaulichen. Es gibt eine ganze Reihe von Möglichkeiten, verschiedene Datentypen darzustellen, und es sollte nicht vergessen werden, dass es sich dabei um eine Kompetenz handelt, die über das Kernanalyseteam hinausgehen sollte.

Arten von Datenvisualisierungen

Die früheste Form der Datenvisualisierung kann bis zu den Ägyptern im 17. Jahrhundert zurückverfolgt werden und diente vor allem zur Unterstützung der Navigation. Im Laufe der Zeit wurden Datenvisualisierungen für breitere Anwendungen genutzt, z. B. in den Bereichen Wirtschaft, Soziales und Gesundheit. Edward Tufte veröffentlichte The Visual Display of Quantitative Information (Link außerhalb von IBM), worin er aufzeigte, wie man Datenvisualisierung nutzen kann, um Daten effektiver zu präsentieren. Sein Buch ist nach wie vor aktuell, vor allem, weil die Unternehmen ihre Leistungskennzahlen in Echtzeit über Dashboards melden. Dashboards sind effektive Datenvisualisierungstools zur Verfolgung und Visualisierung von Daten aus mehreren Datenquellen, die einen Einblick in die Auswirkungen bestimmter Verhaltensweisen eines Teams oder eines benachbarten Teams auf die Leistung geben. Dashboards umfassen gängige Visualisierungstechniken, wie z. B.:

  • Tabellen: Diese besteht aus Zeilen und Spalten, die zum Vergleich von Variablen verwendet werden. Tabellen können eine große Menge an Informationen strukturiert darstellen, aber sie können auch Nutzer überfordern, die lediglich nach übergeordneten Trends suchen.
  • Kreisdiagramme und gestapelte Balkendiagramme: Diese Diagramme sind in Abschnitte unterteilt, die Teile eines Ganzen darstellen. Sie bieten eine einfache Möglichkeit, Daten zu organisieren und die Größe der einzelnen Komponenten miteinander zu vergleichen.
  • Liniendiagramme und Flächendiagramme: Diese visuellen Darstellungen zeigen Veränderungen in einer oder mehreren Größen an, indem sie eine Reihe von Datenpunkten über einen bestimmten Zeitraum aufzeichnen, und werden häufig in Vorhersageanalysen verwendet. Liniendiagramme verwenden Linien, um diese Veränderungen zu veranschaulichen, während Flächendiagramme Datenpunkte mit Liniensegmenten verbinden, Variablen übereinander stapeln und Farben zur Unterscheidung zwischen Variablen verwenden.
  • Histogramme: In diesen Diagrammen wird eine Zahlenverteilung in Form eines Balkendiagramms (ohne Leerzeichen zwischen den Balken) dargestellt, das die Menge der Daten in einem bestimmten Bereich abbildet. Diese Darstellung macht es dem Endbenutzer leicht, Ausreißer in einem bestimmten Datensatz zu erkennen.
  • Streudiagramme: Diese visuellen Darstellungen sind nützlich, um die Beziehung zwischen zwei Variablen aufzudecken, und werden häufig bei der Regressionsdatenanalyse verwendet. Diese können jedoch manchmal mit Blasendiagrammen verwechselt werden, die zur Visualisierung von drei Variablen über die x-Achse, die y-Achse und die Größe der Blase verwendet werden.
  • Heatmaps: Diese grafischen Darstellungen sind hilfreich bei der Visualisierung von Verhaltensdaten nach Standort. Dies kann ein Ort auf einer Karte oder sogar eine Webseite sein.
  • Baumdiagramme, die  hierarchische Daten als eine Reihe von verschachtelten Formen (in der Regel Rechtecke) darstellen. Baumdiagramme eignen sich hervorragend, um die Proportionen zwischen Kategorien anhand ihrer Flächengröße zu vergleichen.
Open-Source-Visualisierungstools

Der Zugriff auf Datenvisualisierungstools war noch nie so einfach. Open-Source-Bibliotheken wie D3.js bieten Analysten die Möglichkeit, Daten auf interaktive Weise zu präsentieren und so ein breiteres Publikum für neue Daten zu begeistern. Nachfolgend einige der am häufigsten genutzten Open-Source-Visualisierungsbibliotheken:

  • D3.js: JavaScript-Bibliothek am Front-End zur Erstellung dynamischer, interaktiver Datenvisualisierungen in Webbrowsern. D3.js (Link außerhalb von IBM) verwendet HTML, CSS und SVG, um visuelle Darstellungen von Daten zu erstellen, die in jedem Browser angezeigt werden können. Diese bietet auch Funktionen für Interaktionen und Animationen.
  • ECharts: Eine leistungsstarke Diagramm- und Visualisierungsbibliothek, die eine einfache Möglichkeit bietet, intuitive, interaktive und hochgradig anpassbare Diagramme zu Produkten, Forschungsarbeiten, Präsentationen usw. hinzuzufügen. ECharts (Link außerhalb von IBM) basiert auf JavaScript und ZRender, einer schlanken Canvas-Bibliothek.
  • Vega: Vega (Link außerhalb von IBM) definiert sich selbst als „Visualisierungsgrammatik“, die Unterstützung bei der Anpassung von Visualisierungen für große Datensätze bietet, die über das Web zugänglich sind.
  • deck .gl: Ist Teil der Open-Source-Visualisierungs-Framework-Suite von Uber. deck .gl (Link außerhalb von IBM) ist ein Framework , das für die explorative Datenanalyse  von Big Data verwendet wird. Es hilft bei der Erstellung leistungsstarker GPU-gestützter Visualisierungen im Web.
Bewährte Verfahren zur Datenvisualisierung

Da so viele Tools zur Datenvisualisierung zur Verfügung stehen, hat auch die ineffektive Informationsvisualisierung zugenommen. Die visuelle Kommunikation sollte einfach und wohlüberlegt sein, um sicherzustellen, dass Ihre Datenvisualisierung Ihrem Zielpublikum zur beabsichtigten Erkenntnis oder Schlussfolgerung verhilft. Die folgenden bewährten Verfahren können dazu beitragen, dass Ihre Datenvisualisierung nützlich und klar ist:

Liefern Sie Kontext: Es ist wichtig, allgemeine Hintergrundinformationen zu liefern, um dem Publikum zu vermitteln, warum gerade dieser Datenpunkt wichtig ist. Wenn z. B. die Öffnungsrate von E-Mails unterdurchschnittlich ist, sollten wir aufzeigen, wie die Öffnungsrate eines Unternehmens im Vergleich zur gesamten Branche ist, um zu zeigen, dass das Unternehmen ein Problem in diesem Marketingkanal hat. Um eine Aktion auszulösen, muss das Publikum verstehen, wie die aktuelle Leistung im Vergleich zu etwas Greifbarem, wie einem Ziel, einem Benchmark oder anderen wichtigen Leistungsindikatoren (KPIs) aussieht.

Kennen Sie Ihre Zuschauer: Überlegen Sie, für wen Ihre Visualisierung gedacht ist, und stellen Sie dann sicher, dass Ihre Datenvisualisierung deren Bedürfnissen entspricht. Was versucht diese Person zu erreichen? Welche Art von Fragen interessieren sie? Geht Ihre Visualisierung auf ihre Anliegen ein? Sie möchten, dass die von Ihnen bereitgestellten Daten die Personen dazu motivieren, im Rahmen ihrer Aufgaben zu handeln. Wenn Sie sich nicht sicher sind, ob die Visualisierung klar ist, präsentieren Sie sie einer oder zwei Personen aus Ihrer Zielgruppe, um ein Feedback zu erhalten, damit Sie vor einer großen Präsentation zusätzliche Änderungen vornehmen können.

Wählen Sie effektives Bildmaterial aus: Bestimmte Bildmaterialien sind für bestimmte Arten von Datensätzen konzipiert. Streudiagramme beispielsweise stellen die Beziehung zwischen zwei Variablen gut dar, während Liniendiagramme Zeitreihendaten gut abbilden. Vergewissern Sie sich, dass das Bildmaterial den Zuhörern tatsächlich hilft, Ihre wichtigsten Aussagen zu verstehen. Eine falsche Anordnung von Diagrammen und Daten kann das Gegenteil bewirken und Ihre Zuschauer weiter verwirren, anstatt für Klarheit zu sorgen.

Halten Sie es einfach: Mit Datenvisualisierungstools können Sie ganz einfach alle möglichen Informationen zu Ihrem Bildmaterial hinzufügen. Aber nur weil Sie es können, heißt das nicht, dass Sie es auch tun sollten! Bei der Datenvisualisierung sollten Sie die zusätzlichen Informationen, die Sie hinzufügen, um die Aufmerksamkeit der Benutzer zu fokussieren, sehr bewusst auswählen. Benötigen Sie zum Beispiel Datenbeschriftungen für jeden Balken in Ihrem Balkendiagramm? Vielleicht brauchen Sie nur eine oder zwei, um Ihren Standpunkt zu verdeutlichen. Brauchen Sie eine Vielzahl von Farben, um Ihre Idee zu vermitteln? Verwenden Sie Farben, die von möglichst vielen Zuschauern wahrnehmbar sind (z. B. unter Berücksichtigung von Farbenblindheit)? Gestalten Sie Ihre Datenvisualisierung so, dass sie maximale Wirkung erzielt, indem Sie Informationen, die Ihre Zielgruppe ablenken könnten, ausblenden.

Relevante Lösungen
Cognos Analytics

Ihr vertrauenswürdiger Watson-Kopilot für smartere Analysen und sichere Entscheidungen.

IBM Cognos Analytics erkunden
Planning Analytics

Eine KI-gestützte integrierte Planungslösung, die Ihnen hilft, die Grenzen manueller Planung zu überwinden.

Planning Analytics erkunden
IBM® Watson Studio

Erstellen Sie KI-Modelle, führen Sie sie aus und verwalten Sie sie. Bereiten Sie Daten vor und erstellen Sie Modelle in jeder beliebigen Cloud mit Open-Source-Code oder visueller Modellierung. Prognostizieren und optimieren Sie Ihre Ergebnisse.

IBM Watson® Studio kennenlernen
Machen Sie den nächsten Schritt

Es gibt zwar verschiedene Datenvisualisierungstools auf dem Markt, aber Cognos Analytics ist das Business Intelligence- und Datenvisualisierungstool von IBM. Die Self-Service-Plattform von Cognos Analytics integriert Cognitive Computing-Technologie, einschließlich künstlicher Intelligenz (KI) und maschinellem Lernen (ML), um Unternehmen die Visualisierung von Daten, die Weitergabe neuer Erkenntnisse und die Förderung datengesteuerter Entscheidungsfindung zu erleichtern.

IBM® Cognos Analytics noch heute kennenlernen