Was versteht man unter Datenvisualisierung?

Ein Mann sitzt an einem großen Fenster in einem modernen Bibliotheksraum und arbeitet an einem Laptop

Was versteht man unter Datenvisualisierung?

Datenvisualisierung ist die Darstellung von Daten anhand von typischen Grafiken wie Diagrammen, Plots, Infografiken oder auch Animationen. Diese visuellen Darstellungen von Informationen vermitteln komplexe Datenzusammenhänge und datengesteuerte Erkenntnisse auf leicht verständliche Weise.

Die Datenvisualisierung kann für eine Vielzahl von Zwecken eingesetzt werden. Dabei eignet sie sich nicht nur für Datenteams. Die Geschäftsleitung nutzt sie beispielsweise, um Unternehmensstrukturen und -hierarchien darzustellen, während Datenanalysten und Data Scientists damit Muster und Trends identifizieren und erklären. Harvard Business Review unterteilt Datenvisualisierung in vier Hauptzwecke: Ideengenerierung, Ideenillustration, visuelle Entdeckung und alltägliche Datenvisualisierung. Im Folgenden gehen wir näher auf diese Kategorien ein:

Ideenfindung

Teams nutzen die Datenvisualisierung typischerweise, um den Prozess der Ideenfindung zu unterstützen. Visualisierte Daten sind oft zentraler Bestandteil von Brainstorming- oder Design Thinking-Sitzungen zu Beginn eines Projekts, um unterschiedliche Perspektiven zu sammeln und gemeinsame Bedenken der Gruppe hervorzuheben. Auch wenn diese Visualisierungen noch relativ grob und allgemein gehalten sind, bilden sie eine solide Grundlage für das Projekt, damit das Team koordiniert das zugrundeliegende Problem angehen kann.

Veranschaulichung von Ideen

Ideen mithilfe visualisierter Daten zu veranschaulichen, ist eine Möglichkeit, um eine Taktik oder einen Vorgang zum Ausdruck zu bringen. Datenvisualisierung wird häufig in Lernumgebungen wie Tutorials, Zertifizierungskursen und Kompetenzzentren verwendet, ist aber ebenso gut geeignet, um Unternehmensstrukturen oder -prozessen darzustellen, um die Kommunikation zwischen den richtigen Personen für bestimmte Aufgaben zu erleichtern. Projektmanager verwenden häufig Gantt- und Wasserfall-Diagramme, um Workflows zu veranschaulichen.Bei der Datenmodellierung kommt auch Abstraktion zum Einsatz, um den Datenfluss innerhalb des Informationssystems eines Unternehmens darzustellen und besser verständlich zu machen. Entwickler, Geschäftsanalysten, Data Architects und andere können Beziehungen in einer Datenbank oder einem Data Warehouse so einfacher bis ins kleinste Detail verstehen.

Visuelle Untersuchung

Visuelle Untersuchungen und routinemäßige Datenvisualisierungen fallen eher in den Aufgabenbereich von Datenteams. Datenanalysten, Data Scientists und andere Datenexperten können mit der visuellen Untersuchung Muster und Trends in einem Datensatz erkennen und mit der routinemäßigen Datenvisualisierung ein Narrativ aus neuen Erkenntnissen vermitteln.

Datenvisualisierung

Die Datenvisualisierung ist ein entscheidender Schritt der Data Science, also dem Sammeln von Daten, der Analyse und der Entscheidungsfindung, um Daten effektiver an Kollegen und Entscheidungsträger zu vermitteln. Die für Berichtsysteme zuständigen Teams nutzen in der Regel definierte Vorlagenansichten zur Leistungsüberwachung. Die Datenvisualisierung ist jedoch nicht auf Leistungs-Dashboards beschränkt. Beispielsweise kann ein Analyst beim Text Mining eine Cloud verwenden, um Schlüsselkonzepte, Trends und verborgene Zusammenhänge in diesen unstrukturierten Daten zu erfassen. Alternativ kann er eine Graphstruktur nutzen, um Beziehungen zwischen Entitäten in einem Wissensgraphen darzustellen. Es gibt zahlreiche Möglichkeiten, verschiedene Datentypen zu repräsentieren, und es ist wichtig zu beachten, dass diese Kompetenz über das Kernteam der Analytik hinausgehen sollte.

Die neuesten Tech-News – von Experten bestätigt

Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und darüber hinaus auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

Arten der Datenvisualisierung

Die früheste Form der Datenvisualisierung geht auf die alten Ägypter vor dem 17. Jahrhundert v. Chr. zurück und wurde hauptsächlich zur Unterstützung der Navigation verwendet. Im Laufe der Zeit nutzten die Menschen Datenvisualisierungen für breitere Anwendungen, z. B. in den Bereichen Wirtschaft, Soziales und Gesundheit. Besonders erwähnenswert ist das von Edward Tufte veröffentlichte Werk The Visual Display of Quantitative Information aus dem Jahr 1983, welches veranschaulicht, wie sich Daten mithilfe von Datenvisualisierung effektiver darstellen lassen. Dieses Buch ist nach wie vor aktuell, insbesondere da Unternehmen Dashboards zur Echtzeit-Berichterstattung ihrer Leistungsmetriken nutzen. Dabei handelt es sich um effektive Datenvisualisierungstools zur Verfolgung und Darstellung von Daten aus unterschiedlichen Datenquellen, die einen Einblick in die Auswirkungen bestimmter Verhaltensweisen und Aktionen eines Teams oder eines Nachbarteams auf die Leistung bieten. Dashboards umfassen gängige Visualisierungstechniken wie:

  • Tabellen: Diese bestehen aus Zeilen und Spalten, die zum Vergleich von Variablen verwendet werden. Tabellen können zwar viele Informationen strukturiert darstellen, sind aber weniger gut geeignet, wenn sich ein Benutzer nur einen allgemeinen Überblick verschaffen will.
  • Kreisdiagramme und gestapelte Balkendiagramme: Diese Diagramme sind in Abschnitte unterteilt, die sich als Teile zu einem Ganzen zusammenfügen. Mit ihnen lassen sich Daten einfach anordnen, um die Größe der einzelnen Abschnitte miteinander zu vergleichen, da unser Gehirn leicht Verbindungen zwischen großen Balken oder Anteilen und großen Werten herstellen kann. Außerdem ist die Informationsdichte deutlich geringer als bei Tabellen.
  • Liniendiagramme und Flächendiagramme: Diese Diagramme zeigen Veränderungen in einem oder mehreren Werten. Erreicht wird dies durch die Abbildung von Datenpunkten im Zeitverlauf. Sie werden häufig bei vorausschauenden Analysen verwendet. Liniendiagramme stellen diese Veränderungen mit Linien dar, Flächendiagramme verbinden Datenpunkte mit Liniensegmenten. Dabei werden veränderliche Größen horizontal oder vertikal geschichtet und farblich abgesetzt.
  • Histogramme: Diese Diagramme stellen die Verteilung von Zahlen mithilfe eines Balkendiagramms dar (ohne Zwischenräume zwischen den Balken), also wie viele Daten in einen bestimmten Bereich fallen. Durch diese Art der Visualisierung können Sonderfälle in einem Datensatz leichter ermittelt werden.
  • Streudiagramme: Diese Diagramme sind nützlich, um die Beziehung zwischen zwei Variablen aufzuzeigen. Sie werden häufig bei der Regressionsdatenanalyse verwendet. Streudiagramme können jedoch auch mit Blasendiagrammen verwechselt werden, bei denen über die X-Achse, die Y-Achse und die Größe der Blase drei Variablen visualisiert werden. Mit Streudiagrammen lässt sich gut erkennen, in welchem Bereich sich bestimmte Werte konzentrieren. Es entstehen Cluster oder lineare Strukturen auf dem Diagramm, aus denen sich neue Erkenntnisse über wichtige Zusammenhänge gewinnen lassen.
  • Heatmaps: Diese grafischen Darstellungen unterstützen die Visualisierung von Verhaltensdaten je nach Standort. Dies kann ein Ort auf einer Karte oder auch eine Webseite sein. So lässt sich beispielsweise die Bevölkerungsdichte eines Landes oder die Verteilung von Sportlern bei einem Fußballspiel visualisieren.
  • Treemaps: Bei Treemaps werden hierarchische Daten als eine Reihe verschachtelter Formen dargestellt, in der Regel Rechtecke. Dies eignet sich hervorragend, um die Proportionen zwischen Kategorien anhand ihrer Flächengröße zu vergleichen, beispielsweise den Anteil einzelner Aktien innerhalb ihrer jeweiligen Branchen und Kategorien am gesamten Marktvolumen einer Börse.
Mixture of Experts | 28. August, Folge 70

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Open-Source-Visualisierungstools

Tools zur Datenvisualisierung waren noch nie so einfach zugänglich wie heute. Open-Source-Bibliotheken wie D3.js bieten die Möglichkeit, Daten interaktiv darzustellen, um eine breitere Zielgruppe mit neuen Daten anzusprechen. Zu den beliebtesten Open-Source-Visualisierungsbibliotheken gehören Folgende:

  • D3.js: Diese JavaScript-Bibliothek für das Front-End dient zur Erstellung dynamischer, interaktiver Datenvisualisierungen in Webbrowsern. D3.js verwendet HTML, CSS und SVG, um visuelle Darstellungen von Daten zu erstellen, die in jedem Browser angezeigt werden können. Zudem bietet die Bibliothek Funktionen für Interaktionen und Animationen.
  • ECharts: Diese leistungsstarke Diagramm- und Visualisierungsbibliothek bietet eine einfache Möglichkeit, intuitive, interaktive und hochgradig anpassbare Diagramme zu Produkten, Thesenpapieren, Präsentationen usw. hinzuzufügen. ECharts basiert auf JavaScript und ZRender, einer schlanken Canvas-Bibliothek.
  • Vega: Vega definiert sich selbst als „Visualisierungsgrammatik“, mit der sich große, online abrufbare Datensätze individuell visualisieren lassen.
  • deck.gl: Dies ist ein Teil der quelloffenen Visualisierungsframework-Suite von Uber. deck.gl ist ein Framework, das für explorative Datenanalysen auf Big Data verwendet wird. Es hilft beim Aufbau einer leistungsstarken GPU-basierten Visualisierung im Web.

Datenvisualisierung – Best Practices

Durch die große Auswahl an Tools zur Datenvisualisierung gibt es auch immer mehr ineffektive Lösungen. Visuelle Kommunikation sollte einfach und wohlüberlegt sein, damit Ihre Datenvisualisierung Ihrer Zielgruppe zu den gewünschten Erkenntnissen oder Schlussfolgerungen verhilft. Die folgenden Best Practices unterstützen Sie bei einer zweckmäßigen, übersichtlichen Datenvisualisierung:

Kontext definieren: Sie müssen allgemeine Hintergrundinformationen bereitstellen, um zu verdeutlichen, warum bestimmte Datenpunkte wichtig sind. Wenn E-Mails beispielsweise eine unterdurchschnittliche Öffnungsrate aufwiesen, könnte die Öffnungsrate dieses Unternehmens im Vergleich zur gesamten Branche dargestellt werden, um zu zeigen, dass das Unternehmen in diesem Marketingkanal ein Problem hat. Um einen Handlungsimpuls zu setzen, muss die Zielgruppe verstehen, wie die aktuelle Leistung im Vergleich zu greifbaren Daten wie einem Ziel, einem Benchmark oder anderen wesentlichen Leistungsindikatoren (KPIs) abschneidet.

Zielgruppe kennen: Überlegen Sie, für wen Ihre Visualisierung konzipiert ist, und stellen Sie dann sicher, dass Ihre Datenvisualisierung den Bedürfnissen dieser Zielgruppe entspricht. Was möchte die Zielgruppe erreichen? Welche Art von Fragen interessiert sie? Geht Ihre Visualisierung auf die Bedenken der Zielgruppe ein? Ihr Ziel sollte sein, dass die von Ihnen bereitgestellten Daten die Mitarbeiter motivieren, im Rahmen ihrer Rolle zu handeln. Bei Zweifeln dahingehend, ob die Visualisierung eindeutig ist, präsentieren Sie sie einer oder zwei Personen aus Ihrer Zielgruppe, um deren Feedback einzuholen, und ggf. vor einer weiteren Präsentation Änderungen vorzunehmen.

Effektive Visualisierung auswählen: Visuelle Darstellungen sind jeweils für bestimmte Arten von Datensätzen konzipiert. So stellen beispielsweise Streudiagramme die Beziehung zwischen zwei Variablen gut dar, während sich Liniendiagramme besonders für Zeitreihendaten eignen. Stellen Sie sicher, dass die visuelle Darstellung der Zielgruppe tatsächlich hilft, Ihre wichtigsten Aussagen zu verstehen. Eine falsche Anordnung von Diagrammen und Daten kann das Gegenteil bewirken und Ihre Zielgruppe weiter verwirren, anstatt für Klarheit zu sorgen.

Einfach halten: Mit Datenvisualisierungstools können Sie Ihrer Darstellung ganz einfach alle möglichen Informationen hinzufügen. Aber Vorsicht: Nur weil Sie es können, heißt das nicht, dass Sie es auch tun sollten! Bei der Datenvisualisierung sollten Sie sehr bewusst mit den zusätzlichen Informationen umgehen, die Sie hinzufügen, um die Aufmerksamkeit der Benutzer zu fokussieren. Benötigen Sie beispielsweise Beschriftungen auf jedem Balken Ihres Balkendiagramms? Vielleicht brauchen Sie nur ein oder zwei, um Ihren Standpunkt zu verdeutlichen. Benötigen Sie eine Vielzahl von Farben, um Ihre Idee zu kommunizieren? Verwenden Sie Farben, die für eine Vielzahl von Zielgruppen zugänglich sind (z. B. für farbenblinde Personen in der Zielgruppe)? Konzipieren Sie Ihre Datenvisualisierung so, dass Sie eine maximale Wirkung erzielen. Lassen Sie Informationen mit wenig oder gar keiner Relevanz auf, da sie die Zielgruppe ablenken könnten.

Weiterführende Lösungen
Data-Science-Tools und -Lösungen

Nutzen Sie Data-Science-Tools und -Lösungen, um mithilfe von Daten, Algorithmen, maschinellem Lernen und KI-Techniken Muster zu erkennen und Prognosen zu treffen.

Entdecken Sie Data-Science-Lösungen
IBM Cognos Analytics

Wir stellen vor: Cognos Analytics 12.0, KI-gestützte Erkenntnisse für eine bessere Entscheidungsfindung.

Cognos Analytics erkunden
Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisorientiertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Entdecken Sie die Analyse-Services
Machen Sie den nächsten Schritt

Nutzen Sie Data-Science-Tools und -Lösungen, um mithilfe von Daten, Algorithmen, maschinellem Lernen und KI-Techniken Muster zu erkennen und Prognosen zu treffen.

Data-Science-Lösungen erkunden Analysedienste erkunden