Datenvisualisierung oder auf Englisch auch „data visualization“ bezeichnet die grafische Darstellung von Daten und Zahlenreihen. Ein Vorteil guter Datenvisualisierung ist, dass Daten und Inhalte damit anschaulich vermittelt werden können. Diagramme sind dabei leichter zu erfassen als beispielsweise Zahlenreihen. Wesentlich für erfolgreiche Datenvisualisierung ist neben der Aufbereitung von Daten ein klar formuliertes Ziel und die Wahl einer passenden Diagrammart. Zudem haben auch die Kenntnisse des Erstellers sowie die Visualisierungsmethode und Datenvisualisierungs-Tools einen Einfluss auf das Resultat. Datenvisualisierungssoftware verfügt über unterschiedlich breit gefächerte Leistungsspektren. Excel beispielsweise bietet Visualisierungen als Zusatzfunktion an. Bei Power BI steht Business Intelligence (BI) und die einfache Benutzung der komplexen Technologie durch den User hingegen im Mittelpunkt. Die Plattform hilft dabei, interaktive Visualisierungen und Geschäftsanalysen zu erstellen.
Datenvisualisierung Kategorien
Es gibt fünf Kategorien, die bei der Visualisierung von Daten herangezogen werden können.
- Zeitliche Darstellung – Darstellungstypen fallen in diese Kategorie, wenn sie linear und eindimensional sind. Die dargestellte Linie hat einen Anfangs- und Endpunkt, wobei auch mehrere Linien überlappend eingezeichnet werden können. Zu dieser Kategorie zählen die Punktwolke (= Scatter Plot), das Liniendiagramm und die Zeitachse.
- Hierarchische Darstellungen – Hierarchische Darstellungsarten zeichnen sich dadurch aus, dass sie Gruppen in wiederum grössere Gruppen einordnen. Sie sind somit ausgezeichnet geeignet, um Cluster abzubilden. Ein Beispiel für diese Variante ist ein Baumdiagramm.
- Darstellung von Netzwerken – Bei dieser Form wird dargestellt, wie die Inhalte von Datensätze zueinander in Verbindung stehen. Ein Beispiel für diese Form der Darstellung ist die Wortwolke.
- Multidimensionale Darstellung – Wie der Name bereits vermuten lässt, zeichnen sich Darstellungsformen dieser Art durch ihre Multidimensionalität aus. Es gibt somit 2 oder mehrere Variablen. Zu dieser Gruppe zählen zum Beispiel das Tortendiagramm, das Mengendiagramm und das Histogramm.
- Geografische Darstellung – Für diese Form der Darstellung werden Karten von realen physischen Orten herangezogen. Durch Einfärben von bestimmten Abschnitten beziehungsweise von Länder-, Kantone- oder Gemeindegebieten werden Daten integriert und Anteile zueinander in Relation gesetzt. Bekannt ist dieser Ansatz zum Beispiel aus der Darstellung von Wahlergebnissen. Zu dieser Kategorie zählen Heat Maps, Density Maps und Flow Maps.
Im Folgenden werden acht häufig verwendete Visualisierungstypen beziehungsweise Diagrammarten näher beschrieben.
Tabellen
Tabellen sind die wohl ursprünglichste Form der Datenvisualisierung und gelten häufig als sogenannte Default-Option. Sie finden Anwendung, wenn Visualisierungen durch Formen und Farben nicht stattfinden beziehungsweise nicht sinnvoll sind. Tabellen eignen sich dazu, um Daten strukturiert und übersichtlich darzustellen. Die Visualisierungsform strukturierter Daten in Spalten und Zeilen kann versehen werden mit Graphen, Icons und Sparklines. Tabellen haben den Vorteil, dass Daten ohne nennenswerte Reduktion abgebildet werden können, dies führt jedoch auch dazu, dass sie schnell unübersichtlich werden.
Wann eignen sich Tabellen zur Datenvisualisierung?
- bei der Darstellung zweidimensionaler Datensätze, die kategorisiert werden können
- wenn die Darstellung exakter Zahlenwerte hohe Priorität hat
Säulendiagramme & Balkendiagramm
Säulendiagramme visualisieren Daten mithilfe rechteckiger Säulen. Die Höhe der Säule ist dabei ein Indikator für den Anteil den ein Bereich an einem grossen Ganzen hat. Säulendiagramme zeigen somit zum Beispiel die absolute oder relative Häufigkeit anhand der Höhe der Säulen an. Säulen- und Balkendiagramme unterscheiden sich lediglich dadurch, dass die „Balken“ bei Balkendiagrammen horizontal und „Säulen“ bei Säulendiagrammen vertikal angeordnet werden.
Wann werden Säulen- oder Balkendiagramme verwendet?
- Darstellung von Strukturen (z. B. bei der Zusammensetzung verschiedener Bereiche)
- Vergleich von Daten zwei- oder mehrerer Kategorien
- Betrachtung beziehungsweise Vergleich weniger Gruppen
- Darstellung von Rangfolgen
Liniendiagramm
Ähnlich wie Säulen- oder Balkendiagramme lassen sich mithilfe von Liniendiagrammen Daten kompakt darstellen. Bei Liniendiagrammen werden Ergebnisdaten in Relation zu fortlaufenden Variablen verbildlicht. Diese fortlaufenden Variablen sind im Business-Kontext häufig Zeit oder Geld. Sofern verschiedene Linien (= Daten) miteinander verglichen werden sollen, ist die korrekte und differenzierte Farbgebung und Beschriftung wichtig.
Wann eignet sich ein Liniendiagramm zur Visualisierung von Daten?
- bei der Darstellung von Trends, Mustern und Fluktuationen in Datensätzen
- beim Vergleich unterschiedlicher Datensätze anhand eines gemeinsamen Parameters (z. B. Entwicklung von Verkaufszahlen zweier Produkte über einen bestimmten Zeitraum)
Histogramme
Was ist ein Histogramm? Histogramme verbildlichen die Verteilung von Daten über einen gewissen Zeitraum. Sie verbinden somit die Stärken eines Säulendiagramms und eines Liniendiagramms. Dabei werden Daten in Klassen eingeteilt. Die Breite der dargestellten Rechtecke beschreibt die Breite der Klassen, diese können sowohl eine konstante (z. B.: 1 - 5, 6 - 10, 11 - 15….) als auch eine variable Breite (z. B.: 1-3, 3-10, 11-13…) annehmen. Die Höhe der Rechtecke stellt die Häufigkeitsdichte dar, in der die in dieser Klasse befindlichen Daten vorkommen. Die relative Häufigkeit wird bei Histogrammen somit mit der Fläche der Rechtecke veranschaulicht. Diese Form der Darstellung ermöglicht das einfache Erkennen von Verteilungsmustern. Dabei werden extreme und unübliche Datenlücken sichtbar.
Wann werden Histogramme zur Visualisierung von Daten verwendet?
- Darstellung von Verteilungen
- Feststellung von Ausreissern
- Vergleich von zeitraumbezogenen Datensätzen
Kreisdiagramm
In einem Kreisdiagramm oder auch Tortendiagramm (zu Englisch Pie Chart) wird ein Kreis in unterschiedlich grosse Stücke aufgeteilt. Dabei kann einfach ersichtlich gemacht werden, welchen Anteil ein Sektor am betrachteten Gesamtvolumen hat. Ein Nachteil von Tortendiagrammen ist, dass relevante Informationen wie Prozentzahlen schriftlich ergänzt werden müssen, da Sie nicht mit freiem Auge erkannt werden können. Zudem können sie schnell verallgemeinernd wirken, wenn der Sektor „Sonstiges“ einen zu grossen Anteil in Anspruch nimmt. Kreisdiagramme können auch unübersichtlich wirken, wenn zu viele Kategorien damit dargestellt werden sollen.
Wann eignen sich Kreisdiagramme zur Visualisierung von Daten?
- Vergleich von relativen Werten
- Darstellung von Struktur (Bestandteile eines grossen Ganzen)
- Darstellung eines Themas mit nur einer Ebene an Unterkategorien
Scatter Plot
Der Scatter Plot oder zu Deutsch das Streudiagramm oder die Punktwolke stellt Wertepaare zweier statistischer Merkmale in einem Koordinatensystem (kartesisch) grafisch dar. Streudiagramme sind geeignet, wenn es viele verschiedene Datenpunkte gibt, deren Differenzen oder Ähnlichkeiten ersichtlich gemacht werden sollen. Somit können Ausreisser sichtbar und ein besseres Verständnis für die Daten geschaffen werden. Zudem kann mit dieser Darstellungsart eine Korrelation festgestellt werden. Bei einer Punktwolke, die sich von links unten nach rechts oben formt, kann angenommen werden, dass die Variablen positiv korrelieren. Umgekehrt bedeutet ein Band von links oben nach rechts unten eine negative Korrelation.
Wann eignen sich Scatter Plots zur Darstellung von Daten?
- Darstellung von Relationen zwischen zwei Variablen
- Verdichtung von Datenmengen
Box-Plot oder Box-Whisker-Plot
Der Box-Plot oder auch der Box-Whisker-Plot wird genutzt, um diverse Streuungs- und Lagermasse in einer Grafik zu vereinen. Bei dieser Form der Visualisierung werden Daten basierend auf fünf Werten dargestellt. Zu diesen zählen das Minimum, das erste Quartil, der Median (auch zweites Quartil genannt), das dritte Quartil und das Maximum. Ein Box-Whisker-Plot zeigt zudem auch Ausreisser auf.
Wann eignet sich ein Box-Plot zur Visualisierung von Daten?
- Darstellung und Vergleich der Datenverteilung
- Darstellung des Minimums, Maximums und des Median
Indikatoren
Indikatoren sind sinnvoll, wenn ein einzelner Wert über ausreichend Aussagekraft, um selbstständig zu funktionieren. Der Indikator (englische Indicator) ist eine aktuelle Zahl, die Auskunft über die Performance einer betrachteten Thematik gibt. Dabei kann es sich zum Beispiel um die gesamten Ausgaben eines Quartals oder um die verkauften Stücke eines Produktes handeln. Die Aussagekraft eines Indikators kann noch gesteigert werden, wenn er um einen Vergleichswert, z. B. aus dem Vorjahr oder vorhergehenden Quartal, beziehungsweise um ein Symbol für Steigerung oder Senkung ergänzt wird.
Wann eignen sich ein Indikator zur Visualisierung von Daten?
- Ein Wert ist selbstständig aussagekräftig
- Informationen sollen auf ein Minimum reduziert dargestellt werden