Blog

Lügenlinien

I want to talk about one of the most basic tasks a data analyst will be asked to do on a regular basis: present some data over a period of time.
— Noah Lorang
Quelle:  Noah Lorang

Quelle: Noah Lorang

Noah Lorang beschäftigt sich in einem Artikel mit geglätteten Liniendiagrammen. Es wird sehr schön erklärt, warum geglättete Linien Informationen und Trends suggerieren, die in den darunterliegenden Daten gar nicht vorhanden sind. 

Source: https://m.signalvnoise.com/lets-chart-stop...

Data Visualization Chart Chooser Cards

Es ist noch etwas Zeit (Stand 02.11.2016 noch 34 Tage) um die Kickstarter Kampagne "Data Visualization Chart Chooser Cards" zu unterstützen. Ich finde den Ansatz, über einen Kartenstapel die richtige Datenvisualisierung zu finden, sehr clever. Gerade in Besprechungen ist es sicherlich ein gutes Werkzeug, um anhand dieser Karten in einen Dialog einzusteigen und einen passenden Diagrammtyp zu finden. Die Umsetzung macht ebenfalls einen vielversprechenden Ersteindruck.

Source: https://www.kickstarter.com/projects/99144...

Lollipop Chart in Excel erstellen

Yesterday, Stephanie Evergreen published a post about how to make a lollipop graph using Excel 2013. If you’re not familiar with the lollipop graph, it’s basically a bar chart except that the end of the bar is replaced with a dot (the candy) and the bar itself is replaced with a line (the stick, if you will). (Alternatively, you might think of it as a dot plot with only one dot and the lines all stretch to the axis.) The lollipop graph reduces a lot of the ink on the page and I think helps the reader focus just on the end where the data are encoded.
— Jonathan Schwabish
Quelle: PolicyVis - Jonathan Schwabish

Quelle: PolicyVis - Jonathan Schwabish

Ein Lollipop Chart kann helfen, den Blick des Lesers konzentrierter auf das Ende eines Balkens zu lenken. Zusätzlich spart es "Tinte". Nicht nur im echten Leben beim Druck, sondern auch im übertragenen Sinne, wenn es um die "Data/Ink Ratio" geht - Das Verhältnis von Information zu verbrauchtem Platz.

Umfangreiches Tutorial von Jonathan Schwabish auf PolicyVis.com und auch bei Stephanie Evergreen.

Source: http://policyviz.com/lollipop_graph_in_exc...

Der Milliardärsclub - Die wertvollsten Startups

Eine Grafik von Statista zeigt die wertvollsten Startups mit dem Stand Oktober 2015. 

Quelle:  Statista

Quelle: Statista

Die Quelldaten gehen auf einen Wallstreet Journal Onlineartikel zurück, der eine sehr interessante, interaktive Tabelle und Visualisierung der Daten beinhaltet. Doch beide Darstellungen verbergen die teilweise dramatische Entwicklung der Startups. Glücklicherweise kommt man meistens an die Rohdaten, wenn die Artikel dynamisch die Visualisierung generieren. So war es möglich, als kleine, unvollständige Spielerei, die Daten als Slopegraph zu modellieren. So wäre sofort ersichtlich geworden, wie stark in die Startups investiert wurde, und man sieht den zusätzlich den zeitlichen Kontext. 

image.jpg

Fußballfans (und Kreisdiagramme) außer Kontrolle

Im Prinzip ist die multimediale Web- Dokumentation [sic!] des ZDF Online Teams über gewaltbereite Fußballfans eine solide Sache. Ein schöner Scroller mit Video Abschnitten, einem interessanten, und polarisierenden, Thema, unterstützt durch visualisierte Fakten. 

Aber dann das…

Quelle: http://webstory.zdf.de/radikale-fussballfans/

Hoffentlich verletzt sich niemand noch zusätzlich beim Versuch, diese Kreisdiagramm zu deuten. Ohne die absoluten Zahlen am rechten Rand wäre man komplett verloren. Dass die Anzahl der Verletzten in der Kategorie Störer ca. 16% höher ist, als bei der Polizei, kann man selbst auf den zweiten Blick nicht erkennen!  Und mit dem "Zweiten" sollte man ja eigentlich besser sehen können [Entschuldigung]. Wie kann man nur diese Darstellung wählen? Warum wird immer wieder zu dem Instrument Kreisdiagramm gegriffen, wenn dieses die schlecht möglichste Wahl ist - nämlich, wenn man Mengen und Verhältnisse darstellen möchte? Dabei ist die Alternative genauso einfach, wie informativ.

Source: http://webstory.zdf.de/radikale-fussballfa...

Frischer Wind bei Kreisdiagrammen - Die Nachteile bleiben

In einer Statista Infografik sind mir wirklich schön gestaltete Kreisdiagramme untergekommen. In diesen wird versucht, die Nachteile der Kreisdiagramme, nämlich, dass man bei mehreren Bestandteilen deren eigentliches Verhältnis nur schwer erkennen kann, abzuschwächen. Die Kreisdiagramme bilden keinen klassischen Kreis, sondern haben je nach Wert auch eine andere Fläche. Im oberen Fall funktioniert das auch sehr gut, doch in den beiden kleineren Diagrammen geht es geradezu wild zu.

Quelle: Statista

Quelle: Statista

Im rechten Diagramm werden acht Kategorien abgebildet. Für ein Kreisdiagramm sind das viel zu viele. Auch die Farbwahl, die nötig ist um die Kategorien im Diagramm überhaupt irgendwie unterscheidbar zu machen, macht es dem Betrachter schwer sich zurecht zu finden.

Vertikale Balkendiagramme 

Mehrere Kategorien lassen sich besser über vertikale Balkendiagramme darstellen. Der Betrachter kann somit die Verhältnisse viel schneller erfassen und die Informationen sind viel dichter - Der Blick zur Legende entfällt, da es keine gibt. Die Werte werden direkt mit den Kategorien verbunden. Auf Farben kann man verzichten, diese sind hier nicht nötig.


Source: http://de.statista.com/infografik/3127/wie...

iOS Adaptionsrate - Kein Grund zur Panik bei iOS8?

Es wird viel über die Adaptionsrate von iOS8 diskutiert. Fakt ist aber, dass iOS8 sich bei weitem sich nicht so rasant verbreitet, wie iOS7 zu seiner Zeit. Im iPhoneblog wurde ein Diagramm einer mir unbekannten Quelle abgebildet, das die Anteile der installierten iOS Versionen über die Zeit vergleicht. Mal abgesehen von der Benutzung von Kuchendiagrammen (mal wieder), habe ich folgende Probleme mit der Darstellung.

  1. Die iOS7 Adaption wird über einen Zeitraum von 47 Tagen dargestellt, die iOS8 Adaption über 71 [sic!] Tage.
  2. Im Verhältnis wurden viel mehr iOS8 vorinstallierte Geräte verkauft (iPhone6/6+), als damals mit iOS7. Man kann also davon ausgehen, dass die Anzahl der aktiven, also bewusst durchgeführten Upgrades von iOS7 auf iOS8 noch geringer sein wird.
  3. Die Prozentwerte lassen keine Rückschlüsse auf die Anzahl der Installationen zu - finde ich in diesem Zusammenhang viel spannender. Und wahrscheinlich auch für die Zielgruppe der Diagramme (aufgrund des AppStore Fokus tippe ich auf Entwickler, die sehen wollen, wie groß deren potenzielle Installationsbasis ist)

Das Diagramm kann somit die Frage, ob iOS8 ein Adaptionsproblem hat, nicht vollständig beantworten. Dafür sind die Randbedingungen und Daten nicht aussagekräftig genug. Mein Vorschlag für eine Visualisierung der Daten berücksichtigt sowohl den Rückstand in der Adaptionsrate, als auch den unterschiedlichen Zeitraum der Messungen - kann aber die Frage auch nicht beantworten. Die Diskussionen werden also weitergehen.


Source: http://www.iphoneblog.de/2015/01/08/eine-z...

Optimierung: The Guardian - "You are probably wrong about almost everything"

The Guardian unterhält einen interessanten Bereich, der sich rein um den Daten Journalismus dreht. Dort ist vor kurzem ein Artikel veröffentlicht worden, in der mir eine neue Verwendung von Balkendiagrammen untergekommen ist.

Der Artikel dreht sich inhaltlich darum, wie weit die Schätzung von innerpolitischen Fakten von der eigentlichen Realität abweicht. Der erste Gedanke wäre, die Schätzung als Balken, und separat die absolute Differenz zwischen Schätzung und Realität darzustellen (Beispiel hier). Der Guardian ist einen anderen Weg gegangen - und macht es dem Leser unnötig schwer...

Bild: The Guardian

Bild: The Guardian

Die Summe der sichtbaren Balken ergeben den Average Guess, die Schätzung. Diese ist im Diagramm nur als graue Zahl am rechten Balkenrand sichtbar. Der hellblaue Actual Balken ist die Realität, und die Differenz zwischen beiden Werten wird durch den dunkelblauen Balken dargestellt. Prinzipiell ist der Ansatz löblich, hier will man viele Informationen (drei) in einer Zeile unterbringen. Im obigen Beispiel funktioniert das auch recht gut, ist aber nicht sehr intuitiv. Das Auge wandert immer wieder zur Legende, um zu validieren, was welcher Balken denn noch einmal darstellen sollte. Will man das gelernte aber direkt im nächsten Diagramm anwenden, fängt man wieder von vorne an.

Bild: The Guardian

Bild: The Guardian

Durch die nötige Darstellung von negativen Differenzen, sind auf einmal die dunkelblauen Differenzbalken direkt an der vertikalen Achse, und nicht mehr, wie im ersten Diagramm, rechts vom Actual Balken und lässt die Kategoriebeschriftung "kippen", was eine deutliche Unruhe generiert. Durch das Ändern der Reihenfolge und missachten der erlernten (und aufgezwungenen) Logik, sollte sich diese Darstellung der drei Werte eigentlich sofort disqualifizieren. Die Average Guess Werte am rechten Ende der Balken, die im ersten Beispiel clever die Summe der beiden Balken ergaben, sind in diesem Fall völlig fehl am Platz. Die Darstellung führt dazu, dass Frankreich mit 49% rechts von Deutschland mit 58% landet! 

Mein Vorschlag zur Optimierung wäre eine um eine Abweichungsspalte erweiterte Tabelle. Diese Darstellung ist zwar nicht so chic wie die vom Guardian gewählte Visualisierung, verlangt aber vom Leser nicht das Neuinterpretieren von Balkendiagrammen ab. Außerdem stellt die optimierte Tabelle die Differenz heraus, was ja auch die eigentliche Aussage des Artikels sein soll. Nämlich, wie weit man bei so ziemlich Allem daneben liegt.