Hier finden Sie die Unterlagen zu meinem Vortrag Ein Bild sagt mehr als tausend Worte: Graphische Darstellungen komplexer Daten.

  • Vortragsfolien
  • Die Daten, die ich in der Einführung benutzt habe, sind in der Literatur als Anscombe-Quartett bekannt.
  • Aufbereitete Ernährungsdaten
  • Quelle der Ernährungsdaten; es handelt sich um die USDA National Nutrient Database for Standard Reference. Im Vortrag habe ich Daten aus der 28. Version der Datenbank benutzt.
  • Um die Daten in eine einfachere Version zu bringen, habe ich ein Skript geschrieben, das Sie gerne zum Experimentieren benutzen können.

Selber Bilder machen

Die Bilder des Vortrags sind hauptsächlich mit gnuplot entstanden. Wenn Sie die aufbereiteten Daten heruntergeladen haben, können mit dem folgenden Code Parallele Koordinaten erzeugen, vorausgesetzt, Sie benutzen mindestens Version 5.0 von gnuplot:

unset tics;
unset border;
unset key;

set size ratio 0.25
set xtics ("Protein" 1, "Fett" 2, "Kohlenhydrate" 3, "Kcal" 4, "Koffein" 5, "Ballaststoffe" 6, "Natrium" 7)

set terminal svg enhanced fname "Myriad Pro" size 500,200;

set for [i=1:7] paxis i tics

set output "USDA.svg";
  plot "USDA.txt" using 1:2:3:4:5:6:7 with parallel lc rgb '#00FFBF00' lw 0.50;
set output;

Sie können entweder diesen Code “abtippen” und in der interaktiven Benutzeroberfläche von gnuplot verwenden oder als Datei—beispielsweise USDA.gp—speichern und

$ gnuplot USDA.gp

aufrufen. Dies erzeugt automatisch ein Bild der Daten.

Weiterführende Informationen

Im Vortrag habe ich über Parallele Koordinaten gesprochen. Es gibt natürlich noch viele anderen Darstellungen für komplexe Datensätze, zum Beispiel Streudiagrammmatrizen.

Johannes Kehrer und Helwig Hauser haben mit multivis.net eine ausgezeichnete Übersicht über verschiedene Verfahren zur Darstellung von Daten geschaffen.

Hier noch einige Literaturempfehlungen:

  • Stephen Few: Now You See It. Dieses Werk enthält einfache und komplizierte Darstellungen für Daten und erläutert sie auch für Laien gut verständlich.
  • Edward Tufte: The Visual Display of Quantitative Information. Dies ist eines der Standardwerke zur “guten” Darstellung von Daten mittels statistischer Werkzeuge. Tufte hat einen sehr eigenen, minimalistisch anmutenden Stil, der zum Nachdenken über die eigenen Daten anregt.
  • Edward Tufte: Envisioning Information. Hierbei handelt es sich um eine wunderbar kuratierte Sammlung von informativen Darstellungen im Lauf der Jahrhunderte.
  • Colin Ware: Visual Thinking for Design. Eine äußerst gelungene Einführung in das Gebiet der Informationsvisualisierung.

Wenn Sie das noch nicht abgeschreckt hat, möchte ich Ihnen gerne meine eigenen Publikationen (in englischer Sprache) sowie meine Vorträge ans Herz legen.

Eigene Daten

Wenn Sie einen Datensatz haben, den Sie gerne visualisiert hätten, schreiben Sie mir einfach eine E-Mail an bastian.rieck@iwr.uni-heidelberg.de oder bastian@rieck.space. Ich helfe Ihnen gerne weiter.