Das Bild oben stammt aus „Marx Engels Werke“ (MEW): Marxismus ist das bekannteste Beispiel für das, was in der Postmoderne als „Große Erzählung“ bezeichnet wird. Marx und Engels suchten sich Daten, zogen ihre Schlüsse und erzählten die eine Erzählung, die entsprechend ihren Erkenntnissen Sinn machte.
Un poème n’est jamais qu’un alphabet en désordre. (Jean Cocteau)
Our time is perhaps the time of an epidemic of things. (Tristan Garcia)
Ich kann mich noch gut daran erinnern wie sich während meiner Kindheit zu Beginn der 1980er Jahre die älteren Leute sich immer über eine „Informationsflut“ oder sogar „Informationsüberlastung“ beschwerten. 30 Jahre später ist nun meine eigene Generation an der Reihe. „Wenn der Schwamm vollgesogen ist, können neue Informationen nur alte verdrängen.“ Solche Sätze kann man fast täglich in beliebigen Artikeln lesen. Aber welche Informationen befürchten die Leute nicht mehr verstehen zu können, wenn die Datenflut sie überrollt?
Was sind Daten? Daten sind der unbearbeitete Inhalt unserer Erfahrung – einerseits die sensorischen Eindrücke, die in unser Gehirn übertragen werden, andererseits das was wir messen um Erfahrungen zu Erfahrung zu machen. Ich will hier nicht zu philosophisch werden, aber es gibt einige Denker, die mein Unbehagen mit der direkten Verbindung von Daten mit Fakten teilen. In der ganzen Postmoderne geht es um nichts anderes als falsches Vertrauen in empirische Wahrheiten zu dekonstruieren. Vor einem Jahrhundert hat uns bereits Husserl gewarnt, dass die Wissenschaft vielleicht eher mittelbare Theorien als direkte Nachweise erzeugt. Quantitative Sozialwissenschaften, ob empirische Soziologie oder experimentelle Psychologie, sind ganz besonders anfällig für diesen positivistischen Fehlschluss. Während man das Werfen eines Würfels vielleicht noch korrekt in eine Serie stochastisch unabhängiger Ereignisse eines Experimentes abstrahieren kann, funktioniert dies bei menschlichem Verhalten fast nie.
Hören wir also auf, Daten für Fakten zu halten. Nehmen wir stattdessen an, dass Daten Fiktion sind. Stellen wir uns, nur für den Moment, vor, Daten wären der rote Faden einer Geschichte, mit der wir über unsere Erfahrungen berichten. Es kann sehr gut sein, dass es so etwas wie Informationen in diesen Daten gar nicht gibt – nur das Gerüst für verschiedene Erzählungen, das die Zufälligkeit und Komplexität begrenzt. Denken Sie zum Beispiel daran wie unsere Augen die Schatten in den Zimmerecken zu geraden Linien abstrahieren, die die Ecken bilden. Tatsächlich gibt es diese Linien nicht, wenn Sie immer näher an die Ecke herangehen, werden Sie eine runde oder unebene Fläche sehen, die die eine Wand mit der anderen verbindet. Das Bild einer Ecke ist nur unsere Art, den visuellen Eindruck zu etwas mit Bedeutung zu reduzieren – einer Erzählung.
Daten an sich sind größtenteils nicht fassbar. Um sie zu verstehen, müssen wir Strukturen finden, Zusammenhänge konstruieren und ihre Komplexität reduzieren. Das bildliche Darstellen von Daten erfüllt denselben Zweck: Infografiken machen aus Daten eine logische Erzählung, machen sie für unser Gehirn verständlich.
Die Verbindung zwischen Daten und unserem aus den Daten entstandenen Wirklichkeitsverständnis wird durch Metaphern erzeugt. Eine Metapher verbindet unterschiedliche Dinge so, dass wir eines mit dem anderen identifizieren können. Wenn wir Objekte zu einer Kategorie zusammenfassen, wird diese Kategorie zur Metapher. Oder, wie Rudolph Carnap es ausdrückte, „‘Tisch‘ ist ein Wort mit fünf Buchstaben“. Das Konzept eines Tisches hingegen ist die Metapher, das Bild, das Ideal einer beliebigen Reihe von Objekten. Das Wort „Tisch“ ist unser Hilfsmittel mit dem wir das Bild des Objektes an das wir denken im Bewusstsein unserer Zuhörer hervorrufen.
Es gibt kein Gesetz, dass uns dazu zwingt, Daten als notwendig anzusehen oder auch als etwas, das beeinflusst wurde und anderes beeinflusst. Wären Daten eindeutig, würde der Fortschritt der Wissenschaft nur aus dem Korrigieren vorheriger Fehler bestehen. Das ist aber mit Sicherheit nicht der Fall. Selbst die sogenannten „exakten Wissenschaften“ verändern ihre Ausrichtungen je nach Erzählung. Quantenphysik war nicht nötig. Heisenbergs Operatoren sind nicht echt in dem Sinn, dass es tatsächlich ein Objekt gäbe, das einen Quantenzustand in den nächsten verwandelt. Es ist eine Abstraktion einer Wirklichkeit, die wir nicht direkt verstehen könnten. Genauso können wir auch Daten sozialer Interaktionen, verhaltensbezogene Daten oder Wirtschaftsdaten behandeln und somit versuchen, eine sinnvolle Erzählung zu finden mit deren Hilfe wir unser Model der Welt mit anderen teilen können.
Die Erzählung, die wir aus den Daten ableiten, ist natürlich keinesfalls komplett zufällig. Selbstverständlich passt nicht jede Erzählung zu unseren Daten. Aber innerhalb unserer Messungen ist jedes Model, das unseren Daten nicht widerspricht, möglich und kann – je nach Kontext – eine passende Metapher unserer Wirklichkeit sein.
Da viele Erzählungen möglich sind und eine große Zahl Parameter zu unseren Daten passen können, sollten wir vorsichtig mit Werturteilen sein. Ob eine Entscheidung durch unsere Daten gerechtfertigt werden kann, hängt von dem Model ab, für das wir uns entscheiden. Wir sollten uns im Klaren sein, dass wir eine Wahl haben, und dass diese Wahl Verantwortung mit sich bringt. Wir sollten uns über unsere Moral im Klaren sein und über die Strategien mit denen wir die Parameter unseres Models gesetzt haben. Wir sollten uns der Algorithmen-Ethik bewusst sein.
Wir sollten uns außerdem bewusst dein, dass unsere Datenerzählung nie frei von Hierarchien ist. Es ist sehr gut möglich, dass wir anderen etwas mit nur einer möglichen Erzählung aufzwingen; keine Erzählung kann unabhängig vom gesellschaftlichen Kontext erzählt werden.
Wenn wir akzeptieren, dass Daten nicht nur Fakten sind, die irgendwie eine Information ergeben müssen, sondern sie als die Hinweise unserer Erzählung ansehen, befreien wir uns von dem Druck, jedes einzelne Bisschen in unser Gehirn stopfen zu müssen. Möglich, dass wir etwas verpassen, aber das wird kaum dramatischer sein als früher. Unser Model mag vielleicht nicht perfekt sein, aber beim Anhören der Datenerzählung können wir vielleicht dennoch einen Blick auf den fehlenden Teil erhaschen. Wir müssen nur unser Dogma der Daten als Fakten loslassen.
Während Big Data zum Paradigma der Sozialwissenschaften wird hoffe ich, dass wir viele inspirierende Datengeschichten hören werden. Ich hoffe, dass Daten vom Fakt zur Fiktion werden. Und ich will das Märchen hören und erzählen in dem wir die schlummernde Schönheit der Daten wecken.
Das ist die Zusammenfassung meines Vortrags „Datengeschichten erzählen: Vom Fakt zur Fiktion“, den ich beim Content Strategy Forum 2014 in Frankfurt hielt.