Weniger ist mehr. Das gilt auch für Big Data.
Kürzlich ist mir am Bahnhofskiosk ein Zeitschriftentitel ins Auge gefallen, der „60 Jahre Toast Hawaii“ feierte. Aber als ich ein Foto des Covers an einen Freund whatsappen wollte, da machte die Autokorrektur im Begleittext aus meinen „goldfarbenen Scheibletten“ ein „Goldbarren Schieblehre“.
Das hat meine Achtung vor Google, dem Hauptverantwortlichen für die Software meines Handys, schwer beschädigt. Alle Welt redet von Big Data. Aber eine Datenbasis, die in meiner Alltagswelt die Verwendung des Wortes „Goldbarren“ für wahrscheinlicher hält als „goldfarben“, die muss grundfalsch strukturiert sein. Und wer glaubt, dass ich privat eher über Werkzeuge als über Käse poste, der ist Lichtjahre von einer brauchbaren digitalen Repräsentation meiner Interessen entfernt.
Im Zusammenhang mit Big Data wird immer wieder die Geschichte von dem minderjährigen Mädchen erzählt, dessen Eltern von einer Handelskette erfuhren, dass ihre Tochter schwanger sei. Denn aus dem Einkaufsverhalten des Mädchens habe das Unternehmen auf die Schwangerschaft rückschließen können. Und erst durch die folgende Werbung für Windeln und Baby-Brei seien die Eltern dann darauf aufmerksam geworden, dass ihre Tochter ein Kind erwartet.
Dazu gibt es zweierlei zu sagen. Erstens: diese Geschichte ist mit hoher Wahrscheinlichkeit nur ein Mythos. Zweitens: selbst wenn es sich so zugetragen haben sollte, dann werden doch die vielen Mädchen ausgeblendet, die gleichzeitig völlig unsinnigerweise mit Windelwerbung und Babybrei-Proben behelligt wurden, obwohl sie entgegen der Datenmodelle doch nicht schwanger waren.
Wenn hier Big Data erfolgreich eingesetzt wurde, dann höchstens in der Form, dass statt tausend betroffener Mädchen nun nur noch einige hundert fälschlich in die ’schwanger‘-Gruppe einsortiert wurden. Wie immer, wenn es um die Analyse und Prognose menschlichen Verhaltens mit Hilfe von Daten und Statistik geht, ist auch Big Data ein gutes Instrument, um aus vielen verschiedenen Fällen weniger aber immer noch verschiedene Fälle zu machen.
Von einer Welt, in der Datenanalysten menschliches Verhalten punktgenau vorhersagen können, sind wir noch genau so weit entfernt, wie in den 50er Jahren des letzten Jahrhunderts, als nicht nur der Toast Hawaii erfunden wurde, sondern auch die Sozialstatistik. Und die wurde damals fast genau so euphorisch gefeiert, wie die parallel entwickelte zivile Nutzung der Kernphysik. Sah man in letzterer die Lösung aller Energiefragen, so erhoffte man sich von der Vermessung der Gesellschaft eine Lösung für die politischen Fragestellungen.
Interessanterweise begegnet heute niemand mehr der Kerntechnik mit der Bereitschaft zu naiver Euphorie. Aber auf die Versprechungen der Datengurus springt insbesondere die Marketingwelt seitdem immer wieder gerne an; ob sie nun unter dem Label ‚CRM‘ oder ’neuronale Netze‘ oder ‚Database Marketing‘ daher kommen. Und das neueste Label ist ‚Big Data‘.
Nun ist Big Data tatsächlich etwas Neues. Denn das Verhalten auch in der physischen Welt erzeugt an immer mehr Stellen digitale Daten. Und diese können mittlerweile fast unbegrenzt gespeichert und in Echtzeit analysiert werden. Was aber nicht neu ist, das sind die begrenzten Fähigkeiten statistischer Modelle. Und die sind nun einmal deutlich besser darin, Unwahrscheinliches auszuschließen als konkrete Ereignisse oder Verhaltensweisen vorherzusagen.
Wer sich Big Data als ein Ausschluss-Verfahren vorstellt, das uns dabei hilft, weniger Falsches oder nicht Sinnvolles zu tun, der liegt richtig. Big Data-Phantasien, die eine berechenbare Welt suggerieren, sind heute so falsch wie vor 60 Jahren. Wer mir Windelwerbung erspart, der tut mir einen Gefallen. Wer mir den Käse vom Brot nimmt und durch ein Werkzeug ersetzt, der geht mir auf die Nerven.
Digitale Presseprodukte werden durch Verwendung der Daten ihrer Nutzer immer individueller und persönlicher werden. Werbekunden werden davon profitieren, dass Verlage die Ausspielung von Werbung immer mehr an tatsächliche, individuelle Nutzermerkmale koppeln können statt an soziodemografische Querschnitte pseudo-exakter Zielgruppen. Und gleichzeitig müssen die Pressemedien das Thema journalistisch begleiten. Die kritische Berichterstattung über die Datensammelwut staatlicher Einrichtungen oder großer Konzerne ist dauerhaft unverzichtbar. Big Data ist für sämtliche Bereiche eines Verlages ein Zukunftsthema.
Aber das darf uns nicht blind machen für die Grenzen automatisierter Ansätze. Die Zukunft bleibt ungewiss und Menschen unberechenbar.
Bildquelle: stockphoto-graf/Shutterstock.com