Die USA haben keine besseren Partner als die Europäer. Philip Murphy

Ein Datensatz mit X

Politik, Wirtschaft und Forschung lieben Big Data. Aber es sind verhängnisvolle Affären, die da begonnen werden.

facebook daten big-data print4

Big Data ist das Modewort unserer Zeit. Manche haben den Einfluss von Daten sogar mit der Erfindung des Mikroskops verglichen: Plötzlich ist es durch eine neue Technologie möglich, Dinge zu sehen, die uns vorher verborgen blieben. Doch dieser Vergleich hinkt.

Die zentrale Entwicklung der letzten Jahre ist nicht die tiefere Einsicht in Datensätze, sondern die Fähigkeit, online immer größere Datenmengen zu sammeln. Big Data ist kein Mikroskop, sondern ein Teleskop. Aus großer Entfernung können wir die digitalen Spuren der Menschheit ins Visier nehmen. So, als ob wir auf dem Mond säßen und durch ein Fernrohr die Erde betrachten.

Daten sind ein enorm wichtiger Rohstoff – und rufen daher neue soziale und ethische Fragen auf. Aber Big Data ist kein Heilsbringer. Die Vorstellung, dass Daten im Großen und Ganzen ein akkurates Bild der Realität liefern, ist ein Trugschluss, dem wir nicht verfallen sollten.

Erstens gibt es keine objektiven Daten. Denn schon die Methodik des Datensammelns hat einen Einfluss auf den Datensatz. Nehmen wir Facebook als Beispiel: Dessen Nutzer kommen aus ganz bestimmten Bevölkerungsgruppen und sind in ihrem Nutzerverhalten eingeschränkt. Bestimmte Interaktionen sind auf Facebook sehr einfach, andere hingegen unmöglich. Die über Facebook generierten Daten sind also nicht unabhängig von den Algorithmen der Plattform. Das gleiche gilt für jede andere Webseite.

Zweitens hat das Internet Daten zwar sichtbarer und erfassbarer gemacht, aber unseren Austausch untereinander nicht grundlegend verändert. Studien über das menschliche Kommunikationsverhalten aus vergangenen Jahrzehnten zeigen, dass wir uns auch damals schon über ähnliche Themen unterhalten haben wie heute. Der Mensch bleibt Mensch. Nur dass wir alles genauer vermessen und untersuchen können.

Wer allerdings nur auf die Datenspuren achtet, macht einen Fehler. Das ist so, als ob wir statt auf den Menschen lediglich auf den Schatten schauen, den er wirft. Komplexität geht dabei verloren. Ein Like auf Facebook kann ganz unterschiedliche Dinge bedeuten: „Wie idiotisch“, „Das tut mir leid für dich“, „Ich hasse das“ und manchmal auch „Das gefällt mir“. Wer glaubt, diese semantischen Unterschiede seien für Maschinen erfassbar, irrt.

Diese beiden Aspekte deuten auf einen zentralen Punkt hin: Daten über menschliches Verhalten sind nur bedingt vergleichbar mit Daten über Objekte. Der Mensch ist ein wankelmütiges Wesen: Manchmal ändern wir unser Verhalten, weil jemand uns beobachtet, manchmal ändern wir es, wenn niemand zuschaut oder wenn etwas Interessantes passiert.

Ich denke dabei an den Versuch von Google, mithilfe der Analyse von Suchanfragen die Ausbreitung von Grippewellen vorherzusagen. Es hat sich herausgestellt, dass Google mit seinen Prognosen dieses Jahr deutlich über das Ziel hinausgeschossen ist. Warum? Weil der Hype um Googles Projekt dazu geführt hat, dass mehr Menschen nach Grippesymptomen gesucht haben und mehr Medien darüber berichtet haben. Wir kennen in diesem Fall die wirkliche Zahlen und können sagen: Das Modell hat versagt.

Immer häufiger ist Big Data allerdings die einzige Quelle, auf die wir uns berufen. Woher sollen wir wissen, wenn die Daten die Realität unzureichend abbilden? Schaffen wir es weiterhin, die Landkarte von der Landschaft zu unterscheiden?

Natürlich haben Daten einen immensen (Mehr-)Wert. Forscher haben kürzlich damit begonnen, Google-Suchanfragen nach den Namen von Medikamenten zu durchkämmen. So lässt sich vielleicht herausfinden, welche Medikamente gleichzeitig eingenommen werden und mit welchen Nebenwirkungen daher zu rechnen ist. Es wäre unmöglich, alle Medikamentencocktails im Labor zu testen – aber wenn wir die Gewohnheiten der Patienten kennen, können wir das Problem von der anderen Seite angehen.

Wir wissen außerdem, dass sich aus einem Facebook-Nutzerprofil ziemlich genaue Rückschlüsse auf sexuelle Orientierung, Herkunft, Religionszugehörigkeit, politische Haltung, Persönlichkeit, Intelligenz, Wohlbefinden, Alter, Geschlecht, Beziehungsstatus und Drogenmissbrauch eines Nutzers ziehen lassen. Alle diese Informationen können indirekt gewonnen werden, ohne den Nutzer ein einziges Mal danach zu fragen. Das bedeutet: Wir können statistische Informationen erlangen, ohne dass der Nutzer davon erfährt.

Diese Asymmetrie macht Big Data zu einem begehrten Gut und wirft gleichzeitig neue ethische Fragen auf. Nicht nur für Unternehmen sind solche Daten lukrativ, sondern auch für die Politik. Stellen Sie sich einmal vor, was beispielsweise ein Wahlkampfteam damit machen könnte. Jedem potenziellen Wähler könnte eine Nachricht gesendet werden, die genau auf seine Persönlichkeit, auf seine Schwächen und Vorlieben zugeschnitten ist. Sympathie aus dem Computer, nicht Liebe auf den ersten Blick.

Dieses Szenario ist übrigens keine Science-Fiction. Big Data hat im US-Wahlkampf 2012 vor allem für Obama eine enorm wichtige Rolle gespielt. Daten können einem unbeliebten Kandidaten nicht plötzlich Charisma verpassen. Aber schon eine bessere Mobilisierung der Stammwähler kann bei knappen Entscheidungen den Unterschied machen. Die Gefahr von Big Data ist, dass die Politik nicht mehr auf überzeugende Argumente setzt, sondern auf eine immer zielgenauere Analyse ihrer Klientel.

Die Literatur des 20. Jahrhunderts wurde von zwei dystopischen Visionen geprägt: George Orwell warnte vor dem totalen Überwachungsstaat, Aldous Huxley vor den Verführungen des Hedonismus und vor psychologischer Manipulation. Was, wenn im 21. Jahrhundert beide Visionen gleichzeitig wahr werden?

Übersetzung aus dem Englischen

Lesen Sie weitere Meinungen aus dieser Debatte von: Mathew Ingram, Reinhard Clemens.

Cover4_klein

Dieser Beitrag ist in der Printausgabe 3/2013 des „The European“ enthalten.

Darin finden Sie u.a.: Endlich Arbeitslos – Wenn Roboter unsere Jobs übernehmen, geht die Arbeit erst so richtig los. Über Chancen und Risiken einer Welt ohne Mühsal debattieren u.a. dm-Gründer Götz Werner und Nobelpreisträger Robert Solow. Weitere Debatten: Die Ressource Big Data, die neuen Geschlechterrollen sowie die Aufarbeitung der deutschen Teilungsgeschichte. Dazu Gespräche mit Jean-Claude Juncker, Jürgen Trittin und Anne-Marie Slaughter.

Sie können es hier direkt bestellen.

Leserbriefe

comments powered by Disqus

Mehr zum Thema: , Daten, Big-data

Kolumne

Medium_45c47f9584
von Gunnar Sohn
05.03.2014

Gespräch

Medium_4c2437cc3e

Debatte

Bedeutung von Small Data

Medium_7c5148ba5d

Auf die Größe kommt es an

Unternehmen sind vor allem scharf auf Small Data – unsere Alltagsspuren im Netz. Und wir lassen uns das einfach so gefallen. weiterlesen

Medium_0d73062cb3
von Mathew Ingram
31.07.2013
meistgelesen / meistkommentiert