Es ist nicht die Zeit der Kontrollfreaks. Alec Ross

„Ein amerikanischer Adolf ist im Schnitt 82 Jahre alt“

Big Data kann uns die Welt erklären. Auch wenn wir unerwartete Fragen stellen. Der Suchmaschinen-Guru Stephen Wolfram erklärt Lars Mensel und Thore Barfuss die Verbreitung von Babynamen und beantwortet die Frage, was die DDR-Führung im Internet angestellt hätte.

The European: Herr Wolfram, was halten Sie von Big Data? Unsere Autorin Zeynep Tufekci spricht von einem Modewort.
Wolfram: Big Data beinhaltet zunächst ja die Aussage, dass es sehr viele Daten in der Welt gibt. Und das ist gut so! Die entscheidende Frage ist aber: Kann aus Big Data auch „Big Knowledge“ (großes Wissen) werden?

The European: Und?
Wolfram: Big Data kann ein Grundstein sein, ja. Die Herausforderung liegt darin, die großen Datenmengen auch berechenbar zu machen. In der Geschichte systematischer Datenerfassung waren die beiden größten Datensammler Babylon und die Vereinigten Staaten.

The European: Was haben die beiden gemein?
Wolfram: Sie zeigen einfach, dass Zivilisation einen Datenfluss erzeugt. Unmengen von Textdokumenten wurden jahrhundertelang gelagert und gespeichert. Heute mag sich zwar die Menge an Daten im Internet stabilisieren, neu sind aber die automatische Erfassung von Daten und die vielen Messmöglichkeiten. So können viele Daten analysiert werden.

The European: Was genau bedeutet das?
Wolfram: Es gibt unglaublich viel Wissen in der Welt und im Internet. Das Wissen ist aber definitiv endlich. Angesichts der vielen Messinstrumente fällt die Wissensproduktion verhältnismäßig klein aus. Erst wenn es einen vernünftigen Rahmen für die Verarbeitung von Wissen gibt, wird aus den vielen Daten im Internet auch tatsächlich eine homogene Wissensquelle.

The European: Wenn Sie an diese riesigen Datenmengen denken: Bekommen Sie da Angst, oder finden Sie das aufregend?
Wolfram: Oh, ich liebe Daten! Ich sammele schon seit Ewigkeiten Daten über mich selbst. Es ist ein bisschen peinlich: Aber ich bin wahrscheinlich der Mensch, der die meisten Daten über sich selbst gesammelt hat. Daten sind einfach meine Welt. Ich bin immer aufgeregt, wenn neue dazukommen.

The European: Haben Sie denn dank der Daten etwas über sich herausgefunden?
Wolfram: Vor einem Jahr habe ich mich hingesetzt und einen Teil der Daten analysiert. Dabei habe ich allerlei schreckliche Sachen über mich entdeckt.

The European: Zum Beispiel?
Wolfram: Am meisten hat mich überrascht, was für ein Gewohnheitstier ich bin. Aber es hat auch Spaß gemacht. Am meisten, als ich sehen konnte, wie sich eine Idee entwickelt hat. Dafür musste ich nur nach einem bestimmten Wort suchen. Das war dann auch der Grund, warum ich alle meine Unterlagen eingescannt habe – ungefähr eine Viertelmillionen Seiten.

The European: Wie bitte, eine Viertelmillion?
Wolfram: Ich produziere nun mal viel Zeug. Zum Glück bin ich später auf Computer umgestiegen.

The European: Wissen Sie noch, wann das war?
Wolfram: 1984.

The European: Welch merkwürdiger Zufall, nicht?
Wolfram: Offensichtlich …

The European: Ihre Suchmaschine Wolfram Alpha nutzt Big Data. Könnte die Suchmaschine auch ähnliches über uns herausfinden?
Wolfram: Nicht unbedingt. Aber wir haben in den letzten Monaten sehr viele Daten über Facebook gesammelt. Bei der Auswertung dieser Daten wurden ziemlich viele Stereotype bestätigt. Etwa, dass Menschen sich mehr für Politik und das Wetter interessieren, je älter sie werden. Oder dass Videospiele vor allem für Männer interessant sind. Und so weiter und so weiter.

The European: Viele Firmen nutzen solche Informationen, um Kaufverhalten vorherzusagen. Das amerikanische Unternehmen Target prognostiziert beispielsweise die Schwangerschaften von Kunden anhand deren Kaufverhalten. Ist das Datensammeln ausgeartet?
Wolfram: Das ist unvermeidbar, es wird so oder so passieren. Trotzdem haben wir noch Einfluss. Lassen Sie mich ein persönliches Beispiel geben: Sie können sehr viel über mich im Internet erfahren, aber bis vor kurzem waren die Namen meiner Kinder nicht zu finden. Jetzt, wo diese aber selber im Internet sind, ist es recht einfach, sie zu finden. Ich wusste genug über das Netz und konnte so entscheiden, ob sie zu finden sind oder nicht. Wenn es um Daten geht, ist die entscheidende Frage, was wir preiszugeben bereit sind.

„Wir können ein nahezu komplettes Bild über jeden Menschen liefern“

The European: Können wir den Firmen denn wirklich unsere Daten anvertrauen?
Wolfram: Es ist gut, wenn die Leute den Firmen vertrauen, die ihre Daten sammeln. Wir haben mit Wolfram Alpha sehr davon profitiert. Bei uns liegt das wohl daran, dass wir weniger kommerziell sind. Wir machen auch nichts mit den persönlichen Daten der Leute. Das haben wir nie gemacht, und das werden wir auch nie machen. Wobei das vielleicht eine schlechte Idee ist.

The European: Warum denn das?
Wolfram: Wir könnten damit sehr viele schöne Dinge anstellen – etwa eine wirklich gute Personen-Suchmaschine. Diese könnte ein nahezu komplettes Bild jedes Menschen liefern. Aber es ist unklar, ob das irgendeinen positiven Wert hätte. Klar ist hingegen, dass es einen negativen hätte. Andererseits könnte man sagen: Besser wir als jemand anderes, der nicht so seriös ist.

The European: Was hält Sie zurück?
Wolfram: Bis jetzt wollten wir Personenprofile nicht komplett verknüpfen. Wir könnten zum Beispiel Häuser und Standorte miteinander verbinden, aber wir scheuen davor zurück. Das Leben von Journalisten würde dadurch vielleicht einfacher, aber ich denke, dass manches besser privat bleiben sollte.

The European: Experten erhoffen sich viel Geld von der Datenanalyse. Was macht Daten wertvoll?
Wolfram: Ich bin kein Experte im Geldmachen. Glücklicherweise haben wir bei Wolfram Alpha Erfolg, ohne uns auf das Kommerzielle zu konzentrieren. Ich interessiere mich eher für intellektuelle Fragen der Datenverwertung. Am spannendsten ist es für mich, verschiedene Datensätze miteinander zu vergleichen.

„Die Welt ist berechenbarer als angenommen“

The European: Was entdecken Sie dabei?
Wolfram: Viele Fehler. Niemand findet mehr Fehler als wir, wenn wir die Glaubwürdigkeit von Datensätzen checken. Hat der Wind wirklich aufgehört zu wehen, oder saß nur ein Vogel auf der Messstation? Per Gegenprobe finden wir solche Dinge heraus.

The European: Was war das Interessanteste, das Sie herausgefunden haben?
Wolfram: Die Welt ist viel berechenbarer, als man annehmen könnte. Es gibt über die allermeisten Sachen einfach sehr viele Daten.

The European: Wo gab es Zusammenhänge, die Sie überrascht haben?
Wolfram: Bei Babynamen. Die stehen in direkter Korrelation mit großen Ereignissen – besonders solchen aus der Popkultur. Wie lautet Ihr Vorname?

The European: Lars.
Wolfram: Unsere Daten funktionieren zwar besser mit amerikanischen Namen, aber lassen Sie mich kurz nachsehen (gibt „Lars“ bei Wolfram Alpha ein). Wie es aussieht, leben nur 2.000 Leute mit diesem Vornamen in den USA. Die meisten wurden in den 1960er- und 1970er-Jahren geboren. Aber was man hier sieht, ist typisch: Es muss einen Grund geben, wieso der Name damals populär war. Vielleicht gab es eine bekannte Person mit diesem Namen.

The European: Eltern erhoffen sich, dass ihr Kind von solchen Namen profitiert?
Wolfram: Ganz genau. Versuchen wir es mal mit einem altmodischen Namen wie Adolf (tippt). Sehen Sie: Der Name war nur in den 1920er- und 1930er-Jahren beliebt. Ein Amerikaner mit diesem Namen ist durchschnittlich 82 Jahre alt. Aber das war ja zu erwarten.

The European: Was haben Sie noch so entdeckt?
Wolfram: Wenn man Daten verknüpft, findet man immer wieder merkwürdige Zusammenhänge. Das sieht oft total bescheuert aus. Ganz viele dieser Zusammenhänge sind rein zufällig, aber manchmal lassen sich so auch grandiose Entdeckungen machen. Leider haben wir noch keinen Weg gefunden, wie man automatisch Zufälle von Entdeckungen trennen kann.

The European: Überschätzen wir manchmal einfach die Macht der Computer?
Wolfram: Momentan wird viel über das automatische Benoten von Studienarbeiten diskutiert: Was für eine Wahnsinnsidee! Sollte das durchgesetzt werden, würden die Studenten nur noch Arbeiten abgegeben, die für andere Menschen unleserlich sind, aber bei Computern gut abschneiden. Genauso falsch ist übrigens, den Kindern in der Schule noch Kurvendiskussionen und Analysis beizubringen. Eines meiner Kinder kam kürzlich zu mir und wollte, dass ich ihm bei den Hausaufgaben helfe. Ich war verblüfft, ich dachte nicht, dass Menschen so noch rechnen. Ich habe das seit über 30 Jahren nicht mehr gemacht.

The European: Was ist denn so schlimm daran?
Wolfram: Das ist doch einfach verrückt: Wir programmieren Menschen darauf, die Arbeit von Maschinen zu übernehmen. Sollte es nicht eigentlich andersherum sein? Die Maschinen sollten uns die Arbeit abnehmen!

The European: Was halten Sie von der Idee, dass Daten ein Verfallsdatum bekommen? Momentan bleiben etwa die Daten von Verstorbenen auf Ewigkeit im Netz.
Wolfram: Diese Frage wurde lange Zeit vernachlässigt. Es ist gut, dass endlich einige Leute und Firmen daran arbeiten. Ich frage mich seit Jahren, ob man einen digitalen Datensafe programmieren kann. Daten, die man heute hinpackt, würden dann beispielsweise erst nach 20 Jahren zugänglich gemacht werden. Es geht um die Frage, ob man digitale Informationen wegschließen kann. Also so ziemlich das Gegenteil von dem, was Sie gefragt haben.

The European: Und was ist denn nun Ihre Haltung zum digitalen Nachlass?
Wolfram: Gestern war ich im Ägyptischen Museum in Berlin. Die Ägypter glaubten fest an das Konzept des Jenseits. Sie hinterlegten Dinge für ihr Nachleben. Während ich da stand, wurde mir klar: Das Museum und all die Dinge darin, das ist ihr Nachleben. Die Ägypter hinterließen all das, was ich angesehen habe.

The European: Aber diese Dinge haben die Ägypter vor ihrem Ableben bereitgelegt.
Wolfram: Das stimmt. Sie hatten ein merkwürdiges Verständnis von Raum und Zeit. Aber wir wissen so viel über sie, auch über die Babylonier, weil sie der Nachwelt so viel hinterlassen haben. Über andere Zivilisationen wissen wir so gut wie gar nichts, einfach weil es keine Daten gibt. Das ist doch schade! Trotzdem müssen wir akzeptieren, wenn Menschen es nicht möchten, dass etwas von ihnen zurückbleibt.

The European: Franz Kafka wollte, dass seine Schriften zerstört werden. Zum Glück wurde seinem Wunsch nicht entsprochen. Gott sei Dank! Lassen Sie uns über Datenmissbrauch reden. Stellen Sie sich mal vor, was ein totalitäres System wie die DDR mit den Möglichkeiten von heute anstellen würde …
Wolfram: Ich habe das große Glück gehabt, in einem Land groß zu werden, wo man vielleicht nicht mit der Regierung zufrieden ist, diese aber nie total verrückte Dinge gemacht hat. In Deutschlands Geschichte waren Daten ganz offensichtlich ein Schlüssel für die beiden Diktaturen. Aber ich bin nicht sicher, ob mehr Daten so nützlich für diese oder andere Regime wären.

The European: Wie kommen Sie darauf?
Wolfram: Lassen Sie mich das mit einem Vergleich beantworten: Viele Menschen denken, dass es ihnen gesundheitlich sehr gut geht, aber das ist falsch! Irgendwas stimmt bei jedem nicht. Wenn man nicht so viele Informationen über seinen gesundheitlichen Zustand hat, denkt man auch nicht viel darüber nach. Wenn man aber 200 Blutwerte misst, dann sind bei jedem doch mindestens fünf abweichend. Das gleiche gilt für Menschen in der Gesellschaft: Wenn man auch den allerletzten Schritt überwacht, findet man bei jeder Person etwas. Und das, obwohl es immer Raum für Interpretation gibt. Ab einem gewissen Punkt sind mehr Daten nicht unbedingt hilfreich.

Übersetzung aus dem Englischen

Cover4_klein

Dieser Beitrag ist in der Printausgabe 3/2013 des „The European“ enthalten.

Darin finden Sie u.a.: Endlich Arbeitslos – Wenn Roboter unsere Jobs übernehmen, geht die Arbeit erst so richtig los. Über Chancen und Risiken einer Welt ohne Mühsal debattieren u.a. dm-Gründer Götz Werner und Nobelpreisträger Robert Solow. Weitere Debatten: Die Ressource Big Data, die neuen Geschlechterrollen sowie die Aufarbeitung der deutschen Teilungsgeschichte. Dazu Gespräche mit Jean-Claude Juncker, Jürgen Trittin und Anne-Marie Slaughter.

Sie können es hier direkt bestellen.

Leserbriefe

comments powered by Disqus

Mehr zum Thema: Suchmaschine, Wissen, Daten

Kolumne

Medium_8b51830bda
von Stefan Andersen
20.06.2013

Gespräch

Medium_4c2437cc3e

Kolumne

Medium_624bfb3b98
von Lars Mensel
10.11.2011
meistgelesen / meistkommentiert