Segen und Fluch der Algorithmen

Rezensiert von Margaret Heckel |
Durch die Analyse des ständig wachsenden Datenstroms werden erstaunlich zuverlässige Prognosen möglich, etwa über Staus. Doch wie die Autoren zeigen, können die Ergebnisse der Analyse auch gegen uns verwandt werden. Deshalb fordern sie eine breite gesellschaftliche Debatte.
In der kalifornischen Küstenstadt Santa Cruz schickt der Computer die Polizisten auf Streife. Die Polizei setzt dort ein Programm ein, das mehrmals täglich errechnet, wo und zu welcher Uhrzeit die höchste Wahrscheinlichkeit für eine Straftat ist. Mord kann damit nicht vorhergesehen werden, Einbrüche und Raubdelikte aber sehr wohl.

"Predictive Policing" oder "Vorausschauende Polizeiarbeit" heißt das Computerprogramm – und es funktioniert. Allein im ersten Jahr sind die Einbrüche um elf Prozent zurückgegangen. Acht Prozent weniger Autos wurden geklaut. Und die Zahl der Festnahmen konnte um 56 Prozent erhöht werden.

Die vorausschauende Polizeiarbeit in Santa Cruz ist eines der bislang spektakulärsten Beispiele dafür, wie die Analyse riesiger Datenmengen unseren Alltag verändert. Wir alle produzieren jeden Tag neue Daten, die immer schnellere und leistungsfähigere Computer verarbeiten, neu kombinieren und analysieren.

"Big Data" nennen die Experten diese ständig fließenden, wachsenden, immer wieder neu verknüpften Datenmengen. Sie werden unser Leben verändern. Das jedenfalls prognostizieren der deutschstämmige Computerwissenschaftler Viktor Mayer-Schönberger und der britische Journalist Kenneth Cukier. Denn die Datenanalyse geschieht in Echtzeit. Und sie ermöglicht uns, vorbeugend zu handeln.

Dazu suchen die Computerprogramme in all den riesigen Datenmengen nach Korrelationen, also nach Zusammenhängen. Das Programm in Santa Cruz basiert auf einer Erkenntnis aus der Erdbebenforschung: Wo es einmal ein Erdbeben gegeben hat, steigt die Wahrscheinlichkeit für ein weiteres. Übersetzt auf die Polizeiarbeit bedeutet das, dass die Wahrscheinlichkeit neuer Diebstähle dort am höchsten ist, wo es bereits welche gab.

Der Paketdienst UPS hat durch Datenanalysen herausgefunden, dass es bis zu zehn Millionen Dollar pro Jahr an Kosten spart, wenn die Fahrer immer nur rechts abbiegen. Dadurch sinkt die Gefahr von Unfällen, auch wenn die Fahrer Umwege in Kauf nehmen.
Nicht immer jedoch lassen sich derartige Kausalitäten bei der Datenanalyse herausfinden. Und wenn es geht, dann geht es immer auch nur nachträglich. Denn nicht alle Korrelationen machen auf den ersten Blick Sinn. Das aber geht gegen unser Streben, Erklärungen für unser Handeln zu finden.

"Wir Menschen sind darauf trainiert, nach Kausalitäten zu suchen, auch wenn das oft schwierig ist und uns in die falsche Richtung führt. In der Welt von Big Data geht es darum, Muster in großen Datenmengen zu erkennen, die uns neue und unschätzbar wertvolle Erkenntnisse bringen. Diese Zusammenhänge sagen uns oft nicht, warum etwas passiert, sondern dass es passiert."

Das ist ein fundamental anderes Erkenntnisprinzip. Als Beispiel zitieren die Autoren die Analyse von Millionen von anonymisierten Krankendaten: Was, wenn dabei herauskäme, dass die Kombination von, sagen wir, Aspirin und Orangensaft, den Krebs stoppen würde? Nutzen wir diese Korrelation dann für die Behandlung? Oder forschen wir weiter, bis wir den Grund irgendwann herausfinden?

"Vor Big Data konnten wir immer nur eine kleine Zahl von Hypothesen testen, die wir meist festgelegt haben, noch bevor wir die Daten gesammelt haben. Wenn wir aber nun die Daten für sich selbst sprechen lassen, können wir Verbindungen herstellen, von denen wir niemals gedacht hätten, dass sie existieren."

Schwangere erkennen, bevor es deren Verwandte erfahren
Das hat tatsächlich das Potenzial, alles zu verändern. Viele der Beispiele, die Mayer-Schönberger und Cukier nennen, bringen die Menschheit voran. Die Stauprognosen von Google Maps sind meist zuverlässiger und aktueller als der Verkehrsfunk. Anhand der weltweiten Google-Suchanfragen nach Erkältungen und ähnlichem lassen sich Grippewellen inzwischen präziser vorhersagen als die staatlichen Gesundheitsdienste dies mit ihren Befragungen tun.

Aber es gibt eben auch die andere Seite von Big Data. So hat der Warenhauskonzern Target seine Datenanalysten herausfinden lassen, ob sie schwangere Frauen identifizieren können, noch bevor diese ihre Schwangerschaft ihren Freunden und Verwandten mitteilen.

Und in der Tat, das funktioniert. Anhand ihrer Käufe von Körperlotion sowie Lebensmittelzusätzen wie Zink, Magnesium und Kalzium ließ sich diese Gruppe zielgenau identifizieren. Target schickten ihnen dann Rabattcoupons für alles Mögliche rund ums Kinderkriegen, denn in diesem Zustand sind Frauen und Männer besonders konsumfreudig.

"Algorithmen werden die Wahrscheinlichkeit berechnen, dass jemand einen Herzinfarkt bekommt und mehr für seine Krankenversicherung bezahlen muss. Algorithmen werden die Wahrscheinlichkeit berechnen, dass jemand seinen Kredit nicht bezahlen kann und so wird der Antrag dafür abgelehnt. Und Algorithmen werden vorhersagen, ob jemand ein Verbrechen begeht und möglicherweise allein schon für die Absicht verhaftet wird. Das führt zu ethischen Fragen über die Rolle des freien Willens gegenüber der Diktatur der Daten."

Beide Autoren regen deshalb zu Recht eine breite gesellschaftliche Debatte über Big Data an. Um sie zu führen, müssen wir uns zuerst über das Phänomen als solches informieren. Das Buch von Mayer-Schönberger und Cukier ist dafür ausgezeichnet geeignet.

Viktor Mayer-Schönberger / Kenneth Cukier: Big Data - Die Revolution, die unser Leben verändern wird
Redline Verlag München, Oktober 2013
288 Seiten, 24,99 Euro
Mehr zum Thema