Aktivisten wollen den SCHUFA-Algorithmus knacken
Wer bekommt einen Kredit, eine Mietwohnung oder ein neues Auto? Darüber entscheidet nicht zuletzt der sogenannte Score bei der SCHUFA. Wie dieser Wert berechnet wird, ist ein Geheimnis. Nun wollen Aktivisten den Algorithmus mithilfe von Datenspenden rekonstruieren.
"Das ist Saskia – und das ist ihr neuer Fernseher, den sie in Raten abbezahlen möchte. Und das ist Herr Müller. Er möchte gern den Fernseher an Saskia verkaufen. Damit das nötige Vertrauen zwischen den beiden entstehen kann, gibt es die SCHUFA."
Ausschnitte aus einem Imagefilm, mit dem die SCHUFA ihre Funktionsweise erklärt: Als neutrales Medium, das Kreditgebern bewerten hilft, ob sie einem Kunden vertrauen können – oder eben nicht. Nach welcher Formel sie das aber berechnet, ist ein Geschäftsgeheimnis.
Ein Großraumbüro in Berlin Mitte. Hier sitzt die Open Knowledge Foundation, eine NGO, die sich für offene Daten einsetzt. Zuletzt etwa mit dem Projekt "Frag den Staat", das Bürgern die Anfrage von Informationen bei Behörden erleichtert.
"Hab grad Post bekommen für FragDenStaat … ‚Unterlassung rufschädigender Äußerungen‘. Ein ganz normaler Freitag."
Arne Semsrott ist auch Mitverantwortlicher für das jüngste Projekt: OpenSCHUFA.
"Da geht es darum, die SCHUFA zu knacken. Wir wollen den Algorithmus, den die SCHUFA benutzt, um den Basisscore zu erstellen, wir wollen den reverse engineeren. Wir wollen den also rekonstruieren und gleichzeitig wollen wir schauen, ob unser Ansatz des Datenaktivismus – möglichst viele Menschen schließen sich zusammen und spenden gemeinsam ihre Daten, um etwas herauszufinden – ob dieser Mechanismus funktionieren kann."
Ausschnitte aus einem Imagefilm, mit dem die SCHUFA ihre Funktionsweise erklärt: Als neutrales Medium, das Kreditgebern bewerten hilft, ob sie einem Kunden vertrauen können – oder eben nicht. Nach welcher Formel sie das aber berechnet, ist ein Geschäftsgeheimnis.
Ein Großraumbüro in Berlin Mitte. Hier sitzt die Open Knowledge Foundation, eine NGO, die sich für offene Daten einsetzt. Zuletzt etwa mit dem Projekt "Frag den Staat", das Bürgern die Anfrage von Informationen bei Behörden erleichtert.
"Hab grad Post bekommen für FragDenStaat … ‚Unterlassung rufschädigender Äußerungen‘. Ein ganz normaler Freitag."
Arne Semsrott ist auch Mitverantwortlicher für das jüngste Projekt: OpenSCHUFA.
"Da geht es darum, die SCHUFA zu knacken. Wir wollen den Algorithmus, den die SCHUFA benutzt, um den Basisscore zu erstellen, wir wollen den reverse engineeren. Wir wollen den also rekonstruieren und gleichzeitig wollen wir schauen, ob unser Ansatz des Datenaktivismus – möglichst viele Menschen schließen sich zusammen und spenden gemeinsam ihre Daten, um etwas herauszufinden – ob dieser Mechanismus funktionieren kann."
Freiwillige Datenspende
Mit einer sogenannten Datenspende sollen möglichst viele Menschen dem Projekt anonymisierte Versionen ihrer persönlichen SCHUFA-Daten zur Verfügung stellen. Wenn das genug tun, könnte das Rückschlüsse auf die geheime Formel zur Errechnung der sogenannten Scores ermöglichen, also Wahrscheinlichkeitswerten für ein zuverlässiges Kreditnehmerverhalten.
"Man kann einmal im Jahr kostenlos nach dem Bundesdatenschutzgesetz die eigene Auskunft beantragen, nicht nur bei der SCHUFA, sondern auch bei anderen Auskunfteien, und dann bekommt man zum Beispiel diese Tabelle. Da sehen wir, dass die SCHUFA Scores hat in verschiedenen Bereichen. Das heißt, das sind SCHUFA-Scores zum Beispiel für Banken, für Telekommunikationsunternehmen. Je nachdem, welches Unternehmen dann bei der SCHUFA anfragt, kriegt sie unterschiedliche Daten über mich."
Wer beim OpenSCHUFA-Projekt mitmacht, kann auch noch mehr von sich preisgeben, zum Beispiel Geschlecht, Wohnort oder die Häufigkeit von Umzügen.
"Aber wir brauchen gar nicht unbedingt nur diese zusätzlichen Angaben. Allein die Tabellen sind schon interessant, weil wir dann Abhängigkeiten innerhalb dieser Scores herausfinden können."
Mehr als 40.000 Euro haben die Aktivisten in einer Crowdfunding-Kampagne gesammelt. Bis Mitte Mai wollen sie damit eine App entwickeln, die die Übermittlung von SCHUFA-Auskünften einfach und anonym ermöglichen soll.
"Man kann einmal im Jahr kostenlos nach dem Bundesdatenschutzgesetz die eigene Auskunft beantragen, nicht nur bei der SCHUFA, sondern auch bei anderen Auskunfteien, und dann bekommt man zum Beispiel diese Tabelle. Da sehen wir, dass die SCHUFA Scores hat in verschiedenen Bereichen. Das heißt, das sind SCHUFA-Scores zum Beispiel für Banken, für Telekommunikationsunternehmen. Je nachdem, welches Unternehmen dann bei der SCHUFA anfragt, kriegt sie unterschiedliche Daten über mich."
Wer beim OpenSCHUFA-Projekt mitmacht, kann auch noch mehr von sich preisgeben, zum Beispiel Geschlecht, Wohnort oder die Häufigkeit von Umzügen.
"Aber wir brauchen gar nicht unbedingt nur diese zusätzlichen Angaben. Allein die Tabellen sind schon interessant, weil wir dann Abhängigkeiten innerhalb dieser Scores herausfinden können."
Mehr als 40.000 Euro haben die Aktivisten in einer Crowdfunding-Kampagne gesammelt. Bis Mitte Mai wollen sie damit eine App entwickeln, die die Übermittlung von SCHUFA-Auskünften einfach und anonym ermöglichen soll.
SCHUFA sieht kein Defizit bei der Transparenz
Die SCHUFA selbst verurteilt die Initiative klar. Unter der Bedingung, zunächst ein einstündiges Hintergrundgespräch führen zu können, erklärt sich deren Sprecher Ingo Koch zu einem Interview bereit.
"Es gibt ja den zentralen Vorwurf der Intransparenz. Und der ist schlichtweg falsch. Die SCHUFA ist streng reguliert. Wir sind unabhängig behördlich beaufsichtigt. Die Berechnungsmethode haben wir den Datenschutzaufsichtsbehörden gegenüber offengelegt. Und zwar allen Ländern und auch denen des Bundes. Das Verfahren wird zudem regelmäßig durch unterschiedliche wissenschaftliche Einrichtungen überprüft und die Ergebnisse stellen wir der Aufsicht auch entsprechend zur Verfügung."
Koch verweist außerdem auf einen Ombudsmann, der im letzten Jahr lediglich 39 begründete Korrekturanfragen der Verbraucher aufgrund einer falschen Datenbasis bestätigt habe. Das müsse man ins Verhältnis zu 140 Millionen bearbeiteten Vorgängen setzen. Was der Pressesprecher dabei nicht erwähnt: Die Zahl der anerkannten Widersprüche könnte auch deshalb verhältnismäßig niedrig sein, weil die Berechnungsgrundlagen für Konsumenten eben nicht nachvollziehbar sind und es damit an Anhaltspunkten für Widersprüche fehlt.
"Nicht einfließen tun solche Dinge wie Herkunft, Gehalt oder Vermögen. Denn das wäre die Diskriminierung, zum Beispiel, wenn Leute einfach aufgrund ihrer Herkunft anders bewertet werden würden. Oder zum Beispiel der Geringverdiener, der gerade hier bei uns auch die höchsten Scores erreichen kann einfach aufgrund seines Zahlungsverhaltens."
Eine Veröffentlichung der Formel lehne man vor allem aber auch aus Angst vor Missbrauch ab.
"Es ist ein Öffnen von Tür und Tor für Manipulation und Missbrauch zum Schaden der Allgemeinheit, wenn nun jedermann weiß: Was muss ich tun, um meinen Score manipulativ in eine Richtung zu entwickeln, in der er der Faktenlage nach ja nicht ist."
Die Initiatoren der OpenSCHUFA-Kampagne können diese Argumentation nicht nachvollziehen. Arne Semsrott:
"Ich bin davon ein bisschen verwirrt, muss ich ganz ehrlich sagen. Wenn es tatsächlich so einfach sein sollte, diesen Scoring-Algorithmus der SCHUFA zu manipulieren, dann hat die SCHUFA ein ziemlich großes Problem, aber dann sind nicht wir das Problem, sondern dann ist dieser Algorithmus das Problem."
"Es gibt ja den zentralen Vorwurf der Intransparenz. Und der ist schlichtweg falsch. Die SCHUFA ist streng reguliert. Wir sind unabhängig behördlich beaufsichtigt. Die Berechnungsmethode haben wir den Datenschutzaufsichtsbehörden gegenüber offengelegt. Und zwar allen Ländern und auch denen des Bundes. Das Verfahren wird zudem regelmäßig durch unterschiedliche wissenschaftliche Einrichtungen überprüft und die Ergebnisse stellen wir der Aufsicht auch entsprechend zur Verfügung."
Koch verweist außerdem auf einen Ombudsmann, der im letzten Jahr lediglich 39 begründete Korrekturanfragen der Verbraucher aufgrund einer falschen Datenbasis bestätigt habe. Das müsse man ins Verhältnis zu 140 Millionen bearbeiteten Vorgängen setzen. Was der Pressesprecher dabei nicht erwähnt: Die Zahl der anerkannten Widersprüche könnte auch deshalb verhältnismäßig niedrig sein, weil die Berechnungsgrundlagen für Konsumenten eben nicht nachvollziehbar sind und es damit an Anhaltspunkten für Widersprüche fehlt.
"Nicht einfließen tun solche Dinge wie Herkunft, Gehalt oder Vermögen. Denn das wäre die Diskriminierung, zum Beispiel, wenn Leute einfach aufgrund ihrer Herkunft anders bewertet werden würden. Oder zum Beispiel der Geringverdiener, der gerade hier bei uns auch die höchsten Scores erreichen kann einfach aufgrund seines Zahlungsverhaltens."
Eine Veröffentlichung der Formel lehne man vor allem aber auch aus Angst vor Missbrauch ab.
"Es ist ein Öffnen von Tür und Tor für Manipulation und Missbrauch zum Schaden der Allgemeinheit, wenn nun jedermann weiß: Was muss ich tun, um meinen Score manipulativ in eine Richtung zu entwickeln, in der er der Faktenlage nach ja nicht ist."
Die Initiatoren der OpenSCHUFA-Kampagne können diese Argumentation nicht nachvollziehen. Arne Semsrott:
"Ich bin davon ein bisschen verwirrt, muss ich ganz ehrlich sagen. Wenn es tatsächlich so einfach sein sollte, diesen Scoring-Algorithmus der SCHUFA zu manipulieren, dann hat die SCHUFA ein ziemlich großes Problem, aber dann sind nicht wir das Problem, sondern dann ist dieser Algorithmus das Problem."
Es geht um die Transparenz von Algorithmen
Es liegt in der Natur der Sache, dass die zahlreichen Thesen über den Algorithmus weder beweisbar noch widerlegbar sind. Zum Beispiel, ob die Anzahl der Umzüge, die ein Mensch hinter sich hat, ein Faktor sein könnte. Die Anzahl der Kreditkarten, oder ob Frauen generell besser abschneiden als Männer. Genau darüber erhoffen sich Arne Semsrott und das Team jetzt Erkenntnisse. Etwa 10.000 Datenspenden könnten dafür ausreichen.
"Wie schafft ihr das nötige Vertrauen bei den Leuten, die Daten spenden sollen?"
"Die Software, die wir einsetzen, die wird Open Source sein. Das heißt: Von allen Leuten überprüfbar, wie wir das machen. Wir setzen darauf, dass die Datenspende an sich Ende-zu-Ende verschlüsselt ist, dass wirklich niemand in diesen Bereich der Übermittlung reinschauen kann. Und wir speichern die Daten sicher."
Schon für den Sommer hoffen die Initiatoren dann auf erste Ergebnisse. Es gehe ihnen nicht darum, Kreditauskunfteien wie die SCHUFA generell infrage zu stellen, sagen sie, sondern um Grundsätzliches.
"Uns geht es um die weiteren gesellschaftlichen Zusammenhänge in Bezug auf Transparenz von Algorithmen. Und das bedeutet, dass bestimmte mathematische Zusammenhänge, die über unser Leben entscheiden oder mitentscheiden, auch so gestaltet werden, dass wir wissen, wie die funktionieren. Und darüber haben wir zu wenig Daten. Wir wollen die Grundlagen dafür liefern, dass wir eine gute politische Debatte darüber haben können."
"Wie schafft ihr das nötige Vertrauen bei den Leuten, die Daten spenden sollen?"
"Die Software, die wir einsetzen, die wird Open Source sein. Das heißt: Von allen Leuten überprüfbar, wie wir das machen. Wir setzen darauf, dass die Datenspende an sich Ende-zu-Ende verschlüsselt ist, dass wirklich niemand in diesen Bereich der Übermittlung reinschauen kann. Und wir speichern die Daten sicher."
Schon für den Sommer hoffen die Initiatoren dann auf erste Ergebnisse. Es gehe ihnen nicht darum, Kreditauskunfteien wie die SCHUFA generell infrage zu stellen, sagen sie, sondern um Grundsätzliches.
"Uns geht es um die weiteren gesellschaftlichen Zusammenhänge in Bezug auf Transparenz von Algorithmen. Und das bedeutet, dass bestimmte mathematische Zusammenhänge, die über unser Leben entscheiden oder mitentscheiden, auch so gestaltet werden, dass wir wissen, wie die funktionieren. Und darüber haben wir zu wenig Daten. Wir wollen die Grundlagen dafür liefern, dass wir eine gute politische Debatte darüber haben können."