svrv-verbrauchergerechtes-scoring

Dieses Dokument ist Teil der Anfrage „Gutachten des Sachverständigenrats für Verbraucherfragen

/ 290
PDF herunterladen
Handlungs­f elder: Stand der Forschung   25




                        B
Handlungs­felder:
Stand der Forschung
27

26   Handlungs­f elder: Stand der Forschung




     I.	Transparenz und
         Verständlichkeit

     Welches Transparenzniveau im Bereich des Scorings          Verwendungsabsichten unterschieden werden. Denn
     angemessen ist und wie ein solches Transparenzniveau       Scoring-Verfahren, die auf eine Verhaltensprognose
     gewährleistet werden kann, diskutieren die allgemeine      abzielen, wollen üblicherweise nicht reflexiv wirken,
     Öffentlichkeit und die Wissenschaft als offene Frage.      das heißt, sie wollen das in den Blick genommene Ver-
     Transparenz bedeutet in diesem Zusammenhang die Of-        halten nicht selbst beeinflussen. Die Bestimmung ei-
     fenlegung von Informationen gegenüber Verbrauchern         nes angemessenen Transparenzniveaus steht damit im
     durch die Ersteller oder Verwender von Scoring-Verfah-     Widerstreit gegensätzlicher Interessen, deren Berech-
     ren. Mit Überlegungen zu angemessenen Transparenz-         tigung nicht von der Hand zu weisen ist und die jeweils
     niveaus stets verbunden ist die Frage danach, wie die      auch verfassungsrechtlich unterlegt sind.
     transparent gemachten Informationen aufzubereiten
     und zu strukturieren sind, um ihre tatsächliche Ver-       Die Person, deren Verhalten Gegenstand einer prognos-
     ständlichkeit zu gewährleisten. Hier kann einerseits der   tischen Einschätzung durch ein Scoring-Verfahren ist
     Verbraucher, dem eine informierte Teilnahme an Sco-        (im Folgenden auch als die „gescorte Person“ bezeich-
     ring-Verfahren ermöglicht werden soll, den Maßstab ab-     net), wird normalerweise ein Interesse daran haben,
     geben. Andererseits kann es um die Verständlichkeit für    zu erfahren, dass ein Scoring überhaupt stattfindet.
     Fachleute gehen, denen die Möglichkeit einer kritischen    Zweitens wird sie um die Konsequenzen des gebildeten
     Prüfung von Scoring-Verfahren eröffnet werden soll.        Scores wissen wollen. Weiterhin kann sie daran interes-
                                                                siert sein, zu wissen, auf welcher Datengrundlage die Er-
     Das Bonitäts-Scoring hat bisher im Zentrum der Trans-      mittlung des sie betreffenden Score-Wertes erfolgt, das
     parenz-Debatte gestanden, weil es sich bis in jüngste      heißt, welche ihrer Merkmale in die Score-Wert-Ermitt-
     Zeit hinein um die technisch reifste und am weitesten      lung eingehen. Schließlich kann sie daran interessiert
     verbreitete Form des Scorings gehandelt hat (zur Ge-       sein, in die innere Funktionsweise des Scoring-Algorith-
     schichte siehe Beckhusen, 2004). Für die Zukunft ist       mus Einblick zu bekommen, also insbesondere zu erfah-
     zu erwarten, dass sich die Diskussion über die Trans-      ren, welches relative Gewicht jedes erfasste persönliche
     parenz des Scorings mit der neuerdings intensiv ge-        Merkmal für die Ermittlung des Score-Wertes hat.
     führten Debatte über die Transparenz von Verfahren
     algorithmischer Entscheidungsfindung verbinden wird.       Diesen Interessen können auf der anderen Seite Ge-
     Der Aspekt der Scoring-Transparenz wird auch deshalb       heimhaltungsinteressen desjenigen, der ein Scoring
     relevant bleiben, weil erst ein ausreichendes Transpa-     durchführt (im Folgenden auch als „Scorer“ bezeichnet),
     renzniveau es Verbrauchern ermöglicht, weitergehende       oder der Allgemeinheit gegenüberstehen. Ein Geheim-
     Rechte, zum Beispiel auf Korrektur eines fehlerhaften      haltungsinteresse des Scorers liegt regelmäßig dann
     Score-Wertes, geltend zu machen. Schließlich ist Trans-    vor, wenn die Prognoseleistung des Scoring-Verfahrens
     parenz eine Bedingung dafür, dass über das Phänomen        dieses wirtschaftlich wertvoll und damit als Unterneh-
     Scoring überhaupt eine informierte gesellschaftliche       mensgeheimnis schützenswert macht (anerkannt bei
     Debatte geführt werden kann.                               BGH, Urteil vom 28. Januar 2014 – VI ZR 156/13 –, BGHZ
                                                                200, 38; siehe auch C.III.3). Wenn bekannt wird, wie das
                                                                algorithmische Verfahren der Score-Berechnung im Ein-
                                                                zelnen ausgestaltet ist, verliert es seinen Charakter als
                                                                Geschäftsgeheimnis und kann von Konkurrenten über-
                                                                nommen werden.
     1.	Transparenz bei
                                                                Ein Geheimhaltungsinteresse der Allgemeinheit kann
         prognostischem Scoring                                 daraus folgen, dass bei Offenlegung des Scoring-Verfah-
                                                                rens dessen Prognosekraft unter bestimmten Umstän-
     Scoring-Verfahren werden sowohl zur Prognose von           den (zu diesen sogleich) abnimmt. Dies kann gesell-
     Ver­haltensweisen als auch zur Verhaltenssteuerung         schaftlich unerwünscht sein. Ein Allgemeininteresse an,
     eingesetzt. Unter dem Gesichtspunkt der Transpa-           zum Beispiel, zuverlässigen Bonitätsbewertungen ist
     renzgewährleistung muss zwischen diesen beiden             nicht von der Hand zu weisen.
28

Handlungs­f elder: Stand der Forschung                                                                                 27




Nicht jede Offenlegung begründet das Risiko, dass die       kehrte Schlussfolgerung gezogen werden: Der richtige
Prognosequalität sinkt. Eine Offenlegung ist unschäd-       Weg, Manipulationsmöglichkeiten abzuhelfen, führt
lich, wenn in den Score nur solche Merkmale eingehen,       nicht über die Aufrechterhaltung von Intransparenz
deren Vorhandensein für die ermittelte Prognosewahr-        über die in den Score eingehenden Merkmale, sondern
scheinlichkeit tatsächlich ursächlich ist. Dann nimmt       über den Ausschluss nicht-ursächlicher Merkmale aus
die gescorte Person mit einer ihrem Score-Wert dien-        dem Scoring-Verfahren. Dieser Weg mag schwerer zu
lichen Verhaltensänderung auf die Wahrscheinlichkeit        verwirklichen sein, allerdings ist die erhöhte Fairness
des prognostizierten Ereignisses tatsächlich Einfluss.      eines Abstellens allein auf ursächliche Merkmale nicht
Wer sich regelmäßig bewegt, reduziert sein Krankheits-      von der Hand zu weisen (eingehend Britz, 2008).
risiko – man kann deshalb die Entscheidung, regelmä-
ßig Sport zu treiben, nicht als eine „Manipulation“ des
Score-Wertes bezeichnen.

Demgegenüber nimmt die Prognosekraft des Scoring-­
Verfahrens dann ab, wenn die Verhaltensanpassung sich       2.	Transparenz bei
auf Merkmale bezieht, die zwar in der Vergangenheit
gute Indikatoren für die durch Scoring zu ermittelnde
                                                                verhaltenssteuerndem
Wahrscheinlichkeit abgegeben haben, aber die Höhe des           Scoring
Wahrscheinlichkeitswertes nicht beeinflussen (Praxis­
beispiele unter B.VIII.1). Niemand senkt sein Krankheits-   Scoring kann auch ein Instrument der Verhaltens-
risiko dadurch, dass er Sportbekleidung nur kauft, aber     steuerung sein. Mit diesem Zweck unterlegt, erscheint
nicht benutzt – wer also weiß, dass der Kauf von Turn-      Transparenz zunächst als eine notwendige Bedingung
schuhen als sogenanntes Proxy-Merkmal (siehe näher          des wirkungsvollen Einsatzes des Scoring-Verfahrens.
B.V.2) in einen „Gesundheits-Score“ eingeht, könnte ver-    Denn ein Anreizsystem kann eine zielgerichtete ver-
sucht sein, durch bloße Konsumentscheidungen statt          haltenssteuernde Wirkung nur dann entfalten, wenn
durch das Sporttreiben auf seinen Score einzuwirken.        es den Zusammenhang zwischen dem Verhalten und
Ist die Funktionsweise eines Scoring-Verfahrens offen-      seiner Bewertung offenlegt. Auf das Scoring bezogen:
gelegt, kann die gescorte Person die Auswirkungen ihres     Wenn es dem Verwender des Scoring-Verfahrens darum
Verhaltens auf ihren Score-Wert erkennen und ihr Ver-       geht, zur Verbesserung des Score-Wertes zu motivieren,
halten deshalb „scoredienlich“ anpassen (Bambaucher         erscheint es zwingend erforderlich, dass er zumindest
& Zarsky, 2018).                                            offenlegt, dass bestimmte Verhaltensweisen „punkte-
                                                            trächtig“ sind.
Die Einflussnahme auf nicht-ursächliche Merkmale
wird in der Literatur unter dem Stichwort des „ga-          Allerdings kann die Verhaltenssteuerung durch Sco-
ming“ eines Scoring-Verfahrens diskutiert (Rona-Tas &       ring-Verfahren auch „weicher“ erfolgen. Dies lässt sich
Hiss, 2011). Mit dem Ausspruch: „when a measure be-         an einem – hypothetischen – Beispiel verdeutlichen.
comes a target, it ceases to be a good measure“ hat         Man stelle sich vor, es wird ein Score-Wert für „gesund-
der britische Ökonom Charles Goodhard diese Ein-            heitsförderliches Verhalten“ oder „gutes Autofahren“
sicht in die Selbstreflexivität sozialer Systeme präg-      ermittelt, dessen Kriterien indessen nicht offengelegt
nant formuliert. Sie verdient in jeder Diskussion über      werden. Man wird annehmen dürfen, dass ein solches
indikatorengestützte Steuerung Beachtung (Strathern,        Scoring-Verfahren Auswirkungen auf das Verhalten der
1997; Wagner, 2018; Weingart & Wagner, 2015). Ein           gescorten Person hat. Sie wird versuchen, ihren Score zu
Score-Gaming zu verhindern, kann im Allgemeininte-          verbessern. Nur ist die Richtung dieser Verhaltensände-
resse liegen, um die Aussagekraft des prognostischen        rung unbestimmter, denn die gescorte Person kann nur
Scores zu erhalten. Erforderlich ist dann ein gewisses      vermuten, welche Verhaltensweisen als zum Beispiel
Maß an Intransparenz über die Funktionsweise des            „gesundheitsförderliches Verhalten“ oder „gutes Auto-
Scoring-Verfahrens. Andererseits kann aus der Mög-          fahren“ vom Scorer bewertet werden und demzufolge
lichkeit des „Score-Gaming“ auch gerade die umge-           zur Verbesserung ihres Scores beitragen. Die gescorte
29

28   Handlungs­f elder: Stand der Forschung




     Person ist also mit der Herausforderung konfrontiert,      tums nicht bekannt ist (siehe aber zur tatsächlichen
     den ihr unbekannten Maßstäben des Scoring-Verfahrens       Bekanntheit entsprechender Auskunftsrechte B.VII.2).
     zu genügen.
                                                                Die Mittel, mit denen Transparenz im Bereich des Sco-
                                                                rings hergestellt werden soll, sind rechtlicher Art. Des-
                                                                halb hat die wissenschaftliche Diskussion über das dem
                                                                Scoring angemessene Transparenzniveau ihren Schwer-
                                                                punkt im Dialog zwischen Gesetzgebung und Rechtspre-
     3.	Sicherung von Transparenz                              chung einerseits und der Rechtswissenschaft anderer-
                                                                seits. Dabei stand sowohl dem Gesetzgeber als auch der
         und Verständlichkeit des                               Rechtswissenschaft das Bonitäts-Scoring als besonders
         Scorings als Dauerthema                                regelungsbedürftig vor Augen. Drei Ereignisse struktu-
                                                                rieren den Transparenzdiskurs in diesem Bereich.
     Transparenz ist ein Schlüsselinstrument der Verbrau-
     cherpolitik. Dementsprechend widmen sich zahlreiche        Eine erste Zäsur ist die Schaffung von scoring-spezifi-
     Untersuchungen der Legitimation, der Effektivität und      schen datenschutzrechtlichen Bestimmungen im Jahre
     den Grenzen des Transparenzprinzips im Verbraucher-        2009 (BGBl. I S. 2254). Durch Novellierung des Bundes-
     schutz (Überblick bei Tamm, 2011, insbes. S. 347 ff.).     datenschutzgesetzes (BDSG) schuf der Gesetzgeber
     Allerdings wird die Verknüpfung zwischen Transparenz       den Scoring-Regelungskomplex aus § 28b BDSG a.F.,
     einerseits und tatsächlicher Informiertheit des Ver-       der Anforderungen an rechtmäßiges Scoring enthielt,
     brauchers andererseits zunehmend in Zweifel gezo-          und § 28a BDSG a.F., der die Datenübermittlung an
     gen (Ben-Shahar & Schneider, 2014; Kettner, Thorun &       Auskunfteien regelte. Ergänzt wurden diese Regelungen
     Vetter, 2018; siehe auch B.VIII.2). Aus einem Maximum      durch eine scoring-spezifische Erweiterung der Aus-
     an Transparenz folgt keineswegs ein Maximum an             kunftsrechte des Betroffenen in § 34 BDSG a.F. (Heine-
     Verbraucherschutz. Perspektivisch wird deshalb die         mann & Wäßle, 2010). Vor dem Erlass dieses Regelungs-
     Absicherung tatsächlicher Verbraucherautonomie ins         komplexes hatte sich die Zulässigkeit des Scorings nach
     Zentrum der Diskussion rücken. Die Debatte über die        den allgemeinen datenschutzrechtlichen Vorschriften
     „Algorithmen-Transparenz“ könnte als Katalysator           bemessen. Die Folge war nicht nur ein erhebliches Maß
     wirken, denn die fehlende Wirksamkeit von Verpflich-       an Rechtsunsicherheit hinsichtlich der Rechtmäßigkeit
     tungen, die auf die bloße Offenlegung unaufbereiteter      des Scorings überhaupt (Petri, 2003; Beckhusen, 2004),
     Informationen abzielen, ist hier besonders augenfällig.    die etwa auch in der skeptischen Einschätzung des da-
     Die Offenlegung des nackten Programmcodes würde            maligen Bundesbeauftragten für den Datenschutz an-
     jeden Verbraucher überfordern (siehe weiter sogleich       klang (BfDI, 1996, Nr. 31.2.3), sondern auch eine weit
     unter 4.).                                                 verbreitete Klage über unzulängliche Transparenz in
                                                                Hinblick auf den Einsatz von Scoring-Verfahren und
     Dessen ungeachtet ist Scoring als ein Datenverarbei-       auf ihre konkrete Funktionsweise (Korczak & Wilken,
     tungsvorgang bereits deshalb auf ein gewisses Maß an       2008). Wurden dem allgemeinen datenschutzrecht-
     Transparenz angewiesen, weil nur Transparenz dem Ein-      lichen Regelwerk zum Teil weitreichende Auskunfts-
     zelnen ermöglicht, seine subjektiven datenschutzrecht-     rechte der Betroffenen entnommen (Unabhängiges
     lichen Rechte wahrzunehmen (Bull, 2011). „Die Recht-       Landeszentrum für Datenschutz Schleswig-Holstein,
     mäßigkeit von Entscheidungen kann nur prüfen, wer          2005), überwog doch die Diagnose eines bereits in den
     die Datengrundlage, Handlungsabfolge und Gewich-           gesetzlichen Regelungen angelegten Transparenzde-
     tung der Entscheidungskriterien kennt – und versteht.“     fizits (Kloepfer & Kutzschbach, 1998; Möller & Florax,
     (Martini, 2017, S. 1018). Dies betrifft insbesondere die   2003; Petri, 2003; Beckhusen, 2005). Diesen beklagten
     Richtigkeit der individuellen Daten, die zur Bildung       Transparenzmängeln wollte der Gesetzgeber mit der
     von Score-­Werten herangezogen werden. Korrektur­          Schaffung scoring-spezifischer Sondervorschriften ab­
     ansprüche (siehe v. a. Art. 16 DSGVO) gehen ins Leere,     helfen (siehe die Begründung des Regierungsentwurfs
     wo die Fehlerhaftigkeit eines personenbezogenen Da-        des maßgeblichen Gesetzes zur Änderung des Bundes-
30

Handlungs­f elder: Stand der Forschung                                                                                  29




datenschutzgesetzes, BT-Drucks. 16/10529, S. 6 u.ö.;        sungsgericht hat über ihre Verfassungsbeschwerde ge-
Beschlussempfehlung und Bericht des Innenausschus-          gen das Urteil noch nicht entschieden.
ses, BT-Drucks. 16/13219, S. 1 f., 10), wie sich auch aus
Darstellungen des Gesetzgebungsprojekts aus der Sicht       Eine Gesetzgebungsinitiative aus den Reihen der Oppo-
Beteiligter ergibt (Piltz & Holländer, 2008; Metz, 2009).   sition (BT-Drucks. 18/4864) strebte, letztlich erfolglos,
Aufgrund der damit geänderten rechtlichen Rahmen-           eine Änderung der Rechtslage an. Der Gesetzentwurf sah
bedingungen kann an die vor Erlass dieses Gesetzes          vor, dass im Bundesdatenschutzgesetz weiterreichen-
bereits intensiv geführte Diskussion über Transparenz-      de Transparenzanforderungen verankert werden, als
mängel des Scorings und die dort herausgearbeiteten         der Bundesgerichtshof sie dem Gesetz in der SCHUFA-­
Transparenzdefizite nicht ohne Weiteres angeschlossen       Entscheidung entnommen hatte. Der Auskunftspflicht
werden, wurden doch vorher offene Fragen durch den          unterfallen sollten auch „die verwendeten Einzeldaten,
Gesetzgeber nunmehr verbindlich entschieden.                die Gewichtung der verwendeten Daten, die verwende-
                                                            ten Vergleichsgruppen und die Zuordnung der betrof-
Die zweite Zäsur markiert das „SCHUFA-Urteil“ des           fenen Personen zu den Vergleichsgruppen, die in die
Bundesgerichtshofs (BGH, Urteil vom 28. Januar 2014 –       Berechnung des Wahrscheinlichkeitswerts einfließen“
VI ZR 156/13 –, BGHZ 200, 38). In dieser Entscheidung       (a.a.O., S. 4).
klärte das Gericht die Reichweite des datenschutz-
rechtlichen Auskunftsanspruchs nach § 34 Abs. 4 Satz 1      Das Inkrafttreten der Datenschutz-Grundverordnung im
BDSG a.F. Auskunft zu erteilen sei über die in die Bil-     Mai 2018 markiert die dritte Zäsur in der Transparenz-
dung des Score-Wertes eingehenden personenbezo-             diskussion. Mit ihr wurde ein unionsrechtlich überform-
genen Datenarten des Auskunftsberechtigten. Keine           tes nationales Datenschutzrecht abgelöst durch ein
Auskunft müsse erteilt werden über das Verfahren,           unmittelbar anwendbares europäisches Gesetzeswerk.
nach dem aus diesem personenbezogenen Datenbe-              Nicht nur dessen Regelungsinhalt weicht in vielerlei Hin-
stand und weiteren Daten ein konkreter Score-Wert           sicht vom früheren Datenschutzrecht ab, auch an die im
ermittelt werde. Insbesondere die Gewichtung, mit           alten Bundesdatenschutzgesetz etablierte Terminologie
der die Daten in die Berechnung eingehen, sei vom           und Regelungstechnik und an dessen Gesetzgebungsstil
Auskunftsanspruch nicht erfasst. Das Scoring-Verfah-        schließt die Datenschutz-Grundverordnung nicht bruch-
ren genieße als Geschäftsgeheimnis grundrechtlichen         los an. Es erscheint daher plausibel, dass wegen des Be-
Schutz. Das Urteil des Bundesgerichtshofs stieß in der      schlusses der Datenschutz-Grundverordnung der „Be-
Rechtswissenschaft auf ein ausgeprägtes Interesse;          ginn einer neuen Zeitrechnung im Datenschutzrecht“
die Rechtsdatenbank Juris weist mehr als ein Dutzend        (Schantz, 2016) ausgerufen worden ist. Durchsetzt ist
rechtswissenschaftliche Analysen der Entscheidung           die Datenschutz-Grundverordnung von Öffnungsklau-
aus. Sie ergeben ein heterogenes Bild, das von nach-        seln, die dem nationalen Gesetzgeber Gestaltungsspiel-
drücklicher Zustimmung (Taeger, 2014) bis zur Kritik        räume eröffnen. Auf dieser Grundlage ergänzt ein neues
(Gärtner, 2014; Schulte am Hülse & Timm, 2014) reicht.      Bundesdatenschutzgesetz die Datenschutz-Grundver-
Fortan bildete die Entscheidung den maßgeblichen Be-        ordnung. Es enthält mit § 31 BDSG n.F. eine Scoring-
zugspunkt der Transparenzdiskussion. So unterziehen         spezifische Sonderbestimmung (siehe näher E.I.3, dort
die Berichterstatter des für das Bundesministerium          auch zur Unionsrechtskonformität der Vorschrift). Mit
für Ernährung, Landwirtschaft und Verbraucherschutz         dieser Vorschrift zum – so ihre Überschrift – „Schutz des
(BMELV) bzw. später für das Bundesministerium der           Wirtschaftsverkehrs bei Scoring und Bonitätsauskünf-
Justiz und für Verbraucherschutz (BMJV) erstatteten         ten“ wollte der deutsche Gesetzgeber „den materiellen
Evaluationsberichts über den 2009 neugeschaffenen           Schutzstandard der §§ 28a und 28b BDSG a.F.“ erhal-
Regelungskomplex zum Scoring die Entscheidung ei-           ten, wie die Gesetzesbegründung ausführt (BT-Drucks.
ner eingehenden Analyse und Kritik (Unabhängiges            18/11325, S. 101, entspricht BR-Drucks. 110/17, S. 101).
Landeszentrum für Datenschutz Schleswig-Holstein &          Erste juristische Untersuchungen zum Scoring unter der
GP Forschungsgruppe, 2014). Eine verfassungsgericht-        Datenschutz-Grundverordnung gehen nicht von tiefgrei-
liche Korrektur der Entscheidung wird von der Klägerin      fenden Änderungen durch das neue Regelungsregime
des Verfahrens derzeit angestrebt. Das Bundesverfas-        aus (Taeger, 2016; von Lewinski & Pohl, 2018) und tat-
31

30   Handlungs­f elder: Stand der Forschung




     sächlich dürfen die Beharrungskräfte einer eingespiel-                                cherungswirtschaft e. V., 2018; Verbraucherzentrale
     ten Praxis gegenüber legislativen Neuerungen nicht                                    Bundesverband e. V., 2017) und Akteure der Zivilgesell-
     unterschätzt werden. Gleichwohl unterscheidet sich die                                schaft (vgl. etwa die sich unter www.algorithmenethik.
     gesetzgeberische Gestaltung der Transparenzvorgaben                                   de und www.algorithmwatch.de präsentierenden Initi-
     und Auskunftsrechte in den Art. 13, 14 und 15 DSGVO tief-                             ativen) haben das Thema der Algorithmenregulierung
     greifend von den §§ 19, 34 BDSG a.F. (siehe weiter E.III.4).                          für sich entdeckt. Der SVRV hat sich grundsätzlich po-
                                                                                           sitioniert (SVRV, 2016; SVRV, 2017; SVRV, 2017a; zusam-
     Nicht nur in der Wissenschaft, auch in der Öffentlichkeit                             menfassend Micklitz, 2017) und gefordert, dass durch
     wird die Transparenz von Scoring-Verfahren diskutiert.                                rechtliche Vorgaben sichergestellt werden muss, dass
     Im Februar 2018 starteten die gemeinnützigen Organi-                                  die zugrundeliegenden Parameter bei Algorithmen mit
     sationen Open Knowledge Foundation und Algorithm­                                     direktem Verbraucherkontakt transparent zu machen
     Watch die Initiative OpenSCHUFA. Zu den erklärten                                     und standardisiert einem Kreis von Experten einer
     Zielen des Projektes gehört es, den Algorithmus zu                                    Digital­agentur18 offenzulegen sind (SVRV, 2017a; weiter
     „knacken“, mit dem die SCHUFA ihre Bonitäts-Scores                                    ­Gigerenzer, Wagner & Müller, 2018).
     ermittelt (OpenSCHUFA, 2018). Sowohl die in die Be-
     rechnung des Score-Wertes eingehenden Daten als auch                                  Ein Scoring-Algorithmus ist ein bestimmter Typ Algo­
     das Verfahren, nach dem aus diesem Datenmaterial ein                                  rithmus (Just & Latzer, 2016). Die Diskussion über Sco-
     individueller Score ermittelt wird, will die Initiative her-                          ring-Transparenz lässt sich deshalb als ein Teil der allge-
     ausfinden, indem möglichst viele Personen der Initiative                              meinen Debatte über die Regulierung von Algorithmen
     ihren SCHUFA-Score (den sie dort erfragen) und ihre per-                              führen. Zwar sind herkömmliche Scoring-Verfahren
     sönlichen Merkmale mitteilen. Zahlreiche Medien be-                                   derzeit bedeutend weniger komplex als die algorith-
     richteten über das Anliegen der Initiative (exemplarisch                              mischen Entscheidungssysteme, die in der Algorith-
     Erdmann, 2018; Schneider, 2018), die SCHUFA selbst trat                               men-Regulierungsdebatte üblicherweise als Referenz-
     ihr kritisch entgegen (SCHUFA Holding AG, 2018a).                                     punkte dienen (SVRV, 2016) und die nicht selten dem
                                                                                           Bereich der Künstlichen Intelligenz zuzurechnen sind.
                                                                                           Aber auch die gegenwärtig eingesetzten Algorithmen
                                                                                           sind für Nicht-Fachleute nicht einfach zu verstehen (sie-
                                                                                           he weiter B.IV.2 unten). Und nähme die Komplexität der
                                                                                           eingesetzten Verfahren zu – hin etwa zu Scoring-Verfah-
     4.	Scoring-Transparenz                                                               ren, die auf Systemen maschinellen Lernens, insbeson-
                                                                                           dere neuronalen Netzen aufbauen (siehe Hurley & Ade-
         als Spezialfall von                                                               bayo, 2016; Thomas, Crook & Edelmann, 2017) –, würde
         Algorithmen-Transparenz                                                           die Debatte über die „Algorithmen-Transparenz“ auch
                                                                                           den Bereich des Verbraucher-Scorings in wachsendem
     Derzeit wird eine intensive Debatte geführt über ein                                  Ausmaß betreffen. Ob es auf breiter Front zu dieser Zu-
     angemessenes Regulierungsregime für „Algorithmen“.                                    nahme der Komplexität von Scoring-Verfahren kommen
     Diese Debatte findet nicht nur unter Wissenschaftlern                                 wird, die sie zu „Black Boxes“ machen würden, ist un-
     statt, sondern beschäftigt auch intensiv die deutsche                                 sicher, nicht zuletzt aus dem einfachen Grund, dass es
     Politik. Im Koalitionsvertrag zwischen CDU, CSU und                                   eine offene Frage ist, ob solche neuen Scoring-Verfahren
     SPD zur 19. Legislaturperiode sind Regulierungsziele                                  den hergebrachten Methoden in einer Weise überlegen
     für den Bereich algorithmischer Entscheidungen for-                                   sind, die ihre Verwendung wirtschaftlich rechtfertigen
     muliert (CDU/CSU/SPD, 2018, Zeilen 2092 ff.). Auch die                                würde. So steht der Nachweis aus, dass neuartige al-
     Verbraucherpolitik (CDU/CSU/SPD, 2018, Zeilen 6266 ff.)                               gorithmische Entscheidungsverfahren immer „besser“
     sowie Verbände (Gesamtverband der Deutschen Versi-                                    (etwa mit Blick auf Modellgüte) sind als etablierte Ver-


     18	Zu einer solchen Digitalagentur siehe auch Tutt (2017), der für eine zentrale Regulierungsbehörde für Algorithmen nach dem Modell der Food and Drug
         Administration eintritt und deren Kompetenzen umreißt (S. 105 ff.): „the agency should serve as a centralized expert regulator that develops guidance, standards,
         and expertise in partnership with industry to strike a balance between innovation and safety.” (S. 83).
32

Handlungs­f elder: Stand der Forschung                                                                                                                      31




fahren. Beispiele hierfür sind „Google Flu Trends“ (zur                              Künstlichen Intelligenz wird diese Diskussion unter den
Prognose von Grippe-Epidemien) und COMPAS (zur Pro-                                  Schlagworten des interpretable machine learning und
gnose der Rückfallwahrscheinlichkeit von Straftätern),                               der „erklärbaren Künstlichen Intelligenz“ (explainable
bei denen jeweils die Aussagekraft komplexer Algorith-                               artificial intelligence, XAI, siehe Gesellschaft für Informa-
men widerlegt wurde und stattdessen einfache Regeln                                  tik, 2018) geführt (Wachter, Mittelstadt & Floridi, 2017;
eine höhere Prognosekraft zeigten (Dressel, 2018; Lazer,                             Selbst & Powles, 2017; Selbst & Barocas, 2018).
Kennedy, King & Vespignani, 2014).19
                                                                                     Ein gegenstandsangemessenes Verständnis von Trans-
Die Relevanz der Frage, ob und inwieweit Entwicklun-                                 parenz wird auf die Einbettung algorithmischer Ent-
gen im Bereich der Künstlichen Intelligenz die Praxis                                scheidungssysteme in arbeitsteilige Begründungs- und
des Scorings betreffen werden, ist als eher gering zu                                Kontrollarchitekturen abzielen (Wischmeyer, 2018).
veranschlagen. Denn die Schwierigkeiten, Einblick in                                 Transparent ist ein System algorithmischer Entschei-
Prozesse algorithmischer Entscheidungsfindung zu                                     dungsfindung nicht dann, wenn es in allen Einzelhei-
erhalten, betreffen keineswegs nur „moderne“ Verfah-                                 ten offen vor dem Betrachter liegt (was bei neuronalen
ren algorithmischer Entscheidungsfindung. Auch ganz                                  Netzen durchaus auch schwierig wäre, vgl. etwa Ribeiro,
konventionelle Algorithmen, die beispielsweise – wie                                 Singh & Guestrin, 2016; Burrell, 2016; Alber, Lapuschkin
der Bonitäts-Score der SCHUFA – auf multivarianten                                   & Seegerer, 2018), sondern wenn es sich seinen Be-
oder nicht-linearen Regressionsmodellen beruhen,                                     nutzern zu erklären vermag: „Lässt sich nachträglich
sind selbst für Fachleute nicht auf den ersten Blick zu                              begründen oder sichtbar machen, wie der Weg zum
durchschauen (Lipton, 2017). Die im Zusammenhang                                     Ergebnis aussah?“ (Passig, 2017, S. 25). Deshalb ist es
mit Künstlicher Intelligenz vielzitierte Black Box ist also                          nicht notwendig, dass Transparenz „volles Verständnis“
nicht erst in jüngster Vergangenheit zur Herausforde-                                für Scoring herstellt. Es reicht aus, Möglichkeiten zu
rung geworden. Mit nur wenig Übertreibung kann man                                   schaffen, auch unter den Bedingungen unvollständiger
stattdessen sagen, dass die Black Box die Entwicklung                                Transparenz und unvollständigen Verständnisses Er-
der Softwaretechnik von Anfang an begleitet hat (poin-                               kenntnisse über die Funktionsweise eines Algorithmus
tiert Passig, 2017).                                                                 zu erlangen, das sogenannte black box tinkering (Perel &
                                                                                     Elkin-Koren, 2017; Wachter, Mittelstadt & Floridi, 2017).
Mit der Offenlegung des Quellcodes selbst einfacher                                  Der Vorschlag einer Transparenz-Schnittstelle (Gigeren-
Computerprogramme ist den Verbrauchern in aller Re-                                  zer, Wagner & Müller, 2018) knüpft hieran ebenso an wie
gel nicht geholfen (siehe auch B.VII.2). Die Mehrheit der                            die Vorschläge der Gesellschaft für Informatik, das Tes-
betroffenen Personen sind keine IT-Spezialisten. Und                                 ten von Algorithmen als Regulierungsinstrument stark
selbst wenn sie es wären: die technische Komplexität                                 zu machen (Gesellschaft für Informatik, 2018, mit der
der Computersysteme, deren Entscheidungsverhalten                                    Empfehlung zur Schaffung eines „Rechts auf Durchfüh-
„transparent“ gemacht werden soll, macht selbst für                                  rung von Tests“). Hierzu werden die Eingaben systema-
die Kontrolle durch Experten eine andere Form von                                    tisch variiert und die Ausgaben ausgewertet. Dies könn-
Transparenz erforderlich als die bloße Offenlegung von                               te z. B. eine datenschutzrechtliche Aufsichtsbehörde im
Programmcodes (Wischmeyer, 2018; Samek, Wiegand &                                    Rahmen von sogenannten Datenschutzüberprüfungen
Müller, 2017; Selbst & Powles, 2017; Montavon, ­Samek &                              („audits“) nach Art. 58 Abs. 1 Buchstabe b DSGVO ver-
Müller, 2018; Gigerenzer, Wagner & Müller, 2018; Gesell-                             langen und ggf. selbst durchführen. Was im Inneren der
schaft für Informatik, 2018). An diese Einsicht knüpft                               Black Box im Detail vor sich geht, erkennt man zwar auf
ein derzeit mit großer Intensität verfolgtes Forschungs-                             diese Weise nicht notwendigerweise, aber man kann
programm an, das der Frage nachgeht, wie die Funk-                                   hinreichende Erkenntnisse über die relevanten Funk-
tionsweise komplexer Algorithmen für Menschen ver-                                   tionsweisen des Algorithmus gewinnen. Dieses tes-
ständlich gemacht werden kann. Für den Bereich der                                   ting folgt im Übrigen der Logik der Stiftung Warentest,



19	Zur Problematik des Einsatzes von Algorithmen in der amerikanischen Justiz siehe Kehl, Guo & Kessler (2017). Die möglichen Schlussfolgerungen für das
    Verbraucherrecht sind bislang nicht wirklich untersucht.
33

32   Handlungs­f elder: Stand der Forschung




     soweit diese für ihre Tests nicht Baupläne und Rezepte                                 Anhand zahlreicher Beispiele und Fallstudien haben die-
     studiert, sondern aus dem Gebrauch eines Produktes                                     se Analysen aufgezeigt, dass, wo immer eine Entschei-
     auf seine relevante Qualitäten schließt.                                               dung zu treffen ist, an eine Zahl deutlich leichtgängiger
                                                                                            angeschlossen werden kann als an eine vielschichtige,
     Auch von den Entwicklern und Anwendern von Sco-                                        differenzierte und unter Umständen auch ambivalente
     ring-Systemen wird inzwischen gesehen, dass die Nach-                                  Beurteilung eines Sachverhalts oder – bezogen auf das
     vollziehbarkeit ihrer Verfahren wichtig ist. Francesca                                 Scoring – einer Person. Damit reduzieren Scores die
     Rossi von IBM formulierte in einem Interview mit einer                                 Komplexität qualitativer Urteile in der beinahe größt-
     Tageszeitung: „Neben deep learning gibt es Systeme wie                                 möglichen Art und Weise. Das macht die Heranziehung
     decision trees, die besser nachzuvollziehen sind, aber                                 von Scores zur Entscheidungsfindung sehr attraktiv, zu-
     leider nicht ganz so akkurat. Wir müssen also herausfin-                               mal wenn diese Entscheidungen automatisiert, schnell
     den, was uns wichtiger ist: das akkurate Ergebnis oder                                 und massenhaft getroffen werden (müssen). Allerdings
     die Nachvollziehbarkeit des Ansatzes.“ (Rossi, 2018).20                                werden die Wertungen, die bei der Entwicklung von Sco-
                                                                                            ring-Verfahren getroffen werden müssen, oft nicht in ei-
                                                                                            ner Weise diskutiert, die der späteren sozialen Verwen-
                                                                                            dung dieser Verfahren angemessen ist. Welche Kriterien
                                                                                            mit welchem Gewicht in die Ermittlung eines „Punkt-
                                                                                            wertes für gesundheitsförderliches Verhalten“ in einem
     5.	Transparenz als Bedingung                                                          Krankenversicherungs-Bonusprogramm eingehen, liegt
                                                                                            üblicherweise außerhalb des Aufmerksamkeitsfeldes
         einer gesellschaftlichen                                                           der Öffentlichkeit (siehe auch C.III.2). Ob beispielsweise
         Debatte über Scoring                                                               lediglich solche Aktivitäten positive Berücksichtigung
                                                                                            finden sollen, die dem eigenen Gesundheitszustand
     In der Verwendung von Scores liegt das Risiko, gesell-                                 förderlich sind, oder auch solche, mit denen die Funk-
     schaftlich nur unzureichend diskutierte Wertungen                                      tionsfähigkeit des Gesundheitssystems unterstützt
     mit dem Anschein der Objektivität zu versehen und                                      werden soll (zum Beispiel Blutspende, Knochenmark­
     dadurch der Kritik zu entheben (grundlegend Porter,                                    typisierung) oder gar solche, die ohne Gesundheitsbe-
     1995; siehe weiter etwa Heintz, 2007). Diese Kritik der                                zug als sozial wertvoll gelten (zum Beispiel ehrenamtli-
     Quantifizierung und des „gesellschaftlichen Zahlenge-                                  ches Engagement), ist eine diskutable Frage. Das Fehlen
     brauchs“ (Vorm­busch, 2012, S. 37) ist inzwischen zum                                  öffentlicher Diskussionen über die Wertungen, die bei
     Gegenstand einer Vielzahl von Studien gemacht wor-                                     der Schaffung eines Score-Verfahrens zu treffen sind,
     den, die ein produktives Forschungsfeld begründen.                                     könnte man als einen Mangel an Politisierung bezeich-
     Etablierte Referenzgebiete für solche Analysen sind die                                nen, d. h. als eine Durchsetzung normativer Wertungen
     Wirtschaftspolitik (Weingart & Wagner, 2015; Wagner,                                   mit erheblichen sozialen Folgen ohne einen vorberei-
     2018; Schlaudt, 2018) ebenso wie diverse Felder der                                    tenden und begleitenden gesellschaftlichen Diskurs.
     Bildungs-, Gesundheits- und Sozialpolitik (Muller, 2018)
     und insbesondere das Handeln internationaler Organi-
     sationen, soweit sich dieses maßgeblich auf Indikato-
     ren, Rankings, ­Grenzwerte usw. stützt (Davis & Fisher,
     2012; Rottenburg, Merry, Park & Mugler, 2015; Merry,
     Davis & Kingsbury, 2015; Merry, 2016).




     20	Zu der Frage, ob dieser Trade-Off in der Realität des Scorings überhaupt besteht, siehe etwa Hand, 2006, der ihn mit guten Argumenten bestreitet. Hier geht es nur
         darum, dass die Praxis den Belang der Verständlichkeit offenkundig anerkennt. Insoweit ist es auch kein Gegeneinwand, dass random forests, also eine Vielzahl
         von decision trees (Gesellschaft für Informatik, 2018), nicht notwendigerweise leichter interpretierbar sind (Groll, Ley, Schauberger & Van Eetvelde, 2018) und das
         Problem der Verständlichkeit deshalb durch die Methodenumstellung nicht verschwindet oder auch nur notwendigerweise verringert wird.
34

Handlungs­f elder: Stand der Forschung                      33




Unzureichende Transparenz kann zudem gesellschaftli-
chen Fehlvorstellungen darüber Vorschub leisten, was
ein Score eigentlich aussagt (siehe auch C.III.3). Zum
Beispiel kann ein Kfz-Score als Grundlage für einen
Telematik-Tarif so gebildet werden, dass er nicht nur auf
das beeinflussbare Fahrverhalten abstellt, also etwa die
Umsicht, mit der der Fahrer bremst und beschleunigt
oder Geschwindigkeitsbegrenzungen beachtet, sondern
auch fahrleistungsindifferente, aber unfallwahrschein-
lichkeitsrelevante Merkmale erfassen. Dies können zum
Beispiel das Verhältnis von Stadtfahrten und Landfahr-
ten (denn in der Stadt ist die Unfallwahrscheinlichkeit
höher) oder von Nachtfahrten und Tagesfahrten sein
(denn nachts zu fahren erhöht die Wahrscheinlichkeit
eines Unfalls). Entsteht bei dem gescorten Autofahrer
oder der Öffentlichkeit der Eindruck, der Score-Wert
drücke vor allem die Fähigkeiten des Fahrers aus, fallen
die reale Bedeutung des Score-Wertes und seine soziale
Verwendung auseinander. Transparenz in dieser Hin-
sicht zielt somit darauf, die Bedeutung von Scores rea-
listisch einzuschätzen und Scores nur dieser Bedeutung
entsprechend einzusetzen.
35

34   Handlungs­f elder: Stand der Forschung




     II.	Diskriminierungsschutz und
          Gleichbehandlung

     Scoring-Verfahren führen zu von Person zu Person un-                                  hen. Die jeweils maßgeblichen Merkmale, nach denen
     terschiedlichen Scores. Darin liegt gerade ihr Sinn:                                  zu unterscheiden unerwünscht oder sogar verboten ist,
     Scores markieren Unterschiede und Scoring-Verfahren                                   sind das Ergebnis von gesellschaftlichen Aushandlungs-
     wollen differenzieren. Jede marktwirtschaftliche demo-                                prozessen, von Einsicht in Strukturen sozialer Exklusion
     kratische Wirtschafts- und Rechtsordnung baut auf der                                 und in historisches Unrecht sowie, letzten Endes, von zi-
     Möglichkeit auf, privatautonom Unterscheidungen zu                                    vilisatorischem Fortschritt (Fritzsche, 2017). Sie müssen
     treffen. Prinzipiell steht es jedem Unternehmer frei, ob                              nicht für alle Lebensbereiche und sozialen Situationen
     er mit einem Verbraucher einen Vertrag abschließen will                               identisch bestimmt werden und sie sind der gesetzge-
     oder nicht. Eine Verpflichtung zum Vertragsschluss gibt                               berischen Anpassung und Fortentwicklung zugänglich.
     es nur in wenigen Ausnahmefällen. Umgekehrt gewinnt
     der Diskriminierungsschutz in der Rechtsordnung im-                                   Eine solche Bestimmung des Phänomens Diskriminie-
     mer weiter an Boden. Scoring-Verfahren bewegen sich                                   rung ist von zwei konkurrierenden Bedeutungen des
     genau in diesem Spannungsverhältnis von unterneh-                                     Begriffs abzugrenzen: Einerseits ist nicht schlechthin
     merischer Freiheit und gesellschaftlichen Wertvorstel-                                jede Unterscheidung zwischen Personen eine „Diskri-
     lungen, das immer wieder neu austariert werden muss.                                  minierung“, wie sie Gegenstand dieses Gutachtens ist.
                                                                                           Ein solches Begriffsverständnis (vgl. Adomeit, 2002;
                                                                                           Picker, 2008) hätte zur Folge, dass unter „Diskriminie-
                                                                                           rung“ eine Vielzahl gesellschaftlicher Vorgänge zu fas-
                                                                                           sen wäre, die nicht problematisiert werden müssen und
                                                                                           keine politische Handlungsnotwendigkeit auslösen, bis
     1. Was ist Diskriminierung?                                                           hin zu der Unterscheidung des Gastwirts zwischen zah-
                                                                                           lungswilliger und nicht zahlungswilliger Kundschaft.
     Das Phänomen Diskriminierung wird in diesem Gut-                                      Auch manchen statistischen Fachbegriffen wie etwa
     achten weit verstanden. Es erfasst Handlungen und                                     dem der Diskriminanzanalyse liegt ein wertneutrales
     Strukturen, die dazu führen, dass die Träger bestimmter                               Verständnis des Begriffs Diskriminieren – das Unter-
     Merkmale21 (etwa Frauen, Homosexuelle oder Personen                                   scheiden – zugrunde. Andererseits soll mit dem Begriff
     „fremder“ ethnischer Herkunft) im gesellschaftlichen                                  der Diskriminierung auch nicht gemeint sein, dass die
     Leben benachteiligt werden. Dafür, welche ­Merkmale in-                               Unterscheidung nach dem Diskriminierungskriterium
     soweit relevant sind, liefert § 1 des Allgemeinen Gleich-                             kategorisch gesellschaftlich missbilligt oder gar recht-
     behandlungsgesetzes (AGG) ­Orientierungspunkte. Die                                   lich verboten ist.
     Vorschrift bestimmt: „Ziel des Gesetzes ist, Benachtei-
     ligungen aus Gründen der Rasse oder wegen der eth-                                    Eine „Diskriminierung“ soll stattdessen jede Ungleich-
     nischen Herkunft, des Geschlechts, der Religion oder                                  behandlung nach einem Kriterium bezeichnen, dessen
     Welt­anschauung, einer Behinderung, des Alters oder der                               Heranziehung zu Unterscheidungszwecken als beson-
     sexuellen Identität zu verhindern oder zu beseitigen.“ In                             ders legitimationsbedürftig bewertet wird. Der bloße
     anderen Vorschriften wird der Kreis der sogenannten                                   Verweis auf das freie Belieben desjenigen, der die Un-
     Diskriminierungsmerkmale22 abweichend bestimmt,                                       terscheidung vornimmt, reicht zur Rechtfertigung der
     wiewohl natürlich zahlreiche Überschneidungen beste-                                  Ungleichbehandlung nicht aus.23



     21	Zur Klarstellung: Es geht nicht darum, dass die genannten Merkmale „objektiv“ vorliegen und der diskriminierten Person gewissermaßen inhärent sind.
         Diskriminierungsverbote schützen vor Unterscheidungen aufgrund bloß zugeschriebener Merkmale (Schiek, 2000; für das AGG siehe BT-Drucks. 16/1780, S. 30 f.).
         Damit ist etwa verständlich, dass sich ein Diskriminierungsverbot auf das Merkmal „Rasse“ beziehen kann, die eine soziale, aber keine anthropologische Kategorie
         darstellt.
     22	Es herrscht eine große begriffliche Vielfalt, die verwirren kann. Man spricht nicht nur von „Diskriminierungsmerkmalen“ (Pärli, 2017, S. 106 ff.), sondern auch
         von „verbotenen Merkmalen“ (Schramm, 2013, S. 7), wiewohl verboten selbstverständlich nicht das Merkmal ist, sondern unter Umständen die an das Merkmal
         anknüpfende Diskriminierungshandlung. Gleichbedeutend spricht man auch von „geschützten Merkmalen“ (Schramm, 2013, S. 3 und passim); in dieser
         Terminologie klingt an, dass Zweck des Diskriminierungsverbots der Schutz von Trägern bestimmter Merkmale ist.
     23	Aus juristischer Perspektive: Mit dem Verweis auf die Privatautonomie, verstanden als „das Prinzip der Selbstgestaltung der Rechtsverhältnisse durch den einzelnen
         nach seinem Willen“ (Flume, 1965, S. 1) und als „Anerkennung der ‚Selbstherrlichkeit‘ des einzelnen“ (a.a.O., S. 6), ist die vom Entscheider vorgenommene
         Ungleichbehandlung nicht abschließend legitimiert.
36

Zur nächsten Seite