Generative KI-Systeme und Datenschutz: Wie DSGVO und KI-Verordnung zueinander stehen

prompt/ Banner vom iRights.Lab, lizenziert unter CC BY 4.0
Personenbezogene Daten an Dienstleister und Hersteller von Apps weiterzugeben ist alltäglich und den allermeisten bewusst: Wer sich von einer Navigationsapp zum Ziel leiten lässt, erlaubt oft die Übertragung seiner Standortdaten an den Betreiber; wer das Smart Home-System auffordert, eine Playlist zu starten, übergibt Stimminformationen an die Hersteller; wer Soziale Netzwerke nutzt, erlaubt den Anbietern in der Regel, geteilte Inhalte und das eigene Nutzungsverhalten zu analysieren, um personalisierte Inhalte vorschlagen zu können.
Was aber, wenn diese Daten ohne Zustimmung zum Training von Sprachmodellen genutzt werden? So hat der Datengigant Meta erst vor wenigen Monaten angekündigt, die eigenen KI-Sprachmodelle künftig mit Texten, Bildern, Filmen und weiteren Inhalten der Nutzer*innen seiner Anwendungen Facebook oder Instagram zu optimieren. Ähnlich ist die Online-Plattform X vorgegangen. Bei Facebook lässt sich diese Nutzung nur verhindern, indem man ausdrücklich Widerspruch einlegt. Doch ist das überhaupt rechtens? Was steht zu solchen Datennutzungen in der EU-KI-Verordnung (KI-VO)? Oder greifen in solchen Fällen die Regelungen der Datenschutz-Grundverordnung (DSGVO)?
Der Newsletter prompt/
Den Text haben wir mit freundlicher Genehmigung übernommen aus der aktuellen Ausgabe von prompt/. Der monatliche Newsletter mit Berichten, Tipps und Debatten zu rechtlichen Fragen rund um generative KI erscheint im Rahmen eines Projektes des iRights.Lab, das Rechtsfragen zu generativer KI untersucht. Hier können Sie prompt/ kostenlos abonnieren.
Weitere Auskopplungen des Newsletters auf iRights.info sind hier erschienen.
Die DSGVO nimmt nicht nur KI-Anbieter in den Blick
Die KI-VO nimmt vor allem die Anbieter (provider) von KI-Systemen in die Pflicht. Die DSGVO hingegen will jede rechtswidrige Verarbeitung personenbezogener Daten verhindern – egal an welcher Stelle der KI-Nutzung sie erfolgt. Immer dann, wenn eine Person dafür verantwortlich ist, dass personenbezogene Daten verarbeitet werden, muss diese Person für die Einhaltung der datenschutzrechtlichen Vorschriften sorgen.
Diese Pflicht betrifft also nicht nur die KI-Anbieter, sondern auch mögliche spätere KI-Betreiber*innen (deployer). Die DSGVO orientiert sich dabei an konkreten Verarbeitungsschritten entlang der KI-Wertschöpfungskette: vom Training über die Optimierung bis hin zum Output generativer KI-Systeme. Anders als der Begriff „Kette“ vermuten lässt, sind die unterschiedlichen datenschutzrechtlich verantwortlichen Personen und Stellen allerdings nicht aneinander gekoppelt. Vielmehr ist jeder und jede – unabhängig von den Aktivitäten der anderen – für die Einhaltung datenschutzrechtlicher Bestimmungen voll verantwortlich:
- Am Anfang stehen jene Stellen, die Trainingsdaten für das spätere KI-System erheben, also Inhalte auffinden und auflisten, wie Texte, Bilder, Filme, Musik- und Sprachwerke und so weiter. Sind darunter personenbezogene Daten, handelt es sich um eine datenschutzrelevante Verarbeitung. Das Sammeln, Generieren, Strukturieren und Aufbereiten kann dabei sehr unterschiedlich organisiert sein. Manche erheben Trainingsdaten in eigener Verantwortung, andere lassen sie durch auftragsverarbeitende Dienstleister*innen erheben. Doch unabhängig davon, ob es um Open Data und Open Source geht oder aufbereitete Datensätze kommerziell auf dem Markt angeboten werden – stets sind die Ausführenden datenschutzrechtlich verantwortlich.
- Auch im nächsten Feld – beim Training und Fine Tuning von KI-Systemen – können schutzrelevante, personenbezogene Daten verarbeitet werden. Ist dies der Fall, gilt es als eigener Verarbeitungsschritt, bei dem entsprechende Schutzmaßnahmen zu treffen sind.
- Auch solche Unternehmen und Stellen, die fertig entwickelte KI-Systeme erwerben und für eigene Zwecke nutzen wollen, können für den Datenschutz verantwortlich sein. Beispielsweise Dienstleistungsfirmen oder Verwaltungen. Sofern sie ein KI-System nutzen und dort Informationen eingeben (Input) eingeben, die personenbezogene Daten enthalten, sind sie verantwortlich dafür, dabei den Datenschutz zu beachten. Ebenso in der datenschutzrechtlichen Verantwortung sind sie dafür, wie sie mit den Ergebnissen umgehen, die ein KI-System liefert (Output). Etwa, wenn es in KI-generierten Texten um personenbezogene Bewertungen, Angebote oder Beschreibungen gehen sollte.
Ein Beispiel: Ein Kunde verlangt beim Unternehmen „U-GmbH“ Auskunft darüber, ob seine private Anschrift durch das dort eingesetzte KI-System verarbeitet wird. Das Unternehmen darf nicht darauf verweisen, dass das KI-System von einem externen Dienstleister finegetuned wurde, der deshalb für den Datenschutz in die Pflicht zu nehmen ist. Stattdessen muss die U-GmbH in der Lage sein, dem Kunden eine richtige und vollständige Auskunft über die von ihr verarbeiteten, personenbezogenen Daten zu erteilen. Gelingt dies nicht, so bestehen womöglich Schadenersatzansprüche. Zudem könnten auch aufsichtsrechtliche Bußgelder verhängt werden.
Fazit
Mit seinem Fokus auf einzelne Verarbeitungsschritte geht das Datenschutzrecht sehr kleinteilig vor. Womöglich erweist es sich gerade deshalb als ausschlaggebend dafür, welche KI-Systeme in welcher Weise in der Praxis genutzt werden. Einerseits könnte es Hersteller und Dienstleister dahingehend beeinflussen, auf die Entwicklung und Konfektionierung datenschutzkonformer und transparenter Produkte zu setzen. Andererseits – so fürchten Gegenstimmen bereits – , könnten sich Anbieter von leistungsstarken und wirkmächtigen KI-Systemen aufgrund dieser datenschutzrechtlichen Anforderungen schlicht vom europäischen Markt zurückziehen.
Der Text stammt aus der aktuellen Ausgabe des monatlichen Newsletters prompt/ aus dem iRights.Lab. Er ist dort unter dem Titel „Sticht die DSGVO die KI-VO?“ erschienen und offen lizenziert. Hier können Sie die vollständige Ausgabe mit Schwerpunkt KI und Datenschutz einsehen.
Was sagen Sie dazu?