OER, Generative KI und fremde Werke
Im letzten Monat haben wir darüber berichtet, wie OER mit KI-Inhalten am besten zu lizenzieren sind. Zwei weitere Fragen im Kontext von KI und OER werden derzeit häufig gestellt: Können KI-Systeme auf OER zurückgreifen, um ihre Modelle zu trainieren? Und: Darf ich beim Einsatz von KI-Generatoren wie ChatGPT, DALL-E oder DiffusionBee fremde Inhalte zum Prompten verwenden?
Lernen aus Bestehendem
KI-Generatoren basieren auf Modellen zur Sprach- oder Bilderzeugung, die sich aus Milliarden von Website-Daten und Inhalten im Netz speisen. Diese Inhalte sind ihrer Art nach nicht begrenzt: Von Online-Zeitungen, wissenschaftlichen Artikeln und Romanen bis hin zu Unternehmenstexten, frei einsehbaren Regierungsdokumenten (etwa von der Europäischen Union), Reden, Comedy-Auftritten oder OER-Inhalten kann prinzipiell jeder Text zum Trainingsmaterial werden.
Einige Kreative klagen derzeit dagegen, dass Betreiber von KI-Systemen die Modelle ohne Zustimmung mit ihren Werken füttern. Die Rechtslage ist kompliziert, lässt sich aber auf die Frage herunterbrechen, ob gesetzliche Urheberrechtserlaubnisse greifen: Diese wären in den USA die „Fair Use“-Regelung und in der EU eine neuere Urheberrechtserlaubnis für Machine-Learning. Viele Gründe sprechen dafür, aber geklärt ist diese Frage derzeit nicht.
OER zum Trainieren von Modellen
Muss man OER ausdrücklich freigeben, damit KI-Modelle damit trainiert werden können? Die kurze Antwort: Nein. Der Grund: Schon die freien Lizenzen, die für das „Open“ in Open Educational Resources sorgen, erlauben dies. Wie zuvor erwähnt, ist es vermutlich auch gesetzlich zulässig (in Deutschland nach § 44b Urheberrechtsgesetz) – die freien Lizenzen räumen dann noch die letzten Zweifel aus. KI-Modelle können also ohne weiteres Vorgehen mit OER trainiert werden.
Was aber ist, wenn man verhindern möchte, dass dies geschieht? Viele Betreiber von KI-Systemen beachten maschinenlesbar erklärte Nutzungsvorbehalte – und sind gesetzlich sogar dazu verpflichtet. Allerdings stehen die freie Lizenzierung (vertragliche Erlaubnis) und das technisch erklärte Opt-Out (erklärtes Verbot) zueinander im Widerspruch. Zudem ist zweifelhaft, ob die OER-Community solche Opt-Outs mit dem Begriff „open“ als vereinbar ansieht.
Fremde Werke als Prompts von generativer KI
Schließlich stellt sich die Frage: Darf ich mit fremden Werken prompten und somit etwas Neues mit KI erstellen? Mit Fremdcontent zu prompten, ist zunächst einmal urheberrechtlich unbedenklich, solange es privat bleibt. Wer das Ergebnis veröffentlichen möchte, muss darauf achten, ob der Fremdcontent – oder Teile daraus – noch enthalten sind. Wenn dies der Fall ist, gilt:
- Ist das verwendete Werk frei lizenziert (insbesondere Wikipedia-Content), müssen der Lizenzhinweis und der Hinweis auf die Bearbeitung erfolgen.
- Sofern das verwendete Werk nicht frei lizenziert ist („Alle Rechte vorbehalten“), darf das Ergebnis nicht ohne weitere Prüfung einer Erlaubnis geteilt werden.
- Ist das verwendete Werk gemeinfrei, gibt es keine Einschränkungen beim Veröffentlichen.
Fallbeispiele
Was unproblematisch möglich ist:
- Zusammenfassungen und Bildbeschreibungen: Gibt man dem KI-System ein Fragment aus einem Roman oder einen Zeitungsartikel und bittet es, eine Zusammenfassung zu schreiben, so ist dies zulässig. Man muss darauf achten, dass die Zusammenfassung nicht originelle Formulierungen aus dem verwendeten Werk übernimmt, sondern die Fakten in eigenen Worten wiedergibt. Hintergrund: Originelle, das heißt Schöpfungshöhe erreichende Formulierungen gelten als Werke im Sinne des Urheberrechts und sind damit schutzfähig.
- Ein geschütztes Bild mit dem Befehl „Erstelle mir etwas Ähnliches in diesem Stil“ zu prompten, ist zulässig. Stile sind nämlich nicht urheberrechtlich geschützt. Aber Vorsicht: „Gib mir dieses Motiv in einem anderen Stil aus“ ist bei einem originellen, urheberrechtlich geschützten Motiv hingegen eine Bearbeitung.
Was nicht (oder nicht einfach so) geht:
- „Outpaintings“ (ein Bild über den Rahmen hinaus „weitermalen“ lassen) oder „Inpaintings“ (Elemente im Bild hinzufügen, ersetzen oder entfernen): Dabei handelt es sich in der Regel um Bearbeitungen. Die Ergebnisse dürfen nur geteilt werden, wenn die Vorlage gemeinfrei oder frei lizenziert ist – oder wenn hierfür eine Erlaubnis vorliegt.
- Übersetzungen eines Textes sind unfreie Bearbeitungen. Sie öffentlich zu teilen, bedarf der Erlaubnis.
Fazit
OER zu teilen bedeutet, sie auch zum Trainieren von KI-Modellen freizugeben. Und wer bei der OER-Erstellung generative KI einsetzt, muss dabei fremde Rechte wahren. Vorsichtig sollte man besonders dann sein, wenn sich fremde Werke oder Teile hiervon im KI-Output wiederfinden.
Hinweis: Dieser Beitrag ist Teil einer Kooperation von iRights.info, dem Deutschen Bildungsserver und OERinfo. Der Text stammt von Fabian Rack, steht unter der Lizenz CC BY 4.0 und wurde zunächst bei OERinfo veröffentlicht.
Sie möchten iRights.info unterstützen?
iRights.info informiert und erklärt rund um das Thema „Urheberrecht und Kreativität in der digitalen Welt“. Alle Texte erscheinen kostenlos und offen lizenziert.
Wenn Sie mögen, können Sie uns über die gemeinnützige Spendenplattform Betterplace unterstützen und dafür eine Spendenbescheinigung erhalten. Betterplace akzeptiert PayPal, Bankeinzug, Kreditkarte, paydirekt oder Überweisung.
Besonders freuen wir uns über einen regelmäßigen Beitrag, beispielsweise als monatlicher Dauerauftrag. Für Ihre Unterstützung dankt Ihnen herzlich der gemeinnützige iRights e.V.!
DOI für diesen Text: https://doi.org/10.59350/pp3ng-thb63 · automatische DOI-Vergabe für Blogs über The Rogue Scholar
Was sagen Sie dazu?