„Künstliche Intelligenz“ à la GPT3: Die große Remix-Maschine
„Generative Pre-trained Transformer 3“ (oder kurz: GPT3) lässt sich am besten umschreiben als Sprachverarbeitungstechnologie, beruhend auf maschinellem Lernen. Das Verfahren: GPT3 erkennt Muster in Millionen bestehender Texte und erstellt auf dieser Basis neue Texte. Genauer gesagt: Text-Remixes.
GPT3 generiert keine unbrauchbaren Buchstabenketten – sondern im besten Falle Formulierungen, Absätze oder sogar längere, in sich geschlossene Texte mit Sinn und Bedeutung. Das klingt aufregend, geheimnisvoll und sogar ein bisschen beängstigend. Dass Sprachverarbeitungstechnologien wie GPT3 für Veränderungen sorgen werden, ist offensichtlich. Die Frage ist eher: Wie tief werden diese Veränderungen greifen?
Eine definitive Antwort auf diese Frage zu finden ist nicht einfach. Und doch verdeckt der aufgeregte Diskurs um die neue Technologie, was GPT3 eigentlich ist: eine Kopiertechnologie, die durch massenhafte Mustererkennung lernt, mit Informationen umzugehen, diese zu bewerten und zu ordnen, um daraus neue Aussagen zu generieren.
GPT3 sollte daher bis auf Weiteres als lernende und sich selbst verbessernde Remix-Maschine verstanden werden: schon mächtig (und in Zukunft noch mächtiger), aber dennoch als Technologie, die vor allem Texte rekombiniert, dafür auf präzise Anfragen angewiesen ist sowie auf das Material, das sie findet.
Sie möchten iRights.info unterstützen?
iRights.info informiert und erklärt rund um das Thema „Urheberrecht und Kreativität in der digitalen Welt“. Alle Texte erscheinen kostenlos und offen lizenziert.
Wenn Sie mögen, können Sie uns über die gemeinnützige Spendenplattform Betterplace unterstützen und dafür eine Spendenbescheingung erhalten. Betterplace akzeptiert PayPal, Bankeinzug, Kreditkarte, paydirekt oder Überweisung.
Besonders freuen wir uns über einen regelmäßigen Beitrag, beispielsweise als monatlicher Dauerauftrag. Für Ihre Unterstützung dankt Ihnen herzlich der gemeinnützige iRights e.V.!
Wie GPT3 arbeitet – und warum man vorsichtig mit den Ergebnissen sein sollte
Damit GPT3 schreiben kann, sind sogenannte „Prompts“ nötig. Das sind sprachliche Aufforderungen, die Nutzer*innen GPT3 als Input geben. Das Programm sucht Informationen zusammen, verarbeitet und führt diese zu einem neuen Text zusammen.
Derzeit agiert GPT3 auf dem Niveau einer komplexen, sehr gut informierten Suchmaschine. Je genau die Anfrage (etwa eine Frage oder eine Anweisung zur Recherche), desto tiefer die Antwort. Bei simplen Anfragen funktioniert GPT3, hier in der Anwendung ChatGPT, schon recht gut. Ein Beispiel:
Die Antwort besteht aus einer Aneinanderreihung von Informationen, die sich so oder so ähnlich etwa in der Wikipedia oder auf einer Seite von Google selbst abrufen lassen. Auch etwas komplexere Anfragen kann GPT3 ganz gut bearbeiten. Beispielsweise das Verhältnis zwischen der Open-Access-Bewegung und den etablierten akademischen Verlagen. Dazu gibt es ebenfalls Informationen im Netz, die GPT3 wie folgt rearrangiert:
In diesem Falle ist GPT3 aber mindestens ungenau: Die Open-Access-Bewegung hat zwar „dazu beigetragen, das Monopol der Verlage auf die Veröffentlichung wissenschaftlicher Forschungsergebnisse zu brechen“. Das stimmt, mehr oder weniger, es ist aber nicht so eindeutig, wie GPT3 nahelegt. Denn das Monopol der Verlage ist höchstens stellenweise gebrochen.
Auch die Rückgabe der Kontrolle über den Zugang zu Forschungsergebnissen liegt allenfalls theoretisch in der Hand der Wissenschaftler*innen. Die Praxis sieht doch komplizierter aus. Insofern sind die Antworten von GPT3 mindestens mit Vorsicht zu genießen oder in der weiteren Folge zu überprüfen.
GPT3: Die selbst lernende Remix-Maschine
Wie bei anderen technologischen Umbrüchen zuvor gibt es auch in der Debatte um GPT3 beides: Eine breite Skepsis gegenüber der Qualität der Antworten wie auch die Sorge, dass die neue Technologie etablierte Berufe ersetzen könnte. Beide Punkte berühren die Frage, ob menschliche Kreativität einzigartig ist. Oder ob sie von der Technologie Konkurrenz bekommen und dadurch unter Druck geraten könnte.
Beim Einsatz von KI-Systemen entstehen viele rechtliche Fragen für die Anwender*innen, etwa zum urheberrechtlichen Schutz der Erzeugnisse oder der Patentierbarkeit der KI als Erfindung. Till Kreutzer erläutert dazu die wichtigsten Fragen des Immaterialgüterrechts aus Theorie und Praxis.
» mehrWelche Regeln gelten für die Erzeugnisse Künstlicher Intelligenz?
Auch wenn niemand die Zukunft voraussehen kann: Es lohnt sich, zunächst einen Schritt zurückzutreten und GPT3 von seinem Ansatz her als Kopiertechnologie zu verstehen. Denn GPT3 arbeitet nicht im luftleeren Raum, sondern rekombiniert maschinenlesbare Texte zu neuen Sätzen, Textblöcken und teils sogar noch größeren semantischen Einheiten zusammen.
GPT3 webt ein sprichwörtliches Netz aus Aussagen, indem es bereits vorliegende Fäden zusammensucht und als sinnvolle Aussagen neu verknüpft. Die gewobenen Netze werden ihrerseits zur Grundlage neuer Texte, da sich aus ihnen wieder Fäden herauslösen und neu verknüpfen lassen. Die technische Grundlage dafür sind komplexe Kopiervorgänge.
Künstliche Intelligenz? Vorerst nur kreative Kopien
Was kopiert GPT3 genau? Hier lassen sich grundsätzlich drei Ebenen unterscheiden: Repräsentation, Replikation und Referenz. Die drei Ebenen sind nicht voneinander losgelöst, sondern bedingen sich gegenseitig. Gemeinsam ergeben die drei Ebenen die sogenannte „technische Reproduzierbarkeit“, ein Begriff des Medientheoretikers Walter Benjamin. Technische Reproduzierbarkeit meint, welche Kopiertechnologien einer Gesellschaft zur Verfügung stehen.
Die von technischer Reproduzierbarkeit ausgelösten Veränderungen kommen oft schubweise: Eine neue Kopiertechnologie etabliert sich und erschüttert die bestehenden Strukturen. Mit der Einführung der Fotografie etwa wurde es möglich, die Wirklichkeit deutlich realitätsgetreuer abzubilden als in der Malerei. Landschaften oder Stadtansichten ließen sich nun besser einfangen und detaillierter repräsentieren.
Mit dem Aufkommen von modernen Druck- und Kopiertechniken (wie dem Xerox) entstand ein weiterer Schub, diesmal auf der Ebene der Replikation. Fotografien wurden selbst reproduzierbar, es wurde leichter, sie zu vervielfältigen und zu verbreiten. Jahrzehnte später führte das Digitale abermals zu einem Schub beim Replizieren, diesmal sogar noch gewaltiger.
Eine Kopie ist eine Kopie ist eine Kopie? Nicht ganz. Drei Formen des Kopierens lassen sich voneinander abgrenzen: Repräsentation, Replikation und Referenz – je nachdem was wir kopieren. Auch im Urheberrecht spiegeln sich die Unterschiede. Ein Vorschlag zur differenzierten Betrachtung.
» mehrWas wir kopieren, wenn wir kopieren
Mit GPT3 und anderen digitalen Technologien, die auf maschinellem Lernen basieren und sich aus Textkopien speisen, deutet sich ein weiterer Schub technischer Reproduzierbarkeit an. Diesmal auf der Ebene der Referenzialität: Denn nun sind automatisierte Arrangements von textuellen Einheiten (Sprache, Sätze, Wörter, Buchstaben) möglich, deren Bedeutungsgehalt Menschen als (mehr oder weniger) sinnvoll erleben.
Interessant ist auch: Ohne die vielen hunderttausend Replikationen von Texten, mit denen GPT3 trainiert wurde, wäre der Schub auf der Referenz-Ebene nicht möglich gewesen. Die Qualität des Texte-Korpus und die Menge der verfügbaren Texte ist entscheidend. Ohne die Open-Access-Bewegung würden sich die Antworten von GPT3 vermutlich ganz anders lesen.
Menschliche Autorschaft unter Druck?
Als der Tonfilm den Stummfilm ablöste, entfaltete sich ein starker Schub technischer Reproduzierbarkeit auf der Ebene der Replikation. Die Folgen für die Filmbranche: Der Tonfilm verengte für zwei Gruppen von Kreativschaffenden den Arbeitsmarkt. Für die Schauspieler*innen, die sich nicht auf das Sprechen vor Kamera und Mikrofon einließen (etwa weil sie keine Sprechausbildung hatten); und für die Filmorchester, die mit der Schallplatte preisgünstigere Konkurrenz bekamen.
Der Tonfilm erhöhte die Anforderungen für die etablierten Mimen, während es die Reproduktionskosten senkte und sich viele Musiker*innen in der Folge nach neuen Einnahmequellen umsehen mussten. Eine ähnliche Dynamik wird vermutlich auch GPT3 auslösen. Die Anforderungen für Menschen aus der schreibenden Zunft, darunter Journalisten, Schriftstellerinnen, Drehbuchautoren, wissenschaftliche Autorinnen und andere, werden sich mittelfristig verändern.
Auch Forschungsdaten und Datenbanken lassen sich mit Creative-Commons-Lizenzen frei nachnutzbar machen. Sie können etwa für die Entwicklung neuer Technologien als Trainingsmaterial für Künstliche Intelligenz oder Machine Learning eingesetzt werden. Was es dabei zu beachten gilt, stellen wir im fünften Teil der CC-FAQs vor.
» mehrDaten und Creative-Commons-Lizenzen - Trainingsmaterial für Künstliche Intelligenz
Gleichwohl heißt das nicht, dass ihre Arbeit vollkommen überflüssig werden wird. Wahrscheinlicher ist, dass Technologien wie GPT3 vor allem mechanische und generische Textarbeiten ergänzen und teils auch ersetzen werden. Das könnte solche Genres wie Zusammenfassungen, kurze Dossiers, Erklärungen, Beipackzettel und andere Formate betreffen, die vor allem auf dem Zusammentragen und Aufbereiten von Informationen beruhen.
Neue Kopiertechnologien erfordern neue Kompetenzen
Es dürften sich neue Betätigungsfelder auftun, in denen bewusst menschliche Autorschaft zum Einsatz kommen und herausgestellt werden soll. Entweder ohne technische Unterstützung oder durch gezielte Ergänzung von Sprachverarbeitungstechnologien.
Auch der Aufbau neuer Kompetenzen im Umgang mit GPT3 dürfte wichtig werden. Das Formulieren von geeigneten Anfragen dürfte ähnlich wie das Suchen via Google und Co. an Relevanz gewinnen. Denn selbst wenn GPT3 solide formuliert und blitzschnell Absätze generiert – notwendig ist weiterhin die Person vor dem Bildschirm, die Fragen formuliert, zur Recherche auffordert, den Text sichtet, überprüft, Fehler entfernt, redaktionell überarbeitet und mit eigener Handschrift versieht.
iRights.info informiert und erklärt rund um das Thema „Urheberrecht und Kreativität in der digitalen Welt“.
Wir sind auch in den Sozialen Medien zu finden: Folgen Sie uns auf Twitter, Facebook, Telegram oder LinkedIn!
Sie möchten uns unterstützen? Das geht ganz einfach über die Spendenplattform Betterplace!
Was sagen Sie dazu?