Benjamin Raue: Text- und Data-Mining nicht weiter beschränken
iRights.info: Was hat es mit dem Urheberrecht zu tun, wenn Texte und Daten analysiert werden?
Benjamin Raue: Im weitesten Sinne spricht man von Text- und Data-Mining, wenn bereits vorhandene Daten automatisch ausgewertet oder analysiert werden, um neue Erkenntnisse zu gewinnen. Die Sachinformation, die in solchen Daten steckt, ist zunächst einmal gar nicht urheberrechtlich geschützt. Sie ist aber häufig in Texten, Bildern oder Videos enthalten, an denen Rechte bestehen.
Die Inhalte können durch Urheberrechte als schöpferisches Werk geschützt sein. Oder es bestehen Leistungsschutzrechte wie bei Lichtbildern, Tonträgern oder Datenbanken, die eine Investitionsleistung schützen sollen.
Man könnte daher auch sagen: Die Informationen sind in einer urheberrechtlich geschützten Hülle gespeichert. Will man sie extrahieren, werden die Schutzgegenstände in der Regel vervielfältigt. Hier kommt stets das Urheberrecht ins Spiel, denn die Vervielfältigung ist grundsätzlich dem Urheber vorbehalten.
Urheberrecht und Data-Mining: „Bislang war vieles ungeklärt“
iRights.info: Also drohen bei Datenanalysen Urheberrechtsverletzungen?
Benjamin Raue: Bislang war vieles ungeklärt. Solange die Daten nur kurz zwischengespeichert und – wie im Arbeitsspeicher – automatisch wieder gelöscht werden, war das bereits nach alten Recht erlaubt. Dafür gibt es die Schrankenregelung in Paragraf 44a Urheberrechtsgesetz, die technisch notwendige, sogenannte „flüchtige Vervielfältigungen“ zu rechtmäßigen Zwecken erlaubt.
Wenn man jedoch aufwändigere Analysen durchführen möchte und weitere Speicherschritte erforderlich sind, müssen die Vervielfältigungen wieder gesondert gerechtfertigt werden.
Da gab bislang es nur einige weitere, im Urheberrecht verstreute Schrankenregelungen, die solche Speicherungen etwa zu wissenschaftlichen Zwecken rechtfertigen konnten. Allerdings waren damit wahrscheinlich nicht alle Speichervorgänge urheberrechtlich abgedeckt.
iRights.info: Das neue Urheberrecht seit dem 1. März regelt auch Text- und Data-Mining. Was genau gilt jetzt?
Benjamin Raue: Mit dem Urheberrechts-Wissensgesellschafts-Gesetz ist eine neue Schrankenregelung für das Text- und Data-Mining eingeführt worden. Diese erlaubt nun ausdrücklich Vervielfältigungen von urheberrechtlich geschütztem Material, die vor der eigentlichen Analyse stattfinden. Um die Daten zu analysieren, sind in der Regel weitere Bearbeitungsschritte nötig, etwa eine statistische Normalisierung, um die Daten vergleichbar zu machen.
Ich möchte aber betonen, dass die Analyse der Daten als solche auch weiterhin nicht urheberrechtlich relevant ist. Das ist in der Gesetzesbegründung noch einmal klargestellt worden. Nur das damit verbundene Speichern fällt in den Anwendungsbereich des Urheberrechts, weil Vervielfältigungen entstehen.
iRights.info: Dann gibt es jetzt keine Rechtsprobleme mehr?
Benjamin Raue: Es sind weniger. Die neue Schrankenregelung ist begrenzt auf die nicht-kommerzielle wissenschaftliche Forschung. Dazu ist es erlaubt, die Daten für die Dauer eines Forschungsprojekts zu speichern. Nach Abschluss müssen sie wieder gelöscht werden. Allerdings gibt es die Möglichkeit, sie Bibliotheken oder Archiven zur Speicherung zur Verfügung zu stellen.
iRights.info: Wie können andere die Erkenntnisse dann überprüfen?
Benjamin Raue: Wenn zu erwarten ist, dass die Daten noch überprüft werden müssen, wird man davon ausgehen können, dass Forscher sie solange behalten dürfen – zum Beispiel beim Peer Review für einen Fachaufsatz oder der Überprüfung durch eine Forschungskommission.
Der Gesetzestext lässt es allerdings unbeantwortet, ob später auch Archive oder Bibliotheken diese Daten bereitstellen können. Aus der Gesetzesbegründung ergibt sich aber, dass eine Überprüfung der Erkenntnisse ja gerade ermöglicht werden soll.
Daher muss man das Gesetz aus meiner Sicht so auslegen, dass diese Einrichtungen die Daten anderen Forschern auch zur Verfügung stellen dürfen, etwa über Repositorien.
iRights.info: Auch in Brüssel wird über eine neue Regelung für das Text- und Data-Mining verhandelt. Wie sehen die Pläne dazu aus?
Benjamin Raue: Hier gibt es den Richtlinienentwurf zum „Urheberrecht im digitalen Binnenmarkt“ der EU-Kommission. In Artikel 3 des Entwurfs ist eine neue, europaweit verpflichtende Schrankenregelung zugunsten des Text- und Data-Minings vorgesehen. Auch bei diesem Entwurf ist die Erlaubnis auf die nicht-kommerzielle wissenschaftliche Forschung beschränkt, nur im Detail etwas anders formuliert.
Urheberrechts-Ausnahmen: „Den Ansatz halte ich für richtig“
Zugleich geht der europäische Vorschlag über die deutsche Regelung hinaus. Dem deutschen Gesetz zufolge sind die Rechteinhaber für das Text- und Data-Mining zu vergüten. Im ursprünglichen Entwurf wollte die EU-Kommission das Text- und Data-Mining ausdrücklich vergütungsfrei ermöglichen. Neuere Kompromissvorschläge sehen vor, diese Entscheidung den Mitgliedstaaten zu überlassen.
iRights.info: Wie bewerten Sie die neuen Regelungen?
Benjamin Raue: Den Ansatz, solche klaren Ausnahmeregelungen zu schaffen, halte ich für richtig. Hinter ihnen steht der wichtige urheberrechtliche Grundsatz, dass Sachinformationen als solche nicht geschützt sind. Informationen zu gewinnen, Zusammenhänge zu finden ist keine Tätigkeit, für die das Urheberrecht ein exklusives Verfügungsrecht vorsieht.
Urheber oder Rechteinhaber haben natürlich die Möglichkeit, den Zugang zu ihrem Werk zu kontrollieren. Daran will die Schranke nichts ändern. Wenn sie aber Zugang gewährt haben, können sie über die Verwendung der Information, die in den Daten enthalten ist, nicht mehr verfügen. Der Ansatz der Schrankenregelungen entspricht daher der Forderung aus der Wissenschaft, nach der das „Right to Read“ auch das „Right to Mine“ umfassen muss.
iRights.info: Wie sehen Sie die Löschpflicht für die Daten?
Benjamin Raue: Kritisch daran ist aus meiner Sicht zu bewerten, dass öffentliche Ressourcen mit ihr nicht sinnvoll eingesetzt werden. Gerade in der geisteswissenschaftlichen Forschung werden Forschungsdaten mit hohem Aufwand aufbereitet, um sie zu analysieren. Derselbe Datenkorpus kann dann aber nicht aus anderen Blickwinkeln untersucht werden, etwa von weiteren Forschungsprojekten.
Auf der anderen Seite müssen hier auch die Interessen der Rechteinhaber berücksichtigt werden. Über solche Forschungskorpora dürfen keine „Schattendatenbanken“ entstehen. Aus meiner Sicht wäre aber eine Regelung sinnvoll, nach der ein Forscher, der bereits Zugang zum Ausgangsmaterial hat, auch auf den bereits überarbeiteten Datensatz zugreifen darf.
Wer etwa Zugriff auf das Archiv von „Nature“ oder eine andere Datenbank hat, sollte ein angereichertes Korpus mit diesen Inhalten nutzen dürfen – wer keinen Zugriff hat, eben nicht. Andernfalls besteht die Gefahr, dass die Rechteinhaber nicht mehr an der Nutzung ihres geistigen Eigentums beteiligt würden.
EU-Entwurf ohne kommerzielle Forschung
iRights.info: Kritik macht sich auch an Beschränkungen auf die nicht-kommerzielle Forschung fest. Im Umkehrschluss würden Datenanalysen zu anderen Zwecken eingeschränkt.
Benjamin Raue: Das wird sowohl an der deutschen als auch an der europäischen Schranke kritisiert: Die kommerzielle Forschung ist nicht von ihr umfasst. Den deutschen Gesetzgeber muss ich da allerdings in Schutz nehmen. Durch die europarechtlichen Vorgaben war Deutschland an einer weitergehenden Regelung gehindert.
In der Richtlinie zum „Urheberrecht in der Informationsgesellschaft“ von 2001 sind die möglichen urheberrechtlichen Schranken der Europäischen Union genau vorgegeben. Die Mitgliedstaaten können darüber bislang nicht hinausgehen und etwa das Text- und Data-Mining auch zu kommerziellen Zwecken freistellen.
iRights.info: Von solchen Datenanalysen verspricht man sich enorme wirtschaftliche Vorteile, etwa im Hinblick auf Künstliche Intelligenz. Wäre es da nicht angemessen, wenn man extra zahlen muss?
Benjamin Raue: Man sollte hier differenzieren. Zum einen setzen die deutsche und die geplante europäische Regelung voraus, dass diejenigen, die das Data-Mining durchführen, bereits rechtmäßigen Zugang zu den Daten haben. Sie schaffen keinen neuen Zugang.
Dementsprechend haben Rechteinhaber wie Fachverlage und Datenbankanbieter auch weiterhin die Möglichkeit, den Zugang zu ihren Daten von Zahlungen abhängig zu machen. Sie können es auch in ihrer Preisgestaltung berücksichtigen, dass Text- und Data-Mining mit ihren Daten möglich ist. Daher ist es aus meiner Sicht konsequent, wenn Text- und Data-Mining als solches nicht vergütet werden muss.
Gleichwohl lässt sich argumentieren, dass geschütztes Material beim Text- und Data-Mining intensiver genutzt wird und Rechteinhaber daran beteiligt werden sollten, wenn es zu kommerziellen Zwecken geschieht. Das hielte ich für einen vernünftigen Kompromiss.
iRights.info: Wie ist die Gemengelage? Sehen Sie Chancen für einen solchen Kompromiss?
Benjamin Raue: Die Rechteinhaber, insbesondere die Verlage, wehren sich gegen eine weitergehende Freistellung. Ihnen geht bereits der Richtlinienentwurf der EU-Kommission zu weit. Er sieht ebenso wie das deutsche Gesetz vor, dass die gesetzliche Befugnis sich gegen entgegenstehende vertragliche Verbote durchsetzt. Verlage und andere Informationsanbieter könnten es rechtmäßigen Nutzern also nicht mehr verbieten, Text- und Data-Mining durchzuführen.
Das ist den Verlagen ein Dorn im Auge. Derzeit gibt es Diskussionen, ob der ursprüngliche Kommissions-Entwurf zugunsten der Verlage geändert werden soll. Andererseits ist besonders die IT-Branche sehr interessiert daran, dass auch das kommerzielle Text und Data Mining erlaubt wird.
iRights.info: Welche Regelungen würde die IT-Branche unterstützen?
Benjamin Raue: Ihr geht es nicht so sehr darum, dass das Text- und Data-Mining immer kostenlos erlaubt wird. Die Unternehmen sind durchaus bereit, dafür zu zahlen.
Aus ihrer Sicht ist es wichtiger, dass die Transaktionskosten dabei sinken. Wenn große Datensammlungen analysiert werden sollen, wird es sehr aufwändig, wenn für viele Teilmengen dieser Daten individuelle Verträge mit den jeweiligen Rechteinhabern verhandelt und Erlaubnisse eingeholt werden müssen.
iRights.info: Um das zu vermeiden, gibt es Verwertungsgesellschaften. Wie würde das beim Text- und Data-Mining aussehen?
Benjamin Raue: Ein Unternehmen, das bestimmte Textmengen analysieren will, müsste bei einer entsprechenden Regelung in Deutschland an die VG Wort zahlen. Wenn nicht nur Texte, sondern andere Werke wie Fotos, Musik oder Videos analysiert werden, kämen weitere Verwertungsgesellschaften ins Spiel.
Es wird aber in jedem Fall nicht ganz einfach sein, eine angemessene Tarifstruktur festzulegen. Zudem darf das Ziel, die Transaktionskosten zu senken, nicht durch zu strenge Dokumentationspflichten zunichte gemacht werden.
Wie das Prozedere nach einer künftigen europäischen Regelung aussehen wird, hängt davon ab, wie sie im Detail ausgestaltet sein wird. Die EU-Regelung könnte darauf hinauslaufen, dass zum kommerziellen Text- und Data-Mining individuelle Verhandlungen mit den Rechteinhabern nötig werden. Oder aber die Nutzung wäre wie in Deutschland verwertungsgesellschaftenpflichtig.
iRights.info: Umgekehrt gibt es die Befürchtung, bei einer zu engen Regelung werde die kommerzielle Forschung dorthin abwandern, wo es mehr Befugnisse zur Datenanalyse gibt, etwa in die USA oder Asien.
Benjamin Raue: Ich halte es für eine realistische Gefahr, dass sich Forschungsaktivitäten in Rechtsordnungen verlagern, deren Urheberrecht beim Text und Data Mining großzügiger ist. Für die Qualität solcher Analysen kommt es entscheidend darauf an, was für ein Datenkorpus ihnen zugrunde liegt. Je größer der Aufwand beim Erstellen des Korpus ist, etwa durch Verhandlungen mit unterschiedlichen Rechteinhabern, desto höher sind die Transaktionskosten.
Wenn Unternehmen ihre Forschung als Reaktion darauf in großzügigere Rechtsordnungen verlagern, könnten zwar noch die Ergebnisse nach Deutschland oder die Europäische Union zurückfließen. Das würde aber zu einer Verlagerung von zukunftsorientierten Arbeitsplätzen führen. Zudem würden wir für Erkenntnisse zahlen, die auch hierzulande hätten generiert werden können. Denn die Ergebnisse werden diese Unternehmen meist nicht kostenlos zur Verfügung stellen, sondern entweder direkt verkaufen oder in einen Wettbewerbsvorsprung ummünzen.
Für die Wettbewerbsfähigkeit europäischer Unternehmen und Forschungsabteilungen hat es daher einen sehr hohen Stellenwert, wie Text- und Data-Mining geregelt wird. Daher würde ich es begrüßen, wenn auch das kommerzielle Mining freigestellt würde und im Gegenzug die Rechteinhaber vergütet werden.
Datenjournalismus und Leaks
iRights.info: Lässt sich Text- und Data-Mining überhaupt von alltäglichen Operationen mit Daten abgrenzen? Auch wenn ich zum Beispiel aus den Noten eines Schülers den Durchschnitt berechne, habe ich eine neue Information gewonnen.
Benjamin Raue: Im Kern geht es immer darum, durch statistische Verfahren Zusammenhänge aufzudecken oder Informationen aus diesen Daten zu extrahieren. Auch eine Textsuche in einem Dokument kann man bereits als einfache Text- und Data-Mining-Operation ansehen. Eine komplexere Auswertung wäre etwa, welche Begriffe typischerweise im Zusammenhang stehen.
Stark vereinfachend ließe sich sagen: Sobald man einen Computer zu Hilfe nimmt, geht es um Text- und Data-Mining. Nur wenn ich einen Text allein in meinem Kopf analysiere, ist das urheberrechtlich nicht relevant, weil die „Vervielfältigungen“ in meinem Kopf ja nicht vom Urheberrecht erfasst werden.
iRights.info: Dann wären sehr viele Datenauswertungen von einer Regelung betroffen, etwa Datenjournalismus. Zum Beispiel, wenn ausgezählt wird, wie oft die Wörter „Werden“ und „Wollen“ im aktuellen Koalitionsvertrag vorkommen.
Benjamin Raue: Richtig, aber daran ändern letztlich auch die neuen Schranken nichts. Urheberrechtlich relevant sind die Vervielfältigungen. Das war auch bisher der Fall: Wenn man ein Dokument auf dem Computer abspeichert, ist das urheberrechtlich relevant. Man benötigt entweder eine – gegebenenfalls auch stillschweigend erteilte – Erlaubnis des Rechteinhabers oder muss eine urheberrechtliche Schranke heranziehen können.
iRights.info: Sehen Sie da keine Gefahr für journalistische Arbeit?
Benjamin Raue: Doch, das ist aus meiner Sicht ein weiterer, ganz zentraler Kritikpunkt an der Beschränkung auf die nicht-kommerzielle Forschung. Datenjournalismus und insbesondere die investigative Recherche von Leaks werden von der Ausnahme nicht abgedeckt, obwohl sie im gesellschaftlichen Interesse sind. Hier gebietet aus meiner Sicht die Pressefreiheit eine entsprechende Ausnahme.
Das ist aus meiner Sicht für die Zukunft der Presse ein viel entscheidenderer Punkt als das Leistungsschutzrecht für Presseverleger, das intensiv und leidenschaftlich diskutiert wird. Denn in letzter Zeit kommt es in Mode, durch das Urheberrecht kritische Diskussionen verhindern zu wollen. Ein Beispiel sind die „Afghanistan-Papiere“, bei denen eine Veröffentlichung unter Berufung auf das Urheberrecht verhindert werden soll.
Der Bundesgerichtshof hat jetzt dem Europäischen Gerichtshof die Frage vorgelegt, ob das mit europäischem Urheberrecht vereinbar ist. Es darf meiner Meinung nach aber keinen Unterschied machen, ob Informationen in einem Text enthalten sind, der die niedrige urheberrechtliche Schwelle gerade erreicht oder nicht. Maßgeblich muss das überwiegende öffentliche Interesse sein.
In Europa verweisen gerade die konservativen Parteien gern auf die wirtschaftlichen Chancen durch Datenanalysen. Beim Text- und Data-Mining haben sie sich gegen weitergehende Befugnisse ausgesprochen. Wie kommt das?
Benjamin Raue: Ich möchte da keine Spekulationen anstellen. Aber grundsätzlich lässt sich festhalten, dass die Rechteinhaber unglücklich über solche Schrankenregelungen sind. Diejenigen Anbieter, die besonders wertvolle Datensammlungen besitzen, haben ein starkes Interesse daran, das Ausmaß des Text- und Data-Mining über Lizenzen steuern zu können. Sie würden bei pauschalierten Vergütungen über Verwertungsgesellschaften wahrscheinlich weniger erhalten als bei individuellen Verhandlungen.
Andererseits können sie sich weiter den Zugang zu ihren Datensammlungen vergüten lassen, sie dürfen nur keine Zusatzvergütung für das Mining verlangen. Das darf man bei der ganzen Diskussion nicht vergessen. Trotzdem üben die Rechteinhaber natürlich Druck auf die Politik aus. Im gesellschaftlichen Interesse würde meines Erachtens aber eine Schrankenregelung liegen, weil sie das Informationswachstum insgesamt fördert.
Was sagen Sie dazu?