Datentracking in der Wissenschaft: Wertvoll für die Verlage, gefährlich für die Forschung?
Wir alle hinterlassen Datenspuren, wenn wir im Internet unterwegs sind. Manchen ist es bewusst, vielen egal. Private Firmen sammeln solche Nutzungsdaten, die weit über das technisch erforderliche Maß hinausgehen, führen sie zusammen, werten sie aus und verkaufen sie zu Werbezwecken.
Öffentlich bekannt ist das vor allem bei großen Social-Media-Plattformen. Weniger bekannt ist, dass sich in den letzten Jahren auch Wissenschaftsverlage zunehmend zu Datenkraken verwandelt haben – und dass die „DEAL“-Abkommen zwischen den deutschen Bibliotheken und den Großverlagen Elsevier, Springer Nature und Wiley diese Entwicklung verschärfen dürften.
Dr. Bernhard Mittermaier leitet die Zentralbibliothek am Forschungszentrum Jülich und befasst sich seit längerem mit dem Datentracking in der Wissenschaft und seinen Folgen. Er ist Mitglied in einer Arbeitsgruppe zum Datentracking im Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme (AWBI) der Deutschen Forschungsgemeinschaft (DFG).
Kürzlich veröffentlichten Mittermaier und Kolleg*innen in der Zeitschrift „Recht und Zugang“ einen Bericht. Darin beschäftigen sie sich mit der möglichen datenschutzrechtlichen Mithaftung von Bibliotheken beim Datentracking.
Im Interview mit iRights.info berichtet Mittermaier über den ungezügelten Datenhunger der Wissenschaftsverlage, warum dieser für Forschende und Bibliotheken problematisch ist – und welche Möglichkeiten er sieht, sich zu schützen.
Datentracking in der Wissenschaft: Bernhard Mittermaier im Interview
Herr Mittermaier, Sie beschäftigen sich schon länger mit dem Datentracking in der Wissenschaft: Was verstehen Sie darunter?
Datentracking bedeutet, dass Forschende in digitalen Umgebungen Nutzungsspuren hinterlassen, immer wenn sie einen wissenschaftlichen Artikel lesen. Das ist zunächst normal und auch unvermeidbar. Denn rein technisch muss natürlich die IP-Adresse an den Verlag übermittelt werden, damit das Dokument überhaupt beim richtigen Rechner landet. Und der anbietende Verlag muss, zum Beispiel beim Aufruf eines Aufsatzes einer Zeitschrift, überprüfen, ob die Einrichtung überhaupt berechtigt ist, den Artikel aufzurufen. Dafür muss die Bibliothek die Zeitschrift subskribiert haben oder die Zeitschrift muss beispielsweise Teil des DEAL-Vertrags sein.
Der technische Prozess klingt erstmal nicht besonders verdächtig.
Das Datentracking geht aber weit über technische Notwendigkeiten hinaus. Denn tatsächlich legen Wissenschaftsverlage Informationen über alle Personen an, die Artikel abrufen. Jedenfalls sind sie dazu in der Lage und es gibt viele Hinweise darauf, dass sie das auch tatsächlich tun.
In den Datenschutzrichtlinien des Verlags Frontiers beispielsweise heißt es ganz offen, dass der Verlag solche Profile anlegt. Bei anderen Verlagen kann man etwa anhand der vom Verlag gesetzten Cookies davon ausgehen, dass ein Datentracking stattfindet – weil die Cookies gesetzt werden von Drittanbietern, die diese Services anbieten. Man kennt das aus der sonstigen Internetnutzung. Dort hat Werbung ja einen ganz wichtigen Anteil an der Finanzierung der Angebote. Viele Angebote im Internet sind kostenfrei nutzbar, wenn man als Leser oder Leserin dem Datentracking zustimmt. Und dieses Datentracking ermöglicht dann den Verkauf von Werbeplätzen, die zugeschnitten sind auf den jeweiligen Nutzer oder die Nutzerin. Solche Plätze sind einfach wesentlich besser monetarisierbar, als wenn die Werbung ins Blaue ginge. Wenn ich beispielsweise Spiegel Online nutzen möchte, ohne ein Abonnement zu haben, dann muss ich zustimmen, dass Datentracking erfolgt. Ich bezahle also den freien Zugang letztlich mit meinen Daten.
„Was die nächsten Forschungsgebiete eines bestimmen renommierten Forschers sind, das ist eine sehr interessante Information“, so Mittermaier.
Welche Wissenschaftsverlage tracken das Verhalten der Nutzer und Nutzerinnen eigentlich?
Wir können davon ausgehen, dass die großen internationalen Verlage alle Datentracking betreiben. Sicherlich in unterschiedlichem Ausmaß, aber sie tun es alle. Ich mache da keinen Unterschied zwischen den klassischen Verlagen der DEAL-Verträge, also Elsevier, Springer Nature und Wiley – und den Open-Access-Verlagen wie Frontiers.
Auch MDPI ist ein schönes Beispiel. Es gibt die sogenannten „Essential Cookies“. Das sind Cookies, die (angeblich) zwingend notwendig sind, um den Dienst überhaupt zu erbringen. Und um die kommt man auch nicht herum, wenn man in den Cookie-Bannern der Cookie-Platzierung nicht zustimmt. Essential Cookies werden also immer gesetzt – aber jetzt kommt’s: MDPI setzt ein Essential Cookie zu LinkedIn. Es kann mir kein Mensch erzählen, dass ein Cookie für LinkedIn notwendig ist, damit ich einen Text von MDPI lesen kann. Das kann gar nicht sein. Die machen das aber.
Man muss also davon ausgehen, dass alle Verlage tracken?
Ich habe in einer Untersuchung, die über die Publikation in Recht und Zugang hinausgeht und die demnächst erscheint, weitere Verlage analysiert. Ich habe lediglich zwei Verlage gefunden, die kein Datentracking betreiben. Zumindest gehe ich bei diesen beiden davon aus, dass sie Cookies nur in dem Umfang verwenden, der auch technisch wirklich notwendig ist. Und ich bin sicher, dass diese beiden auch keinen Datentransfer in andere Länder betreiben. Das ist ein philosophischer Verlag aus Deutschland und ein philosophischer Verlag aus den USA. Diese beiden also die große Ausnahme. Die anderen untersuchten Verlage betreiben Datentracking.
Warum halten Sie das Datentracking in der Wissenschaft für problematisch?
Im Fall von wissenschaftlichen Publikationen sind einige Besonderheiten zu beachten. Zum einen wurden diese wissenschaftlichen Publikationen bereits von den Bibliotheken bezahlt. Man zahlt hier also ein zweites Mal, wenn man noch zusätzlich seine Daten herausgibt.
Und der andere Punkt ist: Die Nutzung von Spiegel Online etc. ist ja eine höchst freiwillige Angelegenheit. Das muss man nicht machen. Wissenschaftlerinnen und Wissenschaftler sind dagegen darauf angewiesen, dass sie wissenschaftliche Artikel lesen – das ist Bestandteil ihrer Arbeit. Und wissenschaftliche Artikel sind nicht gegenseitig austauschbar. Oftmals müssen Sie als Forscher einen ganz bestimmten Artikel lesen, den es nur bei einem ganz bestimmten Verlag gibt. Und Sie sind dann, wenn dieser Verlag Datentracking durchführt, auf Gedeih oder Verderb darauf angewiesen, ihre Daten abzugeben, um diesen beruflich notwendigen Artikel lesen zu können. Und da bin ich der Meinung, dass das nicht geht.
Gefahr durch Militär- und Industrie-Spionage mittels Datentracking?
Sie meinen: Die Daten, welche Forscherin welche Texte liest, sollten nicht von privaten Unternehmen abgeschöpft werden?
Es gab und gibt in der Vergangenheit immer mal wieder Probleme, die Wissenschaftlerinnen bekommen, wenn andere erfahren, was sie erforschen. Jetzt gehe ich mal weit zurück in der Geschichte. Wer beispielsweise im Dritten Reich Sexualforschung betrieben hat – bekannt ist hier etwa der Name Magnus Hirschfeld – der bekam Schwierigkeiten. Für Bibliotheken ist das ein wichtiges Thema, dass sie die Daten, wer was liest, nicht herausgeben: Sei es Das Kommunistische Manifest, sei es queere Literatur, und so weiter. Bibliotheken dürfen selbst auch andere Nutzungsdaten (Wer hat welches Buch ausgeliehen?) nur im notwendigen Umfang speichern. Und notwendig heißt: Eben nur so lange, bis die nächste Ausleihe erfolgt. Spätestens dann muss die Bibliothek solche Daten löschen.
Im Fall elektronischer Literatur sind Verlage technisch definitiv in der Lage, solche sensiblen Daten zu speichern, zu welchem Zweck auch immer zu verarbeiten, zu aggregieren und zusammenzuführen. Dabei kommt ein weiteres Problem zum Tragen: Was die nächsten Forschungsgebiete eines bestimmen renommierten Forschers sind, das ist eine sehr interessante Information. Nur wie erfahre ich das, bevor der Mann publiziert hat? Indem ich analysiere, was der Forscher liest! Denn da, wo er liest, in diesem Gebiet wird er auch in Zukunft publizieren. Und es wäre auf jeden Fall interessant herauszufinden, wo Spitzenforscherinnen und Arbeitsgruppen bei der Recherche hingehen.
Besteht ihrer Meinung auch die Gefahr, dass Daten aus wissenschaftlichen Bereichen abfließen, die nahe an Militär oder Industrie arbeiten?
Ganz genau. Nehmen Sie zum Beispiel die „Seven Sons“ in China. Das sind Universitäten, die sehr nah an der Volksbefreiungsarmee (Streitkräfte der Volksrepublik China, Anm. d. Red.) arbeiten und die das dortige Militär finanziert. Für ausländische Geheimdienste ist es durchaus interessant zu erfahren, was dort geforscht wird. Denn man kann davon ausgehen: Das, was da beforscht wird, das ist die neue Militärtechnologie Chinas. Jetzt könnten wir im Westen natürlich begrüßen, wenn wir hier erfahren, was China an neuer Militärtechnologie entwickelt. Umgekehrt machen das die Chinesen natürlich auch. In China versucht man genauso herauszufinden, was bei uns entwickelt wird. Ich bin jedenfalls summa summarum der Ansicht, dass Wissenschaft frei agieren und die Möglichkeit haben soll, zu forschen, ohne dass jemand drauf guckt und damit irgendwelche sinistren Zwecke verfolgt.
Können sich Forschende und Bibliotheken davor schützen, durch Datentracking ausgeforscht zu werden?
Sehr schwer. Ich nenne drei Punkte. Es gibt zum Beispiel kleine Ansätze, die Wissenschaftlerinnen selbst machen können, um möglichst datensparsam zu sein. Sie können etwa bei Cookie-Bannern nur auf „Essential Cookies“ klicken. Sonstige Vorsichtsmaßnahmen, wie beispielsweise Adblocker im Browser zu benutzen oder ähnliches, können auch helfen. Außerdem kann man Cookies nach jeder Session löschen lassen. Das ist eine feste Einstellung, die man im Browser vornehmen kann.
Ein zweiter Punkt ist, dass wir Bibliotheken versuchen, in Vertragsverhandlungen das Thema Datenschutz in die Lizenzvereinbarungen mit aufzunehmen. Daran bin ich auch beteiligt, das ist aber ein ganz dickes Brett. Wir haben das jetzt bei DEAL erstmals versucht. Das Ergebnis ist zumindest besser als nichts. Es ist aber weit weg von dem, was man sich so wünschen würde.
Und der dritte Punkt ist, dass jemand mal gegen ein vermeintlich illegales Vorgehen klagt. Kürzlich hat Björn Brembs zusammen mit der Gesellschaft für Freiheitsrechte gegen drei Verlage eine Beschwerde eingereicht (iRights.info berichtete, Anm. d. Red). Diese Beschwerde ging an die Datenschutzbeauftragten von Baden-Württemberg und Bayern. Ich bin sehr gespannt, was dabei rauskommen wird.
Herr Mittermaier, vielen Dank für das Gespräch!
Die Fragen stellte Georg Fischer.
Sie möchten iRights.info unterstützen?
iRights.info informiert und erklärt rund um das Thema „Urheberrecht und Kreativität in der digitalen Welt“. Alle Texte erscheinen kostenlos und offen lizenziert.
Wenn Sie mögen, können Sie uns über die gemeinnützige Spendenplattform Betterplace unterstützen und dafür eine Spendenbescheinigung erhalten. Betterplace akzeptiert PayPal, Bankeinzug, Kreditkarte, paydirekt oder Überweisung.
Besonders freuen wir uns über einen regelmäßigen Beitrag, beispielsweise als monatlicher Dauerauftrag. Für Ihre Unterstützung dankt Ihnen herzlich der gemeinnützige iRights e.V.!
DOI für diesen Text: https://doi.org/10.59350/n6npd-sqp52 · automatische DOI-Vergabe für Blogs über The Rogue Scholar
Was sagen Sie dazu?