Matomo Analytics unter der Lupe: Wie datenintensiv die drei Tracking-Varianten im Vergleich sind
Als Alternative zum Branchenriesen Google Analytics bietet Matomo Website-Betreibern ein vielseitiges Tool zur Datenanalyse: Von detaillierten Besucher-Profilen bis hin zu fortgeschrittenen Metriken, wie der Verweildauer, Conversions oder dem Standort, lässt Matomo kaum Wünsche offen.
Allerdings birgt diese Funktionsvielfalt Probleme beim Datenschutz. Matomo preist sich als datenschutzfreundlichere Alternative zu Google Analytics. Eine Aussage, die zumindest im Kern stimmt. Und doch gilt es einiges dabei zu beachten. Einerseits ist wahrscheinlich nur wenigen Website-Betreibern bewusst, wie viele Daten der Dienst tatsächlich im Hintergrund mitschneidet. Und andererseits lässt sich der Datenhunger durch zahlreiche Einstellungen in Matomo konfigurieren.
Um zu verstehen, wie genau Matomo Daten sammelt und verarbeitet, haben wir das Programm zum Vergleich in drei Varianten konfiguriert:
- Voll aufgedreht: Volle Funktionsvielfalt, aber auch größter Datenhunger
- Mit gezügeltem Appetit: Tracking ohne Cookies
- Datensparsam nur mit https-Logs
Wie Matomo in diesen drei Varianten funktioniert, ist in den folgenden Abschnitte genauer erklärt. Eine Einführung in die Webanalyse mit Matomo gibt es hier:
Matomo-Praxisbericht: Wie sich das offene Webanalyse-Tool in der Anwendung macht
Mit Matomo lassen sich Nutzungsdaten für Websiten erheben und auswerten. Wie ist die offen lizenzierte Software zu installieren? Und wie schlägt sie sich im Alltag, auch im Vergleich mit dem Angebot des Branchenriesen Google? Das hat sich Alexander Baetz genauer angesehen. » mehr
Variante 1: Voll aufgedreht – volle Funktionsvielfalt, aber auch größter Datenhunger
Cookies sind vermutlich die am meisten verbreitete Form des Website-Trackings. Der Grund dafür ist denkbar einfach: Technisch gesehen lassen sie sich relativ einfach implementieren. Beim ersten Besuch einer Website wird eine kleine Datei – der sogenannte Cookie – im Browser der Nutzerin gespeichert. Wie das Verfahren genau funktioniert, ist hier beschrieben. Über den Cookie lässt sich die Nutzerin dank einer einzigartigen Kennnummer (ID) zu jeder späteren Zeit wiedererkennen.
Auch Matomo ist standardmäßig mit dem Tracking per Cookies ausgestattet. Für Menschen, die weniger Erfahrung im Online-Marketing oder Webanalyse haben, kann sich das etwas kompliziert anhören. Daher haben wir uns dafür entschieden, die unterschiedlichen Funktionalitäten von Matomo mithilfe der Benutzerprofile darzustellen. Hier werden sämtliche Daten zu einem einzelnen Nutzer zusammengefasst und können über einen Klick auf die Nutzer-ID eingesehen werden.
Auf dem obigen Screenshot lässt sich schnell erkennen, dass Matomo neben den besuchten Seiten noch einige Daten mehr von jeder Besucherin abspeichert. So sind beispielsweise unter der ID der Standort (Deutschland), das Betriebssystem (Mac 10.15), der Browser (Chrome 114.0) und selbst die Display-Auflösung (1728×1117) zu sehen. Darunter werden die Besuche zusammengefasst. Hier kann beispielsweise eingesehen werden, dass ein Ziel „konvertiert“ ist. Bei einer solchen conversion kann es sich etwa um eine Kontaktaufnahme, ein Newsletter-Abo oder eine ähnliche Aktion handeln. Darunter ist der erste Besuch der Nutzerin zu sehen, der in diesem Fall am 11. Juli 2023 stattgefunden hat.
Neben diesen Daten kann der Webmaster außerdem die Historie der Nutzerin einsehen. Die Historie wird in verschiedene Besuche (auf Englisch: visits) eingeteilt. Standardmäßig wird eine besuchte Unterseite als neuer Besuch abgespeichert, wenn mindestens 30 Minuten zum vorherigen Besuch verstrichen sind.
In dem Beispiel können wir neben diesen besuchten Unterseiten und den Besuchen zudem das Datum (inklusive Uhrzeit des Besuchs) sowie die Dauer des Besuchs einsehen. Darüber hinaus sind ebenfalls alle besuchten Unterseiten und die geklickten Links zu externen Webseiten zu sehen.
Darüber hinaus kann jeder Nutzerin pro Besuch ein neuer Standort zugewiesen werden. So lässt sich beispielsweise über einen längeren Zeitraum nachverfolgen, ob sich Kund*innen auf Geschäftsreisen befinden oder aus anderen Gründen häufig ihren Standort wechseln. Um dies zu simulieren, verwendeten wir in unserem Test ein VPN (virtuelles privates Netzwerk), um Matomo eine andere IP-Adresse vorzutäuschen. Fälschlicherweise zeigte Matomo in beiden Fällen einen deutschen Standort an, obwohl wir bei unserem zweiten Besuch mit einer US-amerikanischen IP-Adresse auf die Website zugriffen.
Auch wenn sich diese Besucherprofile sehr gut für die Verdeutlichung der gesammelten Informationen eignen, sind sie in der Praxis in der Regel weniger relevant als die aggregierten Daten aller Nutzer*innen aus einem bestimmten Zeitraum. Mit diesen lassen sich bessere Entscheidungen treffen, da nicht mehr einzelne Besucher analysiert werden, sondern von allen Besuchern die durchschnittlichen Werte ermittelt werden.
So können wir beispielsweise einsehen, dass 92,2 % der iRights.info-Besucher*innen aus Deutschland kommen, der Großteil der Nutzer Google Chrome verwendet und dass die meisten Besuche vor beziehungsweise nach der Mittagspause (um 11:00 und 13:00) stattfinden. Allerdings sei an dieser Stelle angemerkt, dass sich diese Informationen ebenfalls mit der zweiten Variante einsammeln lassen, auf die wir nun im folgenden Abschnitt einen genaueren Blick werfen.
Variante 2: Mit gezügeltem Appetit – Tracking ohne Cookies
Standardmäßig läuft das Tracking in Matomo mit Cookies (siehe erster Abschnitt). Dieses lässt sich einfach in den Einstellungen im Menü Privatsphäre → Daten anonymisieren über den Punkt „Tracking ohne Cookies erzwingen“ abschalten.
Unserer Erwartung nach dürfte jetzt eigentlich nichts mehr in Matomo funktionieren. Schließlich muss man dem Tracking durch Cookies auf fast jeder Website zustimmen. Dann kann ein vernünftiges Tracking ohne Cookies doch nicht möglich sein. Oder?
Tatsächlich war in unserem Praxistest genau das Gegenteil der Fall, wir konnten in unserer Datengrundlage fast keine Unterschiede gegenüber dem Tracking mit Cookies feststellen. Sowohl die vollständigen Benutzerprofile als auch Conversions, Standorte, Browser und lokale Besuchszeiten konnten wir weiterhin auswerten. Warum ist das Tracking ohne Cookies also nicht von Anfang an eingestellt? Gibt es überhaupt einen Nachteil zur Analyse mit Cookies?
Die Antwort ist technischer Natur: Beim Tracken ohne Cookies setzt Matomo auf sogenanntes Browser Fingerprinting, um die Website-Zugriffe voneinander zu unterscheiden und einzelnen Nutzern zuzuordnen. Im Gegensatz zu anderen Marketing-Tools erstellt Matomo einen sehr minimalistischen digitalen Fingerabdruck, der „lediglich“ aus der einzigartigen Kombination des Betriebssystems, des Browsers, der installierten Browser-Plugins, der Browser-Sprachen und der IP-Adresse der Nutzerin generiert wird.
Aus diesem Grund können einzigartige Nutzer*innen maximal für 24 Stunden auf der Website wiedererkannt werden. Ganz im Gegenteil zum Tracking mit Cookies: Hier kann die Aktivität eines individuellen Benutzers in der standardmäßigen Einstellung satte 13 Monate lang analysiert werden.
Gerade für Webseiten, die öfters von den gleichen Besucher*innen angesteuert werden, kann das große Fragezeichen bei der Analyse hinterlassen. Ein – zugespitztes Beispiel – soll das verdeutlichen: Nehmen wir an, eine Website wird jeden Monat 10.000 Mal aufgerufen. Stammen diese 10.000 Aufrufe von unterschiedlichen Personen, die jeweils eine Seite ansurfen? Oder handelt es sich vielleicht um 2.000 Personen, die sich fünfmal im Monat jeweils eine Seite ansehen? Beide Schlussfolgerungen sind auf dieser Datengrundlage möglich.
Auch für viele Betreiber von Online-Shops dürften die Informationen zu wiederkehrenden Besucher*innen von Bedeutung sein. Angenommen eine Besucherin kommt über Google auf die Startseite, navigiert von dort zu einem Produkt und kauft dieses direkt. War das eine „kalte“ Kundin, die vorher noch nie Kontakt zu Ihrer Website hatte? Oder ist sie vielleicht über den Newsletter angemeldet und recherchiert bereits seit 2 Monaten nach dem richtigen Produkt im Shop?
Trotzdem sind das in der Regel fortgeschrittene Einsatzzwecke des Web-Trackings, die eher für die Minderheit der Website-Betreiber interessant sein dürften. Die meisten Firmenwebsites, Blogs, etc. dürfte die Datengrundlage des Cookie-losen Trackings mehr als ausreichen. Ob es die fortgeschrittenen Funktionen aus dem Tracking mit Cookies braucht, muss man allerdings im Einzelfall entscheiden.
Variante 3: Datensparsam nur mit https-Logs
Als dritte Variante unseres Praxistests entschieden wir uns für die datensparsamste Möglichkeit, um Matomo einzusetzen: die Verwendung von http-Logs. Grob zusammengefasst nutzt Matomo dafür Informationen, die aus technischen Gründen bei allen Servern anfallen. Diese Server-Logs können dann automatisiert oder manuell in Matomo importiert werden.
Allerdings gestaltet sich dieser Vorgang deutlich komplizierter als der Wechsel vom Cookie-basierten Tracking (Variante 1) auf das Tracking per Fingerprinting (Variante 2), als lediglich das Klicken eines Buttons nötig war. In der Knowledge Base von Matomo gibt es zwar einige Informationen zum Tracking mit Server-Logs, allerdings sucht man hier nach einer detaillierten Schritt-für-Schritt-Anleitung vergeblich. Deshalb orientierten wir uns an einer hilfreichen Anleitung von gaminghouse.community, wo die Einrichtung detailliert beschrieben wird. Hier ist allerdings deutlich mehr technisches Vorwissen gefragt und da tief ins System eingegriffen wird, sollte die Umstellung nur von einem erfahrenen Webmaster durchgeführt werden.
Beim Server-seitigen Tracking fiel uns sofort der deutliche Anstieg an Besucher*innen auf. Dieser war teilweise zwei bis viermal so hoch (verglichen mit Variante 1) und hielt über Wochen an. Das macht es sehr unwahrscheinlich, dass die Vervielfachung der Besucher*innen-Zahlen auf einen derart plötzlichen Popularitätsanstieg zurückzuführen ist. Deshalb müssen wir davon ausgehen, dass das Tracking per http-Logs andere Ergebnisse erzielt als das Tracking der ersten beiden Varianten. Unsere Ansicht nach ist das auf zwei Gründe zurückzuführen:
- Weniger Daten: Beim Tracking mithilfe der Server-Logs besteht eine noch schlechtere Datengrundlage als beim Tracking mithilfe des Browser-Fingerprintings. Daher kann es sein, dass viele Seitenzugriffe, die eigentlich zu einer einzigen Besucherin gehören, mehreren zugeordnet werden. Außerdem könnten einzelne Zugriffe mehrfach gewertet werden.
- Bot-Traffic: Laut dem Serveranbieter Cloudflare besteht 40 % des Internet-Traffics aus Bot-Traffic. Diese automatisierten Zugriffe, wie beispielsweise über das Crawling (etwa von Google), können beim Tracking per Server-Logs schlechter herausgefiltert werden und sind daher ein weiterer wahrscheinlicher Grund für hohe Abrufzahlen.
Fazit
Eine wichtige Diskrepanz ist uns beim Durchprobieren der drei verschiedenen Technologien aufgefallen: Während sich die gesammelten Nutzungsdaten von Variante 1 bis 3 immer weiter verringern, verhält es sich mit Kontrolle für die Nutzer*innen genau anders herum.
So kann Matomo beim Tracking mit Cookies zwar die genauesten Daten sammeln. Allerdings können Nutzer*innen diese einfach löschen oder blockieren, was sich auch viele Tracking-Blocker wie etwa uBlock Origin zunutze machen.
Beim Tracking per Fingerprinting sieht es hingegen schon anders aus: Hier greifen zwar die meisten Blocker ebenfalls, allerdings sind sie weniger zuverlässig und verlassen sich in der Regel lediglich auf die Namensgebung von verschiedenen Dateien, wie zum Beispiel matomo.js oder matomo.php.
Das Tracking per Server-Logs sammelt zwar die wenigsten Daten. Allerdings können sich Nutzer*innen hier nicht gegen das Tracking zu wehren. Schließlich fallen ihre Daten an, sobald sie auf die Website zugreifen.
Wenig überraschend fällt auch das Fazit für Betreiber von Websites aus: Variante 3 mag die datensparsamste sein. Sie ist zugleich aber auch die unbrauchbarste für Webanalyse-Praxis, da zuviel unerwünschter Beifang (Bot-Traffic) mit ins Netz geht.
Hinweise: Auch iRights.info nutzt Matomo zur Analyse von Nutzungsdaten. Sofern nicht anders angegeben, beziehen sich die Screenshots in diesem Artikel auf Matomo und die Website iRights.info.
Sie möchten iRights.info unterstützen?
iRights.info informiert und erklärt rund um das Thema „Urheberrecht und Kreativität in der digitalen Welt“. Alle Texte erscheinen kostenlos und offen lizenziert.
Wenn Sie mögen, können Sie uns über die gemeinnützige Spendenplattform Betterplace unterstützen und dafür eine Spendenbescheinigung erhalten. Betterplace akzeptiert PayPal, Bankeinzug, Kreditkarte, paydirekt oder Überweisung.
Besonders freuen wir uns über einen regelmäßigen Beitrag, beispielsweise als monatlicher Dauerauftrag. Für Ihre Unterstützung dankt Ihnen herzlich der gemeinnützige iRights e.V.!
DOI für diesen Text: doi.org/10.59350/b7q1e-k0s1 · automatische DOI-Vergabe für Blogs über The Rogue Scholar
1 Kommentar
1 Hyper am 19. September, 2023 um 09:24
Nach unserer Erfahrung steigen die gemessenen Zugriffszahlen bei Cookie-freiem Tracking auch deshalb erheblich an, weil tatsächlich alle Besucher erfasst werden. Der im Fazit des Artikels nur am Rande erwähnte Effekt von Tracking-Blockern hat schon einen nennenswerten Anteil. Und während man auf die Zugriffe, die durch Crawler entstehen, als Website-Betreiber vielleicht verzichten kann (wobei sie ja immerhin den Erfolg der eigenen SEO-Maßnahmen widerspiegeln), wüsste man die Anzahl der Besucher, die das Tracking per Blocker oder Klick im Cookie-Banner unterbinden, ja schon gerne. Insofern kann man darüber nachdenken, die http-Logs zumindest parallel auszuwerten, wenn einen die wirklichen Besucherzahlen interessieren.
Was sagen Sie dazu?