Höhe des Datenverlusts bewusst machen, messen und ausgleichen

Bei der Messung von Webanalysedaten ist ein vollumfänglicher Datenerhalt aufgrund von Adblockern oder bestimmten Browsern nicht möglich oder nur mit höherem Aufwand zu umgehen. Auch wenn dies weitgehend bekannt ist, ist die Höhe des Datenverlustes und die Auswirkungen auf die KPIs bis dato für die meisten eine unbekannte Größe.

Die Geschichte

TAG MANAGER VS. HARDGECODETES SETUP

Bei der Messung von Webanalysedaten ist ein vollumfänglicher Datenerhalt aufgrund von Adblockern oder bestimmten Browsern nicht möglich oder nur mit höherem Aufwand zu umgehen. Auch wenn dies weitgehend bekannt ist, ist die Höhe des Datenverlustes und die Auswirkungen auf die KPIs bis dato für die meisten eine unbekannte Größe. Je nach Kampagnenvolumen kann der obligatorische Datenverlust jedoch signifikante Einbußen für den Advertiser oder Shopbetreiber bedeuten, sodass eine Messung des Datenverlustes sowie die Einleitung adäquater gegensteuernder Maßnahmen sinnvoll sind.

Zur Messung der Webanalysedaten ist jeweils eins der folgenden drei Setups üblich:
1. Das „hardgecodete“ Setup, wobei ein Analytics-Code direkt in die Website eingebaut wird.
2. Das Tag Manager-Setup, wobei ein Tag Manager verwendet wird, der einen Analytics-Code anwendet.
3. Das serverseitige Setup, das Pixel nicht über den Browser des Nutzers, sondern der Server alle relevanten Daten zusammenstellt und das Pixel ohne Umwege oder mögliche Verluste durch Browser
oder Browser-Plugins feuert. Dieses Setup hat aus datenschutzrechtlichen Gründen jedoch keine Relevanz.

Alle Setups ermöglichen einzeln betrachtet jedoch keine lückenlose Datenanalyse. Daraus ergibt sich zum einen die Frage, ob es eine anwendbare Lösung gibt, die den Verlust ausgleichen kann und zum anderen ob es für verschiedene Personengruppen unterschiedliche Lösungen gibt.

Das Ziel

AUSGLEICH DES DATENVERLUSTS

Das Ziel des Tests war es, herauszufinden, welches Setup für welchen Player, wie zum Beispiel den Advertiser, Kampagnenmanager oder BI-Analyst, am besten geeignet ist, um daraus eine entsprechende,
individuelle Empfehlung ableiten zu können. Trotz einer geringeren Datenmenge sollte eine Lösung gefunden werden, die kein verfälschtes Bild über das Nutzerverhalten darstellt, oder alternativ eine Möglichkeit gefunden werden, den Datenverlust auszugleichen.

  • <100%

    DER DATENMENGE (HITS/AUFRUFE DER WBESEITE) MESSBAR

  • +50%

    ANSTIEG DER HITS

  • 20-50%

    KALKULIERTER DATENVERLUST

Ohne das Bewusstsein, dass die auf herkömmlichem Weg gemessenen Daten nicht vollständig sind, ist eine Webanalyse immer verfälscht. Die Anzahl an nicht gemessenen Browsern, Sessions und Aktionen wird mit der zunehmenden Anzahl an Plugins und Browsern, wie Safari, die das Tracking verhindern beziehungsweise einschränken, immer größer. Durch Berücksichtigung des Datenschutzes wird zusätzlich die Anzahl der gemessenen Daten verringert und/oder eingeschränkt. Sind diese Umstände bekannt, können auch die richtigen Rückschlüsse getroffen und der Datenverlust ausgeglichen werden.

CHRISTIAN STANKE, SENIOR DIGITAL STRATEGIST BEI EPROFESSIONAL
Die Vorgehensweise

DEN DATENVERLUST MESSBAR MACHEN

Um die Höhe des Datenverlustes besser einschätzen zu können, wurden Webanalysedaten über das hardgecodete Setup mit dem Tag Manager verglichen. Die erste Messung ergab einen Unterschied von drei bis zehn Prozent mehr Sessions (= Website-Besuche) bei dem hardgecodeten Setup im Vergleich zum TagManager. Um einen Vergleich zu erstellen, haben wir drei Versuchsanordnungen implementiert.In eine Webseite wurde der Analytics-Code direkt eingebaut (=„hardgecodetes“ Setup). Zusätzlich wurde ein Tag Manager verwendet, der den gleichen Analytics-Code verwendet und die Daten in eine weitere Property (= Datenbank) sendet (= Tag Manager-Setup).Zur Messung der Daten, die zum Beispiel von Adblockern gefiltert/geblockt werden und normalerweise verloren gingen, wurde ein weiteres Script auf der Webseite eingebunden, das einen Impuls an eine weitere Kontrolldatenbank sendet, sobald die Messung durch die genannten Setups nicht ausgelöst wurde.Durch die zusätzliche Messung über das Script konnten die restlichen 33 Prozent Datenmenge messbar gemacht werden. Die Differenz von komplett geblockten Analysescripten zu normalen Messung fiel deutlich höher aus. Der Unterschied betrug bis zu einem Drittel (Gesamt-Traffic = 100 Prozent, gemessen 66 Prozent und geblockt 33 Prozent).Die Testmessung ergab im Verhältnis von hardgecodetem Setup zum Tag Manager eine Differenz von drei bis zehn Prozent. Die Höhe der Differenz ist jedoch abhängig von der Webseite, Branche und Zielgruppe. Ein Zusammenhang zwischen Branchen und Differenzen in den Messungen wurde nicht untersucht.Weiterhin fällt auf, dass beide Varianten Abweichungen in der Messung enthalten. Es ist also nicht sichergestellt, dass eine der beiden Varianten immer auslöst. Auch dieser Unterschied kann zu falschen Analyseergebnissen führen.Festzustellen ist, dass die Option der serverseitigen Messung die zuverlässigsten Ergebnisse liefert, aber gemäß der DSGVO das Optout für die Nutzer zusätzlich auf der Webseite eingebunden werdenmuss, da die vom Analytics-Anbieter zur Verfügung gestellten Tools oder Browser-PlugIns nicht greifen.Um die Analyse zu verfeinern, haben wir im nächsten Schritt verschiedene KPIs verglichen:

/ Zeitaufwand
/ Kosten
/ Reaktivität
/ Höhe des Datenverlusts
   / in Euro
   / in Sessions
   / in Kampagnendaten

Bei Nutzung eines Tag Managers zählen zu den Vorteilen unter anderem die Reaktivität und Flexibilität, die für die anderen Varianten nicht gegeben sind. Daraus folgt auch, dass die Kosten für den Tag Manager meist geringer sind, sich dann aber aus Tool- und Personalkosten zusammensetzen.
Betrachtet man die Höhe des Datenverlustes, ist dieser konkret zu beziffern in Umsätzen und Kampagnendaten, die nicht gemessen wurden. Als erster Anhaltspunkt für einen Datenverlust kann im Allgemeinen ein Vergleich der Umsätze zwischen Warenwirtschaftssystem und Analytics dienen. Ist der Unterschied gravierend, sollte ein Weg gefunden werden, den Verlust auszugleichen.

Die Lösung

DIE MESSMETHODE IN ABHÄNGIGKEIT DER ZIELGRUPPE WÄHLEN

Eine generelle Empfehlung kann es aufgrund der Vielfalt an vorhandenen und möglichen Messmethoden und Webseiten nicht geben. Daher ist eine Empfehlung je nach Zielgruppe, die in unserem Fall in Programmierer, Kampagnenmanager, Shopowner, BI-Analyst/Data Scientist unterteilt ist, sinnvoll:

Aus Sicht eines Programmierers:
Als Programmierer gilt es, den Aufwand zur Implementierung der Webanalyse ohne Tag Manager gegenüber der Version mit Tag Manager abzuwägen. Mögliche zusätzliche Kosten für den Tag Manager und der im allgemeinen geringere Aufwand bei der Variante mit Tag Manager sind als Summe direkt vergleichbar mit den Kosten für die Variante ohne Tag Manager.
Der Programmierer ist nach Analyse des Verlustes in der Lage, sich für die verlustärmste Variante zu entscheiden. Über ein Proof of Concept kann zum Beispiel ein weiterer Tag Manager geprüft werden, der Reaktivität und Datenschutz bietet, aber auch serverseitiges Tracking. So kann durch Wechsel des Tag Managers mit Umgehung der üblichen Scrum-Schleifen der Webseitenentwickler das Analytics-Script eingebaut werden. Ist das nicht möglich, bieten die Webseitenentwickler mindestens die Möglichkeit, hardgecodetes oder serverseitiges Tracking einzubauen.

Aus Sicht eines BI-Analysten:
Grundsätzlich ist auch der Analyst an die Vollständigkeit der Zahlen gebunden. Über Hochrechnungen(Data Science) besteht die Möglichkeit, die verlorenen Daten hochzurechnen und wieder nutzbar zu
machen. Voraussetzung hier ist ein bestehendes Modell, das die gemessenen Daten und den Verlust beschreibt. Das Modell kann über ein zeitlich begrenztes, serverseitiges Tracking ermittelt werden, muss aber auch in regelmäßigen Abständen neu definiert werden. Auf Grundlage des Modells können zum Beispiel nicht erfasste Conversions, Stornierungen und Retouren aus dem Warenwirtschaftssystem mit einbezogen werden und auch Kampagnenkanälen zugeordnet werden.

Lösung für Kampagnenmanager & Shopowner:
Hier lautet die eindeutige Empfehlung, eine Mischimplementierung durchzuführen. Auf der Landingpage und auf der Bestellbestätigungsseite ist es empfehlenswert, die Messung serverseitig auszulösen und die restlichen Seiten über den Tag Manager zu messen. Das garantiert für Kampagnen und Umsätze eine fast 100-Prozent-Messung. Das Gros der Seiten wird weiterhin über einen Tag Manager gemessen, der dann Flexibilität und einen hohen Anteil an Messdaten garantiert.

Der Erfolg

100 PROZENT DATENERHALT

Den Verlust durch Softwarelösungen wettmachen, sodass der Verlust ausgeglichen wird. Alle Daten, die nicht durch die Webanalyse ermittelt wurden, werden durch einen BI-Analysten/Data Scientist aufbereitet und über eine verlässliche Hochrechnung wieder nutzbar gemacht.

Da im Normalfall einem Onlinemarketing Manager diese Umgebung sowie die Ressourcen zur Ermittlung der Daten nicht zur Verfügung stehen, stellt DataScientist dem Shopowner und dem Kampagnenmanager seine Ergebnisse in einem Report oder Dashboard zur Verfügung. Dieses wird als Single Point of Truth dann für Analyse und Optimierungen genutzt.

Die Mischimplementierung führt zu einem höheren Anteil an Sessions, die gemessen werden: Es werden nicht nur 90 Prozent, sondern 100 Prozent gemessen. Der Fokus der Messung liegt dabei nicht auf der gesamten Webseite, sondern auf wichtigen Bestandteilen, wie Landingpages und Bestellbestätigungsseiten.

DER TESTLAUF

DASHBOARD ZUM VERGLEICH DER VERSCHIEDENEN SETUPS

Das Dashboard (s.u.) zeigt zusammenfassend alle gemessenen Webseitenbesuche. Die Differenz von Tag Manager zu hardgecodetem Setup ergibt sich aus der Gesamtsumme sowie aus der Differenz innerhalb der Stunden. Insgesamt wurden in den Zeiträumen zum Teil unterschiedlich viele Sessions gemessen. Über den Tag verteilt kommt es so zu einer Summe von 110 Sessions über beide Setups hinweg. Die serverseitige Implementierung feuert dann, wenn keines der beiden ersten Setups greift. Am Ende des Tages wurden hier über 160 Sessions durch die verschiedenen Methoden gemessen. Einzeln pro Setup nur zwischen 30% und 65%.

Das Fazit

DEN DATENVERLUST BEWUSST MACHEN UND NICHT UNTERSCHÄTZEN

Der Verlust muss erst gemessen werden, um die Höhe und einen möglichen Lösungsweg zu kennen. Geringe bis mittelgroße Verluste können durch Hochrechnungen wettgemacht werden. Voraussetzung ist ein Berechnungsmodell und die Verfügbarkeit der errechneten Daten.
Ist der Verlust zu hoch oder das Rechenmodell zu ungenau, ist der Einsatz von servergesteuerten Messdaten mindestens für Landingpages und umsatzrelevanten Seiten unumgänglich.
Ohne den Verlust zu kennen oder zu berücksichtigen, wird kurz- und langfristig eine Analyse verfälscht.
Single Point of Truth: Als Alternative zum Webanalyse-Tool sollte ein BI-Tool verwendet werden, das mit dem Datenverlust kalkulieren kann.

Produkte

    Goals

    • Mehr Kundenbesuche messbar machen

    Branche

    • Brands