Question 1

Wie lange dauert ein typischer A/B-Test?

Accepted Answer

Die Testlaufzeit hängt von drei Faktoren ab: dem aktuellen Traffic-Volumen auf der Testseite, der aktuellen Conversion-Rate und der Grösse der erwarteten Verbesserung (Minimum Detectable Effect). Typischerweise braucht ein A/B-Test zwei bis sechs Wochen, um statistisch signifikante Ergebnisse zu liefern. Bei Seiten mit hohem Traffic können Tests schneller abgeschlossen werden. Wir berechnen die benötigte Stichprobengrösse vor Teststart und legen eine Mindestlaufzeit fest. Tests werden nie vorzeitig abgebrochen – auch wenn eine Variante vielversprechend aussieht. Vorzeitiges Abbrechen (‹Peeking›) ist einer der häufigsten Fehler im A/B-Testing und führt zu Fehlentscheidungen. Zusätzlich empfehlen wir, Tests über mindestens einen vollen Wochenzyklus laufen zu lassen, um saisonale Schwankungen auszugleichen.

Question 2

Welche Tools nutzt ihr für Testing?

Accepted Answer

Wir arbeiten je nach Plattform und Projektanforderung mit verschiedenen Tools. Für die meisten Client-Side-Tests nutzen wir Optimizely oder VWO (Visual Website Optimizer) – beide bieten einen visuellen Editor für einfache Änderungen und JavaScript-Unterstützung für komplexere Varianten. Google Optimize (bzw. dessen GA4-Nachfolger) setzen wir ein, wenn Budgetrestriktionen bestehen oder die Integration mit GA4 besonders eng sein soll. Für Server-Side-Tests, die tiefer in die Anwendungslogik eingreifen, nutzen wir Optimizely Full Stack oder Custom-Lösungen. Heatmaps und qualitative Daten kommen aus Hotjar und Microsoft Clarity. Alle Testergebnisse fliessen im LeadForge Dashboard zusammen, sodass Sie einen zentralen Überblick über alle laufenden und abgeschlossenen Tests haben.

Question 3

Wie berechnet ihr statistische Signifikanz?

Accepted Answer

Wir verwenden primär frequentistische Statistik mit einem Konfidenzniveau von mindestens 95 %. Das bedeutet: Ein Ergebnis gilt erst als signifikant, wenn die Wahrscheinlichkeit, dass es zufällig entstanden ist, unter 5 % liegt. Vor Teststart berechnen wir die benötigte Stichprobengrösse basierend auf dem Minimum Detectable Effect (MDE) – die kleinste Verbesserung, die wir zuverlässig erkennen wollen. Je kleiner der erwartete Effekt, desto mehr Traffic wird benötigt. Bei niedrigem Traffic-Volumen nutzen wir ergänzend bayessche Methoden, die auch bei kleineren Stichproben nützliche Wahrscheinlichkeitsaussagen liefern. Wichtig: Wir berichten immer Konfidenzintervalle statt nur Punktschätzungen. So sehen Sie nicht nur den Durchschnittswert, sondern den realistischen Bereich, in dem die tatsächliche Verbesserung liegt.

Question 4

Kann man A/B-Tests auch in Shopify, Shopware oder WordPress umsetzen?

Accepted Answer

Ja – wir implementieren A/B-Tests auf allen gängigen Plattformen. Bei Shopify integrieren wir Testing-Tools über Theme-Anpassungen und den Google Tag Manager. Bei Shopware nutzen wir Storefront-Erweiterungen und Custom-Snippets. Bei WordPress/WooCommerce arbeiten wir mit Plugin-Integrationen und Child-Theme-Anpassungen. Bei Gambio und Squarespace setzen wir auf Script-Injection und CSS-Overrides. In keinem Fall überschreiben wir Core-Dateien – so bleiben plattform-Updates kompatibel. Die Performance-Auswirkungen der Testing-Tools werden vor dem Start gemessen und optimiert (Anti-Flicker-Snippets, asynchrones Loading). Server-Side-Tests sind auf allen Plattformen möglich, erfordern aber je nach System unterschiedliche Implementierungsansätze.

Question 5

Was passiert, wenn ein Test negativ ausfällt?

Accepted Answer

Negative Tests sind wertvolle Ergebnisse – nicht Misserfolge. Wenn eine Variante schlechter performt als das Original, lernen wir etwas Wichtiges über das Verhalten Ihrer Nutzer. Jedes negative Ergebnis wird dokumentiert und analysiert: Warum hat die Hypothese nicht funktioniert? Gab es Segmente, die anders reagiert haben (z. B. mobile vs. Desktop)? Diese Erkenntnisse verbessern die Qualität zukünftiger Hypothesen. Die Originalversion bleibt selbstverständlich bestehen – kein Risiko für Ihren Shop. In unserer Erfahrung führen etwa 30–40 % der Tests zu keiner signifikanten Verbesserung. Das ist normal und Teil eines seriösen Testprogramms. Die kumulative Wirkung der gewinnenden Tests überwiegt die ‹neutralen› bei weitem.

Question 6

Wie vermeidet ihr Test-Verschmutzung oder falsche Ergebnisse?

Accepted Answer

Test-Verschmutzung (auch ‹Sample Pollution› genannt) entsteht, wenn Nutzer zwischen Varianten wechseln, externe Faktoren das Ergebnis verzerren oder die Stichprobe nicht repräsentativ ist. Wir vermeiden das durch mehrere Massnahmen: Cookie-basiertes User-Bucketing stellt sicher, dass jeder Nutzer konstant dieselbe Variante sieht. Wir schliessen Bot-Traffic und interne Besucher aus der Auswertung aus. Tests laufen über mindestens einen vollen Wochenzyklus, um Tages- und Wochenschwankungen auszugleichen. Bei gleichzeitig laufenden Tests achten wir auf Traffic-Isolation: Tests auf derselben Seite werden nicht parallel geschaltet, es sei denn, die Interaktion zwischen den Variablen ist kontrolliert (MVT). Vor jedem Test führen wir einen AA-Test (Kontrollgruppe vs. Kontrollgruppe) durch, um die technische Korrektheit des Setups zu validieren.

Question 7

Wie integriert ihr A/B-Testing in laufende Kampagnen?

Accepted Answer

A/B-Testing und laufende Marketing-Kampagnen ergänzen sich – wenn die Koordination stimmt. Wir synchronisieren Testpläne mit Ihrem Marketing-Kalender: Während einer grossen Kampagne (Black Friday, Saisonstart) laufen Tests auf den Landingpages der Kampagne, um in Echtzeit die beste Variante zu identifizieren. Ausserhalb von Kampagnenzeiten testen wir permanente Seitenelemente wie Navigation, Produktseiten und Checkout. Wichtig: Tests brauchen stabiles Traffic-Volumen. Kampagnen-Traffic kann die Zusammensetzung der Besucher verändern (z. B. mehr Neukunden über Paid Ads). Deshalb segmentieren wir Ergebnisse immer nach Traffic-Quelle, um sicherzustellen, dass die Erkenntnisse auf alle Nutzergruppen übertragbar sind.

A/B-Testing – Datengetriebene Entscheidungen, die Umsatz steigern

Unsere Leistungen für systematisches Testing

Test-Strategie & Hypothesen

Test-Setup & Technische Umsetzung

Auswertung & Statistik

Iteration & Skalierung

Was Kunden über unser A/B-Testing sagen

FAQ – A/B-Testing

Bereit für mehr Wachstum?