A/B-Testing Agentur

A/B-Testing – Datengetriebene Entscheidungen, die Umsatz steigern

Professionelles A/B- und Multivariate-Testing aus der Schweiz. Wir testen systematisch Varianten von Headlines, Layouts, CTAs, Checkouts und Flows – mit statistischer Signifikanz und klaren Handlungsempfehlungen. Kein Raten, nur messbare Ergebnisse.

Unsere Leistungen für systematisches Testing

Vier Disziplinen, ein Ziel: Jede Design- und Funnel-Entscheidung durch Daten absichern – mit Hypothesen, statistischer Signifikanz und iterativer Optimierung.

Test-Strategie & Hypothesen

Ein A/B-Test ohne Hypothese ist ein Zufallsexperiment. Wir entwickeln strukturierte Testhypothesen, die auf Daten basieren – nicht auf Meinungen. Die Priorisierung erfolgt nach dem ICE-Framework (Impact, Confidence, Ease), damit Tests mit dem grössten erwarteten Effekt zuerst laufen.

Unsere Strategie beginnt mit der Analyse vorhandener Daten: GA4-Funnels, Heatmaps, Session-Replays, Kundenfeedback. Daraus identifizieren wir die grössten Conversion-Hebel und formulieren Hypothesen im Format: ‹Wenn wir X ändern, erwarten wir Y % mehr Conversions, weil Z.› Jede Hypothese wird in eine Impact-Effort-Matrix eingeordnet. High-Impact/Low-Effort-Tests laufen zuerst. Wir erstellen eine Test-Roadmap für die kommenden Monate, die flexibel genug ist, um auf neue Erkenntnisse zu reagieren, aber strukturiert genug, um systematischen Fortschritt zu gewährleisten. Stakeholder erhalten regelmässige Updates zur Roadmap und können Prioritäten mitgestalten.

  • Datenbasierte Hypothesenentwicklung aus Analytics, Heatmaps und Feedback
  • ICE-Priorisierung (Impact, Confidence, Ease) für jede Hypothese
  • Impact-Effort-Matrix für schnelle Entscheidungsfindung
  • Test-Roadmap mit Quartalsplanung und flexibler Anpassung
  • Stakeholder-Alignment: klare Kommunikation von Zielen und Erwartungen
  • Learnings-Datenbank für kumulative Wissenssicherung
  • Konkurrenzanalyse: Was testen andere in Ihrer Branche?
  • KPI-Definition pro Test: primäre und sekundäre Metriken

Test-Setup & Technische Umsetzung

Die technische Qualität des Test-Setups bestimmt die Qualität der Ergebnisse. Flicker-Effekte, fehlerhafte Varianten oder inkonsistente Darstellungen auf verschiedenen Geräten machen Testergebnisse wertlos. Wir implementieren Tests so, dass sie visuell sauber, technisch fehlerfrei und performance-neutral sind.

Je nach Anforderung setzen wir Client-Side- oder Server-Side-Tests ein. Client-Side-Tests (über Optimizely, VWO oder Google Optimize) eignen sich für visuelle Änderungen wie Headlines, CTAs, Bilder und Layouts. Server-Side-Tests kommen zum Einsatz, wenn die Änderung tiefer in die Anwendungslogik eingreift – etwa bei Checkout-Flows, Preislogik oder personalisierten Empfehlungen. Multivariate Tests (MVT) testen mehrere Elemente gleichzeitig und identifizieren die beste Kombination. Bei allen Tests achten wir auf Anti-Flicker-Snippets, korrektes Event-Tracking und saubere Segmentierung. Custom JavaScript und CSS werden nur eingesetzt, wenn die Standard-Editoren der Tools nicht ausreichen.

  • Client-Side A/B-Tests für visuelle Änderungen (Headlines, CTAs, Layouts)
  • Server-Side-Tests für Logik-Änderungen (Checkout, Personalisierung)
  • Multivariate Tests (MVT) für komplexe Seitenbereiche
  • Tool-Konfiguration: Optimizely, VWO, Google Optimize, Custom JS
  • Anti-Flicker-Implementierung für nahtlose Nutzererfahrung
  • Cross-Device- und Cross-Browser-QA vor Teststart
  • Event-Tracking-Setup für präzise Conversion-Messung
  • Performance-Monitoring: kein negativer Einfluss auf Ladezeiten

Auswertung & Statistik

Ein Test ist erst dann aussagekräftig, wenn er statistisch signifikant ist. Wir beenden Tests niemals vorzeitig – auch wenn eine Variante vielversprechend aussieht. Nur so vermeiden wir Fehlentscheidungen auf Basis zufälliger Schwankungen.

Unsere Auswertungsmethodik basiert auf frequentistischer Statistik mit einem Konfidenzniveau von mindestens 95 %. Die benötigte Stichprobengrösse (Sample Size) wird vorab berechnet, basierend auf dem erwarteten Effekt (Minimum Detectable Effect), dem aktuellen Conversion-Niveau und dem Traffic-Volumen. So wissen Sie vor Teststart, wie lange der Test laufen muss. Nach Testabschluss analysieren wir nicht nur das Gesamtergebnis, sondern auch Segmente: Reagieren mobile und Desktop-Nutzer unterschiedlich? Gibt es Unterschiede zwischen Neukunden und Bestandskunden? Zwischen organischem und bezahltem Traffic? Diese Segmentanalyse liefert oft die wertvollsten Erkenntnisse für Follow-up-Tests.

  • Statistische Signifikanz-Berechnung (min. 95 % Konfidenzniveau)
  • Sample-Size-Berechnung vor Teststart (Minimum Detectable Effect)
  • Segmentierte Auswertung: Gerät, Kanal, Nutzertyp, Tageszeit
  • Konfidenzintervalle statt Punktschätzungen für realistische Einschätzung
  • Revenue-per-Visitor (RPV) als primäre Umsatzmetrik
  • Bayessche Auswertung als Ergänzung bei niedrigem Traffic
  • Test-Dokumentation: Hypothese, Ergebnis, Learnings, nächste Schritte
  • Vermeidung von Peeking Bias durch vordefinierte Testlaufzeiten

Iteration & Skalierung

Ein einzelner A/B-Test ist ein Datenpunkt. Nachhaltiges Wachstum entsteht durch systematische Iteration: Gewinner ausrollen, neue Hypothesen ableiten, weiter testen. Wir bauen einen kontinuierlichen Optimierungskreislauf, der immer besser wird.

Nach jedem abgeschlossenen Test folgt eine strukturierte Entscheidung: Gewinner-Rollout, Neutest mit verfeinerter Hypothese oder Archivierung des Learnings. Gewinnende Varianten werden dauerhaft implementiert – in Shopify, Shopware, WordPress, Gambio oder Squarespace. Aus den Ergebnissen leiten wir Follow-up-Tests ab: Wenn eine neue Headline die CTR erhöht hat, testen wir als nächstes den zugehörigen CTA. So entsteht eine Testkette, die den gesamten Funnel schrittweise optimiert. Die Test-Roadmap wird monatlich aktualisiert und an die neuesten Erkenntnisse angepasst. Alle Ergebnisse fliessen in eine Learnings-Datenbank, die über Projekte hinweg nutzbar ist.

  • Gewinner-Rollout: dauerhafte Implementierung auf der Plattform
  • Follow-up-Tests: vertiefte Optimierung basierend auf Ergebnissen
  • Testketten entlang des gesamten Funnels (Einstieg → Checkout)
  • Monatliche Roadmap-Updates basierend auf neuen Erkenntnissen
  • Learnings-Datenbank: projektübergreifende Wissenssicherung
  • Skalierung: erfolgreiche Patterns auf andere Seitenbereiche übertragen
  • Integration in laufende Marketing-Kampagnen und Saisonalität
  • Quarterly Reviews mit ROI-Analyse des gesamten Testprogramms

Was Kunden über unser A/B-Testing sagen

LeadForge hat ein strukturiertes Testing-Programm für unseren Shop aufgesetzt. Innerhalb von drei Monaten hatten wir acht abgeschlossene Tests – drei davon mit signifikanter Verbesserung. Die kumulative Wirkung auf die Conversion-Rate war deutlich spürbar.

E-Commerce-Leiter, Gartengeräte

Emmen

Der erste Test hat gezeigt, dass unsere ‹kreative› Produktseite schlechter performt als eine einfachere Variante. Harte Erkenntnis, aber genau dafür braucht man A/B-Testing. Seitdem treffen wir Design-Entscheidungen nur noch mit Daten.

Geschäftsführerin, Schmuckatelier

Arbon

Die statistische Auswertung war vorbildlich – keine Schnellschüsse, sondern saubere Konfidenzintervalle und klare Erklärungen, warum ein Ergebnis valide ist oder nicht. Das hat intern viel Vertrauen in den Prozess geschaffen.

Data Analyst, Versicherungsplattform

Chur

Ehrlich: Wir hätten gerne schneller Ergebnisse gesehen. Aber LeadForge hat erklärt, warum Tests eine Mindestlaufzeit brauchen und vorzeitiges Abbrechen zu Fehlentscheidungen führt. Am Ende hat sich die Geduld ausgezahlt – die Checkout-Optimierung war ein klarer Gewinner.

Shop-Manager, Fahrradzubehör

Bellinzona

Wir hatten vorher nie systematisch getestet. Nach sechs Monaten mit LeadForge haben wir eine Learnings-Datenbank mit über zwanzig dokumentierten Tests. Nicht jeder war ein Gewinner, aber die Gesamtrichtung stimmt klar.

Marketing-Verantwortliche, Optik-Fachhandel

Herisau

Gute Arbeit, solides Setup. Die Integration mit unserer Shopware-Umgebung war reibungslos, und die Performance-Auswirkungen waren tatsächlich nicht messbar. Einzig die Kommunikation hätte manchmal proaktiver sein können.

Technischer Leiter, Werkzeughandel

Lyss

FAQ – A/B-Testing

Die wichtigsten Fragen zu Hypothesen, Statistik und Testlaufzeiten – direkt und ohne Marketing-Floskeln.

Bereit für mehr Wachstum?

Lassen Sie uns gemeinsam herausfinden, wie wir Ihr Unternehmen voranbringen können – unverbindlich und kostenlos.

Potenzialanalyse anfordern