Den richtigen statistischen Test für Ihren A/B-Test auswählen

Die Wahl des falschen Tests kann Ihre Ergebnisse ungültig machen. Dieser Leitfaden führt Sie durch den Entscheidungsbaum basierend auf Ihrem Metriktyp.

Schritt 1: Welchen Typ von Metrik testen Sie?

Die allererste Frage: Welche Art von Daten liefert Ihre Metrik?

Binär / Conversion-Raten — Jeder Nutzer konvertiert entweder oder nicht (geklickt, gekauft, angemeldet). Verwenden Sie den Konversionen-Rechner.
Kontinuierliche Pro-Nutzer-Metriken — Jeder Nutzer hat einen numerischen Wert (Umsatz pro Nutzer, Sitzungsdauer, Seitenaufrufe). Verwenden Sie den Rechner für kontinuierliche Metriken.
Ratio-Metriken — sum(X)/sum(Y), wobei der Nenner pro Nutzer variiert (AOV = Umsatz/Bestellungen, Umsatz pro Klick). Verwenden Sie den Ratio-Metriken-Rechner.

Schritt 2: Wählen Sie eine Methode innerhalb Ihres Metriktyps

Für Conversion-Raten:

Z-Test (zwei Proportionen) — die Standardwahl. Funktioniert gut bei mittleren bis großen Stichproben (n > 30 pro Gruppe) und erwarteten Zellhäufigkeiten ≥ 5.
Chi-Quadrat-Test — am besten geeignet zum gleichzeitigen Vergleich von mehr als 2 Gruppen oder zur Analyse von Kontingenztafeln mit mehreren Kategorien.
Exakter Fisher-Test — verwenden Sie ihn bei kleinen Stichproben oder wenn erwartete Zellhäufigkeiten unter 5 liegen. Exakt statt approximativ.

Für kontinuierliche Metriken:

Welch-t-Test — die erste Wahl zum Vergleich von Mittelwerten. Funktioniert bei normalverteilten Daten oder großen Stichproben (CLT gilt ab n > 30). Setzt keine gleichen Varianzen voraus.
Mann-Whitney-U-Test — verwenden Sie ihn, wenn Daten stark schief sind, Ausreißer haben oder die Normalverteilungsannahme verletzen. Vergleicht gesamte Verteilungen statt nur Mittelwerte.

Für Ratio-Metriken:

Einfacher t-Test auf Ratios — schnell, kann aber verzerrt sein, wenn Nutzer unterschiedlich viele Ereignisse beitragen.
Delta-Methode — der empfohlene Ansatz. Behandelt die Varianz eines Ratios korrekt, wenn der Nenner pro Nutzer variiert.
Bootstrap — die flexibelste Methode. Macht keine Verteilungsannahmen. Am besten für komplexe oder nicht-standardmäßige Metriken.

Schritt 3: Berücksichtigen Sie diese Sonderfälle

Möchten Sie frühzeitig in die Ergebnisse schauen? Verwenden Sie Sequenzielles Testen mit Spending-Funktionen, um die Falsch-Positiv-Rate zu kontrollieren und frühzeitiges Stoppen zu ermöglichen.
Testen Sie mehr als eine Variante? Verwenden Sie den Multi-Varianten-Rechner mit Bonferroni- oder Holm-Bonferroni-Korrekturen.
Bevorzugen Sie Wahrscheinlichkeiten statt p-Werte? Verwenden Sie den Bayesianischen Rechner für die Posteriori-Wahrscheinlichkeit, dass eine Variante die andere übertrifft.

Schneller Entscheidungsbaum

Ist Ihre Metrik eine Conversion-Rate (Ja/Nein)?

JA → Stichprobe > 30 pro Gruppe? → Z-Test

JA → Kleine Stichproben oder spärliche Daten? → Exakter Fisher-Test

JA → Mehrere Gruppen oder Kategorien? → Chi-Quadrat-Test

Ist Ihre Metrik ein Wert pro Nutzer?

JA → Annähernd normal oder n > 30? → Welch-t-Test

JA → Schief oder kleine Stichproben? → Mann-Whitney-U-Test

Ist Ihre Metrik ein Ratio (Summe/Summe)?

JA → Nutzer haben unterschiedliche Nenner? → Delta-Methode

JA → Komplexe Metrik oder keine Annahmen? → Bootstrap