Как выбрать правильный статистический тест для A/B теста
Неверный тест может сделать результаты невалидными. Этот гайд поможет выбрать тест по типу метрики.
Шаг 1: Какой тип метрики вы тестируете?
Первый вопрос: какие данные генерирует ваша метрика?
- Бинарные / Конверсии — пользователь либо конвертируется, либо нет (клик, покупка, регистрация). Используйте Калькулятор конверсий.
- Непрерывные метрики на пользователя — у каждого пользователя одно числовое значение (доход, длительность сессии, просмотры). Используйте Калькулятор непрерывных метрик.
- Метрики-отношения — sum(X)/sum(Y), где знаменатель различается (AOV = доход/заказы, доход на клик). Используйте Калькулятор метрик-отношений.
Шаг 2: Выберите метод для типа метрики
Для конверсий:
- Z-тест (две пропорции) — выбор по умолчанию. Хорошо работает при умеренных и больших выборках (n > 30) и ожидаемых частотах ≥ 5.
- Критерий Хи-квадрат — лучше всего при сравнении более 2 групп или анализе таблиц сопряжённости.
- Точный тест Фишера — используйте при малых выборках или ожидаемых частотах < 5. Точный, а не приблизительный.
Для непрерывных метрик:
- T-тест Уэлча — основной метод сравнения средних. Для нормальных данных или больших выборок (ЦПТ при n > 30). Не предполагает равенства дисперсий.
- U-тест Манна-Уитни — используйте при асимметричных данных, выбросах или нарушении нормальности. Сравнивает распределения.
Для метрик-отношений:
- Простой t-тест на отношениях — быстрый, но может быть смещённым при различном числе событий.
- Дельта-метод — рекомендуемый подход. Правильно обрабатывает дисперсию отношения.
- Бутстрап — наиболее гибкий. Без предположений о распределении. Лучший для сложных метрик.
Шаг 3: Особые случаи
- Хотите подглядывать в результаты? Используйте Последовательное тестирование с функциями расходования для контроля ложноположительных при досрочной остановке.
- Тестируете более одного варианта? Используйте Мультивариантный калькулятор с поправками Бонферрони или Холма.
- Предпочитаете вероятности вместо p-значений? Используйте Байесовский калькулятор для апостериорной вероятности победы варианта.
Быстрая схема решений
Ваша метрика — конверсия (да/нет)?
ДА → Выборка > 30 на группу? → Z-тест
ДА → Малые выборки или разреженные данные? → Точный тест Фишера
ДА → Несколько групп или категорий? → Хи-квадрат
Метрика — одно значение на пользователя?
ДА → Примерно нормальное или n > 30? → T-тест Уэлча
ДА → Асимметрия или малые выборки? → Манна-Уитни
Метрика — отношение (сумма/сумма)?
ДА → У пользователей разные знаменатели? → Дельта-метод
ДА → Сложная метрика без предположений? → Бутстрап