ABtesting.tools

Как выбрать правильный статистический тест для A/B теста

Неверный тест может сделать результаты невалидными. Этот гайд поможет выбрать тест по типу метрики.

Шаг 1: Какой тип метрики вы тестируете?

Первый вопрос: какие данные генерирует ваша метрика?

  • Бинарные / Конверсии пользователь либо конвертируется, либо нет (клик, покупка, регистрация). Используйте Калькулятор конверсий.
  • Непрерывные метрики на пользователя у каждого пользователя одно числовое значение (доход, длительность сессии, просмотры). Используйте Калькулятор непрерывных метрик.
  • Метрики-отношения sum(X)/sum(Y), где знаменатель различается (AOV = доход/заказы, доход на клик). Используйте Калькулятор метрик-отношений.

Шаг 2: Выберите метод для типа метрики

Для конверсий:

  • Z-тест (две пропорции)выбор по умолчанию. Хорошо работает при умеренных и больших выборках (n > 30) и ожидаемых частотах ≥ 5.
  • Критерий Хи-квадратлучше всего при сравнении более 2 групп или анализе таблиц сопряжённости.
  • Точный тест Фишераиспользуйте при малых выборках или ожидаемых частотах < 5. Точный, а не приблизительный.

Для непрерывных метрик:

  • T-тест Уэлчаосновной метод сравнения средних. Для нормальных данных или больших выборок (ЦПТ при n > 30). Не предполагает равенства дисперсий.
  • U-тест Манна-Уитнииспользуйте при асимметричных данных, выбросах или нарушении нормальности. Сравнивает распределения.

Для метрик-отношений:

  • Простой t-тест на отношенияхбыстрый, но может быть смещённым при различном числе событий.
  • Дельта-методрекомендуемый подход. Правильно обрабатывает дисперсию отношения.
  • Бутстрапнаиболее гибкий. Без предположений о распределении. Лучший для сложных метрик.

Шаг 3: Особые случаи

Быстрая схема решений

Ваша метрика — конверсия (да/нет)?

ДА → Выборка > 30 на группу? → Z-тест

ДА → Малые выборки или разреженные данные? → Точный тест Фишера

ДА → Несколько групп или категорий? → Хи-квадрат

Метрика — одно значение на пользователя?

ДА → Примерно нормальное или n > 30? → T-тест Уэлча

ДА → Асимметрия или малые выборки? → Манна-Уитни

Метрика — отношение (сумма/сумма)?

ДА → У пользователей разные знаменатели? → Дельта-метод

ДА → Сложная метрика без предположений? → Бутстрап