Байесовское vs частотное A/B тестирование

Два статистических подхода отвечают на разные вопросы о тесте. Ни один не лучше универсально — выбор зависит от целей.

Частотный подход

Частотное тестирование — традиционный подход. Вы формулируете нулевую гипотезу («нет разницы»), собираете данные и вычисляете p-значение.

Задаёт вопрос:

«Если разницы нет, насколько вероятны такие экстремальные данные?»

Устоявшаяся теория с десятилетиями исследований
Фиксированный уровень ложноположительных (α) гарантирован при соблюдении протокола
Легко предрегистрировать: зафиксировать выборку, провести тест, проанализировать

Нельзя сказать «вероятность X%, что B лучше» — только «отвергаем/не отвергаем нулевую»
Подглядывание нарушает гарантии без коррекции
Требует фиксированного размера выборки заранее

Байесовское тестирование начинает с априорного убеждения и обновляет его данными для получения апостериорного распределения.

Задаёт вопрос:

«Какова вероятность, что B лучше A, с учётом наблюдаемых данных?»

Аспект	Частотный	Байесовский
Ключевой вопрос	Разница реальна или случайный шум?	Какова вероятность, что B лучше A?
Основной результат	P-значение и доверительный интервал	Апостериорная вероятность и кредитный интервал
Подглядывание в результаты	Повышает ошибки без коррекции	Безопасно — вероятность обновляется непрерывно
Размер выборки	Должен быть зафиксирован до теста	Гибкий — можно остановить при высокой вероятности
Интерпретация	«Отвергаем нулевую гипотезу при α = 0.05»	«Вероятность 96%, что B лучше A»

Нужен гарантированный контроль ложноположительных (напр., регуляторный контекст)
Можете зафиксировать размер выборки и провести полный тест
Нужна простая бинарная система решений

Проанализируйте данные Калькулятором конверсий для частотного результата и Байесовским калькулятором для байесовского. Сравнение обоих даст полную картину.