Поширені помилки A/B тестування та як їх уникнути
Більшість провалів — через методологічні помилки, а не погані ідеї.
1. Підглядання та рання зупинка
Найчастіша помилка. Щоденна перевірка при 5% значущості дає ~25-30% реальних хибнопозитивних.
Чому це трапляється — P-значення коливаються. При багатьох перевірках шум перетне поріг.
Рішення — Зафіксуйте вибірку або використовуйте послідовне тестування.
2. Слабкі тести
При 40% потужності тест пропустить реальний ефект у 60% випадків.
Рішення — Розрахуйте розмір вибірки перед запуском.
3. Багато варіантів без поправок
4 варіанти при α = 0.05 дають ~19% шанс хибного результату.
Рішення — Використовуйте Мультиваріантний калькулятор з поправками.
4. Оптимізація неправильної метрики
Оптимізація CTR замість доходу може призвести до зростання кліків, але зниження покупок.
Рішення — Оберіть головну метрику, пов'язану з бізнес-цінністю.
5. Тестування без гіпотези
Випадкові зміни іноді працюють, але ви нічого не дізнаєтесь.
Рішення — Перед тестом запишіть: «Ми вважаємо, що [зміна] призведе до [ефекту], тому що [причина]».
6. Ігнорування невдач
Невдалі експерименти містять цінну інформацію.
Рішення — Документуйте все — перемоги, невдачі, невизначені результати.
7. Помилки реалізації
Типові проблеми:
- Невідповідність розподілу — баги рандомізації
- Кешування показує контроль користувачам варіанту
- Зміна не завантажується через JS-помилки
- Бот-трафік роздуває один варіант
Рішення — Перевіряйте SRM. Проводьте A/A тест для валідації.
Чек-лист
- Розрахуйте вибірку до запуску
- Не підглядайте — або послідовне тестування
- Поправки на множинні порівняння
- Предреєструйте головну метрику
- Сформулюйте гіпотезу
- Перевірте SRM після тесту
- Документуйте все