ABtesting.tools

A/B testing bayesiano vs frecuentista

Estos dos marcos estadísticos responden preguntas diferentes sobre tu test A/B. Ninguno es universalmente mejor — la elección correcta depende de tus objetivos y limitaciones.

El enfoque frecuentista

El testing frecuentista es el enfoque tradicional. Planteas una hipótesis nula ("no hay diferencia"), recopilas datos y calculas un p-value.

Pregunta:

"Si no hubiera diferencia real, ¿qué tan probable sería observar datos tan extremos?"

Fortalezas

  • Teoría bien establecida con décadas de investigación
  • La tasa de falsos positivos (α) está garantizada si sigues el protocolo
  • Fácil de prerregistrar: compromete un tamaño de muestra, ejecuta el test, analiza una vez

Limitaciones

  • No puede decir "hay un X% de probabilidad de que B sea mejor" — solo "rechazamos / no rechazamos la hipótesis nula"
  • Revisar los resultados antes de tiempo invalida las garantías sin corrección
  • Requiere un tamaño de muestra fijo decidido de antemano

El enfoque bayesiano

El testing bayesiano parte de una creencia previa y la actualiza con los datos observados para producir una distribución posterior.

Pregunta:

"Dados los datos que he observado, ¿cuál es la probabilidad de que B sea mejor que A?"

Fortalezas

  • Ofrece declaraciones directas de probabilidad ("92% de probabilidad de que B sea mejor")
  • Maneja el peeking de forma natural — puedes revisar resultados en cualquier momento
  • Interpretación intuitiva que coincide con cómo piensa la gente
  • Puede incorporar conocimiento previo de experimentos anteriores

Limitaciones

  • Los resultados dependen del prior — diferentes priors dan diferentes respuestas
  • No garantiza una tasa fija de falsos positivos
  • Puede ser excesivamente confiado con muestras pequeñas si el prior es demasiado fuerte

Comparación lado a lado

AspectoFrecuentistaBayesiano
Pregunta central¿Es la diferencia real o ruido aleatorio?¿Cuál es la probabilidad de que B supere a A?
Resultado principalP-value e intervalo de confianzaProbabilidad posterior e intervalo de credibilidad
Revisión de resultadosInfla las tasas de error sin correcciónSeguro — la probabilidad se actualiza continuamente
Tamaño de muestraDebe fijarse antes del testFlexible — se puede detener cuando la probabilidad es suficientemente alta
Interpretación"Rechazamos la hipótesis nula con α = 0,05""Hay un 96% de probabilidad de que B sea mejor que A"

Cuándo usar cada uno

Usa frecuentista cuando:

  • Necesitas control garantizado de falsos positivos (por ejemplo, contextos regulatorios)
  • Puedes comprometerte con un tamaño de muestra fijo y ejecutar el test completo
  • Quieres un marco de decisión simple de sí/no

Usa bayesiano cuando:

  • Quieres saber la probabilidad de que una variante gane
  • Necesitas monitorear resultados continuamente y detener antes de tiempo
  • Ejecutas muchos tests y quieres reportes intuitivos para los stakeholders

Usa test secuencial cuando:

  • Quieres garantías frecuentistas pero necesitas revisar resultados
  • Quieres parada anticipada con tasas de error controladas

Prueba ambos enfoques

Pasa tus datos por la calculadora de conversiones para un resultado frecuentista y la calculadora bayesiana para un resultado bayesiano. Comparar ambos puede darte una visión más completa de lo que dicen tus datos.