All I know about A/B Test (1) : 均值型指标与比值（率）型指标的计算区别

日期：2021-05-10 栏目：程序人生浏览：次

因为最近在找实习，所以打算把自己之前学过的关数据分析的知识总结（复习）一下。在总结A/B test时，我发现中文互联网中关于A/B test的总结已经很多了，但是对于均值型指标和比值（率）型指标在设计实验、计算统计量时的区别却没有一个很明确的总结。甚至有的文章给出的计算公式语焉不详、前后矛盾，计算样本数量给的是均值型指标的计算公式，计算Z值时又给出了比值（率）型指标的计算公式。

均值型指标和比值（率）型指标

在互联网数据分析中，有许多指标是数据分析师所关心的，对于不同的数据分析任务需要选取合适的指标。对A/B test而言，这些指标可以分为两类

比值（率）型，如点击率、转化率等

均值型，如人观看时长等

需要注意的是，在统计学中，这两类指标的假设检验是不同的。这种不同主要体现在三个方面：效应量（Effect size）的计算、所需样本量的计算以及Z检验统计量的计算。

所需样本量

在给出计算样本量之前，首先介绍一下样本量的四个影响因素，分别是：

显著性水平（α）：显著性水平越低，对实验结果的要求也就越高，越需要更大的样本量来确保精度

统计功效（1 – β）：统计功效意味着避免犯二类错误的概率，这个值越大，需要的样本量也越大

均值差异（\(\mu_1, \mu_2\)）：如果两个版本的均值差别巨大，也不太需要多少样本，就能达到统计显著

标准差（σ）：标准差越小，代表两组差异的趋势越稳定。越容易观测到显著的统计结果

一个A/B test需要的样本量就由四个指标进行计算：

比值（率）型指标

\[N = \frac{(z_{1-\alpha/2}\sqrt{2\frac{p_1 +p_2}{2}(1-\frac{p_1 +p_2}{2})} +z_{1-\beta}\sqrt{p_1(1-p_1)+ p_2(1-p_2)} )^2}{(p_1-p_2)^2} \]

转载注明出处：https://www.heiqu.com/wspsjz.html

All I know about A/B Test (1) : 均值型指标与比值（率）型指标的计算区别

相关推荐