ab测试数据分析 ab测试流程

转载

mob6454cc690811 2024-02-16 10:09:32

文章标签 ab测试数据分析方差解决方案数据值 文章分类 数据分析人工智能

    知识点
        基本流程
        实验分层问题
        最小样本量计算
            均值类
            比值类
        SRM检验
        指标检验
            比值类
            均值类
        关于统计检验显著性问题
        参考资料

基本流程

确定基本流程和假设，确认做这个功能是为了提升/降低什么指标。
开发相关功能
设计分层实验，进行流量分配。通过PowerAnalysis计算最小样本量。
实验达到最小样本量后，进行SRM检验，检验分流是否符合预期，若不符合预期，则回去检查分流系统正确性。
若通过SRM检验，进行效果分析，得出实验结论。

实验分层问题

流量正交要求层与层之间必须相互独立。
同一层可以有多个实验，但流量不能有交集。
一般采用MD5哈希算法来进行ID的分流。

ab测试数据分析 ab测试流程_方差

　　4. 流量分配采用先上小流量，再上大流量的方法进行。

最小样本量计算
均值类
实验采用双边检验，原假设如下：

H0:μA−μB=0
H1:μA−μB<>0

样本计算公式如下：

nA=knB  nB=(1+1/k)(σ(z1−2α+z1−β)/(μA−μB))²

其中， μ B 是当前的数据， μ A 是预期改进后的数据值。k为 n A 和 n B的比值，这个值一般情况下，我们都默认为1，即AB两组样本量相等，方便做严谨的实验对比， σ 需要根据历史数据估计。

因此，计算均值类指标的最小样本量需要如下变量

α ，显著性水平

β ，第二类错误

δ，预期提升值( μ A − μ B)

σ , μ B，历史均值和标准差

同样的，根据已有的参数，我们也可以估计统计的功效 β \beta β是多少，若功效不足，也无法得到实验结论：

ab测试数据分析 ab测试流程_ab测试数据分析_02

比值类

实验采用双边检验，原假设如下：

H0:pA−pB=0
H1:pA−pB≠0

样本计算公式如下：

ab测试数据分析 ab测试流程_方差_03

其中， p B B是当前的数据， p A是预期改进后的数据值。k为 n A和 n B的比值，这个值一般情况下，我们都默认为1，即AB两组样本量相等，方便做严谨的实验对比，跟均值有所不同的是，比值类无需计算方差。

因此，计算均值类指标的最小样本量需要如下变量

α ，显著性水平

β ，第二类错误

δ，预期提升值( p A − p B )

p B ，历史均值

同样的，根据已有的参数，我们也可以估计统计的功效 β \beta β是多少，若功效不足，也无法得到实验结论：

ab测试数据分析 ab测试流程_ab测试数据分析_04

在计算得到最小样本量公式后，根据流量的分配及每日流入的用户数，估算需要天数。理论上需要涵盖完整行为周期(视情况而定，有一定的时间成本)。

SRM检验

Sample Ratio Mismatch Test，简称样本分流不一致检验。主要检验实验人数分流是否符合预期。

卡方检验：

卡方检验，主要有两种用途。1. 推断总体分布与期望分布是否一致。 (test of goodness-of-fit) 2. 推断两个分类变量是否相关或独立。(test of independence/homogenetity) 实验中，主要用来做第一种检验。

其原假设为：观察频数与期望频数没有差别。

计算公式：

ab测试数据分析 ab测试流程_数据值_05

其中 f o 为实际观测值， f e 为期望值。df 为number of groups - 1。

指标检验

比值类

ab测试数据分析 ab测试流程_数据值_06

均值类

1.首先要进行方差齐性检验：

H 0 ：对照组和实验组方差一致

H 1 ：对照组和实验组方差不一致

ab测试数据分析 ab测试流程_方差_07

根据F值计算P值，理论上只有在方差一致的情况下才能进行配对t检验。方差不一致时，可以对t检验做一些调整来计算。

2.两个总体方差未知但相等：

ab测试数据分析 ab测试流程_方差_08

　　df 为 n 1 + n 2 − 2。

　3.两个总体方差未知且不等:

此时抽样已不服从自由度为 ( n 1 + n 2 − 2 ) 的t分布，而是近似服从自由度为f的t分布，f的计算公式：

ab测试数据分析 ab测试流程_数据值_09

df为f

关于统计检验显著性问题

在实际业务中，统计指标显著性是一个重要参考，但并非决定因素，还取决于业务上的判断。
关于样本量太大导致实验组和对照组间细微的变化也会显著的解决方案：

　　计算当前样本量/最小样本量= n，然后将实验指标的检验变的更加严格，即使用 α n e w = α / n \alpha_{new} = \alpha/n αnew=α/n
　　在样本中随机采样出最小所需样本量，进行统计分析。
　　以上均是可能的解决方案，并没有严格的理论支持。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：_tcp权重 tcpsh

下一篇：如何理解神经网络计算加上激活函数就可以变成非线性神经网络激活函数

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

ab测试数据分析 ab测试流程

ab测试数据分析 ab测试流程

51CTO博客