一、什么是AARRR模型,以及为什么它如此受欢迎?

让我们深入了解Dave McClure的模型。

AARRR代表:

用户拉新Acquisition
用户激活Activation
用户留存Retention
用户推荐Referral
商业收入Revenue

二 、RARRA模型

是托马斯·佩蒂特Thomas Petit和贾博·帕普Gabor Papp对于海盗指标-AARRR模型的优化。RARRA模型突出了用户留存的重要性。

用户留存Retention:为用户提供价值,让用户回访。
用户激活Activation:确保新用户在首次启动时看到你的产品价值。
用户推荐Referral:让用户分享、讨论你的产品。
商业变现Revenue:一个好的商业模式是可以赚钱的。
用户拉新Acquisition:鼓励老用户带来新用户。

(联想到拼多多砍一刀,以及现在很多的帮砍帮抢现象)

三、ABtest

无法衡量就无法优化,对于互联网产品而言,不仅是推荐系统,整个app系统的更新迭代必然需要建立一套度衡量,来把控整个流程优化的方向,而ABtest系统就是一个很好的进行变量控制和优化方向选取的工具,循环:衡量-发现-迭代-验证。所谓精细化迭代是一种建立在数据基础上的思维方式——用较少的成本获得较好的成果。

无数据,不优化,线上分流实验是推荐算法优化的必由之路。并且ABtest不仅是推荐迭代的利器,它还可服务于所有需要足部完善的产品迭代。或许有人会有疑惑,为什么需要AB test,为什么不前后进行实验比较,因为:同时期测试的AB test非常有必要的原因是不同时间的测试无法说明b比a好,因为通常时间也是一个变量,比如电商的双十一的商品CTR(或者是CVR)会比平时明显增加。

四、有哪些回归类型?

线性回归(Linear Regression)

逻辑回归(Logistic Regression)

多项式回归(Polynomial Regression)

逐步回归(Stepwise Regression)

岭回归(Ridge Regression)

套索回归(Lasso Regression)

弹性回归(ElasticNet Regression)

七种回归

五、几种分类模型

二分类

多类别分类

多标签分类

不平衡分类

几种分类模型

六、几种聚类模型

1.分隔聚类:
需要先确定分成的类数,在根据 类内的点都足够近,类间的点都足够远的目标去做迭代。
常用的有K-means,K-medoids,K-modes等,只能针对数值类的分类,且只能对中等量级数据划分,只能对凸函数进行聚类,凹函数效果很差。

2.密度聚类:
有效的避免了对分隔聚类下对凹函数聚类效果不好的情况,有效的判别入参主要有1:单点外的半径2:单点外半径内包含的点的个数
DBSCAN为主要常见的算法,可优化的角度是现在密度较高的地方进行聚类,再往密度较低的地方衍生,优化算法: OPTICS 。

3,网格聚类:
将n个点映射到n维上,在不同的网格中,计算点的密度,将点更加密集的网格归为一类。
优点是:超快,超级快,不论多少数据,计算速度只和维度相关。
缺点:n维的n难取,受分布影响较大(部分行业数据分布及其不规则)

4.模型聚类:
基于概率和神经网络聚类,常见的为GMM, 高斯混合模型。缺点为,计算量较大,效率较低。
GMM:每个点出现的概率:将k个高斯模型混合在一起,每个点出现的概率是几个高斯混合的结果