1.背景
对比业界广告推荐、触达成熟的平台,例如抖音,小红书,淘宝,知乎等,都已经站在巨量数据的基础之上,具备了 “用户意图分析” 的能力,可以分析出 “用户的隐性需求”,假设我们同样也具有丰富的用户行为数据,那么我们已经具备为用户推送潜在感兴趣商品的必要条件。
2.技术方案
2.1 特征工程
3.2 算法工程
3.2.1 召回路径
1. 召回方式一:i2u 召回路径
i2u路径 算法选型
使用朴素贝叶斯
贝叶斯算法主要是利用统计学的数据,计算出直观的先验概率,通过明确的先验概率进行 “用户意向” 的判定。
贝叶斯算法假设世界遵从 “大数定律”, 通过足够的行为数据,几乎可以确定在发生某种行为时,发生特定事件的概率。
贝叶斯模型算法(Native Bayes)
贝叶斯算法主要是利用统计学的数据,计算出直观的先验概率,通过明确的先验概率进行 “用户意向” 的判定。
贝叶斯算法假设世界遵从 “大数定律”, 通过足够的行为数据,几乎可以确定在发生某种行为时,发生特定事件的概率。
贝叶斯提出的 “先验概率” 作为我们挖掘推断意向的基线,一般认为在 【可解释性,定理普适性,统计学意义】 上是不错的方法。
2. 召回方式二:协同过滤推荐相似商品
u2i2i召回路径 (itemCF)
基于物品的协同过滤,先统计用户喜爱的物品,再推荐他喜欢的物品;
召回模型:Swing 模型
Swing和ItemCF非常像,唯一的区别是计算物品相似度的公式不一样。
ItemCF:如果同时喜欢两个物品的用户越多,那么这两个物品的相似度越高。
Swing:如果同时喜欢两个物品的用户越多,且这些用户的重合度越低,那么这两个物品的相似度越高。
粗排/精排模型:FM 模型
FM 模型
FM(Factorization Machine)是一种常用的机器学习模型,用于处理稀疏数据和特征交互的问题。它是由Steffen Rendle在2010年提出的。FM模型基于因子分解机制,能够学习特征之间的隐含关系和交互信息。
FM模型通过对特征进行因子分解来建模特征之间的交互关系。它通过将特征表示为低维稠密的向量表示,并使用这些向量来计算特征之间的交互。FM模型的主要思想是通过两两特征交互的二阶项来捕捉特征之间的关联,同时还包括一阶项用于表示特征的线性关系。
通过FM模型的结果,可以反映用户对商品的喜好程度,这里用于精排打分。
3.3.1 PUSH Agent
1. 系统架构图
2. PUSH疲劳度规则
维度 | 规则 |
用户+商品维度 | 一个商品仅向一个用户发送一次 |
用户+场景维度 | 一个用户XX时间范围内只会获取一条 |
3. AIGC&个性化模板
4. 可视化监控大盘
4.总结
优化算法是一个复杂且耗时的工作,需要开发者细致地审查并提升算法性能。这一过程触及多个方面,包括算法本身的构建、参数设定、数据处理,以及评判模型的标准等。调优的终极目标在于增强算法的预测精度、执行速度及其对新情境的适应程度。为实现这些目标,开发者必须持续进行实验与调整,寻求最适合的方案和设定。