1. 推荐系统与推荐模型
- 排名预测
- TopN推荐
- 分类模型
推荐系统的两个阶段:召回(挑选候选集),排序(对候选集排序)
2.基于表示学习的深度学习推荐模型
DL 在召回阶段的关键:学习User 和 Item的Embedding表达。
具体的方法有:
- 无监督模式:Auto-encoder
- 半监督模式:Auto-encoder + 矩阵分解
- 监督方式:
无监督方法:Auto-Encoder
(1) AutoRec
直接对用户和item的输入进行重构,获得中间层的信息作为表示的Embedding。
(2)CDAE模型
协同过滤神经网络:
半监督模式
有监督模式
(1)Rating
通过对用户Embedding和item的Embedding,使用内积,cosine相似性等来进行预测,训练。训练结束,就可以获得相应的用户Embedding向量。
神经网络协同过滤框架
Facebook product
深度矩阵分解
YouTube视频推荐
用户历史观察的物品向量,经过MLP特征提取,在最后一层作为用户的Embedding表示。然后,根据最近邻索引,获得top N 个物品。
3. 基于特征组合的深度学习推荐模型
难题:
特征表达问题:如何处理大量离散特征及高维度稀疏特征?
特征组合问题:如何捕获和表达两两组合特征?多组组合特征?
离散特征:
使用Onehot表达。
但是这个CTR预估任务里往往不现实,因为节点很多,有时特征的取值范围很大。
这里有个缺点:低阶和高阶特征组合隐含地体现在隐层。而MLP表达能力很弱。
改进:把低阶特征单独建模。
并行结构代表:Wide & Deep模型。 Wide网络为LR模型;
总结:
- 深度模型输入问题基本解决:onehot ->field Embedding;
- 关键: 2阶特征组合网络结构的设计;
- 多特征组合分层表示:2阶、3阶、4阶有效,再高阶用处不大;
- MLP这种加性捕获特征组合能力不强,乘性结构捕获组合特征比较合适;
- 多模态融合是趋势;
4.微博上的应用