(1)工业界推荐系统-小红书推荐场景及内部实践【业务指标、链路、ItemCF】(2)工业界推荐系统-小红书推荐场景及内部实践【UserCF、离线特征处理】(3)工业界推荐系统-小红书推荐场景及内部实践【矩阵补充、双塔模型】(4)工业界推荐系统-小红书推荐场景及内部实践【正负样本选择】(5)工业界推荐系统-小红书推荐场景及内部实践【线上召回和模型更新】(6)工业界推荐系统-小红书推荐场景及内部实践【其他召回通道】(7)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题1】(8)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题2】(9)工业界推荐系统-小红书推荐场景及内部实践【排序模型】(10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
推荐系统链路
粗排 vs 精排
精排模型
• 前期融合:先对所有特征做 concatenation, 再输入神经网络。
• 线上推理代价大:如果有 𝑛 篇候选笔记,整个大模型要做 𝑛 次推理。
双塔模型
- 后期融合:把用户、物品特征分别输入不同的神经 网络,不对用户、物品特征做融合。
- 线上计算量小:
• 用户塔只需要做一次线上推理,计算用户表征 𝐚。
• 物品表征 𝐛 事先储存在向量数据库中,物品塔在线上不做推理。
• 预估准确性不如精排模型。
粗排的三塔模型
1、有 𝑛 个物品,模型上层需要做 𝑛 次推理。
2、粗排推理的大部分计算量在模型上层。
三塔模型的推理
- 从多个数据源取特征:
• 1 个用户的画像、统计特征。
• 𝑛 个物品的画像、统计特征。 - 用户塔:只做 1 次推理。
- 物品塔:未命中缓存时需要做推理。
- 交叉塔:必须做 𝑛 次推理。
- 上层网络做 𝑛 次推理,给 𝑛 个物品打分。