(1)工业界推荐系统-小红书推荐场景及内部实践【业务指标、链路、ItemCF】(2)工业界推荐系统-小红书推荐场景及内部实践【UserCF、离线特征处理】(3)工业界推荐系统-小红书推荐场景及内部实践【矩阵补充、双塔模型】(4)工业界推荐系统-小红书推荐场景及内部实践【正负样本选择】(5)工业界推荐系统-小红书推荐场景及内部实践【线上召回和模型更新】(6)工业界推荐系统-小红书推荐场景及内部实践【其他召回通道】(7)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题1】(8)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题2】(9)工业界推荐系统-小红书推荐场景及内部实践【排序模型】(10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】

推荐系统链路

小红书APP开发架构 小红书系统架构_人工智能

粗排 vs 精排

小红书APP开发架构 小红书系统架构_小红书APP开发架构_02

精排模型

• 前期融合:先对所有特征做 concatenation, 再输入神经网络。
• 线上推理代价大:如果有 𝑛 篇候选笔记,整个大模型要做 𝑛 次推理。

小红书APP开发架构 小红书系统架构_人工智能_03

双塔模型

  • 后期融合:把用户、物品特征分别输入不同的神经 网络,不对用户、物品特征做融合。
  • 线上计算量小:
    • 用户塔只需要做一次线上推理,计算用户表征 𝐚。
    • 物品表征 𝐛 事先储存在向量数据库中,物品塔在线上不做推理。
    • 预估准确性不如精排模型。

粗排的三塔模型

小红书APP开发架构 小红书系统架构_推荐系统_04


小红书APP开发架构 小红书系统架构_推荐系统_05

1、有 𝑛 个物品,模型上层需要做 𝑛 次推理。
2、粗排推理的大部分计算量在模型上层。

三塔模型的推理

  • 从多个数据源取特征:
    • 1 个用户的画像、统计特征。
    • 𝑛 个物品的画像、统计特征。
  • 用户塔:只做 1 次推理。
  • 物品塔:未命中缓存时需要做推理。
  • 交叉塔:必须做 𝑛 次推理。
  • 上层网络做 𝑛 次推理,给 𝑛 个物品打分。