推荐规则经过了人工规则千人一面,到线性模型,再到非线性模型(树型、根据上下文千人千面),如今已经演进到深度学习(强化与在线学习)。

一、特征构建

跨越人工规则之后,特征构建是个性化的基础,特征构建包含两部分用户特征和商品特征:

  • 用户特征
    • 人口统计学特征:不限于年龄、性别、地域、职业、人生阶段等等
    • 购物偏好(关键词偏好)
      • 短期偏好:user-query维度挖掘
      • 长期偏好:属性、品牌
      • 店铺偏好
      • 类目偏好
      • 购买力
    • 用户群体标签
      • 行为聚类ID
      • 人口统计学分群
  • 商品特征
    • ID
    • 静态属性
      • 类目
      • 地域
      • 关键词
      • CPL
      • 价格
      • 销量
    • 关联的卖家
    • 所在店铺

用户特征和商品特征形成关联关系,包括正向强关系、负向强关系、弱关系等,关系有如下几种分类角度:

  • 匹配类特征:tag-tag
  • 点击反馈类特征
    • 用户标签 vs 商品ID
    • 用户标签组合 vs 商品ID
    • 用户tag vs 商品类目
    • 用户tag vs 商品卖家

推荐结果好坏的评估方式主要通过命中率来衡量,推荐命中的i2i_pair/点击i2i_pair,推荐命中的指标包含准确率、覆盖率、召回率、零结果率、I2I、深度。

 

二、场景串联与用户旅程

  • 商品列表:购买意图
    • 搜索/类目:trade in>trade cross
    • 首页:trade cross>trade in
  • 商品详情:挑选/比较/性价比/相关,trade in> trade cross
  • 购物车页:凑单/比价,trade up>trade cross
  • 无结果页:减少跳出率,trade cross
  • 订单完成:交叉销售,trade cross
  • 关注推荐/push:提高转化,trade in
  • 我的XXX推荐:提高忠诚度

三、系统&全局生态:多角度考虑目标,最终落脚于平台收益。

  • 战略:生态闭环,长期指标(回访、复购、netGMV)。其中涉及了供应商、seller等级建设,流量分配,运营机制。
  • 商品的理解和建设:良好的后备力量
    • 新品测试、流量扶持、供需关系/双边市场
  • 用户理解&智能投放:低延时、高效率展现
    • 商品价值/质量分级,热度预估(活动前后)
    • 意图、兴趣、负反馈、视觉窄化
  • 分群:做补足,主召回源。
    • 分群策略:购买力、兴趣、静态标签、类目强偏好/弱偏好
  • 同店铺行为
    • 商品trigger权重
    • 实时上下文强化
    • rank-多召回源融合
  • 购物车推荐
    • 对比:相似
    • 凑单:相关
    • 根据意图强弱做比例调整

 总结

  1. 好算法:假设--分析--策略--执行--效果
  2. 定期回顾:埋点,看数据
  3. 不断迭代:逆向思维、发现问题(高流低转)
  4. 系统化思考:全局收益、场景串联、局部与全局优化
  5. 最重要的:合理的指标是健康生态系统的定义