推荐规则经过了人工规则千人一面,到线性模型,再到非线性模型(树型、根据上下文千人千面),如今已经演进到深度学习(强化与在线学习)。
一、特征构建
跨越人工规则之后,特征构建是个性化的基础,特征构建包含两部分用户特征和商品特征:
-
用户特征
- 人口统计学特征:不限于年龄、性别、地域、职业、人生阶段等等
- 购物偏好(关键词偏好)
- 短期偏好:user-query维度挖掘
- 长期偏好:属性、品牌
- 店铺偏好
- 类目偏好
- 购买力
- 用户群体标签
- 行为聚类ID
- 人口统计学分群
-
商品特征
- ID
- 静态属性
- 类目
- 地域
- 关键词
- CPL
- 价格
- 销量
- 关联的卖家
- 所在店铺
用户特征和商品特征形成关联关系,包括正向强关系、负向强关系、弱关系等,关系有如下几种分类角度:
- 匹配类特征:tag-tag
- 点击反馈类特征
- 用户标签 vs 商品ID
- 用户标签组合 vs 商品ID
- 用户tag vs 商品类目
- 用户tag vs 商品卖家
推荐结果好坏的评估方式主要通过命中率来衡量,推荐命中的i2i_pair/点击i2i_pair,推荐命中的指标包含准确率、覆盖率、召回率、零结果率、I2I、深度。
二、场景串联与用户旅程
- 商品列表:购买意图
- 搜索/类目:trade in>trade cross
- 首页:trade cross>trade in
- 商品详情:挑选/比较/性价比/相关,trade in> trade cross
- 购物车页:凑单/比价,trade up>trade cross
- 无结果页:减少跳出率,trade cross
- 订单完成:交叉销售,trade cross
- 关注推荐/push:提高转化,trade in
- 我的XXX推荐:提高忠诚度
三、系统&全局生态:多角度考虑目标,最终落脚于平台收益。
- 战略:生态闭环,长期指标(回访、复购、netGMV)。其中涉及了供应商、seller等级建设,流量分配,运营机制。
- 商品的理解和建设:良好的后备力量
- 新品测试、流量扶持、供需关系/双边市场
- 用户理解&智能投放:低延时、高效率展现
- 商品价值/质量分级,热度预估(活动前后)
- 意图、兴趣、负反馈、视觉窄化
- 分群:做补足,主召回源。
- 分群策略:购买力、兴趣、静态标签、类目强偏好/弱偏好
- 同店铺行为
- 商品trigger权重
- 实时上下文强化
- rank-多召回源融合
- 购物车推荐
- 对比:相似
- 凑单:相关
- 根据意图强弱做比例调整
总结
- 好算法:假设--分析--策略--执行--效果
- 定期回顾:埋点,看数据
- 不断迭代:逆向思维、发现问题(高流低转)
- 系统化思考:全局收益、场景串联、局部与全局优化
- 最重要的:合理的指标是健康生态系统的定义