(一)B站推荐策略概述

作为UGC视频平台和年轻文化社区,B站经过10年多的成长,已经积累了庞大而丰富的内容资源,也成功吸引了上亿用户。2019年第四季度财报显示,B站平均月活用户数量达1.3亿,移动端月均活跃用户达1.16亿,日均活跃用户达3800万。同时,2019年日均视频播放量高达7.1亿,其中专业用户的自制内容(PUGV)占整体平台播放量的91%。

哔哩哔哩推荐策略分析与思考_权重

B站是国内视频平台中比较有代表性的长尾市场案例之一,在长尾市场中,尽管内容资源越来越丰富,但是用户的注意力和时间仍然有限。为保证用户留存和良好的口碑,提升竞争地位,帮助用户在纷繁的内容中找到个人感兴趣的那些就变得尤为重要。从用户角度来看,主要有两种方式可以达到目的,主动的 “搜索” 和被动的 “推荐” 。从用户体验来看 “推荐” 更能降低用户的选择成本,对于平台来说也可以成为一种更为高效的营销方式。

(二)本文分析内容说明

目前,B站“推荐”策略的主要应用有两块:1、移动端首页推荐;2、视频播放相关推荐。因为两者对应的场景不同,用户的需求也不同,因此需要分别进行分析。本文仅针对移动端首页。

本次分析的目的和目标:

1、通过阶段性抽样调研的方式,根据推荐内容的展现和排序,分析B站推荐策略的影响因素和衡量标准,根据分析推测推荐策略的评分计算规则;

2、评估当前的推荐策略效果,拟定优化方向;

(三)移动端首页推荐分析

目标一:推测推荐策略的影响因素和排序展现规则

(1)推荐理想态:用户花费最短的时间找到自己感兴趣的内容;

(2)可能影响推荐结果的因素拟定:主要可以从三个大的方面考虑,基于用户基本信息、用户历史行为分析和其他的客观影响因素,详见下图。

哔哩哔哩推荐策略分析与思考_权重_02

(3)分析方法:通过随机的十次刷新首页推荐,截屏记录推荐的内容,从以上影响因素的维度进行分析,得出具体的结果如下表。根据相关因素的出现次数,统计得到一个总分数,理论上,分数越高代表在推荐内容中占的比重越高,说明在推荐规则中占的权重越大。(但是由于个人做调研分析,样本量过小,也不能排除个人主观影响,所以可能会与实际情况存在偏差)

(4)影响因素和计算逻辑推测

从以上的分析中根据个人经验推测的可能影响因素和计算规则如下图所示:

哔哩哔哩推荐策略分析与思考_召回率_03

哔哩哔哩推荐策略分析与思考_权重_04

(5)实现逻辑说明

为用户推荐感兴趣的内容的基本原理是:找到用户的兴趣点,提取为可以描述的关键标签,分析候选内容,识别提取内容的标签,实现标签的匹配,即实现按照用户的兴趣推荐的目的。

哔哩哔哩推荐策略分析与思考_权重_04

目标二:推荐策略效果及优化方向分析

(1)用户行为与满意度之间的关系分析

用户的行为可分为四类:跳出行为、查看行为、互动行为和跳转行为。跳出行为说明内容并没有非常吸引用户;查看行为说明推荐的内容比较让用户满意,而且有进一步探索的欲望;互动行为说明用户对于推荐结果很满意,但是有一个“不喜欢”的互动是反向情况,说明用户对该内容感兴趣但是不同意推荐内容的观点或者引起不适;跳转或者下载也是比较满意的行为表现。

哔哩哔哩推荐策略分析与思考_移动端_06

(2)核心指标量化

通过准确率和召回率对推荐效果进行评估,准确率是指:策略覆盖的案例中真正希望被覆盖的占策略覆盖的所有案例的比例;召回率是指:希望被覆盖的案例中实际覆盖到的案例占理想状态下希望策略覆盖的案例的比例;

在本案例中转化为以下指标:

准确率=用户点击的推荐内容的数量/推荐给用户的内容总数量;

例如:平台给用户推荐了10条内容,用户点击了其中一条,准确率为:0.1

召回率=用户点击的推荐内容的数量/用户在平台中总共的点击量;

例如:平台推荐给用户20条内容,用户在系统推荐的内容中一共点击了10条,但是用户在平台中一共点击了200条内容,召回率为:0.05

满意度为(点击内容后用户对应行为的数量/进入内容页的总用户数量)的累加之和;

例如:进入某视频内容详情页的用户为10000人次,产生互动行为的有3000人次,跳转或者下载行为的是200人次,则非常满意的占比为:(3000+200)/10000=0.32

(3)抽样调研说明

实际情况下的抽样分析方案:一天之内随机筛选一定数量用户的首页推荐的session,针对用户的推荐内容数量和用户推荐中点击的数量等数据,计算准确率和召回率。根据上述分析的各类用户行为计算用户的满足情况。(因为资源和条件的限制,本文以自己十分钟内的推荐相关的操作数据为准进行分析,不代表真实情况,仅用做分析参考。准确率=3/39=0.077;召回率=3/8=0.375;)

随机抽取200个不满意和一般满意的用户行为session,分析不同行为所占的比例,确定改进方案的影响面。(同样因为条件限制,本文为虚拟的数据,只为分析思路提供支持,不代表真实情况)

(4)可能存在的问题分析

1、热点内容或者热门内容权重比针对性的用户兴趣标签比重大;

2、商业推广和活动运营权重比针对性的用户兴趣标签比重大;

3、用户画像分析和基本信息提取不够准确;

4、用户不感兴趣的相同类型内容重复推荐;

5、标签过于宽泛,推荐内容与用户匹配精准性欠缺;

(5)改进方案及优先级判断

(以上数据为自行实验测定,仅供思路参考,不代表实际情况)

因此,进一步的优化计划如下,优先级依次下降:

1、将推荐计算规则中热门内容和热点内容的权重系数适当调低;

2、将推荐计算规则中商业推广和活动运营的权重系数适当调低;

3、进一步优化用户画像分析算法,提高用户画像的精准性;

4、添加负向权重,关注推荐内容的重复度,减少重复内容比例;

5、细化标签体系;

本文分析均为个人观点,建立在不考虑其他因素仅追求极致用户体验的基础上,但是整体的优化方向和具体计划还要参考平台整体的战略规划。目前,B站需要吸引和培养更多的优秀up主,保护良好的社区环境和内容质量,同时,不断提高营收也是B站需要努力的方向,商业推广和活动运营也必不可少。因此在“推荐”策略中需要权衡up主、广告主和用户等各方的利益。

智能推荐

个性化推荐技术与产品社区

长按并识别关注

哔哩哔哩推荐策略分析与思考_召回率_07