内容分析思路和想法

by yuzaer


内容的考虑维度

1、内容的生命周期

内容的生命周期 是指内容从抓取或产生到审核到展示到最后被消费的整个周期的分析


用流程图表示为如下:


Created with Raphaël 2.2.0 内容的产生 内容的审核 审核是否通过 文章的库存 内容是否被展示 内容的消费 标记审核未通过及原因 yes no yes no



在流程图进行的每一个阶段都存在一定的内容变化

  • 内容的产生 --> 内容审核
  • 不同的方式产生的内容的分布:如抓取,原创等比例分布
  • 不同渠道来源的内容的分布(与上一点有部分重复)
  • 内容审核是否通过 --> yes / no
  • 部分内容审核未通过,分析未通过的内容占比
  • 未通过的内容的未通过原因的分布
  • 内容是否被展示 --> yes / no
  • 分析展示的比例情况(展示占整体库存的比例,展示的内容中对应命中的策略分布)
  • 分析不可展示的原因的分布(不同过滤策略的影响)
  • 内容的消费情况
  • 用户的各种交互行为情况分析(点击、阅读完成度、顶、踩、收藏等)

2、内容的评价维度

内容的评价维度是指从对某一个具体的内容进行认识和评价的角度

  • 将内容分为 news、entertainment、funny等内容类别
  • 将内容分为 article、video、GIF、gallery等形式类别
  • 将内容分为 level1、level2 ··· 等质量评级类别
  • 将内容分为 originality1、originality2 ··· 等原创度评级类别
  • 将内容分为 1days、2days ··· 等时效性类别
  • 其他根据消费情况所形成的类别:高展低展、高点击低点击、高完成度低完成度等

不同的维度需要考虑的分析角度:

  • 不同类别的展示占比情况
  • 不同类别的消费情况
  • 其余目标情况(如留存等)

3、内容分析的落脚点

  • 内容现状的分析
  • 内容单独维度下的分析
  • 不同内容类别的占比分布
  • 不同形式类别的占比分布
  • 内容不同评价维度的交叉逻辑
  • 不同形式类别的时效性标准不同
  • 不同内容类别的时效性标准也不同
  • 内容与其余核心指标联系在一起进行分析(留存、卸载、用户交互行为)