项目背景:

  • 作为刚刚入驻小红书的新人,本人账号主要分享关于数据分析相关知识的作品。目前对如何利用小红书发作品,吸引更多用户关注账号仍处于一知半解。
  • 正如我之前在“啥是数据分析?”中所说“数据分析就是一种生活的方式,一种解决问题的方法,更是一种为人处世的态度”。那么我为何不用数据分析的方式解决一下我当前的问题呢?
  • 于是便成立了“小红书数据分析项目”,对小红书客户端数据进行收集,分别对用户、笔记内容两个方面进行分析,来解决问题:“如何制作小红书作品,吸引更多人的关注?”。

需求分析:

  • 利用“结构思维”进行需求分析,采用5W2H方法进行分解。
  • Why:如何制作数据分析相关的作品?如何吸引更多人的关注?
  • Where:小红书平台
  • What:
  • 小红书平台关于“数据分析”的博主基本情况:维度包括用户名、性别、IP属地、用户标签、关注人数、粉丝人数、获赞与收藏数;指标包括爱学习指数和受欢迎程度。
  • 小红书平台关于“数据分析”的内容基本情况;维度包括用户名、标题、笔记类型、内容类型、点赞数、收藏数、评论数、发布时间、发布省份、关联话题数、关联话题;指标包括受欢迎程度和话题热度。
  • Who:小红书平台关键词“数据分析”搜索用户列表和综合排名靠前的笔记内容。
  • When:本项目周期预计7天:博主信息分析(3天)、笔记内容分析(4天)
  • How:利用小红书手机端App搜索“数据分析”获取数据;分析思路主要分为对博主信息和内容信息数据分析,从中获取小红书制作经验和用户们关注热点;由于数据有效期比较短,需要尽快完成。
  • How much:本项目暂时不投入资金成本,但是数据收集需要每个笔记都点开记录,要耗费大量人力成本,粗略估计2天的人力成本。

数据收集:

  • 小红书博主信息获取流程:搜索栏搜索“数据分析” —— 用户列表(用户信息、用户标签、关注人数、粉丝人数、获赞与收藏数)

小红书 数仓架构 小红书做数据_小红书 数仓架构

  • 小红书笔记内容信息获取流程 —— 综合排名前200篇内容(发布类型、发布时间、发布位置、发布内容、关键词)

项目文件组织架构图

小红书 数仓架构 小红书做数据_数据挖掘_02