一、背景介绍
前几天我发布了「淄博烧烤」全流程分析案例:
【爬虫+数据清洗+可视化】用Python分析“淄博烧烤“的评论数据
得到了许多小伙伴的广泛关注。
但是由于我的分析项不能满足某些个性化要求,所以,单独把数据集分享出来。
二、数据集
数据来源,以下10个「淄博烧烤」相关的哔哩哔哩视频的评论:
- https://www.bilibili.com/video/BV1dT411p7Kd
- https://www.bilibili.com/video/BV1Ak4y1n7Zb
- https://www.bilibili.com/video/BV1BX4y1m7jP
- https://www.bilibili.com/video/BV1pB4y1F7o9
- https://www.bilibili.com/video/BV1T24y1T7Eo
- https://www.bilibili.com/video/BV1tV4y1d7j9
- https://www.bilibili.com/video/BV1Pk4y1b7nd
- https://www.bilibili.com/video/BV1oX4y127NC
- https://www.bilibili.com/video/BV1Xs4y1g7G1
- https://www.bilibili.com/video/BV1gc411L7uU
数据共8个字段,分别是:
视频链接,视频id,评论页码,评论作者,评论时间,IP属地,点赞数,评论内容
一共12840条数据。
部分数据展示:
截图1:
截图2:
截图3:
以上。