一、背景介绍

前几天我发布了「淄博烧烤」全流程分析案例:

【爬虫+数据清洗+可视化】用Python分析“淄博烧烤“的评论数据

得到了许多小伙伴的广泛关注。

但是由于我的分析项不能满足某些个性化要求,所以,单独把数据集分享出来。

二、数据集

数据来源,以下10个「淄博烧烤」相关的哔哩哔哩视频的评论:

  1. https://www.bilibili.com/video/BV1dT411p7Kd
  2. https://www.bilibili.com/video/BV1Ak4y1n7Zb
  3. https://www.bilibili.com/video/BV1BX4y1m7jP
  4. https://www.bilibili.com/video/BV1pB4y1F7o9
  5. https://www.bilibili.com/video/BV1T24y1T7Eo
  6. https://www.bilibili.com/video/BV1tV4y1d7j9
  7. https://www.bilibili.com/video/BV1Pk4y1b7nd
  8. https://www.bilibili.com/video/BV1oX4y127NC
  9. https://www.bilibili.com/video/BV1Xs4y1g7G1
  10. https://www.bilibili.com/video/BV1gc411L7uU

数据共8个字段,分别是:

视频链接,视频id,评论页码,评论作者,评论时间,IP属地,点赞数,评论内容

一共12840条数据。

部分数据展示:

截图1:

【爬虫数据集】「淄博烧烤」12840条评论数据_文本分析

截图2:

【爬虫数据集】「淄博烧烤」12840条评论数据_数据采集_02

截图3:

【爬虫数据集】「淄博烧烤」12840条评论数据_文本分析_03

以上。