一、背景分析

1.1 开发背景

采集目标

众所周知,抖音是国内流量最为突出的短视频平台,拥有庞大的用户群体和超过亿级的日活跃用户。尤其是视频下方的评论区,蕴含着大量的挖掘潜力。通过收集抖音的评论数据,客户可以更深入地了解消费者对商品和品牌的看法与反馈,从而更有效地掌握消费者的喜好、需求和购买意图。

基于此,我用python开发了一个爬虫采集工具,叫【爬抖音搜索评论软件】,支持2种模式的评论采集:

  1. 根据关键词采集评论,爬取思路:作品关键词->作品链接->评论
  2. 根据作品链接采集评论,爬取思路:作品链接->评论

可按需选择其中一种模式,进行评论采集。

1.2 软件界面

软件界面,如下: 运行截图1

运行截图2

1.3 结果展示

爬取结果1-笔记数据:笔记数据.csv

爬取结果2-评论数据:评论数据.csv

1.4 演示视频

软件运行演示: 【软件演示】抖音评论区采集工具,支持2种模式:指定关键词和指定作品链接

bilibili.com/video/BV1fH21YEEDV

1.5 软件说明

几点重要说明,请详读了解:

1. Windows用户可直接双击打开使用,无需Python运行环境,非常方便! 
2. 软件通过接口协议爬取,并非通过模拟浏览器等RPA类工具,稳定性较高! 
3. 先在cookie.txt中填入自己的cookie值,方便重复使用(内附cookie获取方法) 
4. 支持筛选:排序方式(综合排序/最新发布/最多点赞)和发布时间(不限/一天内/一周内/半年内) 
5. 支持多个的设置项有:笔记关键词、笔记链接、评论关键词、IP属地 
6. 爬取过程中,每爬一页,存一次csv。并非爬完最后一次性保存!防止因异常中断导致丢失前面的数据(每条间隔1~2s) 
7. 爬取过程中,有log文件详细记录运行过程,方便回溯 
8. 爬取过程中,评论筛选同时进行。并非全部评论爬完再一次性筛选!所以效率较高! 
9. 笔记csv含13个字段,有:关键词,页码,视频标题,视频链接,作者昵称,作者uid,作者链接,作者粉丝数,发布时间,点赞数,评论数,收藏数,转发数
10. 评论csv含11个字段,有:目标链接,页码,评论者昵称,评论者id,评论者uid,评论者主页链接,评论时间,评论IP属地,评论点赞数,评论级别,评论内容

以上。

二、主要技术

软件全部模块采用python语言开发,主要分工如下:

tkinter:GUI软件界面 
requests:爬虫请求 
json:解析响应数据 
pandas:保存csv结果、数据清洗 
logging:日志记录

出于版权考虑,暂不公开源码,仅向用户提供软件使用。

三、功能介绍

3.0 填写cookie

开始采集前,先把自己的cookie值填入cookie.txt文件。 cookie获取方法:cookie获取方法

3.1 根据关键词爬评论

爬取思路:作品关键词->作品链接->评论

先填写左上区的笔记筛选项,再填写右上区的评论筛选项,点击按钮1爬取。

3.2 根据作品链接爬评论

爬取思路:作品链接->评论

先填写中上区的作品链接,再填写右上区的评论筛选项,点击按钮2爬取。

四、付费说明

4.1 卡密说明

付费如下:

日卡:使用期限1天,29元。日卡仅能购买一次。适合试用等临时需求
月卡:使用期限1个月,149元。月卡可多次购买。适合短期采集需求
季卡:使用期限3个月,399元。季卡可多次购买。适合中期采集需求
年卡:使用期限1年,799元。年卡可多次购买。适合长期采集需求

暂不支持自动化付费,直接与我对接即可。

4.2 一机一码

软件采用一机一码机制,一个卡密只能在一台电脑运行、不可多电脑运行。

4.3 软件多开

一台电脑仅允许运行一个软件,不支持软件多开。

4.4 软件维护

软件由本人独立原创开发,长期维护更新,提供稳定运行​。

五、软件首发

软件【爬抖音搜索评论软件】首发于公众号【老男孩的平凡之路】,欢迎交流!