一、背景分析
1.1 开发背景
众所周知,抖音是国内流量最为突出的短视频平台,拥有庞大的用户群体和超过亿级的日活跃用户。尤其是视频下方的评论区,蕴含着大量的挖掘潜力。通过收集抖音的评论数据,客户可以更深入地了解消费者对商品和品牌的看法与反馈,从而更有效地掌握消费者的喜好、需求和购买意图。
基于此,我用python开发了一个爬虫采集工具,叫【爬抖音搜索评论软件】,支持2种模式的评论采集:
- 根据关键词采集评论,爬取思路:作品关键词->作品链接->评论
- 根据作品链接采集评论,爬取思路:作品链接->评论
可按需选择其中一种模式,进行评论采集。
1.2 软件界面
软件界面,如下:
1.3 结果展示
爬取结果1-笔记数据:
爬取结果2-评论数据:
1.4 演示视频
软件运行演示: 【软件演示】抖音评论区采集工具,支持2种模式:指定关键词和指定作品链接
bilibili.com/video/BV1fH21YEEDV
1.5 软件说明
几点重要说明,请详读了解:
1. Windows用户可直接双击打开使用,无需Python运行环境,非常方便!
2. 软件通过接口协议爬取,并非通过模拟浏览器等RPA类工具,稳定性较高!
3. 先在cookie.txt中填入自己的cookie值,方便重复使用(内附cookie获取方法)
4. 支持筛选:排序方式(综合排序/最新发布/最多点赞)和发布时间(不限/一天内/一周内/半年内)
5. 支持多个的设置项有:笔记关键词、笔记链接、评论关键词、IP属地
6. 爬取过程中,每爬一页,存一次csv。并非爬完最后一次性保存!防止因异常中断导致丢失前面的数据(每条间隔1~2s)
7. 爬取过程中,有log文件详细记录运行过程,方便回溯
8. 爬取过程中,评论筛选同时进行。并非全部评论爬完再一次性筛选!所以效率较高!
9. 笔记csv含13个字段,有:关键词,页码,视频标题,视频链接,作者昵称,作者uid,作者链接,作者粉丝数,发布时间,点赞数,评论数,收藏数,转发数
10. 评论csv含11个字段,有:目标链接,页码,评论者昵称,评论者id,评论者uid,评论者主页链接,评论时间,评论IP属地,评论点赞数,评论级别,评论内容
以上。
二、主要技术
软件全部模块采用python语言开发,主要分工如下:
tkinter:GUI软件界面
requests:爬虫请求
json:解析响应数据
pandas:保存csv结果、数据清洗
logging:日志记录
出于版权考虑,暂不公开源码,仅向用户提供软件使用。
三、功能介绍
3.0 填写cookie
开始采集前,先把自己的cookie值填入cookie.txt文件。 cookie获取方法:
3.1 根据关键词爬评论
爬取思路:作品关键词->作品链接->评论
先填写左上区的笔记筛选项,再填写右上区的评论筛选项,点击按钮1爬取。
3.2 根据作品链接爬评论
爬取思路:作品链接->评论
先填写中上区的作品链接,再填写右上区的评论筛选项,点击按钮2爬取。
四、付费说明
4.1 卡密说明
付费如下:
日卡:使用期限1天,29元。日卡仅能购买一次。适合试用等临时需求
月卡:使用期限1个月,149元。月卡可多次购买。适合短期采集需求
季卡:使用期限3个月,399元。季卡可多次购买。适合中期采集需求
年卡:使用期限1年,799元。年卡可多次购买。适合长期采集需求
暂不支持自动化付费,直接与我对接即可。
4.2 一机一码
软件采用一机一码机制,一个卡密只能在一台电脑运行、不可多电脑运行。
4.3 软件多开
一台电脑仅允许运行一个软件,不支持软件多开。
4.4 软件维护
软件由本人独立原创开发,长期维护更新,提供稳定运行。
五、软件首发
软件【爬抖音搜索评论软件】首发于公众号【老男孩的平凡之路】,欢迎交流!