总结下之前app应用数据抓取学习的文章。

 

####(一)回顾的之前一起学习的内容

模拟器,抓包工具,客户端自动化工具appium。

  • 模拟器

对比了三款模拟器,最终选择了应用型高功能性强的夜神模拟器,也不是其他两款模拟器。这个是根据个人的喜好,其实在真实的环境中最好使用真实的移动设备。手机进行抓取。

  • 抓包工具

对比了三款抓包工具,fiddler,packet capture,mitmproxy,数据包进行分析的时候经常使用fiddler进行抓包,fiddler的图形界面利于咱们的查看和分析,mitmproxy中的mitmdump组件数据进行解析和python进行交互。也介绍了移动抓包工具packet capture。

  • appium

最终用了selenium,模拟点击,滑动,输入等操作。

  • 实例

豆果美食app,考研帮app,抖音app的实例操作
1.豆果美食app,通过抓包工具进行抓取,进而进行python爬虫进行抓取数据
2.考研帮app,appium的使用,滑动操作
3.抖音app,分为三块,个人数据,粉丝数据,视频数据。

个人反爬字符破解。
粉丝数据滑动+mitmdump
视频数据通过破解signature字段来进行抓取,编写破解js的文件

####(二)打造多任务端app应用数据抓取系统-架构图

同时抓取三款app的,最终将数据放入mongodb中,之前也是抖音多客户端的抓取的变形。其实不难,跟我一起做就可以了。docker我已经很熟悉了,但是有的老铁没看我之前的文章。

PS:接下来docker系统管理的讲解吧。本节主要回顾下之前的方式。