「docker实战篇」python的docker-打造多任务端app应用数据抓取系统-系统介绍(27)
2019-06-25 09:51:59
李明
  • 访问次数: 375
  • 注册日期: 2018-07-09
  • 最后登录: 2019-08-08

总结下之前app应用数据抓取学习的文章。

####(一)回顾的之前一起学习的内容

模拟器,抓包工具,客户端自动化工具appium。

  • 模拟器

    对比了三款模拟器,最终选择了应用型高功能性强的夜神模拟器,也不是其他两款模拟器。这个是根据个人的喜好,其实在真实的环境中最好使用真实的移动设备。手机进行抓取。

  • 抓包工具

    对比了三款抓包工具,fiddler,packet capture,mitmproxy,数据包进行分析的时候经常使用fiddler进行抓包,fiddler的图形界面利于咱们的查看和分析,mitmproxy中的mitmdump组件数据进行解析和python进行交互。也介绍了移动抓包工具packet capture。

  • appium

    最终用了selenium,模拟点击,滑动,输入等操作。

  • 实例

    豆果美食app,考研帮app,抖音app的实例操作
    1.豆果美食app,通过抓包工具进行抓取,进而进行python爬虫进行抓取数据
    2.考研帮app,appium的使用,滑动操作
    3.抖音app,分为三块,个人数据,粉丝数据,视频数据。

    个人反爬字符破解。
    粉丝数据滑动+mitmdump
    视频数据通过破解signature字段来进行抓取,编写破解js的文件

####(二)打造多任务端app应用数据抓取系统-架构图

同时抓取三款app的,最终将数据放入mongodb中,之前也是抖音多客户端的抓取的变形。其实不难,跟我一起做就可以了。docker我已经很熟悉了,但是有的老铁没看我之前的文章。

PS:接下来docker系统管理的讲解吧。本节主要回顾下之前的方式。

>>原创文章,欢迎转载。转载请注明:转载自 IT人故事会 ,谢谢!
>>原文链接地址: 「docker实战篇」python的docker-打造多任务端app应用数据抓取系统-系统介绍(27)