目录需求分析选型设计与流程实现过程结果展示1 需求分析  在一些业务场景中需要拿到IM上的通信记录来做一些数据分析,例如对QQ平台中的消息进行领域分类等。2 选型环境与工具:python 2.7Ubuntu 16.04ElasticSearch 5.5.2Kibana 5.5.2Firefox 57.0.1 (64-bit)Python第三方依赖:pypcap(1.2.0)【捕包】dpkt(1.9
转载 2023-07-02 17:36:44
32阅读
疫情在校没有什么事情干,于是在吾爱论坛的各大网友帮助下,我完成了这款作品使用python写的自动获取自己QQ群的信息,声明:***只是获取自己所在群的信息************非常适用于群主管理自己的群***********具体操作就看图片吧,仅用于研究学习,切勿用于其他非法用途谢谢老铁们的支持    import threading import tkinter as tk
环境:selenium-java 3.9.1firefox 57.0geckodriver 0.19.11.大概的思路就是模拟用户点击行为,关于滚动条的问题,我是模拟下拉箭头,否则只能每个相册只能爬到30个链接2.多开标签页的原因是因为爬取多个相册时,当你爬完第一个相册无论采取什么方式总会导致当前原来的相册列表刷新,从而导致selenium的元素附着失败的异常,所以我的思路是一个相册一个标签页,全
转载 2024-06-17 07:35:46
68阅读
# 使用 Python 抓取 QQ 音乐的基础教程 在本教程中,我将带你逐步实现使用 Python 抓取 QQ 音乐的任务。我们会先了解整体流程,然后具体讲解每一步所需的代码。 ## 整体流程 | 步骤 | 描述 | 工具/库 | |------|----------------------------
原创 2024-10-11 10:38:16
201阅读
# 利用Python抓取QQ邮箱的教程 在这个数字化时代,学会如何从电子邮件服务中抓取数据是非常有用的技能。本文将教你如何使用Python抓取QQ邮箱,帮助你理解整个过程并实现数据的自动化获取。接下来,我们将详细说明抓取QQ邮箱的步骤。 ## 流程概述 在开始之前,我们需要理解抓取QQ邮箱的基本流程。可以参考下表: | 步骤 | 描述 | |------|------| | 1 |
原创 2024-08-03 07:25:15
273阅读
      好久没写博文了,最近捣鼓了一下python,好像有点上瘾了,感觉python比js厉害好多,但是接触不久,只看了《[大家网]Python基础教程(第2版)[www.TopSage.com]》的前7章,好多东西还不会,能做的也比较少。我想做的是爬QQ空间,然后把空间里的留言,说说拷下来,已经成功做到了,只是,拷下来是word文档,看着没有在线看那么有感触,有
转载 2023-07-01 13:27:54
154阅读
论坛好几天没人发帖子了,前几天忙考试了,后来终于挂了,淡定,要淡定。 可能有的朋友们早就在空间抓到了这些接口,不会的一定要自己抓包啊,IE9版本以前的可以用httpwatch,IE9自带抓包软件(快捷键F12) 本论坛已经发布了登陆空间源代码,其中含有g_tk的计算,关于登陆的不用多说。 在VB中首先登陆一个QQ,计算得到g_tk,然后用GET方式请求下面的URL即可,最好用inet1.openu
转载 2023-06-27 15:50:04
10000+阅读
以下是我用spy++截取到的信息:好像截取不到发送的信息内容,不是很看的懂,高人指点下。或者有什么办法截取到聊天的信息他发送的信息都是经过加密的,你有这样,还不如去他的聊天记录来的实在一点聊天窗口的信息不能这样找到的,很早之前的版本可以。这位大哥,我也有想过这个办法,但是有Msg2.0的文章不?谢谢了啊。我还有个想法是可不可以直接截取数据包?或者说我用c#,让通过我的跑
转载 2024-08-29 11:30:48
39阅读
有一天我突然发现自己空间的说说竟然已经达到1833条,于是萌生了爬一下看看的想法(其实就是想学下python爬虫)。我找了一些博客,方法不少,但是有些并不适用。所以我把真正能用的方法记录下来,并且爬取了我自己的全部说说,亲测可用。下面我介绍下爬虫的写法。用到的库——selenium,requests,json,sqlite3,re,time,random其中,selenium是用于模拟QQ空间登录
环境:PyCharm+Chorme+MongoDB Window10爬虫爬取数据的过程,也类似于普通用户打开网页的过程。所以当我们想要打开浏览器去获取好友空间的时候必定会要求进行登录,接着再是查看说说。那么我们先把登录步骤给解决了。1.模拟登录QQ空间因为想更直观的看到整个登录过程所以就没有用selenium+phantomjs,而是结合Chorme使用。除了slenium和Chorme之外还需要
首先需要安装curl工具,然后复制curl浏览器打开http://user.qzone.qq.com/[QQ号码]/myhome/friends,复制friend_ship_manager.cgi为curl获取的是我在意谁和谁在意我的json列表,QQ空间对我在意谁的好友数目限制是200,谁在意我的好友数目限制是200,代码把两个列表全部获取了,但是通过这个方法有个缺陷,当好友数大于200时,无法
转载 2023-07-01 21:06:56
95阅读
# Python爬虫与QQ空间数据抓取 随着互联网的快速发展,数据的获取变得愈发重要。在这一背景下,Python作为一种简单易学的编程语言,越来越受到开发者和数据分析师的青睐。本文将探讨如何利用Python爬虫技术抓取QQ空间的数据,同时提供相关的代码示例和图示。 ## 什么是爬虫 网络爬虫(Web Crawler)是一种自动访问互联网并提取信息的程序。它能够模拟用户在网站上的行为,从而获取
原创 9月前
155阅读
这几天在看《从零开始学python网络爬虫》中的模拟浏览器篇,对其中的爬取好友说说比较感兴趣,不过书中只是爬取每个好友第一页说说,因此我稍微改进了下(发书名是尊重作者,不过个人认为这本书讲得比较浅,不求甚解)。先大致说一下我遇到的坑。首先,如果想要看别人的说说,是必须要登录的(使用cookie应该也可以);然后,可能没有权限访问好友空间;最后则是获取下一页链接并点击前还要注意可能没有下一页了。本次
20150903更新:本文仍存在部分相册不能下载的问题,本文代码不再维护不过由于QQ空间后台更新,本文根据QQ空间最新的JSONAPI做了改进 首先需要下载windows版本的curl,具体可以参考百度经验下载地址:http://curl.haxx.se/download/?C=M;O=D如果你是64位系统,建议下载curl-7.33.0-win64-nossl.zip然后解压到D盘根目录下,如图
转载 2023-12-05 20:10:10
56阅读
1、背景a、鹅厂近期发布了自己的人工智能 api,包括身份证ocr、名片ocr、文本分析等一堆API,因为前期项目用到图形OCR,遂实现试用了一下,发现准确率还不错,放出来给大家共享一下。b、基于python3,跟python2还是有些区别。c、特别需要提到的就是签名生成这块,鹅厂的api说明里写的比较简单,一开始在sign的生成(https://ai.qq.com/doc/auth.shtml)
Python 抓取 QQ 好友 IP 的探秘之旅 在日常的编程实践中,我们常常需要处理一些独特且富有挑战性的任务,例如用 Python 抓取 QQ 好友 IP。虽然这个问题的实现有点复杂,但我们将一步一步来解决。以下是对这个过程的详细记录,包含环境准备、分步指南、配置详解、验证测试、排错指南和扩展应用等内容。 ### 环境准备 在开始之前,我们需要确保有合适的环境进行开发。以下是本项目的
原创 8月前
98阅读
# Python抓取QQ群聊天图片的实现 在现代社交中,QQ群成为了许多团队和朋友交流的主要方式。在群聊中,图片常用于分享信息、表达情感等。为了保存这些图片,我们可以利用Python编写一个简单的爬虫来抓取QQ群聊天中的图片。本文将带领大家走进这个过程,了解如何实现这一功能。 ## 需求分析 首先,我们需要明确一下需求: 1. **提取QQ群聊天记录**中的图片链接。 2. **下载这些图片
原创 11月前
453阅读
怎么利用爬虫爬取QQ空间中设置了权限的无法正常访问的内容?比如很多人的空间不允许别人访问,或者有些相册不允许别人访问回复内容:你把 『利用爬虫爬取』 这个定语去掉,能做到,再去考虑 『利用爬虫爬取』 这个问题。任何情况下,计算机程序都只可以做它的创造者会做的事情,只是大多数情况下比那个创造它的人做的更快、更不易出错。意味着,如果你可以在不知道加密相册的问题的答案的情况下进入相册(如果鹅厂存在BUG
腾讯QQ空间超分辨率技术TSR:为用户节省3/4流量,处理效果和速度超谷歌RAISR  雷锋网AI科技评论:随着移动端屏幕分辨率越来越高,甚至像iPhone更有所谓的“视网膜屏”,人们对高清图片的诉求也随之越来越大。在QQQQ空间、微博、微信等社交平台,人们常乐于发送和浏览数兆的高清图片,以获得更佳的视觉体验。但这也给用户造成了一定的困扰——要看高清大图也就意味着要占用大量带宽,
前言虽然扒qq空间不是很地道,但咱还是干干吧……正好也是闲来无事,我这个应该不会被别人发现 tao)技术路线selenium + beautifulsoup + pyautogui + echarts selenium模拟浏览器 beautifulsoup解析文本 pyautogui 负责下拉 echarts 可视化图像需要注意的点QQ空间在加载的时候,是一部分一部分加载的。也就是说当下拉到最底的
  • 1
  • 2
  • 3
  • 4
  • 5