下面的操作针对于 m.weibo.cn :
这里要实现的是对微博用户的影响力抓取,我本文以广电时评为例。
点击查看,里面的数据会更多一点。
未登陆时:
这里是需要微博用户登陆之后才可以查看的,
所以为了实现我们的需求,我们开始模拟登陆。
- 首先来到微博移动端的登陆页面
- 然后选择使用账号密码登陆
- 先输入一个错误的账号来查看一下登陆的接口
错误的账号返回了retcode - 查看下 Formdata
- 当然请求头也不能忘记
- 有了这些信息之后,我们就可以进行代码登陆测试了
模拟登陆:
import requests
session = requests.session()
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36',
'Accept': 'text/html;q=0.9,*/*;q=0.8',
'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.3',
'Connection': 'close',
'Referer': 'https://passport.weibo.cn/signin/login',
'Host': 'passport.weibo.cn'
}
formdata = {
'username': '你的账号',
'password': '你的密码',
'savestate': '1',
'r': r'',
'ec': '0',
'pagerefer': '',
'entry': 'mweibo',
'wentry': '',
'loginfrom': '',
'client_id': '',
'code': '',
'qq': '',
'mainpageflag': '1',
'hff': '',
'hfp': ''
}
login_url = 'https://passport.weibo.cn/sso/login'
print(session.post(url=login_url, headers=headers, data=formdata).text)
输出之后,返回了 retcode,已经登陆成功
如果需要获取指定的微博影响力。我们可以通过接口
- 先访问用户api,获取用户主页的cid
uid = '微博ID'
user_api = 'https://m.weibo.cn/api/container/getIndex?uid={}&luicode=10000011&containerid=100505{}'.format(uid, uid)
- 然后通过cid请求影响力的api
yingxiangli_url = 'https://m.weibo.cn/api/container/getIndex?uid={}&luicode=10000011&lfid=100103type%3D3%26q%3D{}%26t%3D0&containerid={}'.format(item['uid'], item['userName'], yingxiang_cid)
这里就不多做介绍了,没有太多难度。
结果如下:
如果有用 欢迎点赞
如有疑问 请留言
节日快乐