文 | 某某白米饭
618不到一个月了,京东 618 活动已经开始了,不知道小伙伴们参与了没。先抢一下京东的优惠劵,也许 618 出现神劵呢?
抓包分析登录
获取二维码图片
这里我们使用二维码登录,通过浏览器的控制台可以看出有个带 show 的 url 地址可以得到二维码登录图片
首先导入所有需要的包和一个解析 json 的方法
import requests
import random
import time
import os
import json
from PIL import Image
def parse_json(str):
return json.loads(str[str.find('{'):str.rfind('}') + 1])
显示京东登录二维码图片
user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
session = requests.session()
def show_QRcode():
url = 'https://qr.m.jd.com/show'
params = {
'appid': 133,
'size': 147,
't': str(int(time.time() * 1000)),
}
headers = {
'User-Agent': user_agent,
'Referer': 'https://passport.jd.com/new/login.aspx',
}
resp = session.get(url=url, headers=headers, params=params)
QRcode_path = 'QRcode.png'
with open(QRcode_path, 'wb') as f:
for chunk in resp.iter_content(chunk_size=1024):
f.write(chunk)
QRcode = Image.open(QRcode_path)
QRcode.show()
示例结果
检测二维码是否扫码
获取二维码图片之后,在 Fiddler 抓包神器中一直刷新带 check 的 url 地址,猜测这个也是和登录有关的,应该是检测二维码是否被扫码。
检测是否被扫码抓包
def check_QRcode():
url = 'https://qr.m.jd.com/check'
params = {
'appid': '133',
'callback': 'jQuery{}'.format(random.randint(1000000, 9999999)),
'token': session.cookies.get('wlfstk_smdl'),
'_': str(int(time.time() * 1000)),
}
headers = {
'User-Agent': user_agent,
'Referer': 'https://passport.jd.com/new/login.aspx?ReturnUrl=https%3A%2F%2Fwww.jd.com%2F',
}
resp = session.get(url=url, headers=headers, params=params)
resp_json = parse_json(resp.text)
if 'ticket' in resp_json:
print(resp_json)
return resp_json['ticket']
else:
print(resp_json['msg'])
print('请刷新京东登录二维码!')
os._exit(0)
示例结果
{'code': 200, 'ticket': 'AAEAIPL-bkU4RNrUw7YaLqYZhjWKqvP23PtkY1XTD2Cv2a52'}
验证二维码
在检测二维码是否被扫码之后,在 Fiddler 抓包神器中出现有一个带 qrCodeTicketValidation 的 url 地址,需要传递一个 t 参数,这个参数正好是 https://qr.m.jd.com/check
的返回值
验证二维码抓包
def validation_QRcode(ticket):
url = 'https://passport.jd.com/uc/qrCodeTicketValidation'
headers = {
'User-Agent': user_agent,
'Referer': 'https://passport.jd.com/new/login.aspx?ReturnUrl=https%3A%2F%2Fwww.jd.com%2F',
}
params={
't': ticket
}
resp = session.get(url=url, headers=headers, params=params)
print(resp.text)
示例结果
{"returnCode":0,"url":"https://www.jd.com/"}
到这里京东二维码已经登录成功了
领取优惠券
可以看到这个 url 的参数有 page,pageSize,不用猜都知道这是刷新的优惠券列表,抓它
def coupon_list():
url = 'https://a.jd.com/indexAjax/getCouponListByCatalogId.html'
headers = {
'User-Agent': user_agent,
'Referer': 'https://a.jd.com/?cateId=118',
}
couponList = []
for i in range(1, 20):
params = {
'callback': 'jQuery{}'.format(random.randint(1000000, 9999999)),
'catalogId': '118',
'page': str(i),
'pageSize': '9',
'_': str(int(time.time() * 1000)),
}
try:
resp = session.get(url=url, params=params, headers=headers)
json = parse_json(resp.text)
couponList.extend(json['couponList'])
if json['totalNum'] == 1:
continue
else:
break
except Exception:
print('出错了!')
return couponList
示例结果就不写了,返回的 json 串太长了
最后一步领取优惠劵,在浏览器控制台中 url 地址上有一个 key,这个 key 存在与优惠劵列表的返回值中
最后一步,领取优惠券
def get_coupon(coupon_list):
url = 'https://a.jd.com/indexAjax/getCoupon.html'
headers = {
'User-Agent': user_agent,
'Referer': 'https://a.jd.com/?cateId=118',
}
for coupon in coupon_list:
params = {
'callback': 'jQuery{}'.format(random.randint(1000000, 9999999)),
'key': coupon['key'],
'type': '1',
'_': str(int(time.time() * 1000)),
}
time.sleep(1)
resp = session.get(url=url, params=params, headers=headers)
print(resp.text)
示例结果
jQuery1912666({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery3381540({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery6247320({"code":"16","success":false,"message":"本时段优惠券已抢完,请14:00再来吧!"})
jQuery5888701({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery5048959({"code":"14","success":false,"message":"您已经参加过此活动,别太贪心哟,下次再来~"})
jQuery8608381({"code":"14","success":false,"message":"您已经参加过此活动,别太贪心哟,下次再来~"})
jQuery2539212({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery6439595({"code":"999","success":true,"message":"领券成功"})
jQuery2972325({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery1697862({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery1905738({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery7639432({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery8239706({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
jQuery1221489({"code":"15","success":false,"message":"您今天已经参加过此活动,别太贪心哟,明天再来~"})
总结
京东PC版抓取优惠券到这里就结束了,代码还有不完善的地方,比如每次都要扫码登录,没有保存 cookies 自动登录京东等待。小伙伴们可以根据自身需求更改代码,造出适合自己的轮子。
PS:公号内回复「Python」即可进入Python 新手学习交流群,一起 100 天计划!
老规矩,兄弟们还记得么,如果感觉文章内容不错的话,记得分享让更多的人知道!
【代码获取方式】
识别文末二维码,回复:200525