用python获取斗图吧表清包
微信关注公众号回复 斗图吧 获取源代码
看效果
打开网站
点击系列表情包
然后随便点击一个
然后打开开发者模式
找到该段代码
一个是表情包名称
还有一个是src属性
属性值是表情包的url地址
所以先从这个网页中获取表情包的名称和表情包的url地址
然后再进行下载保存
进行访问
注意要加上referer防盗链,因为表情包的地址设置了防盗链,如果不设置,就访问下载不了
url = 'https://www.doutub.com/series_lists/details/p5bdhifn5WEW3JXjDz8ReaED'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36 Edg/111.0.1661.54',
'referer': 'https://m.doutub.com/'
}
response = requests.get(url=url,headers=headers).text
提取信息
img_url = re.findall('<img alt=".*?" src="(.*?)" .*?>',response)
title = re.findall('<p class="imgText" .*?>(.*?)</p>',response)
# print(title)
下载保存
for i in img_url[1:]:
img_name = re.sub(rstr,"", title[a])
a+=1
print(i)
content = requests.get(url=i,headers=headers).content
with open(f'斗图网/{img_name}.jpg',mode='wb') as f:
f.write(content)
print('保存完成!')
微信关注公众号回复 斗图吧 获取源代码