用python获取斗图吧表清包

微信关注公众号回复 斗图吧 获取源代码

看效果

爬取斗图吧表情包_公众号


打开网站

点击系列表情包

然后随便点击一个

爬取斗图吧表情包_微信_02

然后打开开发者模式

找到该段代码

爬取斗图吧表情包_公众号_03

一个是表情包名称

还有一个是src属性

属性值是表情包的url地址

所以先从这个网页中获取表情包的名称和表情包的url地址

然后再进行下载保存

进行访问

注意要加上referer防盗链,因为表情包的地址设置了防盗链,如果不设置,就访问下载不了

url = 'https://www.doutub.com/series_lists/details/p5bdhifn5WEW3JXjDz8ReaED'


    headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36 Edg/111.0.1661.54',
    'referer': 'https://m.doutub.com/'
    }


    response = requests.get(url=url,headers=headers).text


提取信息

img_url = re.findall('<img alt=".*?" src="(.*?)" .*?>',response)
    title = re.findall('<p class="imgText" .*?>(.*?)</p>',response)
    # print(title)


下载保存

for i in img_url[1:]:
        img_name = re.sub(rstr,"", title[a])
        a+=1
        print(i)
        content = requests.get(url=i,headers=headers).content
        with open(f'斗图网/{img_name}.jpg',mode='wb') as f:
            f.write(content)
        print('保存完成!')


微信关注公众号回复 斗图吧 获取源代码