python 抓取本地图片 python爬取图片保存到本地

转载

幸福的地图 2023-07-06 09:38:21

首先要爬取图片，我们先要把网站上面的html请求数据拉取下来，看看请求返回的内容是什么，我们就需要用到网络请求，这里直接使用简单的urllib2来实现，有的网站请求，可能设置了验证，我们需要模拟请求头，打开浏览器，f12查看network,可以看到我们网络请求的请求头，主要是User-Agent

python 抓取本地图片 python爬取图片保存到本地_python爬图片

找到User-Agent，将值，复制添加到我们的urllib2的addheader,

编写get_html获取到网页的基础html,然后就是解析html

python 抓取本地图片 python爬取图片保存到本地_python爬图片_02

解析之前，我们首先需要了解到这个网页图片保存在哪个元素下面，找到对应的元素，我们进行对应的解析，操作浏览器，f12打开开发者工具，首先点击elements,然后选择箭头，指向对应我们想找的页面元素，然后我们就会直接看到他属于哪个标签元素了，具体操作步骤如下图

python 抓取本地图片 python爬取图片保存到本地_获取标签_03

然后，我们可以观察到，具体图片在img标签下面的src，

python 抓取本地图片 python爬取图片保存到本地_python爬图片_04

然后我们就是获取标签img,获取标签页面元素可以通过正则表达式和BeautifulSoup方便的类库来实现，可以参考下面经验

python 抓取本地图片 python爬取图片保存到本地_请求头_05

由于我们找出的是别人的html，所以我们需要做下基本的判断，判断img是否包含src这个key,否则可能引起异常，这篇文章是简单的获取图片地址，对于相对的路径拼接图片地址没有，所以做了下http开头的判断

python 抓取本地图片 python爬取图片保存到本地_请求头_06

找到了图片url地址，然后就是讲他保存到本地了，使用简单的urllib.urlretrieve，实现保存到本地，如下图

python 抓取本地图片 python爬取图片保存到本地_获取标签_07

接下来看下完整的代码，然后我们直接运行，就可以看到结果了

python 抓取本地图片 python爬取图片保存到本地_python爬图片_08

然后我们到D盘的pic目录下面，我们就可以看到我们爬取出来的图片啦

python 抓取本地图片 python爬取图片保存到本地_html_09

END

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客