Beautiful Soup
https://cuiqingcai.com/1319.html
第1步、解析网页
有四种解析方式:
(1)‘html.parser’解析 速度适中,容错能力强
(2)’lxml’解析 速度快,容错能力强
(3)’xml’解析 速度快,唯一支持xml的解析器
(4)’html5lib’解析 速度慢点,最好的容错性
几种爬虫比较
- urllib+正则:无第三方依赖
- requests+BeautifulSoup:library
- scrapy:框架
https://cuiqingcai.com/1319.html
第1步、解析网页
有四种解析方式:
(1)‘html.parser’解析 速度适中,容错能力强
(2)’lxml’解析 速度快,容错能力强
(3)’xml’解析 速度快,唯一支持xml的解析器
(4)’html5lib’解析 速度慢点,最好的容错性
几种爬虫比较
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M