Python 使用BeautifulSoup

转载

mob604756f3c518 2021-08-19 22:27:00

pip install bs4
pip install lxml

BeautifulSoup 使用

from bs4 import BeautifulSoup

page_text=res.text
soup=BeautifulSoup(page_text,'lxml')

数据解析方法：
soup.tagName: 返回文档中，第一次出现的tagName
soup.find()
|-soup.find('tagName') 等同于 soup.div
|-属性定位：
soup.find('div',class_/id/attr="mao")
soup.find_all('tagName') 符合所有标签

-select:
|- select('某种选择器（id,class,标签，……）')，返回一个列表
|-层级选择器：
-soup.select('.mao>ul>li>a') >表示的是一个层级
-soup.select('.mao>ul a') 空格表示的多个层级

-获取标签之间的文本数据：
-soup.a.text/string/get_text()/soup.a['href']
-text/get_text():获取标签中所有的文本内容
-string: 只可以获取标签下面直系的文本内容

专注：全栈开发工程师 | 独立开发者

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：链接_装载与库_读书笔记(3)

下一篇：Linux（centos）安装vim

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

Python 使用BeautifulSoup

Python 使用BeautifulSoup

51CTO博客