正则表达式(re模块) 正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串,在文本处理方面功能非常强大,也经常用作爬虫,来爬取特定内容,Python本身不支持正则,但是通过导入re模块,Python也能用正则表达式,正则表达式默认以单行开始匹配的
Beautifulsoup 网页解析库,灵活方便,处理效率高,支持多种解析器 利用它不用编写正则表达式,即可实现网页信息的处理 需定义frombs4 import Beautifulsoup
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号