<ul class="list"> <li>123li> <li>abcli>ul> #1 xx.xpath("./ul[@class='list']/li") #xx是html文档 #xpath解析返回一个解析器列表 #2 xx.xpath("./ul[@class='list']/li").extract() #output #['123','abc] #extract使提取内容转换为Unicode字符串,返回数据类型为list #3 xx.xpath("./ul[@class='list']/li").extract()[0] #output #['123'] #返回列表中第一个元素 #4 xx.xpath("./ul[@class='list']/li")[0].extract() #output与3相同 #返回SelectorList里的第一个元素 #5 #xx.xpath("./ul[@class='list']/li".extract_first() #output与3相同 #和3作用效果相同 #6 xx.xpath("./ul[@class='list']/li")[0].extract()[0] #output #'1' #返回SelectorList里的第一个元素的第一个字符
python-爬虫中的extract()
原创javaSpr℡¹⁷ ©著作权
©著作权归作者所有:来自51CTO博客作者javaSpr℡¹⁷的原创作品,请联系作者获取转载授权,否则将追究法律责任
上一篇:Python几种主流框架
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
PythonPython
-
Python之FastAPI构建Python Web
FastAPI 构建高效的 Python Web
ico Python 服务器 -
python创建panel对象
Python 面向对象:类的创建及其基本内置方法的使用 首先了解一下什么是面向对象面向过程: 就是分析出解决问题所需要的步骤,然后用函数把这些步骤一步一步实现,使用的时候一个一个依次调用就可以了。 例如五子棋,面向过程的设计思路就是首先分析问题的步骤:1、开始游戏,2、黑子先走,3、绘制画面,4、判断输赢,5、轮到白子,6、绘制画面,7、判断输赢,8、返回步骤2,9、输出最后结果。把上
python创建panel对象 python面向对象 类、属性、方法、实例’ 私有属性、类属性 类方法、静态方法、私有方法