一、 获取p标签里面的内容

通用的一个字段类型public,然后字符串类型的string的文本字符,自定义设置字段路径FormateHandler,通过传参来进行他们之间的内容获取传递。

字符串string定义声明一个值,明显的记录他获取的内容数据。

if判断来从中实现他的结果,判断获取p标签的内容,这就需要Regex正则表达式,Regex表示是一个不可变的正则表达式,然后IsMatch他指的是所指定的正则表达式在指定的输入字符串中是否找到了匹配项。

然后拿进参数htmlP进行所之间的匹配。

拿进声明的局部变量htmlStr来进行着之间的已经处理好带图片的p标签,引用进写好封装好的getImages的值数。

否则else返回一些span标签里所带的正则,和p标签里所带的正则表达式,Regex一个指定是不可变的正则表达式,一个Replace在指定的输入字符串内使用指定的替换与指定正则表达是匹配的所有字符串。

然后弄一个正则让他去掉所不需要的东西

python获取标签里的内容 获取p标签值_正则表达式


二、处理带图片的p标签

通用的一个字段类型public,然后字符串类型的string的文本字符,自定义设置字段路径getImages让他引用到if判断里进行实用,通过传参来进行他们之间的内容获取传递。

也是要字符串string定义声明一个值,明显的记录他获取的内容数据。

获取p标签里面的img标签,MatchCollection表示通过以 代方式将正则表达式模式应用与输入字符串所找到的成功匹配的集合,定义名称局部变量,加上一个不可变的正则表达式Regex,再加上一个在指定的输入字符串中搜索指定的正则表达式的所有匹配项,中获取的img标签。

python获取标签里的内容 获取p标签值_字段类型_02


然后遍历循环所有的matches,获取value值

python获取标签里的内容 获取p标签值_字符串_03


匹配出所有的span标签,跟上面获取p标签里面的img标签一样实用到正则表达式。

匹配出所有的span标签,便实例循环便利循环他的结果集。

循环结果集出来后,进行获取匹配出来的内容,在加进if判断值,判断匹配的内容的集有了,就进行获取图片的路径。

否则如果没有标签则直接去掉span标签和空格

python获取标签里的内容 获取p标签值_字段类型_04