<pre name="code" class="python">
find_by_tag_name:
@elements = $h->find_by_tag_name('tag', ...);
$first_match = $h->find_by_tag_name('tag', ...);
在列表环境,返回一个元素列表或者在$h下有很多指定tag名字的。
在标量上下文, 返回第一个(以先前的顺序遍历树)
<span class="link_view" title="阅读次数"><a href="/zhaoyangjian724/article/details/50749020" title="阅读次数">阅读</a>(5)</span>
#<a> 标签的 href 属性用于指定超链接目标的 URL。
href 属性的值可以是任何有效文档的相对或绝对 URL,包括片段标识符和 JavaScript 代码段。如果用户选择了 <a> 标签中的内容,那么浏览器会尝试检索并显示 href 属性指定的 URL 所表示的文档,或者执行 JavaScript 表达式、方法和函数的列表。
@Links = $tree->find_by_tag_name('a');
foreach (@Links) {
@href = $_->attr('href');
foreach (@href) {
if($_=~ /.*category.*/) {
push( @category, $_ );
}
}
}
根据a标签,href 是a标签的一个属性
数据格式:
<div id="article_content" class="article_content">^M
^M
<p>什么时候会产生实例恢复呢?当你数据库服务器异常断电,重启数据库就会发生实例恢复。实例恢复是由数据库自动完成的,无须DBA的干涉。当然这里有个前提条件:数据文件、</p>^M
<p>在线日志文件、控制文件不得有损坏。</p>^M
<p> 我们用实验来分析一下实例恢复的整个过程吧!</p>^M
<p>1、在关闭数据库前,我们先看一下几个检查点的SCN<br>^M
--System checkpoint SCN (存在于控制文件)</p>^M
<p>SQL> select checkpoint_change# from v$database; </p>^M
<p>CHECKPOINT_CHANGE#<br>^M
------------------<br>^M
1. name :指定标签的名称。
2. id :指定标签的唯一标识。
3. class :指定标签的类名。
use HTML::TreeBuilder::XPath;
my $tree= HTML::TreeBuilder::XPath->new;
$tree->parse_file( 'dump 验证实例恢复的起点和终点 .html');
#获取每个版块的页码数
my $pageString;
##根据div标签,查找@id属性的列表
@pageString = $tree->findvalues('/html/body//div[@id="article_content"]');
foreach (@pageString){print " $_\n";
};
findvalues:
返回匹配节点的值作为列表,这主要是和findnodes_as_strings一样,除了列表的元素是对象a
html模块一些方法
转载本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
python的一些模块
urllib和urllib2;BeautifulSoup的简介;python的正则表达式re模块;
字符串 python Request