1.幻剑书盟小说采集节点
{dede:comments}
{!-- 采集列表获取规则 --}
{/dede:comments}
{dede:list source='single' sourcetype='list'
varstart='1' varend='10'}
{dede:url ='http://read.hjsm.tom.com/book/[var:分页]/html/contents.html'}
{/dede:url} <script language="JavaScript" src="http://book.book560.com/ads/ads728x15.js" type="text/javascript"></script>
{dede:need}http://read.hjsm.tom.com/book/{/dede:need}
{dede:cannot}{/dede:cannot}
{/dede:list}
{dede:comments}
{!-- 网页内容获取规则 --}
{/dede:comments}
{dede:art sptype='full'}
{dede:sppage}{/dede:sppage}
{dede:note field='title' ='[var:内容]'
isunit='' isdown=''}
{dede:match}<DIV class=title align=center>[var:内容]</div><HR>{/dede:match}
{/dede:note}
{dede:note field='writer' ='[var:内容]'
isunit='' isdown=''}
{dede:match}/index.php"><font color=blue>[var:内容]的会客室{/dede:match}
{/dede:note}
{dede:note field='body' ='[var:内容]'
isunit='1' isdown='1'}
{dede:match}</div><HR>[var:内容]</TD></TR>{/dede:match}
{dede:trim}<p>{/dede:trim}
{/dede:note}
{/dede:art}
2.翠微居小说采集节点
{dede:comments}
{!-- 采集列表获取规则 --}
{/dede:comments}
{dede:list source='single' sourcetype='list'
varstart='34271' varend='34272'}
{dede:url ='http://www.cuiweiju.com/articleinfo.php?id=[var:分页]'}
{/dede:url}
{dede:need}http://www.cuiweiju.com/htmpage/{/dede:need}
{dede:cannot}{/dede:cannot}
{/dede:list}
{dede:comments}
{!-- 网页内容获取规则 --}
{/dede:comments}
{dede:art sptype='full'}
{dede:sppage}{/dede:sppage}
{dede:note field='title' ='[var:内容]'
isunit='' isdown=''}
{dede:match}<div align='center'><span class='max'>[var:内容]</span><br><br><span class='min'>{/dede:match}
{/dede:note}
{dede:note field='writer' ='[var:内容]'
isunit='' isdown=''}
{dede:match}</span><br><br><span class='min'>作者:[var:内容]</span><br><br></div><div align='left'>{/dede:match}
{/dede:note}
{dede:note field='body' ='[var:内容]'
isunit='1' isdown='1'}
{dede:match}<span class='middle' id='content' name='content'><!--this-is-text-->[var:内容]<!--this-is-text--></span>{/dede:match} <script language="JavaScript" src="http://book.book560.com/ads/ads728x15.js" type="text/javascript"></script>
{/dede:note}
{/dede:art}
上面的两个都是一些小数据量的采集,由于大数据量太费时间了,所以把网址的范围写小了,有需要的朋友可以把网址的范围写大一些。
织梦部分采集规则-DedeCms
原创wx634e1c97257c6 博主文章分类:[随笔分类]NET知识库 ©著作权
文章标签 JavaScript PHP HTML ViewUI javascript 文章分类 运维
上一篇:jQuery常用技巧大放送
下一篇:.NET 开发系统 -知识 点
-
Beginctf 2024 pwn部分题解
beginctf 2024 pwn 部分题解wp
格式化字符串 beginctf pwn 栈溢出 wp -
详解网络知识:iptables规则
本文主要为大家详解介绍iptables规则。
IP iptables规则 云容器网络 -
织梦网采集
作者:少帅 您的支持是对博主最大的鼓励,感谢您的认真阅读。本文版权归作者所有,欢迎转载,但请保留该声明。
2.6 采集 支付宝 javascript 微信 -
dedecms(织梦)表前缀的bug
dedecms(织梦)设置表前缀的做法存在bug
dedecms 表前缀 -
python行内循环拼接
Python 虽然写起来代码量要远少于如 C++,Java,但运行速度又不如它们,因此也有了各种提升 Python 速度的方法技巧,这次要介绍的是用 Numba 库进行加速比较耗时的循环操作以及 Numpy 操作。如何加速循环操作,一个办法就是采用 Numba 加速,刚好最近看到一篇文章介绍了利用 Numba 加速 Python ,文章主要介绍了两个例子,也是 Numba 的两大作用,分
python行内循环拼接 numpy合并循环数组的array python 创建空的numpy数组 利用python查询电脑配置 如何在List中放部分实体