(CURL *handle, CURLoption option, parameter);
说明:
此函数用来告诉 libcurl 执行什么样的动作。该函数有 3 个参数(该函数的可设置选项非常之多):
第 1 个参数 handle 是由 curl_easy_init() 返回的句柄;第 2 个参数是可以设置的选项(CURLoption);第 3 个参数是与第 2 个选项相关联的参数,这个参数可以是 long 型,也可以是一个函数指针(function pointer),还可以是一个对象的指针 (object pointer),或者是一个 curl_off_t 类型,这些参数类型必须由选项值(CURLoption)来确定。
具体选项说明(分大类和小类,本说明为个人理解以及对说明手册的翻译,根据应用不断更新说明内容,分类顺序不按照说明手册):
网络选项(NETWORK OPTIONS):
1. CURLOPT_URL
这个选项后面接实际要处理的 URL ,这个 URL 是一个以 '\0' 结尾的字符串或参数指针(关于这个参数的简单示例见:http://www.groad.net/bbs/read.php?tid-1641.html)。如果 URL 参数不写上协议头(如 "http://" 或者 "ftp:// 等等 ),那么函数会自己进行猜解所给的主机上用的是哪一种服务协议。假如你给的这个地址是一个不被 支持的协议,那么在其后执行 curl_easy_perform() 函数或 curl_multi_perform() 函数时, libcurl 将返回错误(CURLE_UNSUPPORTED_PROTOCOL)。这个选项是唯一一个必须在 curl_easy_perform() 调用之前就要设置的选项。
2. CURLOPT_POSTFIELDSIZE
该选项要求第 3 个参数 parameter 是一个 void * 指针,它指向一个向 HTTP 服务器 POST 出去的一段数据,这段数据要根据服务器的具体要求填写。该选项用法参考示例:http://www.groad.net/bbs/read.php?tid-3909.html
3. CURLOPT_WRITEFUNCTION
使用该选项时,要求第 3 个参数中的回调函数必须是下面的函数原型:
size_t function( char *ptr, size_t size, size_t nmemb, void *userdata);
在启动会话时,一旦检测到有需要接收的数据时,回调函数被调用。ptr 所指向的数据大小由 size 和 nmemb 的乘积获得。函数最后需要返回接收数据的大小。如果不使用该函数,那么接收到的数据会直接打印到终端;使用该函数,那么接收到的数据保存在 ptr 所执向的区域,可以利用此来保存接收下来的数据。
4. CURLOPT_USERAGENT
该选项要求传递一个以 '\0' 结尾的字符串指针,这个字符串用来在向服务器请求时发送 HTTP 头部中的 User-Agent 信息,有些服务器是需要检测这个信息的,如果没有设置 User-Agent,那么服务器拒绝请求。设置后,可以骗过服务器对此的检查。
5. CURLOPT_WRITEDATA
使用该选项时,第 3 个参数作为用户数据的指针而传递到使用 CURLOPT_WRITEFUNCTION 选项时指定的回调函数中(第 4 个参数)。如果不想用回调函数而保存数据,那么可以使用 CURLOPT_WRITEDATA 选项,使用该选项时,函数的第 3 个参数必须是个 FILE 指针,函数会将接收到的数据自动的写到这个 FILE 指针所指向的文件流中。
6. CURLOPT_VERBOSE
在使用该选项且第 3 个参数为 1 时,curl 库会显示详细的操作信息。这对程序的调试具有极大的帮助。
7. CURLOPT_NOBODY
使用该选项时,若第 3 个参数设为 1,这样在输出中就不会包含主体内容部分。这仅是对在传输的所有内容中,含有“头部”和“主题内容”两部分的协议而言。如 HTTP(S) 服务器,在这种情况下将会使 libcurl 库仅发出一个头部请求。
8. CURLOPT_HEADER
使用该选项时,第 3 个参数设置为 1,那么会通知 curl 库在输出时要同时包含 "头部“ 和 "主题内容" 两个部分。该选项仅是对那些同时包含了”头部“和”主题内容“这两部分的协议而言(如 HTTP)。
9. CURLOPT_HEADERFUNCTION
该选项与上面第 3 个选项 CURLOPT_WRITEFUNCTION 类似,只要它一接收到头部信息时,它就会执行回调函数。需要注意的是,回调函数里处理的头部包含了所有收到的响应的头部信息,而不只是最后一次的响应。如果需要处理其中的一个头部,那么自己需要在所收集的头部信息中进行区分。
10. CURLOPT_WRITEHEADER 和 CURLOPT_HEADERDATA
这两个选项是同一种意思。它们和第 5 条中的 CURLOPT_WRITEDATA 选项功能一样,表示在接收到头部信息并调用回调函数时,给回调函数传递第 4 个参数。
11. CURLOPT_INFILESIZE
当向服务器上传文件时,该选项用来告诉 curl 库期望上传的文件的大小。使用该选项时,应该给函数第 3 个参数的应该是个 long 型变量。如果用的是 SCP 传输,那么该选项强制使用 CURLOPT_INFILESIZE_LARGE 。
12. CURLOPT_INFILESIZE_LARGE
该选项和 CURLOPT_INFILESIZE 功能一样,但是它要求函数的第 3 个参数必须是个 curl_off_t 类型。curl_off_t 为 int64_t 类型,而 int64_t 定义在 stdint.h 中:
if __WORDSIZE == 64
typedef long int int64_t;
# else
__extension__
typedef long long int int64_t;
由上面定义知,一般的,如果是 32 位平台,它就是 long long 型,表示 64 位的;如果是 64 位平台,它就是 long 型,也为 64 位。总之,就是个 64 位的。
13. CURLOPT_QUOTE 和 CURLOPT_POSTQUOTE
这两个选项的功能类似,它们的共同点都是给 FTP 或 SFTP 传递命令。这些命令应该放在 struct slist 链表中存储,使用时需要用 curl_slist_append() 函数将这些命令打包起来,然后一起发送出去。
它们的不同点是:CURLOPT_QUOTE 选项要求命令要在 FTP 传输请求之前就要发送到库,而 CURLOPT_POSTQUOTE 则可以在 FTP 传输请求发送完后发送。比如像下面的执行顺序是无法达到目的的:
1 . ... ...
2 curl_easy_perform(curl);
3 curl_easy_setopt(curl, CURLOPT_QUOTE, headerlist);
4 curl_easy_perform(curl);
5 ... ...
上面假设第 1 条 curl_easy_perform(curl); 语句已经发送了 FTP 传输请求,然后再用 CURLOPT_QUOTE 发送命令是错误的,这里应该使用 CURLOPT_POSTQUOTE 选项。使用 CURLOPT_QUOTE 选项需要先用 curl_easy_perform() 函数将其发送,然后再用一次 curl_easy_perform() 发送 FTP 传输请求。也就是说需要执行两次 curl_easy_perform() 函数。而用 CURLOPT_POSTQUOTE 选项则不需要这样,它只要将选项设置好后,然后只执行一次 curl_easy_perform() 函数即可。
14. CURLOPT_READFUNCTION 和 CURLOPT_READDATA
这两个选项和上面的 CURLOPT_WRITEFUNCTION 和 CURLOPT_WRITEDATA 类似。在 CURLOPT_READFUNCTION 的回调函数里,第 1 个参数 ptr 指针用来接收从第 4 个参数传递过来的数据(这个参数往往是个文件流指针),而这个参数是使用 CURLOPT_READDATA 选项时传递过来的。
15. CURLOPT_UPLOAD
在使用该选项时,第 3 个参数设置为 1,表示要准备上传文件。这个参数往往会配合 CURLOPT_READDATA,CURLOPT_INFILESIZE_LARGE,以及 CURLOPT_INFILESIZE 这几个选项一起用。如果是使用 HTTP 协议,那么使用 PUT 的方法进行上传,除非另有指定。
CURLOPT_HEADER:设为1,则在返回的内容里包含http header;
CURLOPT_FOLLOWLOCATION:设为0,则不会自动301,302跳转;
*CURLOPT_INFILESIZE: 当你上传一个文件到远程站点,这个选项告诉PHP你上传文件的大小。
*CURLOPT_VERBOSE: 如果你想CURL报告每一件意外的事情,设置这个选项为一个非零值。
*CURLOPT_HEADER: 如果你想把一个头包含在输出中,设置这个选项为一个非零值。
*CURLOPT_NOPROGRESS: 如果你不会PHP为CURL传输显示一个进程条,设置这个选项为一个非零值。
注意:PHP自动设置这个选项为非零值,你应该仅仅为了调试的目的来改变这个选项。
*CURLOPT_NOBODY: 如果你不想在输出中包含body部分,设置这个选项为一个非零值。
*CURLOPT_FAILONERROR: 如果你想让PHP在发生错误(HTTP代码返回大于等于300)时,不显示,设置这个选项为一人非零值。默认行为是返回一个正常页,忽略代码。
*CURLOPT_UPLOAD: 如果你想让PHP为上传做准备,设置这个选项为一个非零值。
*CURLOPT_POST: 如果你想PHP去做一个正规的HTTP POST,设置这个选项为一个非零值。这个POST是普通的 application/x-www-from-urlencoded 类型,多数被HTML表单使用。
*CURLOPT_FTPLISTONLY: 设置这个选项为非零值,PHP将列出FTP的目录名列表。
*CURLOPT_FTPAPPEND: 设置这个选项为一个非零值,PHP将应用远程文件代替覆盖它。
*CURLOPT_NETRC: 设置这个选项为一个非零值,PHP将在你的 ~./netrc 文件中查找你要建立连接的远程站点的用户名及密码。
*CURLOPT_FOLLOWLOCATION: 设置这个选项为一个非零值(象 “Location: “)的头,服务器会把它当做HTTP头的一部分发送(注意这是递归的,PHP将发送形如 “Location: “的头)。
*CURLOPT_PUT: 设置这个选项为一个非零值去用HTTP上传一个文件。要上传这个文件必须设置CURLOPT_INFILE和CURLOPT_INFILESIZE选项.
*CURLOPT_MUTE: 设置这个选项为一个非零值,PHP对于CURL函数将完全沉默。
*CURLOPT_TIMEOUT: 设置一个长整形数,作为最大延续多少秒。
*CURLOPT_LOW_SPEED_LIMIT: 设置一个长整形数,控制传送多少字节。
*CURLOPT_LOW_SPEED_TIME: 设置一个长整形数,控制多少秒传送CURLOPT_LOW_SPEED_LIMIT规定的字节数。
*CURLOPT_RESUME_FROM: 传递一个包含字节偏移地址的长整形参数,(你想转移到的开始表单)。
*CURLOPT_SSLVERSION: 传递一个包含SSL版本的长参数。默认PHP将被它自己努力的确定,在更多的安全中你必须手工设置。
*CURLOPT_TIMECONDITION: 传递一个长参数,指定怎么处理CURLOPT_TIMEVALUE参数。你可以设置这个参数为TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。这仅用于HTTP。
*CURLOPT_TIMEVALUE: 传递一个从1970-1-1开始到现在的秒数。这个时间将被CURLOPT_TIMEVALUE选项作为指定值使用,或被默认TIMECOND_IFMODSINCE使用。
下列选项的值将被作为字符串:
*CURLOPT_URL: 这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项。
*CURLOPT_USERPWD: 传递一个形如[username]:[password]风格的字符串,作用PHP去连接。
*CURLOPT_PROXYUSERPWD: 传递一个形如[username]:[password] 格式的字符串去连接HTTP代理。
*CURLOPT_RANGE: 传递一个你想指定的范围。它应该是”X-Y”格式,X或Y是被除外的。HTTP传送同样支持几个间隔,用逗句来分隔(X-Y,N-M)。
*CURLOPT_POSTFIELDS: 传递一个作为HTTP “POST”操作的所有数据的字符串。
*CURLOPT_REFERER: 在HTTP请求中包含一个”referer”头的字符串。
*CURLOPT_USERAGENT: 在HTTP请求中包含一个”user-agent”头的字符串。
*CURLOPT_FTPPORT: 传递一个包含被ftp “POST”指令使用的IP地址。这个POST指令告诉远程服务器去连接我们指定的IP地址。这个字符串可以是一个IP地址,一个主机名,一个网络界面名(在UNIX下),或是‘-’(使用系统默认IP地址)。
*CURLOPT_COOKIE: 传递一个包含HTTP cookie的头连接。
*CURLOPT_SSLCERT: 传递一个包含PEM格式证书的字符串。
*CURLOPT_SSLCERTPASSWD: 传递一个包含使用CURLOPT_SSLCERT证书必需的密码。
*CURLOPT_COOKIEFILE: 传递一个包含cookie数据的文件的名字的字符串。这个cookie文件可以是Netscape格式,或是堆存在文件中的HTTP风格的头。
*CURLOPT_CUSTOMREQUEST: 当进行HTTP请求时,传递一个字符被GET或HEAD使用。为进行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request.
注意: 在确认你的服务器支持命令先不要去这样做。
下列的选项要求一个文件描述(通过使用fopen()函数获得):
*CURLOPT_FILE: 这个文件将是你放置传送的输出文件,默认是STDOUT.
*CURLOPT_INFILE: 这个文件是你传送过来的输入文件。
*CURLOPT_WRITEHEADER: 这个文件写有你输出的头部分。
*CURLOPT_STDERR: 这个文件写有错误而不是stderr。
几种选项测试函数:
<stdio.h>
<stdlib.h>
<string.h>
<curl/curl.h>
<curl/easy.h>
static size_t save_header(void *ptr, size_t size, size_t nmemb, void *data)
{
fwrite(ptr, size, nmemb, data);
return (size * nmemb);
}
int main(void)
{
"http://www.sina.com.cn/";
CURL *curl; CURLcode res;
FILE *fp;
"htmheader.html", "w")))
{
"fopen error\n");
return -1;
}
curl_global_init(CURL_GLOBAL_ALL);
curl = curl_easy_init();
if (curl)
{
curl_easy_setopt(curl, CURLOPT_URL, url);
curl_easy_setopt(curl, CURLOPT_NOBODY, 1L);
curl_easy_setopt(curl, CURLOPT_HEADER, 0L);
curl_easy_setopt(curl, CURLOPT_HEADERFUNCTION, save_header);
curl_easy_setopt(curl, CURLOPT_WRITEHEADER, fp);
curl_easy_perform(curl);
}
curl_easy_cleanup(curl);
curl_global_cleanup();
fclose (fp);
return 0;
}
//超时设置(单位:秒),如果在指定时间内没数据可接收则超时
curl_easy_setopt( curl, CURLOPT_TIMEOUT, 3 );
//连接超时,不过只适用于Unix系统,Windows系统应该就是使用CURLOPT_TIMEOUT
curl_easy_setopt( curl, CONNECTTIMEOUT, 3 );
//
curl_easy_setopt( curl, CURLOPT_VERBOSE, 1L ); //在屏幕打印请求连接过程和返回http数据
curl_easy_setopt( curl, CURLOPT_TIMEOUT, 10 );//接收数据时超时设置,如果10秒内数据未接收完,直接退出
curl_easy_setopt(curl, CURLOPT_AUTOREFERER, 1); // 以下3个为重定向设置
curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1); //返回的头部中有Location(一般直接请求的url没找到),则继续请求Location对应的数据
curl_easy_setopt(curl, CURLOPT_MAXREDIRS, 1);//查找次数,防止查找太深
curl_easy_setopt( curl, CURLOPT_CONNECTTIMEOUT, 3 );//连接超时,这个数值如果设置太短可能导致数据请求不到就断开了
//
cocos2dx AssetsManager的一个BUG
我们在用AssetsManager做资源更新的时候遇到了一个问题,部分玩家热更新失败。查了好久才查出来,原来是我们的资源文件被宽带提供商(我们发现BUG的是华数网通、部分手机3G)缓存了这个资源文件,并对我们的请求链接做了跳转。解决办法在AssetsManager源代码中curl的设置加上一句
第443以及138行左右
curl_easy_setopt(_curl, CURLOPT_FOLLOWLOCATION, 1);
//设置成更随跳转
//----
http://www.groad.net/bbs/read.php?tid-4455.html
Curl 中有一个
CURLOPT_FOLLOWLOCATION
参数可以用来跟随重定向页面,比如你在访问某个页面时,该页面又重定向到了另外一个页面(比如使用 php 的 header() 参数实现的重定向,或者是 html 里的 refresh 做的重定向),这时可以使用
CURLOPT_FOLLOWLOCATION
参数进行 URL 跟随,最终会来到重定向后的页面。
比如我的论坛实际上也是用了重定向,当你访问
www.groad.net
时,实际上是访问了
www.groad.net/index.html
这个页面,而这个页面除了将你带到
www.groad.net/bbs/index.php
外什么都不做,代码如:
复制代码
//--
和 CURLOPT_FOLLOWLOCATION 相关的还有两个参数:
CURLOPT_MAXREDIRS
和
CURLOPT_AUTOREFERER
。
CURLOPT_MAXREDIRS : 允许你定义跳转请求的最大次数,当超过了这个数,将不再获取往后的内容。
CURLOPT_AUTOREFERER :curl 会自动添加 Referer header 在每一个跳转链接,也就是一跟到底。
CURLOPT_FOLLOWLOCATION 选项的一个好处是在一些反盗链的链接中会用到。
//
http://blog.chinaunix.net/uid-20657201-id-1588339.html
1、CURLcode curl_global_init(long flags);//初始化libcurl
描述:这个函数只能用一次。(其实在调用curl_global_cleanup 函数后仍然可再用),如果这个函数在curl_easy_init函数调用时还没调用,它全由libcurl库自动完成。
参数:flags
CURL_GLOBAL_ALL //初始化所有的可能的调用。
CURL_GLOBAL_SSL //初始化支持 安全套接字层。
CURL_GLOBAL_WIN32 //初始化win32套接字库。
CURL_GLOBAL_NOTHING //没有额外的初始化。
2、void curl_global_cleanup(void);
描述:在结束libcurl使用的时候,用来对curl_global_init做的工作清理。类似于close的函数。
3、char *curl_version( );
描述: 打印当前libcurl库的版本。
4、CURL *curl_easy_init( ); //得到 easy interface型指针
描述:curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样). 相应的在调用结束时要用curl_easy_cleanup函数清理.
一般curl_easy_init意味着一个会话的开始. 它的返回值一般都用在easy系列的函数中.
5、void curl_easy_cleanup(CURL *handle); //释放内存
描述:这个调用用来结束一个会话.与curl_easy_init配合着用.
参数:CURL类型的指针.
6、CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter); //设置的传输选项,实现回调函数以完成用户特定任务
描述: 这个函数最重要了.几乎所有的curl 程序都要频繁的使用它.它告诉curl库.程序将有如何的行为. 比如要查看一个网页的html代码等.(这个函数有些像ioctl函数)参数:
(1) CURL类型的指针
(2) 各种CURLoption类型的选项.(都在curl.h库里有定义,man 也可以查看到)
(3) parameter 这个参数既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数.
(4) CURLoption 这个参数的取值很多.具体的可以查看man手册.
补充:curl_setop()函数中的参数中文说明
curl_setopt()函数将为一个CURL会话设置选项。option参数是你想要的设置,value是这个选项给定的值。下列选项的值将被作为长整形使用(在option参数中指定):
*CURLOPT_INFILESIZE:当你上传一个文件到远程站点,这个选项告诉PHP你上传文件的大小。
*CURLOPT_VERBOSE:如果你想CURL报告每一件意外的事情,设置这个选项为一个非零值。
*CURLOPT_HEADER:如果你想把一个头包含在输出中,设置这个选项为一个非零值。
*CURLOPT_NOPROGRESS:如果你不会PHP为CURL传输显示一个进程条,设置这个选项为一个非零值。注意:PHP自动设置这个选项为非零值,你应该仅仅为了调试的目的来改变这个选项。
*CURLOPT_NOBODY:如果你不想在输出中包含body部分,设置这个选项为一个非零值。
*CURLOPT_FAILONERROR:如果你想让PHP在发生错误(HTTP代码返回大于等于300)时,不显示,设置这个选项为一人非零值。默认行为是返回一个正常页,忽略代码。
*CURLOPT_UPLOAD:如果你想让PHP为上传做准备,设置这个选项为一个非零值。
*CURLOPT_POST: 如果你想PHP去做一个正规的HTTPPOST,设置这个选项为一个非零值。这个POST是普通的application/x-www-from-urlencoded 类型,多数被HTML表单使用。
*CURLOPT_FTPLISTONLY:设置这个选项为非零值,PHP将列出FTP的目录名列表。
*CURLOPT_FTPAPPEND:设置这个选项为一个非零值,PHP将应用远程文件代替覆盖它。
*CURLOPT_NETRC: 设置这个选项为一个非零值,PHP将在你的 ~./netrc文件中查找你要建立连接的远程站点的用户名及密码。
*CURLOPT_FOLLOWLOCATION: 设置这个选项为一个非零值(象“Location:“)的头,服务器会把它当做HTTP头的一部分发送(注意这是递归的,PHP将发送形如“Location: “的头)。
*CURLOPT_PUT: 设置这个选项为一个非零值去用HTTP上传一个文件。要上传这个文件必须设置CURLOPT_INFILE和CURLOPT_INFILESIZE选项.*CURLOPT_MUTE:设置这个选项为一个非零值,PHP对于CURL函数将完全沉默。
*CURLOPT_TIMEOUT: 设置一个长整形数,作为最大延续多少秒,由于设置传输时间。
*CURLOPT_CONNECTIONTIMEOUT: 设置连接等待时间。
*CURLOPT_LOW_SPEED_LIMIT:设置一个长整形数,控制传送多少字节。
*CURLOPT_LOW_SPEED_TIME:设置一个长整形数,控制多少秒传送CURLOPT_LOW_SPEED_LIMIT规定的字节数。
*CURLOPT_RESUME_FROM:传递一个包含字节偏移地址的长整形参数,(你想转移到的开始表单)。
*CURLOPT_SSLVERSION:传递一个包含SSL版本的长参数。默认PHP将被它自己努力的确定,在更多的安全中你必须手工设置。
*CURLOPT_TIMECONDITION:传递一个长参数,指定怎么处理CURLOPT_TIMEVALUE参数。你可以设置这个参数为TIMECOND_IFMODSINCE或 TIMECOND_ISUNMODSINCE。这仅用于HTTP。
*CURLOPT_TIMEVALUE:传递一个从1970-1-1开始到现在的秒数。这个时间将被CURLOPT_TIMEVALUE选项作为指定值使用,或被默认TIMECOND_IFMODSINCE使用。下列选项的值将被作为字符串:
*CURLOPT_URL:这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项。
*CURLOPT_USERPWD:传递一个形如[username]:[password]风格的字符串,作用PHP去连接。
*CURLOPT_PROXYUSERPWD: 传递一个形如[username]:[password]格式的字符串去连接HTTP代理。
*CURLOPT_RANGE:传递一个你想指定的范围。它应该是”X-Y”格式,X或Y是被除外的。HTTP传送同样支持几个间隔,用逗句来分隔(X-Y,N-M)。
*CURLOPT_POSTFIELDS: 传递一个作为HTTP“POST”操作的所有数据的字符串。
*CURLOPT_REFERER:在HTTP请求中包含一个”referer”头的字符串。
*CURLOPT_USERAGENT:在HTTP请求中包含一个”user-agent”头的字符串。
*CURLOPT_FTPPORT: 传递一个包含被ftp“POST”指令使用的IP地址。这个POST指令告诉远程服务器去连接我们指定的IP地址。这个字符串可以是一个IP地址,一个主机名,一个网络界面名(在UNIX下),或是‘-’(使用系统默认IP地址)。
*CURLOPT_COOKIE: 传递一个包含HTTP cookie的头连接。
*CURLOPT_SSLCERT: 传递一个包含PEM格式证书的字符串。
*CURLOPT_SSLCERTPASSWD:传递一个包含使用CURLOPT_SSLCERT证书必需的密码。
*CURLOPT_COOKIEFILE:传递一个包含cookie数据的文件的名字的字符串。这个cookie文件可以是Netscape格式,或是堆存在文件中的HTTP风格的头。
*CURLOPT_CUSTOMREQUEST: 当进行HTTP请求时,传递一个字符被GET或HEAD使用。为进行DELETE或其它操作是有益的,更Passa string to be used instead of GET or HEAD when doing an HTTPrequest. This is useful for doing or another, more obscure, HTTPrequest. 注意:在确认你的服务器支持命令先不要去这样做。下列的选项要求一个文件描述(通过使用fopen()函数获得):
*CURLOPT_FILE:这个文件将是你放置传送的输出文件,默认是STDOUT.
*CURLOPT_INFILE: 这个文件是你传送过来的输入文件。
*CURLOPT_WRITEHEADER: 这个文件写有你输出的头部分。
*CURLOPT_STDERR:这个文件写有错误而不是stderr。用来获取需要登录的页面的例子,当前做法是每次或许都登录一次,有需要的人再做改进了:)
*CURLOPT_WRITEDATA:选项允许你定义一个流,接收到的数据将传递给这个流而不是发送给标准输出。你可以在流中执行任何你想要的数据处理,并控制在应用程序中显示哪些数据
*CURLOPT_WRITEFUNCTION:回调函数原型为:size_t function( void *ptr, size_t size, size_t nmemb, void *stream); 函数将在libcurl接收到数据后被调用,因此函数多做数据保存的功能,如处理下载文件。
*CURLE_OK: 任务完成一切都好。
*CURLE_UNSUPPORTED_PROTOCOL: 不支持的协议,由URL的头部指定
*CURLE_COULDNT_CONNECT: 不能连接到remote 主机或者代理
*CURLE_REMOTE_ACCESS_DENIED: 访问被拒绝
*CURLE_HTTP_RETURNED_ERROR: Http返回错误
*CURLE_READ_ERROR: 读本地文件错误
7、CURLcode curl_easy_perform(CURL *handle); //完成传输任务;返回0意味一切ok,非0代表错误发生
描述:这个函数在初始化CURL类型的指针 以及curl_easy_setopt完成后调用. 就像字面的意思所说perform就像是个舞台.让我们设置的option 运作起来.
参数:CURL类型的指针.
补充:
(1)在连接过程中,如果出现异常,如网线拔掉,返回CURLE_COULDNT_CONNECT;
(2)在下载过程中,即已经连接上了,后面如果出现异常,如网线拔掉,返回CURLE_OPERATION_TIMEOUTED
三:应用实例
1、为什么要使用libcurl,
(1)作为http的客户端,可以直接用socket连接服务器,然后对到的数据进行http解析,但要分析协议头,实现代理…这样太麻烦了。
(2)libcurl是一个开源的客户端url传输库,支持FTP,FTPS,TFTP,HTTP,HTTPS,GOPHER,TELNET,DICT,FILE和LDAP,支持Windows,Unix,Linux等平台,简单易用,且库文件占用空间不到200K。
2、get和post方式
客户端在http连接时向服务提交数据的方式分为get和post两种
(1)Get方式将所要传输的数据附在网址后面,然后一起送达服务器,它的优点是效率比较高;缺点是安全性差、数据不超过1024个字符、必须是7位的ASCII编码;查询时经常用此方法。
(2)Post通过Http post处理发送数据,它的优点是安全性较强、支持数据量大、支持字符多;缺点是效率相对低;编辑修改时多使用此方法。
3、cookie与session
(1)cookie是发送到客户浏览器的文本串句柄,并保存在客户机硬盘上,可以用来在某个Web站点会话之间持久地保持数据。cookie在客户端。
(2)session是访问者从到达某个特定主页到离开为止的那段时间。每一访问者都会单独获得一个session,实现站点多个用户之间在所有页面中共享信息。session在服务器上。
(3)libcurl中使用cookie,保存cookie, 使之后的链接与此链接使用相同的cookie
(3.1)在关闭链接的时候把cookie写入指定的文件: curl_easy_setopt(curl, CURLOPT_COOKIEJAR, "/tmp/cookie.txt");
(3.2)取用现在有的cookie,而不重新得到cookie: curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt");
4、http与https的区别
(1)Http是明文发送,任何人都可以拦截并读取内容
(2)Https是加密传输协议,用它传输的内容都是加密过的,https是http的扩展,其安全基础是SSL协议
5、base64编码
(1)如果要传一段包含特殊字符比较多的数据,直接上传就需要处理转意符之类的很多问题,用base64编码,它可以把数据转成可读的字串,base64由a-z, A-Z, +/总计64个字符组成。
(2)由于base64的组成部分有加号,而加号是url中的转意字符,所以无论是get方式还是post,传到服务器的过程中,都会把加号转成空格,所以在传base64之前需要把base64编码后的加号替换成”%2B”,这样就可以正常发送了。
//---------------------------------------------------------------------------------------------------------------------------------
这篇讲一下基于libcurl库的开发(Windows平台,MSVC2005开发环境)。
libcurl是一个简单易用的基于URL传输的客户端开发库,支持多种平台以及三十多种开发语言绑定。libcurl是线程安全的,兼容IPv6,功能强大且运行效率高,很多知名公司如Google、Adobe的产品都应用过libcurl。
在05环境中做libcurl开发,需要将静态库文件加到编译链接环境中,并且要dll动态运行库支持。
libcurl提供了一组C语言API函数直接调用。首先需要提到的两个函数就是curl_global_init()和 curl_global_cleanup()。libcurl要用到一系列的全局常量,curl_global_init()函数就是初始化这些变量,并 分配一些全局资源;curl_global_cleanup()则负责释放这些资源。因此一般情况下,在调用libcurl函数之前,先用 curl_global_init(CURL_GLOBAL_ALL)做初始化,在调用完毕后,用curl_global_cleanup()
退出。需要注意的是,这些全局变量和资源并不是线程安全的,因此,在多线程应用的环境中,最好不要多次调用curl_global_init()和curl_global_cleanup(),调用其他函数并不会改变这些全局变量和资源。
libcurl支持3种不同的接口调用方式,分别是"easy"、"multi"和"share"模式。libcurl-easy是一组同步接口,函数都 是curl_easy_*形式,这种模式调用curl_easy_perform()函数进行URL数据传输,直到传输完成函数才返回;libcurl- multi是一组异步接口,函数都是curl_multi_*形式,调用curl_multi_perform()函数进行传输,但是每次调用只传一片数 据,我们可以用select()函数控制多个下载任务进行同步下载,来实现在一个线程中同时下载多个文件;libcurl-share允许在多线程中操作 共享数据。下面以libcurl-easy为例讲一下libcurl的函数。
1、CURL *curl_easy_init()
此函数需要最先被调用,返回CRUL easy句柄;后续其他函数调用都要用到这个句柄。如果没有调用curl_global_init(),该函数自动调用,但是考虑到线程安全的问题,最好自己调用curl_global_init()。
2、CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter)
所有参数和选项设置都是通过这个函数完成的,它告诉libcurl怎样去进行传输。参数handle即为curl_easy_init()返回的句柄,后 面根据option的类型,设置相应的parameter值,该函数每次调用只能设置一个选项。具体的option讲解在这两篇博文中有较全面的介绍:
http://blog.163.com/wangsen_315/blog/static/9461414200882384555217/ http://blog.sina.com.cn/s/blog_4f9fc6e10100einf.html 这里只总结一下与下载有关的常用选项设置。
CURLOPT_URL
字符串类型,该选项设置要处理的URL地址,该选项是进行curl_easy_perform之前唯一必须要设置的选项。
CURLOPT_COOKIE
字符串类型,设置http头中的cookie信息。
CURLOPT_COOKIEFILE
字符串类型,同CURLOPT_COOKIE,不过cookie信息从文件中读取。
CURLOPT_FOLLOWLOCATION
布尔值类型,该参数设置为非零值表示follow服务器返回的重定向信息。
CURLOPT_POSTFIELDS
字符串类型,提交http的post操作字符串数据。
CURLOPT_TIMEOUT
long数值类型,设置函数执行的最长时间,时间单位为s。
CURLOPT_CONNECTTIMEOUT
long数值类型,设置连接服务器最长时间,时间单位为s;当置为0时表示无限长。
CURLOPT_MAX_RECV_SPEED_LARGE
curl_off_t类型数据,指定下载过程中最大速度,单位bytes/s。
CURLOPT_HEADERFUNCTION
函数指针类型,该选项设置一个处理接收到的header数据的回调函数,函数原型为:
size_t function( void *ptr, size_t size, size_t nmemb, void *stream);
其中,ptr指向接收到的header头数据,数据大小为size*nmemb,stream指向调用CURLOPT_WRITEHEADER选项设置的参数。该回调函数应返回实际处理的数据量大小,或者出错返回-1。
CURLOPT_WRITEFUNCTION
函数指针类型,该选项设置一个处理接收到的下载数据的回调函数,函数原型为:
size_t function( void *ptr, size_t size, size_t nmemb, void *stream);
其中,ptr指向接收到的数据,数据大小为size*nmemb,stream指向调用CURLOPT_WRITEDATA选项设置的参数。
如果函数指针置为NULL,则会调用默认的函数,将数据写入到由CURLOPT_WRITEDATA指定的FILE*中。
CURLOPT_HTTPHEADER
curl_slist结构体类型,该选项自定义请求头信息。
CURLOPT_NOPROGRESS
布尔值类型,设置该值为非零值关闭PHP为CRUL传输显示的进度条。
3、void curl_easy_reset(CURL *handle )
重新初始化CURL句柄的选项设置。
4、CURLcode curl_easy_getinfo(CURL *curl, CURLINFO info, ... )
查询CRUL会话的内部信息,具体说明请参考curl自带文档。
5、void curl_easy_cleanup(CURL * handle )
该函数与curl_easy_init函数成对出现,handle即为调用curl_easy_init返回的句柄。该函数在CURL会话结束退出时调用,之后handle无效。
libcurl库开发就简单总结这些,只是一个很粗略的介绍,具体的细节请参考curl自带的文档手册。本文没有给出示例代码,因为curl的源码包中已经自带了很多例子,大家可以仔细研究一下。
//---------------------------------------------------------------------------------------------------------------------------------
一、curl简介
curl是一个利用URL语法在命令行方式下工作的文件传输工具。它支持的协议有:FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP。curl同样支持HTTPS认证,HTTP POST方法, HTTP PUT方法, FTP上传, kerberos认证, HTTP上传, 代理服务器, cookies,用户名/密码认证, 下载文件断点续传, 上载文件断点续传, http代理服务器管道( proxy tunneling), 甚至它还支持IPv6, socks5代理服务器,通过http代理服务器上传文件到FTP服务器等等,功能十分强大。
二、curl安装
ubuntu安装:sudo apt-get install curl
libcurl静态库:./configure & make & install
windows:下载curl.exe,cmd进入curl.exe所在目录可以直接使用
三、curl使用
curl的用法为:curl [options] [URL...],其中options是下载需要的参数,大约有80多个,curl的各个功能完全是依靠这些参数完成的。这里只介绍几种简单的用法,详细的curl的参数在http://curl.haxx.se/docs/说明。
1、读取网页
2、保存网页、下载文件
以page.html命名下载网页:curl –o page.html http://www.linuxidc.com
以服务器上的文件名命名网页:curl –O http://cgi2.tky.3web.ne.jp/~zzh/screen1.JPG
批量下载文件:curl -O http://cgi2.tky.3web.ne.jp/~zzh/screen[1-10].JPG
3、使用代理服务器及其端口
curl –x 127.0.0.1:8580 –o page.html http://www.linuxidc.com
4、使用cookie来记录session信息
cookie 信息存到cookie1.txt中:curl –o page.html –D cookie1.txt http://www.linuxidc.com
使用上次的cookie并生成新的cookie:curl –o page.html –D cookie2.txt -b cookie2.txt http://www.linuxidc.com
5、断点续传
比如下载screen1.JPG中,突然掉线了,可以这样开始续传:curl -c -O http://cgi2.tky.3wb.ne.jp/~zzh/screen1.JPG
另外可以用-r选项进行分块下载
6、上传文件
比如我们向ftp传一个文件:curl -T localfile -u name:passwd ftp://upload_site:port/path/
PS:对于ftp服务器用-u name:passwd选项
7、http提交一个表单GET与POST模式
GET模式什么option都不用,只需要把变量写在url里面就可以了比如:
$curl http://www.linuxidc.com/login.cgi?user=nickwolfe&password=12345
POST模式的选项是 -d
比如:curl -d "user=nickwolfe&password=12345" http://www.linuxidc.com/login.cgi
四、curl编程
1、curl编程流程
LibCurl编程流程在基于LibCurl的程序里,主要采用callback function (回调函数)的形式完成传输任务,用户在启动传输前设置好各类参数和回调函数,当满足条件时libcurl将调用用户的回调函数实现特定功能。下面是利用libcurl完成传输任务的流程:
(1)调用curl_global_init()初始化libcurl
(2)调用 curl_easy_init()函数得到 easy interface型指针
(3)调用curl_easy_setopt设置传输选项
(4)根据curl_easy_setopt设置的传输选项,实现回调函数以完成用户特定任务
(5)调用curl_easy_perform()函数完成传输任务
(6)调用curl_easy_cleanup()释放内存
在整过过程中设置curl_easy_setopt()参数是最关键的,几乎所有的libcurl程序都要使用它。
2、重要函数
(1)CURLcode curl_global_init(long flags);
描述:
这个函数只能用一次。(其实在调用curl_global_cleanup 函数后仍然可再用)
如果这个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动完成。
参数:flags
CURL_GLOBAL_ALL //初始化所有的可能的调用。
CURL_GLOBAL_SSL //初始化支持 安全套接字层。
CURL_GLOBAL_WIN32 //初始化win32套接字库。
CURL_GLOBAL_NOTHING //没有额外的初始化。
(2)void curl_global_cleanup(void);
描述:在结束libcurl使用的时候,用来对curl_global_init做的工作清理。类似于close的函数。
(3)char *curl_version( );
描述: 打印当前libcurl库的版本。
(4)CURL *curl_easy_init( );
描述:curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样). 相应的在调用结束时要用curl_easy_cleanup函数清理.
一般curl_easy_init意味着一个会话的开始. 它的返回值一般都用在easy系列的函数中.
(5)void curl_easy_cleanup(CURL *handle);
描述:
这个调用用来结束一个会话.与curl_easy_init配合着用.
参数:
CURL类型的指针.
(6)CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter);
描述: 这个函数最重要了.几乎所有的curl 程序都要频繁的使用它.它告诉curl库.程序将有如何的行为. 比如要查看一个网页的html代码等.(这个函数有些像ioctl函数)参数:
1 CURL类型的指针
2 各种CURLoption类型的选项.(都在curl.h库里有定义,man 也可以查看到)
3 parameter 这个参数 既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数.
CURLoption 这个参数的取值很多.具体的可以查看man手册.
(7) CURLcode curl_easy_perform(CURL *handle);描述:这个函数在初始化CURL类型的指针 以及curl_easy_setopt完成后调用. 就像字面的意思所说perform就像是个舞台.让我们设置的
option 运作起来.参数:
CURL类型的指针.
3、curl_easy_setopt函数介绍
本节主要介绍curl_easy_setopt中跟http相关的参数。注意本节的阐述都是以libcurl作为主体,其它为客体来阐述的。
1. CURLOPT_URL
设置访问URL
2. CURLOPT_WRITEFUNCTION,CURLOPT_WRITEDATA
回调函数原型为:size_t function( void *ptr, size_t size, size_t nmemb, void *stream); 函数将在libcurl接收到数据后被调用,因此函数多做数据保存的功能,如处理下载文件。CURLOPT_WRITEDATA 用于表明CURLOPT_WRITEFUNCTION函数中的stream指针的来源。
3. CURLOPT_HEADERFUNCTION,CURLOPT_HEADERDATA
回调函数原型为 size_t function( void *ptr, size_t size,size_t nmemb, void *stream); libcurl一旦接收到http 头部数据后将调用该函数。CURLOPT_WRITEDATA 传递指针给libcurl,该指针表明CURLOPT_HEADERFUNCTION 函数的stream指针的来源。
4. CURLOPT_READFUNCTION CURLOPT_READDATA
libCurl需要读取数据传递给远程主机时将调用CURLOPT_READFUNCTION指定的函数,函数原型是:size_t function(void *ptr, size_t size, size_t nmemb,void *stream). CURLOPT_READDATA 表明CURLOPT_READFUNCTION函数原型中的stream指针来源。
5. CURLOPT_NOPROGRESS,CURLOPT_PROGRESSFUNCTION,CURLOPT_PROGRESSDATA
跟数据传输进度相关的参数。CURLOPT_PROGRESSFUNCTION 指定的函数正常情况下每秒被libcurl调用一次,为了使CURLOPT_PROGRESSFUNCTION被调用,CURLOPT_NOPROGRESS必须被设置为false,CURLOPT_PROGRESSDATA指定的参数将作为CURLOPT_PROGRESSFUNCTION指定函数的第一个参数
6. CURLOPT_TIMEOUT,CURLOPT_CONNECTIONTIMEOUT:
CURLOPT_TIMEOUT 由于设置传输时间,CURLOPT_CONNECTIONTIMEOUT 设置连接等待时间
7. CURLOPT_FOLLOWLOCATION
设置重定位URL
CURLOPT_RANGE: CURLOPT_RESUME_FROM:
断点续传相关设置。CURLOPT_RANGE 指定char *参数传递给libcurl,用于指明http域的RANGE头域,例如:
表示头500个字节:bytes=0-499
表示第二个500字节:bytes=500-999
表示最后500个字节:bytes=-500
表示500字节以后的范围:bytes=500-
第一个和最后一个字节:bytes=0-0,-1
同时指定几个范围:bytes=500-600,601-999
CURLOPT_RESUME_FROM 传递一个long参数给libcurl,指定你希望开始传递的
偏移量。
4、curl_easy_perform 函数说明(error 状态码)
该函数完成curl_easy_setopt指定的所有选项,本节重点介绍curl_easy_perform的返回值。返回0意味一切ok,非0代表错误发生。主要错误码说明:
1. CURLE_OK
任务完成一切都好
2 CURLE_UNSUPPORTED_PROTOCOL
不支持的协议,由URL的头部指定
3 CURLE_COULDNT_CONNECT
不能连接到remote 主机或者代理
4 CURLE_REMOTE_ACCESS_DENIED
访问被拒绝
5 CURLE_HTTP_RETURNED_ERROR
Http返回错误
6 CURLE_READ_ERROR
读本地文件错误
五、curl编程例子
1、获取html网页
[cpp] view plain copy print ?
1. #include <stdio.h>
2.
3. #include <curl/curl.h>
4.
5. #include <stdlib.h>
6.
7. int main(int argc, char *argv[])
8.
9. {
10.
11. CURL *curl; //定义CURL类型的指针
12.
13. CURLcode res; //定义CURLcode类型的变量,保存返回状态码
14.
15. if(argc!=2)
16.
17. {
18.
19. printf("Usage : file <url>;/n");
20.
21. exit(1);
22.
23. }
24.
25. curl = curl_easy_init(); //初始化一个CURL类型的指针
26.
27. if(curl!=NULL)
28.
29. {
30.
31. // 设置curl选项. 其中CURLOPT_URL是让用户指定url. argv[1]中存放的命令行传进来的网址
32.
33. curl_easy_setopt(curl, CURLOPT_URL, argv[1]);
34.
35. //调用curl_easy_perform 执行我们的设置.并进行相关的操作. 在这里只在屏幕上显示出来.
36.
37. res = curl_easy_perform(curl);
38.
39. //清除curl操作.
40.
41. curl_easy_cleanup(curl);
42.
43. }
44.
45. return 0;
46.
47. }
编译gcc get_http.c -o get_http –lcurl
./ get_http www.baidu.com
2、网页下载保存
[cpp] view plain copy print ?
1. // 采用CURLOPT_WRITEFUNCTION 实现网页下载保存功能
2.
3. #include <stdio.h>;
4.
5. #include <stdlib.h>;
6.
7. #include <unistd.h>;
8.
9. #include <curl/curl.h>;
10.
11. #include <curl/types.h>;
12.
13. #include <curl/easy.h>;
14.
15. FILE *fp; // 定义FILE类型指针
16.
17. //这个函数是为了符合 CURLOPT_WRITEFUNCTION而构造的
18.
19. //完成数据保存功能
20.
21. size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)
22.
23. {
24.
25. int written = fwrite(ptr, size, nmemb, (FILE *)fp);
26.
27. return written;
28.
29. }
30.
31. int main(int argc, char *argv[])
32.
33. {
34.
35. CURL *curl;
36.
37. curl_global_init(CURL_GLOBAL_ALL);
38.
39. curl=curl_easy_init();
40.
41. curl_easy_setopt(curl, CURLOPT_URL, argv[1]);
42.
43. if((fp=fopen(argv[2],"w"))==NULL)
44.
45. {
46.
47. curl_easy_cleanup(curl);
48.
49. exit(1);
50.
51. }
52.
53. CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理
54.
55. curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);
56.
57. curl_easy_perform(curl);
58.
59. curl_easy_cleanup(curl);
60.
61. exit(0);
62.
63. }
编译gcc save_http.c -o save_http –lcurl
./ save_http www.baidu.com /tmp/baidu
3、进度条实例(显示文件下载进度)
[cpp] view plain copy print ?
1. // 采用CURLOPT_NOPROGRESS, CURLOPT_PROGRESSFUNCTION CURLOPT_PROGRESSDATA 实现文件传输进度提示功能
2.
3. //函数采用了gtk库,故编译时需指定gtk库
4.
5. //函数启动专门的线程用于显示gtk 进度条bar
6.
7. #include <stdio.h>
8.
9. #include <gtk/gtk.h>
10.
11. #include <curl/curl.h>
12.
13. #include <curl/types.h> /* new for v7 */
14.
15. #include <curl/easy.h> /* new for v7 */
16.
17. GtkWidget *Bar;
18.
19. 这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的
20.
21. //完成数据保存功能
22.
23. size_t my_write_func(void *ptr, size_t size, size_t nmemb, FILE *stream)
24.
25. {
26.
27. return fwrite(ptr, size, nmemb, stream);
28.
29. }
30.
31. // 这个函数是为了符合CURLOPT_READFUNCTION而构造的
32.
33. // 数据上传时使用
34.
35. size_t my_read_func(void *ptr, size_t size, size_t nmemb, FILE *stream)
36.
37. {
38.
39. return fread(ptr, size, nmemb, stream);
40.
41. }
42.
43. // 这个函数是为了符合CURLOPT_PROGRESSFUNCTION而构造的
44.
45. //显示文件传输进度,t代表文件大小,d代表传输已经完成部分
46.
47. int my_progress_func(GtkWidget *bar,
48.
49. double t, /* dltotal */
50.
51. double d, /* dlnow */
52.
53. double ultotal,
54.
55. double ulnow)
56.
57. {
58.
59. /* printf("%d / %d (%g %%)/n", d, t, d*100.0/t);*/
60.
61. gdk_threads_enter();
62.
63. gtk_progress_set_value(GTK_PROGRESS(bar), d*100.0/t);
64.
65. gdk_threads_leave();
66.
67. return 0;
68.
69. }
70.
71.
72.
73. void *my_thread(void *ptr)
74.
75. {
76.
77. CURL *curl;
78.
79. CURLcode res;
80.
81. FILE *outfile;
82.
83. gchar *url = ptr;
84.
85. curl = curl_easy_init();
86.
87. if(curl)
88.
89. {
90.
91. outfile = fopen("test.curl", "w");
92.
93. curl_easy_setopt(curl, CURLOPT_URL, url);
94.
95. curl_easy_setopt(curl, CURLOPT_WRITEDATA, outfile);
96.
97. curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, my_write_func);
98.
99. curl_easy_setopt(curl, CURLOPT_READFUNCTION, my_read_func);
100.
101. curl_easy_setopt(curl, CURLOPT_NOPROGRESS, 0L);
102.
103. curl_easy_setopt(curl, CURLOPT_PROGRESSFUNCTION, my_progress_func);
104.
105. curl_easy_setopt(curl, CURLOPT_PROGRESSDATA, Bar);
106.
107. res = curl_easy_perform(curl);
108.
109. fclose(outfile);
110.
111. /* always cleanup */
112.
113. curl_easy_cleanup(curl);
114.
115. }
116.
117. return NULL;
118.
119. }
120.
121. int main(int argc, char **argv)
122.
123. {
124.
125. GtkWidget *Window, *Frame, *Frame2;
126.
127. GtkAdjustment *adj;
128.
129. /* Must initialize libcurl before any threads are started */
130.
131. curl_global_init(CURL_GLOBAL_ALL);
132.
133. /* Init thread */
134.
135. g_thread_init(NULL);
136.
137. gtk_init(&argc, &argv);
138.
139. Window = gtk_window_new(GTK_WINDOW_TOPLEVEL);
140.
141. Frame = gtk_frame_new(NULL);
142.
143. gtk_frame_set_shadow_type(GTK_FRAME(Frame), GTK_SHADOW_OUT);
144.
145. gtk_container_add(GTK_CONTAINER(Window), Frame);
146.
147. Frame2 = gtk_frame_new(NULL);
148.
149. gtk_frame_set_shadow_type(GTK_FRAME(Frame2), GTK_SHADOW_IN);
150.
151. gtk_container_add(GTK_CONTAINER(Frame), Frame2);
152.
153. gtk_container_set_border_width(GTK_CONTAINER(Frame2), 5);
154.
155. adj = (GtkAdjustment*)gtk_adjustment_new(0, 0, 100, 0, 0, 0);
156.
157. Bar = gtk_progress_bar_new_with_adjustment(adj);
158.
159. gtk_container_add(GTK_CONTAINER(Frame2), Bar);
160.
161. gtk_widget_show_all(Window);
162.
163. if (!g_thread_create(&my_thread, argv[1], FALSE, NULL) != 0)
164.
165. g_warning("can't create the thread");
166.
167. gdk_threads_enter();
168.
169. gtk_main();
170.
171. gdk_threads_leave();
172.
173. return 0;
174.
175. }
编译export PKG_CONFIG_PATH=/usr/lib/pkgconfig/
gcc progress.c –o progress ` pkg-config --libs –cflags gtk+-2..0` -lcurl –lgthread-2.0
./ progress http://software.sky-union.cn/index.asp
4、断点续传实例
[cpp] view plain copy print ?
1. //采用CURLOPT_RESUME_FROM_LARGE 实现文件断点续传功能
2.
3. #include <stdlib.h>
4.
5. #include <stdio.h>
6.
7. #include <sys/stat.h>
8.
9. #include <curl/curl.h>
10.
11. //这个函数为CURLOPT_HEADERFUNCTION参数构造
12.
13. /* 从http头部获取文件size*/
14.
15. size_t getcontentlengthfunc(void *ptr, size_t size, size_t nmemb, void *stream) {
16.
17. int r;
18.
19. long len = 0;
20.
21. /* _snscanf() is Win32 specific */
22.
23. // r = _snscanf(ptr, size * nmemb, "Content-Length: %ld/n", &len);
24.
25. r = sscanf(ptr, "Content-Length: %ld/n", &len);
26.
27. if (r) /* Microsoft: we don't read the specs */
28.
29. *((long *) stream) = len;
30.
31. return size * nmemb;
32.
33. }
34.
35. /* 保存下载文件 */
36.
37. size_t wirtefunc(void *ptr, size_t size, size_t nmemb, void *stream)
38.
39. {
40.
41. return fwrite(ptr, size, nmemb, stream);
42.
43. }
44.
45. /* 读取上传文件 */
46.
47. size_t readfunc(void *ptr, size_t size, size_t nmemb, void *stream)
48.
49. {
50.
51. FILE *f = stream;
52.
53. size_t n;
54.
55. if (ferror(f))
56.
57. return CURL_READFUNC_ABORT;
58.
59. n = fread(ptr, size, nmemb, f) * size;
60.
61. return n;
62.
63. }
64.
65. // 下载 或者上传文件函数
66.
67. int download(CURL *curlhandle, const char * remotepath, const char * localpath,
68.
69. long timeout, long tries)
70.
71. {
72.
73. FILE *f;
74.
75. curl_off_t local_file_len = -1 ;
76.
77. long filesize =0 ;
78.
79. CURLcode r = CURLE_GOT_NOTHING;
80.
81. int c;
82.
83. struct stat file_info;
84.
85. int use_resume = 0;
86.
87. /* 得到本地文件大小 */
88.
89. //if(access(localpath,F_OK) ==0)
90.
91. if(stat(localpath, &file_info) == 0)
92.
93. {
94.
95. local_file_len = file_info.st_size;
96.
97. use_resume = 1;
98.
99. }
100.
101. //采用追加方式打开文件,便于实现文件断点续传工作
102.
103. f = fopen(localpath, "ab+");
104.
105. if (f == NULL) {
106.
107. perror(NULL);
108.
109. return 0;
110.
111. }
112.
113. //curl_easy_setopt(curlhandle, CURLOPT_UPLOAD, 1L);
114.
115. curl_easy_setopt(curlhandle, CURLOPT_URL, remotepath);
116.
117. curl_easy_setopt(curlhandle, CURLOPT_CONNECTTIMEOUT, timeout); // 设置连接超时,单位秒
118.
119. //设置http 头部处理函数
120.
121. curl_easy_setopt(curlhandle, CURLOPT_HEADERFUNCTION, getcontentlengthfunc);
122.
123. curl_easy_setopt(curlhandle, CURLOPT_HEADERDATA, &filesize);
124.
125. // 设置文件续传的位置给libcurl
126.
127. curl_easy_setopt(curlhandle, CURLOPT_RESUME_FROM_LARGE, use_resume?local_file_len:0);
128.
129. curl_easy_setopt(curlhandle, CURLOPT_WRITEDATA, f);
130.
131. curl_easy_setopt(curlhandle, CURLOPT_WRITEFUNCTION, wirtefunc);
132.
133. //curl_easy_setopt(curlhandle, CURLOPT_READFUNCTION, readfunc);
134.
135. //curl_easy_setopt(curlhandle, CURLOPT_READDATA, f);
136.
137. curl_easy_setopt(curlhandle, CURLOPT_NOPROGRESS, 1L);
138.
139. curl_easy_setopt(curlhandle, CURLOPT_VERBOSE, 1L);
140.
141. r = curl_easy_perform(curlhandle);
142.
143. fclose(f);
144.
145. if (r == CURLE_OK)
146.
147. return 1;
148.
149. else {
150.
151. fprintf(stderr, "%s/n", curl_easy_strerror(r));
152.
153. return 0;
154.
155. }
156.
157. }
158.
159. int main(int c, char **argv) {
160.
161. CURL *curlhandle = NULL;
162.
163. curl_global_init(CURL_GLOBAL_ALL);
164.
165. curlhandle = curl_easy_init();
166.
167. //download(curlhandle, "ftp://user:pass@host/path/file", "C://file", 0, 3);
168.
169. download(curlhandle , "http://software.sky-union.cn/index.asp","/work/index.asp",1,3);
170.
171. curl_easy_cleanup(curlhandle);
172.
173. curl_global_cleanup();
174.
175. return 0;
176.
177. }
(CURL *handle, CURLoption option, parameter);
说明:
此函数用来告诉 libcurl 执行什么样的动作。该函数有 3 个参数(该函数的可设置选项非常之多):
第 1 个参数 handle 是由 curl_easy_init() 返回的句柄;第 2 个参数是可以设置的选项(CURLoption);第 3 个参数是与第 2 个选项相关联的参数,这个参数可以是 long 型,也可以是一个函数指针(function pointer),还可以是一个对象的指针 (object pointer),或者是一个 curl_off_t 类型,这些参数类型必须由选项值(CURLoption)来确定。
具体选项说明(分大类和小类,本说明为个人理解以及对说明手册的翻译,根据应用不断更新说明内容,分类顺序不按照说明手册):
网络选项(NETWORK OPTIONS):
1. CURLOPT_URL
这个选项后面接实际要处理的 URL ,这个 URL 是一个以 '\0' 结尾的字符串或参数指针(关于这个参数的简单示例见:http://www.groad.net/bbs/read.php?tid-1641.html)。如果 URL 参数不写上协议头(如 "http://" 或者 "ftp:// 等等 ),那么函数会自己进行猜解所给的主机上用的是哪一种服务协议。假如你给的这个地址是一个不被 支持的协议,那么在其后执行 curl_easy_perform() 函数或 curl_multi_perform() 函数时, libcurl 将返回错误(CURLE_UNSUPPORTED_PROTOCOL)。这个选项是唯一一个必须在 curl_easy_perform() 调用之前就要设置的选项。
2. CURLOPT_POSTFIELDSIZE
该选项要求第 3 个参数 parameter 是一个 void * 指针,它指向一个向 HTTP 服务器 POST 出去的一段数据,这段数据要根据服务器的具体要求填写。该选项用法参考示例:http://www.groad.net/bbs/read.php?tid-3909.html
3. CURLOPT_WRITEFUNCTION
使用该选项时,要求第 3 个参数中的回调函数必须是下面的函数原型:
size_t function( char *ptr, size_t size, size_t nmemb, void *userdata);
在启动会话时,一旦检测到有需要接收的数据时,回调函数被调用。ptr 所指向的数据大小由 size 和 nmemb 的乘积获得。函数最后需要返回接收数据的大小。如果不使用该函数,那么接收到的数据会直接打印到终端;使用该函数,那么接收到的数据保存在 ptr 所执向的区域,可以利用此来保存接收下来的数据。
4. CURLOPT_USERAGENT
该选项要求传递一个以 '\0' 结尾的字符串指针,这个字符串用来在向服务器请求时发送 HTTP 头部中的 User-Agent 信息,有些服务器是需要检测这个信息的,如果没有设置 User-Agent,那么服务器拒绝请求。设置后,可以骗过服务器对此的检查。
5. CURLOPT_WRITEDATA
使用该选项时,第 3 个参数作为用户数据的指针而传递到使用 CURLOPT_WRITEFUNCTION 选项时指定的回调函数中(第 4 个参数)。如果不想用回调函数而保存数据,那么可以使用 CURLOPT_WRITEDATA 选项,使用该选项时,函数的第 3 个参数必须是个 FILE 指针,函数会将接收到的数据自动的写到这个 FILE 指针所指向的文件流中。
6. CURLOPT_VERBOSE
在使用该选项且第 3 个参数为 1 时,curl 库会显示详细的操作信息。这对程序的调试具有极大的帮助。
7. CURLOPT_NOBODY
使用该选项时,若第 3 个参数设为 1,这样在输出中就不会包含主体内容部分。这仅是对在传输的所有内容中,含有“头部”和“主题内容”两部分的协议而言。如 HTTP(S) 服务器,在这种情况下将会使 libcurl 库仅发出一个头部请求。
8. CURLOPT_HEADER
使用该选项时,第 3 个参数设置为 1,那么会通知 curl 库在输出时要同时包含 "头部“ 和 "主题内容" 两个部分。该选项仅是对那些同时包含了”头部“和”主题内容“这两部分的协议而言(如 HTTP)。
9. CURLOPT_HEADERFUNCTION
该选项与上面第 3 个选项 CURLOPT_WRITEFUNCTION 类似,只要它一接收到头部信息时,它就会执行回调函数。需要注意的是,回调函数里处理的头部包含了所有收到的响应的头部信息,而不只是最后一次的响应。如果需要处理其中的一个头部,那么自己需要在所收集的头部信息中进行区分。
10. CURLOPT_WRITEHEADER 和 CURLOPT_HEADERDATA
这两个选项是同一种意思。它们和第 5 条中的 CURLOPT_WRITEDATA 选项功能一样,表示在接收到头部信息并调用回调函数时,给回调函数传递第 4 个参数。
11. CURLOPT_INFILESIZE
当向服务器上传文件时,该选项用来告诉 curl 库期望上传的文件的大小。使用该选项时,应该给函数第 3 个参数的应该是个 long 型变量。如果用的是 SCP 传输,那么该选项强制使用 CURLOPT_INFILESIZE_LARGE 。
12. CURLOPT_INFILESIZE_LARGE
该选项和 CURLOPT_INFILESIZE 功能一样,但是它要求函数的第 3 个参数必须是个 curl_off_t 类型。curl_off_t 为 int64_t 类型,而 int64_t 定义在 stdint.h 中:
if __WORDSIZE == 64
typedef long int int64_t;
# else
__extension__
typedef long long int int64_t;
由上面定义知,一般的,如果是 32 位平台,它就是 long long 型,表示 64 位的;如果是 64 位平台,它就是 long 型,也为 64 位。总之,就是个 64 位的。
13. CURLOPT_QUOTE 和 CURLOPT_POSTQUOTE
这两个选项的功能类似,它们的共同点都是给 FTP 或 SFTP 传递命令。这些命令应该放在 struct slist 链表中存储,使用时需要用 curl_slist_append() 函数将这些命令打包起来,然后一起发送出去。
它们的不同点是:CURLOPT_QUOTE 选项要求命令要在 FTP 传输请求之前就要发送到库,而 CURLOPT_POSTQUOTE 则可以在 FTP 传输请求发送完后发送。比如像下面的执行顺序是无法达到目的的:
1 . ... ...
2 curl_easy_perform(curl);
3 curl_easy_setopt(curl, CURLOPT_QUOTE, headerlist);
4 curl_easy_perform(curl);
5 ... ...
上面假设第 1 条 curl_easy_perform(curl); 语句已经发送了 FTP 传输请求,然后再用 CURLOPT_QUOTE 发送命令是错误的,这里应该使用 CURLOPT_POSTQUOTE 选项。使用 CURLOPT_QUOTE 选项需要先用 curl_easy_perform() 函数将其发送,然后再用一次 curl_easy_perform() 发送 FTP 传输请求。也就是说需要执行两次 curl_easy_perform() 函数。而用 CURLOPT_POSTQUOTE 选项则不需要这样,它只要将选项设置好后,然后只执行一次 curl_easy_perform() 函数即可。
14. CURLOPT_READFUNCTION 和 CURLOPT_READDATA
这两个选项和上面的 CURLOPT_WRITEFUNCTION 和 CURLOPT_WRITEDATA 类似。在 CURLOPT_READFUNCTION 的回调函数里,第 1 个参数 ptr 指针用来接收从第 4 个参数传递过来的数据(这个参数往往是个文件流指针),而这个参数是使用 CURLOPT_READDATA 选项时传递过来的。
15. CURLOPT_UPLOAD
在使用该选项时,第 3 个参数设置为 1,表示要准备上传文件。这个参数往往会配合 CURLOPT_READDATA,CURLOPT_INFILESIZE_LARGE,以及 CURLOPT_INFILESIZE 这几个选项一起用。如果是使用 HTTP 协议,那么使用 PUT 的方法进行上传,除非另有指定。
CURLOPT_HEADER:设为1,则在返回的内容里包含http header;
CURLOPT_FOLLOWLOCATION:设为0,则不会自动301,302跳转;
*CURLOPT_INFILESIZE: 当你上传一个文件到远程站点,这个选项告诉PHP你上传文件的大小。
*CURLOPT_VERBOSE: 如果你想CURL报告每一件意外的事情,设置这个选项为一个非零值。
*CURLOPT_HEADER: 如果你想把一个头包含在输出中,设置这个选项为一个非零值。
*CURLOPT_NOPROGRESS: 如果你不会PHP为CURL传输显示一个进程条,设置这个选项为一个非零值。
注意:PHP自动设置这个选项为非零值,你应该仅仅为了调试的目的来改变这个选项。
*CURLOPT_NOBODY: 如果你不想在输出中包含body部分,设置这个选项为一个非零值。
*CURLOPT_FAILONERROR: 如果你想让PHP在发生错误(HTTP代码返回大于等于300)时,不显示,设置这个选项为一人非零值。默认行为是返回一个正常页,忽略代码。
*CURLOPT_UPLOAD: 如果你想让PHP为上传做准备,设置这个选项为一个非零值。
*CURLOPT_POST: 如果你想PHP去做一个正规的HTTP POST,设置这个选项为一个非零值。这个POST是普通的 application/x-www-from-urlencoded 类型,多数被HTML表单使用。
*CURLOPT_FTPLISTONLY: 设置这个选项为非零值,PHP将列出FTP的目录名列表。
*CURLOPT_FTPAPPEND: 设置这个选项为一个非零值,PHP将应用远程文件代替覆盖它。
*CURLOPT_NETRC: 设置这个选项为一个非零值,PHP将在你的 ~./netrc 文件中查找你要建立连接的远程站点的用户名及密码。
*CURLOPT_FOLLOWLOCATION: 设置这个选项为一个非零值(象 “Location: “)的头,服务器会把它当做HTTP头的一部分发送(注意这是递归的,PHP将发送形如 “Location: “的头)。
*CURLOPT_PUT: 设置这个选项为一个非零值去用HTTP上传一个文件。要上传这个文件必须设置CURLOPT_INFILE和CURLOPT_INFILESIZE选项.
*CURLOPT_MUTE: 设置这个选项为一个非零值,PHP对于CURL函数将完全沉默。
*CURLOPT_TIMEOUT: 设置一个长整形数,作为最大延续多少秒。
*CURLOPT_LOW_SPEED_LIMIT: 设置一个长整形数,控制传送多少字节。
*CURLOPT_LOW_SPEED_TIME: 设置一个长整形数,控制多少秒传送CURLOPT_LOW_SPEED_LIMIT规定的字节数。
*CURLOPT_RESUME_FROM: 传递一个包含字节偏移地址的长整形参数,(你想转移到的开始表单)。
*CURLOPT_SSLVERSION: 传递一个包含SSL版本的长参数。默认PHP将被它自己努力的确定,在更多的安全中你必须手工设置。
*CURLOPT_TIMECONDITION: 传递一个长参数,指定怎么处理CURLOPT_TIMEVALUE参数。你可以设置这个参数为TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。这仅用于HTTP。
*CURLOPT_TIMEVALUE: 传递一个从1970-1-1开始到现在的秒数。这个时间将被CURLOPT_TIMEVALUE选项作为指定值使用,或被默认TIMECOND_IFMODSINCE使用。
下列选项的值将被作为字符串:
*CURLOPT_URL: 这是你想用PHP取回的URL地址。你也可以在用curl_init()函数初始化时设置这个选项。
*CURLOPT_USERPWD: 传递一个形如[username]:[password]风格的字符串,作用PHP去连接。
*CURLOPT_PROXYUSERPWD: 传递一个形如[username]:[password] 格式的字符串去连接HTTP代理。
*CURLOPT_RANGE: 传递一个你想指定的范围。它应该是”X-Y”格式,X或Y是被除外的。HTTP传送同样支持几个间隔,用逗句来分隔(X-Y,N-M)。
*CURLOPT_POSTFIELDS: 传递一个作为HTTP “POST”操作的所有数据的字符串。
*CURLOPT_REFERER: 在HTTP请求中包含一个”referer”头的字符串。
*CURLOPT_USERAGENT: 在HTTP请求中包含一个”user-agent”头的字符串。
*CURLOPT_FTPPORT: 传递一个包含被ftp “POST”指令使用的IP地址。这个POST指令告诉远程服务器去连接我们指定的IP地址。这个字符串可以是一个IP地址,一个主机名,一个网络界面名(在UNIX下),或是‘-’(使用系统默认IP地址)。
*CURLOPT_COOKIE: 传递一个包含HTTP cookie的头连接。
*CURLOPT_SSLCERT: 传递一个包含PEM格式证书的字符串。
*CURLOPT_SSLCERTPASSWD: 传递一个包含使用CURLOPT_SSLCERT证书必需的密码。
*CURLOPT_COOKIEFILE: 传递一个包含cookie数据的文件的名字的字符串。这个cookie文件可以是Netscape格式,或是堆存在文件中的HTTP风格的头。
*CURLOPT_CUSTOMREQUEST: 当进行HTTP请求时,传递一个字符被GET或HEAD使用。为进行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request.
注意: 在确认你的服务器支持命令先不要去这样做。
下列的选项要求一个文件描述(通过使用fopen()函数获得):
*CURLOPT_FILE: 这个文件将是你放置传送的输出文件,默认是STDOUT.
*CURLOPT_INFILE: 这个文件是你传送过来的输入文件。
*CURLOPT_WRITEHEADER: 这个文件写有你输出的头部分。
*CURLOPT_STDERR: 这个文件写有错误而不是stderr。
几种选项测试函数:
<stdio.h>
<stdlib.h>
<string.h>
<curl/curl.h>
<curl/easy.h>
static size_t save_header(void *ptr, size_t size, size_t nmemb, void *data)
{
fwrite(ptr, size, nmemb, data);
return (size * nmemb);
}
int main(void)
{
"http://www.sina.com.cn/";
CURL *curl; CURLcode res;
FILE *fp;
"htmheader.html", "w")))
{
"fopen error\n");
return -1;
}
curl_global_init(CURL_GLOBAL_ALL);
curl = curl_easy_init();
if (curl)
{
curl_easy_setopt(curl, CURLOPT_URL, url);
curl_easy_setopt(curl, CURLOPT_NOBODY, 1L);
curl_easy_setopt(curl, CURLOPT_HEADER, 0L);
curl_easy_setopt(curl, CURLOPT_HEADERFUNCTION, save_header);
curl_easy_setopt(curl, CURLOPT_WRITEHEADER, fp);
curl_easy_perform(curl);
}
curl_easy_cleanup(curl);
curl_global_cleanup();
fclose (fp);
return 0;
}