wget是Linux中的一个下载文件的工具,wget是在Linux下开发的开放源代码的软件,作者是Hrvoje Niksic,后来被移植到包括Windows在内的各个平台上。 首先安装wget [root@network test]# yum install -y wget 查看帮助手册 [root@network test]# wget --help 1、使用 wget 下载单个文件

以下的例子是从网络下载一个文件并保存在当前目录

在下载的过程中会显示进度条,包含(下载完成百分比,已经下载的字节,当前下载速度,剩余下载时间)。

1 wget http://cn.wordpress.org/wordpress-4.9.4-zh_CN.tar.gz 2、使用 wget -O 下载并以不同的文件名保存

1 [root@network test]# wget https://cn.wordpress.org/wordpress-4.9.4-zh_CN.tar.gz 2 [root@network test]# ls 3 wordpress-4.9.4-zh_CN.tar.gz 我们可以使用参数-O来指定一个文件名:

1 wget -O wordpress.tar.gz http://cn.wordpress.org/wordpress-4.9.4-zh_CN.tar.gz 2 wordpress.tar.gz 3、使用 wget -c 断点续传

使用wget -c重新启动下载中断的文件:

对于我们下载大文件时突然由于网络等原因中断非常有帮助,我们可以继续接着下载而不是重新下载一个文件

1 wget -c https://cn.wordpress.org/wordpress-4.9.4-zh_CN.tar.gz 4、使用 wget -b 后台下载

对于下载非常大的文件的时候,我们可以使用参数-b进行后台下载

1 [root@network test]# wget -b https://cn.wordpress.org/wordpress-4.9.4-zh_CN.tar.gz 2 继续在后台运行,pid 为 1463。 3 将把输出写入至 “wget-log”。 你可以使用以下命令来察看下载进度 1 [root@network test]# tail -f wget-log 2 8550K .......... .......... .......... .......... .......... 96% 814K 0s 3 8600K .......... .......... .......... .......... .......... 97% 9.53M 0s 4 8650K .......... .......... .......... .......... .......... 98% 86.8M 0s 5 8700K .......... .......... .......... .......... .......... 98% 145M 0s 6 8750K .......... .......... .......... .......... .......... 99% 67.4M 0s 7 8800K .......... .......... .......... .......... .......... 99% 107M 0s 8 8850K .......... ......... 100% 1.95M=16s 9 10 2018-11-10 15:39:07 (564 KB/s) - 已保存 “wordpress-4.9.4-zh_CN.tar.gz.2” [9082696/9082696])

5、伪装代理名称下载

有些网站能通过根据判断代理名称不是浏览器而拒绝你的下载请求。不过你可以通过**–user-agent**参数伪装。

6、使用 wget –spider 测试下载链接

当你打算进行定时下载,你应该在预定时间测试下载链接是否有效。我们可以增加–spider参数进行检查。

复制代码 复制代码 1 wget –spider URL 2 如果下载链接正确,将会显示 3
4 wget –spider URL 5 Spider mode enabled. Check if remote file exists. 6 HTTP request sent, awaiting response… 200 OK 7 Length: unspecified [text/html] 8 Remote file exists and could contain further links, 9 but recursion is disabled — not retrieving. 10 这保证了下载能在预定的时间进行,但当你给错了一个链接,将会显示如下错误 11
12 wget –spider url 13 Spider mode enabled. Check if remote file exists. 14 HTTP request sent, awaiting response… 404 Not Found 15 Remote file does not exist — broken link!!! 复制代码 复制代码

你可以在以下几种情况下使用spider参数:

1 定时下载之前进行检查 2 间隔检测网站是否可用 3 检查网站页面的死链接 7、使用 wget –tries 增加重试次数

如果网络有问题或下载一个大文件也有可能失败。wget默认重试20次连接下载文件。如果需要,你可以使用–tries增加重试次数。

1 wget –tries=40 URL 8、使用 wget -i 下载多个文件

复制代码 复制代码 1 首先,保存一份下载链接文件 2
3 cat > filelist.txt 4 url1 5 url2 6 url3 7 url4 8 接着使用这个文件和参数-i下载 9
10 wget -i filelist.txt 复制代码 复制代码 9、使用 wget –mirror 镜像网站

10、使用 wget –reject 过滤指定格式下载

你想下载一个网站,但你不希望下载图片,你可以使用以下命令。

1 wget –reject=gif url 11、使用 wget -o 把下载信息存入日志文件

你不希望下载信息直接显示在终端而是在一个日志文件,可以使用以下命令:

1 wget -o download.log URL

使用wget -O下载并以不同的文件名保存(-O:下载文件到对应目录,并且修改文件名称)

1 wget -O wordpress.zip http://www.minjieren.com/download.aspx?id=1080 image

使用wget -b后台下载

1 wget -b <a rel="nofollow" href="http://www.minjieren.com/wordpress-3.1-zh_CN.zip">http://www.minjieren.com/wordpress-3.1-zh_CN.zip</a> 1 备注: 你可以使用以下命令来察看下载进度:tail -f wget-log 利用-spider: 模拟下载,不会下载,只是会检查是否网站是否好着

1 [root@localhost ~]# wget --spider www.baidu.com #不下载任何文件 image

模拟下载打印服务器响应

1 [root@localhost ~]# wget -S www.baidu.com # 打印服务器响应 image

设定指定次数

1 2 [root@localhost ~]# wget -r --tries=2 www.baidu.com (指定尝试2次,2次后不再尝试) [root@localhost ~]# wget -r --tries=2 -q www.baidu.com (指定尝试,且不打印中间结果) image