鉴于第一次的脚本不能控制同时执行的进程数目从而不能保障下载速度,将原脚本修改为:
########################以下是脚本#####################
#!/bin/bash
#filename
base=/usr/local/data
thread=6
task0(){
cd $base
wget -m -np -c -nH http://x.x.x.x/VipProcessData/BasicObject/AreaObject/
}
task1(){
cd $base
wget -m -np -c -nH http://x.x.x.x/VipProcessData/BasicObject/ClassObject/
}
task2(){
cd $base
wget -m -np -c -nH http://x.x.x.x/VipProcessData/BasicObject/FullTextObject/
}
task3(){
cd $base
wget -m -np -c -nH http://x.x.x.x/VipProcessData/BasicObject/FundObject/
}
task4(){
cd $base
wget -m -np -c -nH http://x.x.x.x/VipProcessData/BasicObject/MediaObject/
}
task5(){
cd $base
wget -m -np -c -nH http://x.x.x.x/VipProcessData/BasicObject/OrganObject/
}
task6(){
cd /usr/local/data/VipProcessData/BasicObject/SubjectObject
wget -c -i /usr/local/data/wget/SubjectObject01
}
task7(){
cd /usr/local/data/VipProcessData/BasicObject/SubjectObject
wget -c -i /usr/local/data/wget/SubjectObject02
}
task8(){
cd /usr/local/data/VipProcessData/BasicObject/SubjectObject
wget -c -i /usr/local/data/wget/SubjectObject03
}
task9(){
cd /usr/local/data/VipProcessData/BasicObject/SubjectObject
wget -c -i /usr/local/data/wget/SubjectObject04
}
task10(){
cd /usr/local/data/VipProcessData/BasicObject/WriterObject
wget -c -i /usr/local/data/wget/WriterObject01
}
task11(){
cd /usr/local/data/VipProcessData/BasicObject/TitleObject
wget -c -i /usr/local/data/wget/TitleObject01
}
task12(){
cd /usr/local/data/VipProcessData/BasicObject/TitleObject
wget -c -i /usr/local/data/wget/TitleObject02
}
task13(){
cd /usr/local/data/VipProcessData/BasicObject/TitleObject
wget -c -i /usr/local/data/wget/TitleObject03
}
task14(){
cd /usr/local/data/VipProcessData/BasicObject/TitleObject
wget -c -i /usr/local/data/wget/TitleObject04
}
task15(){
cd /usr/local/data/VipProcessData/BasicObject/TitleObject
wget -c -i /usr/local/data/wget/TitleObject05
}
task16(){
cd /usr/local/data/VipProcessData/BasicObject/TitleObject
wget -c -i /usr/local/data/wget/TitleObject06
}
function a_sub() { # 此处定义一个函数,(子进程,进程内为实际打算每个进程内须要执行的命令)
task$i
#sleep $i
#echo "start....... ${task[i]}"
}
tmp_fifofile="/tmp/$.fifo"
mkfifo $tmp_fifofile # 新建一个fifo类型的文件
exec 6<>$tmp_fifofile # 将fd6指向fifo类型
rm $tmp_fifofile
for ((i=0;i<$thread;i++));do
echo
done >&6 # 事实上就是在fd6中放置了$thread个回车符 #循环1 创建6个进程
date_start=$(date +%s)
for ((i=0;i<17;i++));do #循环2 启动多进程
read -u6 #每启动一个子进程就在fifo中删除一个回车
{
a_sub && {
echo "task$i finshed"
} ||{
echo "error"
}
echo >&6 # 每完成一个子进程就在fifo中增加一个回车
}&
done
wait
exec 6>&- 删除fd6文件描述符
date_stop=$(date +%s)
echo "download finshed ;and all run $((date_stop-date_start)) sec"
exit 0
####################以上是脚###########################
可以看到 先定义了task0~task16总共17个任务的函数 每个函数实际就是一个wget
然后创建一个fifo文件并指定一个文件描述符; 然后循环1中在fifo中放入$thread个回车(n为进程数);循环2中每次启动一个子进程前先删除一个回车;循环载入进程,由于前只创建了$thread个进程(文件描述符里只有$thread个回车);只有完成一个进程并重写一个回车到fifo中 循环2才能继续循环。
task任务 最初是放在数组里的
task[0]="cd /usr/local/data/VipProcessData/BasicObject/TitleObject && wget -c -i /usr/local/data/wget/TitleObject01"
但是放在数组中后
在a_sub中载入的时候
function a_sub()
发现 echo "start....... ${task[i]} 没问题,但是${task[i]} 实际没有执行命令 因此 暂时把命令改为放在函数里了。
发现 ${task[i]}没有实际执行的原因是 ${task[i]}变量里是 命令1 && 命令2 && 命令3这种形式的;这种形式的命令如果放在变量里 想通过变量引用直接执行会失败。 把${task[i]} 换成 exec ${task[i]} 可以看到 多了'' 感觉是shell把多个命令用强引给分开了。

















