当使用find来删除指定文件时有多种方法,但删除大量文件时存在效率问题。
创建百万测试文件
for i in {1..1000000} ; do touch tt$i; done
方法1:xargs rm -f
##由于time命令不支持管道符,因此将命令写入脚本中执行。
[root@iZ259iq283hZ tmp]# cat del.sh
find ./ -type f -name "tt*" |xargs rm -f
[root@iZ259iq283hZ tmp]# time ./del.sh
real 0m1.339s
user 0m0.176s
sys 0m1.105s
xargs 可以将管道或标准输入(stdin)数据转换成命令行参数,也能够从文件的输出中读取数据。xargs每次传入的字节数是1024字节。如果find查找到的文件名较长,比如50个字节,则一次传入20个文件;比如20个字节,则一次传入51个文件。因此删除速度与文件名长度有关。如果find查找时不是当前目录,那么还会将路径名计算在内。
方法2:-exec rm -f
[root@iZ259iq283hZ tmp]# time find ./ -type f -name "tt*" -exec rm -f {} \;
real 1m31.298s
user 0m1.391s
sys 0m21.368s
-exec命令是查找到的每个文件调用一次rm命令,因此速度最慢。
方法3:-delete
[root@iZ259iq283hZ tmp]# time find ./ -type f -name "tt*" -delete
real 0m1.170s
user 0m0.088s
sys 0m1.036s
-delete命令是find内部调用,省去了从外部调用的时间。
但如果一次删除大量文件,建议采用第三种方式。经测试在删除千万级文件时,第三种方式比前两种快百倍。