@Author : Spinach | GHB
grep命令、find命令详解
- find命令
- find命令常用选项及实例
- find与xargs结合
- grep命令
- grep命令的一般选项及实例
find命令
find命令,又称文件查找命令。在一个目录(及子目录)中搜索文件,你可以指定一些匹配条件,如按文件名、文件类型、用户甚至是时间戳查找文件。
// find命令的一般形式为:
find [-H] [-L] [-P] [-D debugopts] [-Olevel] [path...] [expression]
// find命令的常用形式可以简化为:
find [path...] [expression]
// path:find命令所查找的目录路径。例如用.来表示当前目录,用/来表示系统根目录
// expression:expression可以分为——“-options [-print -exec -ok ...]”
-options:指定find命令的常用选项。
[options]主要参数:
-c:只输出匹配行的计数。
-i:不区分大小写
-h:查询多文件时不显示文件名。
-l:查询多文件时只输出包含匹配字符的文件名。
-n:显示匹配行及行号。
-s:不显示不存在或无匹配文本的错误信息。
-v:显示不包含匹配文本的所有行。
-print:find命令将匹配的文件输出到标准输出
-exec:find命令对匹配的文件执行该参数所给出的shell命令。
相应命令的形式为'command' { } \;,注意{ }和\;之间的空格
i. find ./ -size 0 -exec rm {} \; 删除文件大小为零的文件 (还可以以这样做:rm -i `find ./ -size 0` 或 find ./ -size 0 | xargs rm -f &)
ii. 为了用ls -l命令列出所匹配到的文件,可以把ls -l命令放在find命令的-exec选项中:find . -type f -exec ls -l { } \;
iii. 在/logs目录中查找更改时间在5日以前的文件并删除它们:find /logs -type f -mtime +5 -exec rm { } \;
-ok:和-exec的作用相同,只不过以一种更为安全的模式来执行该参数所给出的shell命令,在执行每一个命令之前,都会给出提示,让用户来确定是否执行。
i. find . -name "*.conf" -mtime +5 -ok rm { } \; 在当前目录中查找所有文件名以.LOG结尾、更改时间在5日以上的文件,并删除它们,只不过在删除之前先给出提示
find命令常用选项及实例
-name : 按照文件名查找文件。
// 在/dir目录及其子目录下面查找名字为filename的文件
$ find /dir -name filename
// 在当前目录及其子目录(用“.”表示)中查找任何扩展名为“c”的文件
$ find . -name "*.c"
-perm:按照文件权限来查找文件。
// 在当前目录下查找文件权限位为755的文件,即文件属主可以读、写、执行,其他用户可以读、执行的文件
$ find . -perm 755 –print
-prune:使用这一选项可以使find命令不在当前指定的目录中查找,如果同时使用-depth选项,那么-prune将被find命令忽略。
// 在apps目录下查找文件,但不希望在/apps/bin目录下查找
$ find /apps -path "/apps/bin" -prune -o –print
// 在/usr/sam目录下查找不在dir1子目录之内的所有文件
$ find /usr/sam -path "/usr/sam/dir1" -prune -o –print
-user:按照文件属主来查找文件。
// 在$HOME目录中查找文件属主为sam的文件
$ find ~ -user sam –print
-group:按照文件所属的组来查找文件。
// 在/apps目录下查找属于gem用户组的文件
$ find /apps -group gem –print
-mtime -n +n:按照文件的更改时间来查找文件, - n表示文件更改时间距现在n天以内,+ n表示文件更改时间距现在n天以前。
// 在系统根目录下查找更改时间在5日以内的文件
$ find / -mtime -5 –print
// 在/var/adm目录下查找更改时间在3日以前的文件
$ find /var/adm -mtime +3 –print
-nogroup:查找无有效所属组的文件,即该文件所属的组在/etc/groups中不存在。
$ find / –nogroup -print
-nouser:查找无有效属主的文件,即该文件的属主在/etc/passwd中不存在。
$ find /home -nouser –print
-newer file1 ! file2:查找更改时间比文件file1新但比文件file2旧的文件。 -type:查找某一类型的文件,诸如:
b - 块设备文件。
d - 目录。
c - 字符设备文件。
p - 管道文件。
l - 符号链接文件。
f - 普通文件。
$ find /etc -type d –print // 在/etc目录下查找所有的目录
$ find . ! -type d –print // 在当前目录下查找除目录以外的所有类型的文件
$ find /etc -type l –print // 在/etc目录下查找所有的符号链接文件
-size n:[c] 查找文件长度为n块的文件,带有c时表示文件长度以字节计。
// 在当前目录下查找文件长度大于 1M 字节的文件
$ find . -size +1000000c –print
// 在/home/apache目录下查找文件长度恰好为100字节的文件
$ find /home/apache -size 100c –print
// 在当前目录下查找长度超过10块的文件(一块等于512字节)
$ find . -size +10 –print
-depth:在查找文件时,首先查找当前目录中的文件,然后再在其子目录中查找。
// 它将首先匹配所有的文件然后再进入子目录中查找
$find / -name "CON.FILE" -depth –print
-mount:在查找文件时不跨越文件系统mount点。
// 从当前目录开始查找位于本文件系统中文件名以XC结尾的文件(不进入其他文件系统)
$ find . -name "*.XC" -mount –print
-type d:查找文件夹
// 从当前目录开始查找文件夹名为test的文件夹
$ find . -name "test" -type d
其他
find / -amin -10 # 查找在系统中最后10分钟访问的文件(access time)
find / -atime -2 # 查找在系统中最后48小时访问的文件
find / -empty # 查找在系统中为空的文件或者文件夹
find / -group cat # 查找在系统中属于 group为cat的文件
find / -mmin -5 # 查找在系统中最后5分钟里修改过的文件(modify time)
find / -mtime -1 #查找在系统中最后24小时里修改过的文件
find / -user fred #查找在系统中属于fred这个用户的文件
find / -size +10000c #查找出大于10000000字节的文件(c:字节,w:双字,k:KB,M:MB,G:GB)
find / -size -1000k #查找出小于1000KB的文件
使用混合查找方式查找文件
# 参数有: !,-and(-a),-or(-o)。
find /tmp -size +10000c -and -mtime +2 #在/tmp目录下查找大于10000字节并在最后2分钟内修改的文件
find / -user fred -or -user george #在/目录下查找用户是fred或者george的文件文件
find /tmp ! -user panda #在/tmp目录中查找所有不属于panda用户的文件
find与xargs结合
在使用find命令的-exec选项处理匹配到的文件时, find命令将所有匹配到的文件一起传递给exec执行。但有些系统对能够传递给exec的命令长度有限制,这样在find命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是xargs命令的用处所在,特别是与find命令一起使用。
find命令把匹配到的文件传递给xargs命令,而xargs命令每次只获取一部分文件而不是全部,不像-exec选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。
在有些系统中,使用-exec选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行;这样在有些情况下就会出现进程过多,系统性能下降的问题,因而效率不高;
而使用xargs命令则只有一个进程。另外,在使用xargs命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。
来看看xargs命令是如何同find命令一起使用的,并给出一些例子。
// 查找系统中的每一个普通文件,然后使用xargs命令来测试它们分别属于哪类文件
$ find . -type f -print | xargs file
// 在整个系统中查找内存信息转储文件(core dump) ,然后把结果保存到/tmp/core.log 文件中
$ find / -name "core" -print | xargs echo "" >/tmp/core.log
// 用grep命令在所有的普通文件中搜索hostname这个词
$ find . -type f -print | xargs grep "hostname"
// 删除3天以前的所有东西 (find . -ctime +3 -exec rm -rf {} \;)
$ find ./ -mtime +3 -print|xargs rm -f –r
// 删除文件大小为零的文件
$ find ./ -size 0 | xargs rm -f &
grep命令
grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)命令,又称文件内容查找命令,是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。。
grep [OPTIONS] PATTERN [FILE...]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
[options]主要参数:
-c:只输出匹配行的计数。
-i:不区分大小写
-h:查询多文件时不显示文件名。
-l:查询多文件时只输出包含匹配字符的文件名。
-n:显示匹配行及行号。
-s:不显示不存在或无匹配文本的错误信息。
-v:显示不包含匹配文本的所有行。
pattern正则表达式主要参数:
\: 忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<:从匹配正则表达式的行开始。
\>:到匹配正则表达式的行结束。
[ ]:单个字符,如[A]即A符合要求 。
[ - ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。
.:所有的单个字符。
* :有字符,长度可以为0。
grep命令用于搜索由Pattern参数指定的模式,并将每个匹配的行写入标准输出中。这些模式是具有限定的正则表达式,它们使用ed或egrep命令样式。如果在File参数中指定了多个名称,grep命令将显示包含匹配行的文件的名称。
grep命令的一般选项及实例
// 通过管道过滤ls -l输出的内容,只显示以a开头的行。
$ ls -l | grep '^a'
// 显示所有以d开头的文件中包含test的行。
$ grep 'test' d*
// 显示在aa,bb,cc文件中匹配test的行。
$ grep 'test' aa bb cc
// 显示所有包含每个字符串至少有5个连续小写字符的字符串的行。
$ grep '[a-z]\{5\}' aa
// 如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.*),这些字符后面紧跟着另外一个es(),找到就显示该行。
// 如果用egrep或grep -E,就不用""号进行转义,直接写成'w(es)t.*'就可以了。
$ grep 'w(es)t.*' aa
// 不区分大小写地搜索。默认情况区分大小写。
$ grep -i pattern files
// 只列出匹配的文件名。
$ grep -l pattern files
// 列出不匹配的文件名。
$ grep -L pattern files
// 只匹配整个单词,而不是字符串的一部分(如匹配‘magic’,而不是‘magical’)。
$ grep -w pattern files
// 匹配的上下文分别显示[number]行。
$ grep -C number pattern files
// 显示匹配pattern1或pattern2的行。
$ grep pattern1 | pattern2 files
// 显示既匹配pattern1又匹配pattern2的行。
$ grep pattern1 files | grep pattern2