文件查找

在linux中我们每天都会面对大量的文件,有自定义的及系统自动生成的所及我们需要在Linux中也可以像windows一样进行文件的查找

文件查找:

​ 非实时查找:locate(基于文件索引数据库查找)

​ 试试查找:find

locate

​ locate查询依靠在系统上预建的文件索引数据库/var/lib/mlocate/mlocate.db

​ 索引的构建实在系统较为空闲是自动进行的周期任务,可以执行updatedb来手动更新数据库

​ 索引的构建过程需要便利整个根文件系统,非常消耗资源

​ locate和updatedb命令来自于mlocate包

语法

locate [OPTION]... [PATTERN]...

选项

-i 不区分大小写的搜索
-n N 只列举前N个匹配项目
-r 使用基本正则表达式

[root@centos8 ~]#yum -y install mlocate
[root@centos8 ~]#locate conf
locate: can not stat () `/var/lib/mlocate/mlocate.db': No such file or directory
[root@centos8 ~]#updatedb
[root@centos8 ~]#ll /var/lib/mlocate/mlocate.db
-rw-r----- 1 root slocate 1041065 Jun 11 20:08 /var/lib/mlocate/mlocate.db
[root@localhost ~]# locate -n 3 sh
/boot/grub2/i386-pc/fshelp.mod
/boot/grub2/i386-pc/gcry_blowfish.mod
/boot/grub2/i386-pc/gcry_sha1.mod
#实时的创建和删除无法感知斌更新数据库
[root@localhost date]# touch yyyyyy.txt
[root@localhost date]# locate yyyyyy.txt
[root@localhost date]# updatedb
[root@localhost date]# locate yyyyyy.txt
/date/yyyyyy.txt
[root@localhost date]# rm -f yyyyyy.txt 
[root@localhost date]# locate yyyyyy.txt
/date/yyyyyy.txt
[root@localhost date]# updatedb
[root@localhost date]# locate yyyyyy.txt
[root@localhost date]# 

find

特点

​ 查找速度略慢

​ 精确查找

​ 实时查找

​ 查找条件丰富

​ 可能只搜索用户具备读取和执行权限的目录

语法

find [OPTION]... [查找路径] [查找条件] [处理动作]
#查找路径:指定查找的目标路径,默认为当前目录
#查找条件:制定的查找标准,可以是文件大小、文件名、类型、权限等,默认为制定路径下的所有文件
#处理动作:对符合条件的文件做操作,默认输出到屏幕

根据文件名搜索

-name "文件名称" #支持使用glob,如:*, ?, [], [^],通配符要加双引号引起来
-iname "文件名称"  #不区分字母大小写
-inum n #按inode号查找
-samefile name #相同inode号的文件
-links n   #链接数为n的文件
-regex “PATTERN”    #以PATTERN匹配整个文件路径,而非文件名称

根据属主、属组查找

-user USERNAME #查找属主为指定用户(UID)的文件
-group GRPNAME #查找属组为指定组(GID)的文件
-uid UserID #查找属主为指定的UID号的文件
-gid GroupID #查找属组为指定的GID号的文件
-nouser #查找没有属主的文件
-nogroup #查找没有属组的文件

根据文件类型查找

-type TYPE
TYPE可以是以下形式:
f: 普通文件
d: 目录文件
l: 符号链接文件
s:套接字文件
b: 块设备文件
c: 字符设备文件
p: 管道文件
-empty #空文件或目录

组合条件

与:-a ,默认多个条件是与关系
或:-o
非:-not   ! 
德·摩根定律:
(非 A) 或 (非 B) = 非(A 且 B) 
(非 A) 且 (非 B) = 非(A 或 B)
!A -a !B = !(A -o B)
!A -o !B = !(A -a B)

[root@localhost /]# find ! \( -type d -a -empty \)| wc -l
187147
[root@localhost /]# find ! -type d -o ! -empty |wc -l
187147

排除目录

-path 路径
-prune 排除目录

#查找/etc/下,除/etc/security目录的其它所有.conf后缀的文件
find /etc -path '/etc/security' -a -prune -o -name "*.conf"
#查找/etc/下,除/etc/security和/etc/systemd,/etc/dbus-1三个目录的所有.conf后缀的文件
find /etc \( -path "/etc/security" -o -path "/etc/systemd"  -o -path "/etc/dbus-1" \) -a -prune -o -name "*.conf"
#排除/proc和/sys目录
find / \( -path "/sys" -o -path "/proc" \) -a -prune -o -type f -a -mmin -1

根据文件大小

-size [+|-]#UNIT #常用单位:k, M, G,c(byte),注意大小写敏感
#UNIT: #表示(#-1, #],如:6k 表示(5k,6k]
-#UNIT #表示[0,#-1],如:-6k 表示[0,5k]
+#UNIT #表示(#,∞),如:+6k 表示(6k,∞)

[root@centos8 ~]#find / -size +10G
/proc/kcore
find: ‘/proc/25229/task/25229/fd/6’: No such file or directory
find: ‘/proc/25229/task/25229/fdinfo/6’: No such file or directory
find: ‘/proc/25229/fd/5’: No such file or directory
find: ‘/proc/25229/fdinfo/5’: No such file or directory
[root@centos8 ~]#ll -h /proc/kcore
-r-------- 1 root root 128T Dec 14  2020 /proc/kcore
[root@centos8 ~]#du -sh /proc/kcore
0 /proc/kcore
#/proc/kocre是一个内存映射文件并不占实际磁盘空间

根据时间戳查找

#以“天”为单位
-atime [+|-]# 
# #表示[#,#+1)
+# #表示[#+1,∞]
-# #表示[0,#)
-mtime
-ctime
#以“分钟”为单位
-amin
-mmin
-cmin

根据权限查找

-perm [/|-]MODE
MODE  #精确权限匹配
/MODE #任何一类(u,g,o)对象的权限中只要能一位匹配即可,或关系,+ 从CentOS 7开始淘汰
-MODE #每一类对象都必须同时拥有指定权限,与关系
0 表示不关注
#####################################################################
find -perm 755 会匹配权限模式恰好是755的文件
只要当任意人有写权限时,find -perm /222就会匹配
只有当每个人都有写权限时,find -perm -222才会匹配
只有当其它人(other)有写权限时,find -perm -002才会匹配

正则表达式

-regex     属于测试项。使用-regex时有一点要注意:-regex不是匹配文件名,而是匹配完整的文件名(包括路径)。
例如,当前目录下有一个文件"abar9",如果你用"ab.*9"来匹配,将查找不到任何结果,正确的方法是使用".*ab.*9"或者".*/ab.*9"来匹配

处理动作

-print:默认的处理动作,显示至屏幕
-ls:类似于对查找到的文件执行"ls -dils"命令格式输出
-fls file:查找到的所有文件的长格式信息保存至指定文件中,相当于 -ls > file
-delete:删除查找到的文件,慎用!
-ok COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令,对于每个文件执行命令之前,都会
交互式要求用户确认
-exec COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令
{}: 用于引用查找到的文件名称自身

参数替换

xargs(英文全拼: eXtended ARGuments)是给命令传递参数的一个过滤器,也是组合多个命令的一个工具。

xargs 可以将管道或标准输入(stdin)数据转换成命令行参数,也能够从文件的输出中读取数据。

xargs 也可以将单行或多行文本输入转换为其他格式,例如多行变单行,单行变多行。

xargs 默认的命令是 echo,这意味着通过管道传递给 xargs 的输入将会包含换行和空白,不过通过 xargs 的处理,换行和空白将被空格取代。

xargs 是一个强有力的命令,它能够捕获一个命令的输出,然后传递给另外一个命令。

之所以能用到这个命令,关键是由于很多命令不支持|管道来传递参数,而日常工作中有有这个必要,所以就有了 xargs 命令

语法

somecommand |xargs -item  command
find | xargs COMMAND    #find与xargs组合使用

选项

-a file 从文件中读入作为 stdin
-e flag ,注意有的时候可能会是-E,flag必须是一个以空格分隔的标志,当xargs分析到含有flag这个标志的时候就停止。
-p 当每次执行一个argument的时候询问一次用户。
-n num 后面加次数,表示命令在执行的时候一次用的argument的个数,默认是用所有的。
-t 表示先打印命令,然后再执行。
-i 或者是-I,这得看linux支持了,将xargs的每项名称,一般是一行一行赋值给 {},可以用 {} 代替。
-r no-run-if-empty 当xargs的输入为空的时候则停止xargs,不用再去执行了。
-s num 命令行的最大字符数,指的是 xargs 后面那个命令的最大命令行字符数。
-L num 从标准输入一次读取 num 行送给 command 命令。
-l 同 -L。
-d delim 分隔符,默认的xargs分隔符是回车,argument的分隔符是空格,这里修改的是xargs的分隔符。
-x exit的意思,主要是配合-s使用。。
-P 修改最大的进程数,默认是1,为0时候为as many as it can ,这个例子我没有想到,应该平时都用不到的吧。

[root@localhost /]# find /sbin -perm +700 |ls -l    #这个命令是错误的
find: invalid mode ‘+700’
total 36
-rw-r--r--.   1 root root   10 Nov 29 03:41 a.txt
lrwxrwxrwx.   1 root root    7 Nov  3  2020 bin -> usr/bin
dr-xr-xr-x.   6 root root 4096 Nov 27 09:46 boot
-rw-r--r--.   1 root root   10 Nov 29 03:41 b.txt
drwxr-xr-x.   3 root root  150 Dec 11 04:45 date
drwxr-xr-x.  19 root root 3160 Dec  8 07:41 dev
drwxr-xr-x.  97 root root 8192 Dec 11 04:41 etc
drwxr-xr-x.  14 root root  169 Nov 28 22:25 home
lrwxrwxrwx.   1 root root    7 Nov  3  2020 lib -> usr/lib
lrwxrwxrwx.   1 root root    9 Nov  3  2020 lib64 -> usr/lib64
drwxr-xr-x.   2 root root    6 Nov  3  2020 media
drwxr-xr-x.   3 root root    0 Dec 11 05:34 misc
drwxr-xr-x.   4 root root   31 Nov 29 21:07 mnt
drwxr-xr-x.   2 root root    0 Dec  8 07:41 net
-rw-r--r--.   1 root root  945 Nov 29 02:39 number.txt
drwxr-xr-x.   2 root root    6 Nov  3  2020 opt
dr-xr-xr-x. 175 root root    0 Dec  8 07:41 proc
dr-xr-x---.   3 root root  198 Dec 11 05:12 root
drwxr-xr-x.  29 root root  820 Dec 11 01:12 run
lrwxrwxrwx.   1 root root    8 Nov  3  2020 sbin -> usr/sbin
drwxr-xr-x.   2 root root    6 Nov  3  2020 srv
dr-xr-xr-x.  13 root root    0 Dec  8 07:41 sys
drwxrwxrwt.  11 root root 4096 Dec 11 05:34 tmp
drwxr-xr-x.  12 root root  144 Nov 27 09:37 usr
drwxr-xr-x.  21 root root 4096 Dec  1 07:21 var
[root@localhost /]# find /sbin -perm +700 |xargs ls -l    #这样才是正确的
find: invalid mode ‘+700’
total 36
-rw-r--r--.   1 root root   10 Nov 29 03:41 a.txt
lrwxrwxrwx.   1 root root    7 Nov  3  2020 bin -> usr/bin
dr-xr-xr-x.   6 root root 4096 Nov 27 09:46 boot
-rw-r--r--.   1 root root   10 Nov 29 03:41 b.txt
drwxr-xr-x.   3 root root  150 Dec 11 04:45 date
drwxr-xr-x.  19 root root 3160 Dec  8 07:41 dev
drwxr-xr-x.  97 root root 8192 Dec 11 04:41 etc
drwxr-xr-x.  14 root root  169 Nov 28 22:25 home
lrwxrwxrwx.   1 root root    7 Nov  3  2020 lib -> usr/lib
lrwxrwxrwx.   1 root root    9 Nov  3  2020 lib64 -> usr/lib64
drwxr-xr-x.   2 root root    6 Nov  3  2020 media
drwxr-xr-x.   3 root root    0 Dec 11 05:34 misc
drwxr-xr-x.   4 root root   31 Nov 29 21:07 mnt
drwxr-xr-x.   2 root root    0 Dec  8 07:41 net
-rw-r--r--.   1 root root  945 Nov 29 02:39 number.txt
drwxr-xr-x.   2 root root    6 Nov  3  2020 opt
dr-xr-xr-x. 176 root root    0 Dec  8 07:41 proc
dr-xr-x---.   3 root root  198 Dec 11 05:12 root
drwxr-xr-x.  29 root root  820 Dec 11 01:12 run
lrwxrwxrwx.   1 root root    8 Nov  3  2020 sbin -> usr/sbin
drwxr-xr-x.   2 root root    6 Nov  3  2020 srv
dr-xr-xr-x.  13 root root    0 Dec  8 07:41 sys
drwxrwxrwt.  11 root root 4096 Dec 11 05:34 tmp
drwxr-xr-x.  12 root root  144 Nov 27 09:37 usr
drwxr-xr-x.  21 root root 4096 Dec  1 07:21 var

练习

1、查找/var目录下属主为root,且属组为mail的所有文件

[root@localhost /]# find /var -user root -a -group mail
/var/spool/mail

2、查找/var目录下不属于root、lp、gdm的所有文件

find /var ! \( -user root -o -user lp -o -user gdm \)

3、查找/var目录下最近一周内其内容修改过,同时属主不为root,也不是postfix的文件

[root@localhost date]# find /var -mtime 7 ! \( -user root -a -user postfix \) -ls

4、查找当前系统上没有属主或属组,且最近一个周内曾被访问过的文件

[root@localhost date]# find / -nouser -a -nogroup -a -atime 7

5、查找/etc目录下大于1M且类型为普通文件的所有文件

[root@localhost date]# find /etc/ -size +1M -type f |xargs ls -hl
-rw-r--r--. 1 root root 8.2M Mar 18  2021 /etc/selinux/targeted/policy/policy.31
-r--r--r--. 1 root root 8.8M Nov 27 09:45 /etc/udev/hwdb.bin
[root@localhost date]# 

6、查找/etc目录下所有用户都没有写权限的文件

[root@localhost date]# find /etc/ -perm -555

7、查找/etc目录下至少有一类用户没有执行权限的文件

[root@localhost date]# find /etc/  -not -perm -111|xargs ls -l

8、查找/etc/init.d目录下,所有用户都有执行权限,且其它用户有写权限的文件

[root@localhost date]# find /etc/init.d  -perm /113 -ls