Shell的本质是对系统传达一系列的命令或者信号,其表现形式通常都是某个命令加上一大串的字符。这一串字符就是用来表达意义的字符,也就是正则表达式。正则表达式的最基本元素是元字符,它们是用来描述字符的字符,用途是对字符表达内容、解释以及各种操作信息进行描述。


    Linux Shell本身不支持正则表达式,必须使用各种Shell命令和工具来实现,这里主要介绍正则表达式的组成和各个元字符的意义。


#正则表达式的用途

正则表达式通常用在查询或者查找某一类文件中,对不满足表达式条件的信息进行过滤,输出与表达式匹配的信息或者数据。


#正则表达式的基本元素

正则表达式的基本元素包含普通字符和元字符

普通字符:即普通的字符,包含字母、数字等,其中字母是区分大小写的。

元字符:主要包含*、.、^、[]、$、\、\<\>等赋予特殊作用的字符。


#元字符的作用

* 用于匹配前面一个普通字符的0次或者多次重复

    如 wo*f 可以表示woof也可以表示wooooof等

     . 用于匹配任意字符,如果有有多个字符,可以连续使用用多个.符号

   如 .he 可以表示she也可以表示ahe、bhe等,如果有多个字符可以表示为...he

表示he前面有三个字符

    ^ 用于表示行首匹配,即行首的字符是”^”后面的字符,可以是一个或者多个

    如 ^txt 表示以txt开头的行

   [] 为匹配符号集,支持穷举法列出的字符集合的所有元素,同时支持用“-”表示字

集范围,范围为“-”左边到右边的字符范围。

    如 [0123456] 表示匹配0到6的任意一个数字,也可以表示为[0-6]

    $ 用于表示行尾匹配,即行尾的字符是 $ 前面的字符,可以是一个或者多个

    如 txt$ 表示以txt为行尾的行,这里要注意,元字符的位置与行首匹配是相反的。

    \ 定义转义符,作用是屏蔽一个元字符的特殊意义,即”\”后面的字符不再有特殊意义,只是普通的字符。

    \<\> 精确匹配符,其形式为\<要匹配的内容\>。作用是输出精确匹配的结果。

      如 \<a.txt\> 则只会输出a.txt,其他无论是包含a还是包含txt的结果都不会输出。

      \{\} 系列匹配符,其有三种形式,如下。

      \{n\} 匹配前面字符出现n次的结果

      如hel\{1\}o 表示重复l一次,即匹配结果为hello

      \{n,\} 匹配前面字符至少出现n次的结果

      如 hel\{3,\}o,则匹配结果为hellllo

      \{n,m\} 匹配前面字符出现n到m次的结果

      如 hel\{1,3\}o,则输出结果为hello、helllo、hellllo。

      除了以上列出的正则表达式的元字符外,其实还有一些扩展元字符,通常用的比较少。


#帮助信息:

#Edit By Lion @2015/07/30

#QQ:2022215673

#Mail:simy_88@163.com