grep, sed, awk

grep: 文本搜索工具;egrep, fgrep

sed: stream editor, 流编辑器;

awk(gawk):文本格式化工具,报告生成器

 

sed命令:

 

正则表达式元字符:

字符匹配:., [], [^]

次数匹配:*, \?, \+, \{m,n\}, \{n\}

位置锚定:^, $, \<, \>

分组及引用:\(\), \1, \2, ...

多选一:a|b|c

 

vim编辑中文本的查找替换:

地址定界s/要查找的内容/替换为的内容/

要查找的内容:可使用正则表达式

替换为的内容:不支持正则表达式,但支持引用前面正则表达式分组中的内容

地址定界:%全文查找,.当前行,$尾行,startline,endline

 

语法:sed [OPTION]... {script} [input-file]...

 

工作机制:每次读取一行文本至“模式空间(pattern space)”中,在模式空间中完成处理;将处理结果输出至标准输出设备;

 

-r: 支持扩展正则表达式

-n: 静默模式;

-e script1 -e script2 -e script3:指定多脚本运行;

-f /path/to/script_file:从指定的文件中读取脚本并运行;

-i: 直接修改源文件;

 

地址定界:

#: 指定行[#表示一个数字]

$: 最后一行;

/regexp/:任何能够被regexp所匹配到的行;

\%regexp%:同上,只不过换作%regexp边界符;

/regexp/|

\%regexp%| :匹配时忽略字符大小写;

startline,endline

#,/regexp/:从#行开始,到第一次被/regexp/所匹配到的行结束,中间的所有行;

#,#

/regexp1/,/regexp2/:从第一次被/regexp1/匹配到的行开始,到第一次被/regexp2/匹配到的行结束,中间的所有行;

#,+n:从#行开始,一直到向下的n行;

first~step:指定起始行,以及步长;

 

sed的编辑命令

d: 删除模式空间中的行;

=:显示行号;

a \text:附加text

i \text:插入text,支持\n实现多行插入;

c \text:用text替换匹配到的行;

p: 打印模式空间中的行;

s/regexp/replacement/:替换由regexp所匹配到的内容为replacement

g: 全局替换;

i: 不区分大小写

w /path/to/somefile:把指定的内容另存至/path/to/somefile路径所指定的文件中;

r /path/from/somefile:在文件的指定位置插入另一个文件的所有内容,完成文件合并;

 

练习:

(1) 删除/boot/grub/grub.conf文件中所有行的行首的空白字符;

sed 's/^[[:space:]]\+//' /boot/grub/grub.conf

(2) 删除/etc/fstab文件中所有以#开头,后跟至少一个空白字符的行的行首的#和空白字符;

sed 's/^#[[:space:]]\+//' /etc/fstab

(3) /etc/fstab文件的奇数行另存为/tmp/fstab.3

sed '1~2w /tmp/fstab.3' /etc/fstab

(4) echo一个文件路径给sed命令,取出其基名;进一步地,取出其路径名;

取基名:echo "/etc/sysconfig/network-scripts/" | sed 's@^.*/\([^/]\+\)/\?$@\1@'

取路径名:echo "/etc/sysconfig/network-scripts/" | sed 's@[^/]\+/\?$@@'