grep, sed, awk
grep: 文本搜索工具;egrep, fgrep
sed: stream editor, 流编辑器;
awk(gawk):文本格式化工具,报告生成器
sed命令:
正则表达式元字符:
字符匹配:., [], [^]
次数匹配:*, \?, \+, \{m,n\}, \{n\}
位置锚定:^, $, \<, \>
分组及引用:\(\), \1, \2, ...
多选一:a|b|c
vim编辑中文本的查找替换:
地址定界s/要查找的内容/替换为的内容/
要查找的内容:可使用正则表达式
替换为的内容:不支持正则表达式,但支持引用前面正则表达式分组中的内容
地址定界:%全文查找,.当前行,$尾行,startline,endline
语法:sed [OPTION]... {script} [input-file]...
工作机制:每次读取一行文本至“模式空间(pattern space)”中,在模式空间中完成处理;将处理结果输出至标准输出设备;
-r: 支持扩展正则表达式;
-n: 静默模式;
-e script1 -e script2 -e script3:指定多脚本运行;
-f /path/to/script_file:从指定的文件中读取脚本并运行;
-i: 直接修改源文件;
地址定界:
#: 指定行[#表示一个数字];
$: 最后一行;
/regexp/:任何能够被regexp所匹配到的行;
\%regexp%:同上,只不过换作%为regexp边界符;
/regexp/| :
\%regexp%| :匹配时忽略字符大小写;
startline,endline:
#,/regexp/:从#行开始,到第一次被/regexp/所匹配到的行结束,中间的所有行;
#,#
/regexp1/,/regexp2/:从第一次被/regexp1/匹配到的行开始,到第一次被/regexp2/匹配到的行结束,中间的所有行;
#,+n:从#行开始,一直到向下的n行;
first~step:指定起始行,以及步长;
sed的编辑命令
d: 删除模式空间中的行;
=:显示行号;
a \text:附加text
i \text:插入text,支持\n实现多行插入;
c \text:用text替换匹配到的行;
p: 打印模式空间中的行;
s/regexp/replacement/:替换由regexp所匹配到的内容为replacement;
g: 全局替换;
i: 不区分大小写
w /path/to/somefile:把指定的内容另存至/path/to/somefile路径所指定的文件中;
r /path/from/somefile:在文件的指定位置插入另一个文件的所有内容,完成文件合并;
练习:
(1) 删除/boot/grub/grub.conf文件中所有行的行首的空白字符;
sed 's/^[[:space:]]\+//' /boot/grub/grub.conf
(2) 删除/etc/fstab文件中所有以#开头,后跟至少一个空白字符的行的行首的#和空白字符;
sed 's/^#[[:space:]]\+//' /etc/fstab
(3) 把/etc/fstab文件的奇数行另存为/tmp/fstab.3;
sed '1~2w /tmp/fstab.3' /etc/fstab
(4) echo一个文件路径给sed命令,取出其基名;进一步地,取出其路径名;
取基名:echo "/etc/sysconfig/network-scripts/" | sed 's@^.*/\([^/]\+\)/\?$@\1@'
取路径名:echo "/etc/sysconfig/network-scripts/" | sed 's@[^/]\+/\?$@@'