Sed是一个行编辑器,通常一次只处理一行数据,默认不编辑原文件,而是把原来的数据复制一份到内存中执行编辑操作,可以对行进行删除,增加,替换,选取等特×××。
工具原理:
Sed读取文件的内容放到内存中,我们通常称作为模式空间,sed会通过正则表达式匹配模式空间中符合条件的行,匹配到的行会进行编辑操作,有可能会输出到频幕上,这得看你的编辑操作了,原本读取到的行默认会输出到频幕上,你可以不让它输出,sed会一直从第一行读取到最后一行。
Sed还有段空间,被称为保持空间,当你读取行文件到模式空间,模式空间会把读取到的行文件保存到保持空间,我们还可以实现模式空间和保持空间的对换编辑。
Sed指令:
Sed的正则表达式元字符 | |||
元字符 | 功能 | 示例 | 示例的匹配对象 |
^ | 行首定位符 | /^love/ | 匹配所有以love开头的行 |
$ | 行尾定位符 | /love$/ | 匹配所有以love结尾的行 |
. | 匹配除换行符外的单个字符 | /l..e/ | 匹配包含字母l后跟两个任意字符在跟字母e的行 |
* | 匹配零个或多个前导字符 | /*love/ | 匹配在零个或多个空格紧跟着模式love的行 |
[] | 匹配指定字符组内的任一字符 | /[Ll]ove/ | 匹配包含love和Love的行 |
[^] | 匹配不在指定字符组内的任一字符 | /[^A-KM-Z]ove/ | 匹配包含ove,但ove之前的那个字符不在A至K或M至Z之间的行 |
\(..\) | 保存已匹配的字符 | s/\(love\)able/\1er/ | 标记元字符之间的模式,并将其保存为标签1,之后可以用好\1来引用它。最多可定义9个标签,从左边开始编号,最左边的是第一个。在这个示例中,loe被保存在寄存器1里,之后被替换串引用,结果loveable被替换为lover。 |
& | 保存查找串以便在替换串中引用 | s/love/**&**/ | 符号&代表查找串。字符串love将替换前后各加了两个星号的引用,即love变成**love** |
\< | 词首定位符 | /\<love/ | 匹配包含以love开头的单词的行 |
\> | 词尾定位符 | /love/>/ | 匹配包含以love结尾的单词的行 |
x\{m\} | 连续m个x | /o\{5\}/ | 分别匹配出现连续5个字母o、至少5个连续的o、或5-10个连续的o的行 |
x\{m,\} | 至少m个x | /o\{5,\}/ | |
X\{m,n\} | 至少m个但不超过n个x | /o\{5,10\}/ |
常用选项:
-n:不输出模式空间中的内容至屏幕;
-e :多点编辑;
-f /PATH/TO/SED_SCRIPT_FILE:指定sed脚本
注意:sed脚本后边不能有空格
-r, --regexp-extended:支持使用扩展正则表达式;
-i[SUFFIX], --in-place[=SUFFIX]:编辑的结果保存到原文件中
地址定界:
(1) 空地址:默认是对全文进行处理;
(2) 单地址:
#:指定行;
/pattern/:被此模式所匹配到的每一行;
(3) 地址范围
#,#:匹配两者之间的内容带其本身
#,+#:匹配从本行往后的#行
#,/pat1/:匹配本行到匹配到的字符的行
/pat1/,/pat2/:匹配两字符串之间的内容,包括本身
$:最后一行;
(4) 步进:~
1~2:所有奇数行
2~2:所有偶数行
编辑命令:
d:删除;
上面删除第一行
p:显示模式空间中的内容;
显示第一行
a \text:在行后面追加文本“text”,支持使用\n实现多行追加;
i \text:在行前面插入文本“text”,支持使用\n实现多行插入;
c \text:把匹配到的行替换为此处指定的文本“text”;
w /PATH/TO/SOMEFILE:保存模式空间匹配到的行至指定的文件中;
r /PATH/FROM/SOMEFILE:读取指定文件的内容至当前文件被模式匹配到的行后面;文件合并;
=:为模式匹配到的行打印行号;
!:条件取反;
地址定界!编辑命令;
s///:查找替换,其分隔符可自行指定,常用的有s@@@, s###等;
替换标记:
g:全局替换;
w /PATH/TO/SOMEFILE:将替换成功的结果保存至指定文件中;
p:显示替换成功的行;