sed的模式空间和保持空间
 

sed之所以能以行为单位的编辑或修改文本,其原因在于它使用了两个空间:一个是活动的“模式空间(pattern space)”,另一个是起辅助作用的“保持空间(hold space)这2个空间的使用。

模式空间:可以想成工程里面的流水线,数据之间在它上面进行处理。
保持空间:可以想象成仓库,我们在进行数据处理的时候,作为数据的暂存区域。

正常情况下,如果不显示使用某些高级命令,保持空间不会使用到!

sed在正常情况下,将处理的行读入模式空间,脚本中的“sed command(sed命令)”就一条接着一条进行处理,直到脚本执行完毕。然后该行被输出,模式被清空;接着,在重复执行刚才的动作,文件中的新的一行被读入,直到文件处理完毕。

 sed的模式空间和保持空间_a标签

一般情况下,数据的处理只使用模式空间(pattern space),按照如上的逻辑即可完成主要任务。但是某些时候,通过使用保持空间(hold space),还可以带来意想不到的效果。

sed命令:
+ g:[address[,address]]g 将hold space中的内容拷贝到pattern space中,原来pattern space里的内容清除。

+ G:[address[,address]]G 将hold space中的内容append到pattern space\n后。
+ h:[address[,address]]h 将pattern space中的内容拷贝到hold space中,原来的hold space里的内容被清除。
+ H:[address[,address]]H 将pattern space中的内容append到hold space\n后。
+ d:[address[,address]]d 删除pattern中的所有行,并读入下一新行到pattern中。
+ D:[address[,address]]D 删除multiline pattern中的第一行,不读入下一行。
+ x:交换保持空间和模式空间的内容。

 

1. 给每行结尾添加一行空行                                                                                                   

sed的模式空间和保持空间_sed_02

2.用sed模拟出tac的功能(倒序输出)

sed的模式空间和保持空间_i++_03

1!G:第1行不执行“G”命令,从第2行开始执行。$!d:最后一行不删除(保留最后1行)。

3.追加匹配行到文件结尾

sed的模式空间和保持空间_i++_04

-e :进行多项编辑,即对输入行应用多条sed命令时使用

4.行列转化

sed的模式空间和保持空间_sed_05

-n :取消默认的输出

H表示把pattern space 的内容追加到hold space中去,H可以带一个地址,这里用的是$,表示到文件的末尾,然后用x将之取到pattern space中,把\n替换成空格再打印即可。

5. 行列转化,求1~100的求和

sed的模式空间和保持空间_i++_06
seq 100 ==>竖排打印1...100个数字。

bc    ==>交给bc计算

附:seq命令的语法

1)生成序列[1…LAST]
例:seq 5 表示序列为 1 2 3 4 5

sed的模式空间和保持空间_a标签_07

2)生成序列[FIRST…LAST],步长为1

例:seq 2 5表示序列为  2 3 4 5

sed的模式空间和保持空间_a标签_08

3)生成序列[FIRST…LAST],步长为INCREMENT

例:seq 2 2 5表示序列为  2 4 

sed的模式空间和保持空间_sed命令_09

6. 打印奇偶数行

sed的模式空间和保持空间_sed_10

sed的模式空间和保持空间_i++_11

附:awk打印奇偶行

方法一:

sed的模式空间和保持空间_数据_12

NR是行号,awk的内建函数,当第一行,NR==1时,对2取余,结果是1,在awk的执行模式里,这个1就是pattern,为真,执行默认的{print},这个action操作。那么打印出该行,到第2行则余数是0,pattern为0,则为假,不会执行默认的{print},则不会输出偶数行。就达到了只输出奇数行的效果,反之则输出偶数行了。

方法二:

sed的模式空间和保持空间_sed_13

 这行命令充分的利用了C语言中 ++i 与 i++ 的区别,i++ 中i的值自加一次后这个表达式的结果等于1,但此时i的值仍然为0,i的值在当前表达式中不会改变,++i中i的值自加一次后,i的值是1。第一行时,因为对2取余的时候 i++ 自加一次后的值是1,但 i++ 是把i的自加前的值去对2取余的,0对2取余结果为0,条件为假,到第二行的时候i的值才是上次自加后的值为1,对2取余数为1,pattern为真,则输出第2行,以此类推。++i 则是自加后i的值是1,所以输出的奇数行。

方法三:

sed的模式空间和保持空间_i++_14

方法四:

sed的模式空间和保持空间_sed_15

awk里面有三个built-in function,分别是:and(a, b)按位与,or(a, b)按位或,xor(a, b)按位异或,当FNR为1的时候,就是第一行,1的2进制为0001,与0001按位与,得到结果是0001,0001的结果为真,就打印改行,当FNR为2时二进制表示为0010,那么又与0001相与,结果为0000,条件为假,则不打印。只有当FNR为奇数时,二进制的尾数为1,与0001相与结果才为真,否则结果都为假。即只输出奇数行,非则输出偶数行。

7.求1~100和

sed的模式空间和保持空间_数据_16

:a表示标签a,ba表示跳转到a标签,$表示最后一行,!表示不做后续操作,所以,$!ba表示最后一行不用跳转到a标签,结束此次操作。