在一次sed使用中,执行命令:

sed "s/\n//g" file

发现,没起到任何效果。

后来,经查sed官方用户手册,才得知,sed是按行处理文本数据的,每次处理一行数据后,都会在行尾自动添加trailing newline,其实就是行的分隔符即换行符。

如果非要使用sed命令,实现替换file文本内容的换行符为空的话,那么就要了解sed的分支条件命令,以及了解sed的pattern space模式空间和hold space保持空间。即,连续两行执行一次sed命令,这样就可以把前一行的\n替换完成。

这个基础内容,可以百度,也可以参考下文连接:

最终程序和执行结果如下例所示:

qilei@AFAAW-704030720:~$cat a.txt
a11111
a22222
a33333
qilei@AFAAW-704030720:~$sed "s/\n//g" a.txt
a11111
a22222
a33333
qilei@AFAAW-704030720:~$sed ":a;N;s/\n//g;ta" a.txt
a11111a22222a33333
qilei@AFAAW-704030720:~$

实现方法

第一种方法:使用test跳转命令,实现替换换行符

sed ":a;N;s/\n//g;ta" a.txt

N是把下一行加入到当前的hold space模式空间里,使之进行后续处理,最后sed会默认打印hold space模式空间里的内容。也就是说,sed是可以处理多行数据的。

:a和ta是配套使用,实现跳转功能。t是test测试的意思。

另外,还有:a和ba的配套使用方式,也可以实现跳转功能。b是branch分支的意思。

branch和test区别
branch循环到文本结束。比如sed ":a;N;s/\n//g;ba" a.txt,转换成自然语言的描述,就是
while(1) {
N;
s/\n//g;
}
test可以根据替换命令的完成是否成功,决定是否跳转。比如sed ":a;N;s/\n//g;ta" a.txt,转换成自然语言的描述,就是
while(state == 1) { #注释:默认state就当是1好了。
N;
s/\n//g;#注释:成功,返回state为1;否则返回state=0。此state用于跳转判断。
}
else {
last; #注释:即退出循环语句。
}

第二种方法:使用branch跳转命令,实现替换换行符

qilei@AFAAW-704030720:~$sed ":a;N;s/\n//g;$!ba" a.txt

a11111a22222a33333

qilei@AFAAW-704030720:~$

增加$!ba语句,$的意思是最后一行,不跳转到标记a处,即退出命令循环。

同理,也可以用下述命令。

qilei@AFAAW-704030720:~$sed ":a;$!N;s/\n//g;ba" a.txt
a11111a22222a33333
qilei@AFAAW-704030720:~$

深入使用

保持空间

保持空间用于保存模式空间的内容,模式空间的内容可以复制到保持空间,同样地保持空间的内容可以复制回模式空间。sed提供了几组命令用来完成复制的工作,其它命令无法匹配也不能修改模式空间的内容。

操作保持空间的命令如下所示:

名称

命令

说明

保存(Hold)

h/H

将模式空间的内容复制或者追加到保持空间

取回(Get)

g/G

将保持空间的内容复制或者追加到模式空间

交换(Exchange)

x

交换模式空间和保持空间的内容

读下一行:N
$ sed'/Operator$/{N;s/Owner and Operator\nGuide/Installation Guide/}'text
上面的例子简单地介绍了保持空间命令的基本使用方法,这些命令单个使用可能效果不大,但是组合起来的效果是非常好的。
1.第一个例子: 使用逗号拼接行
$ sed'H;$!d;${x;s/^\n//;s/\n/,/g}'text1,11,2,11,22,111,222

上面的命令执行过程是这样的,使用H将每一行都追加到保持空间,这里利用d命令打断常规的命令执行流程,让sed继续读入新的一行,直接到将最后一行都放到保持空间。这个时候使用x命令将保持空间的内容交换到模式空间,模式空间的内容现在是这样的:\n1\n11\n2\n11\n22\n111\n222。替换的步骤分成两个,首先去掉首个回车符,然后把剩余的回车符替换成逗号。