文本编辑器及文本处理
文本编辑器介绍
常见的Linux文本编辑器有:
emacs
nano
gedit
kedit
vi
vim
Linux文本编辑器-emacs
emacs是一款功能强大的编辑器,与其说是一款编辑器,它更像一个操作系统。emacs带有内置的网络浏览器、IRC客户端、计算器,甚至是俄罗斯方块。当然,emacs需要在图形化界面的Linux中使用。
优点:
可定制,可扩展
功能强大
可以与许多自由软件编程工具集成
缺点:
入门难度高,对普通用户不友好
Linux文本编辑器-nano
nano是命令行界面下一个相对简单的文本编辑器,它是为了代替闭源的Pico文本编辑器而开发的,1999年以GPL协议发布第一个版本,是一个自由软件,同时也是GNU计划的一个组成部分。nano有很多人性化的功能设计,如语法高亮、正则表达式搜索和替换、平滑滚动、多个缓冲区、自定义快捷键、撤销或重复编辑。
优点:
易于使用,操作简单,适用于简单文本编辑。
缺点:
对复杂的文本编辑比较耗时,无强大的命令功能进行复杂操作,不支持如宏、一次编辑多个文件、窗口分割、垂直块/矩形选择/编辑、自动完成等高级功能。
Linux文本编辑器 - gedit
gedit是一个GNOME桌面环境下兼容UTF-8的文本编辑器。它简单易用,有良好的语法高亮,对中文支持很好,支持包括GB2312、GBK在内的多种字符编码。gedit是一款自由软件。gedit包含语法高亮和标签编辑多个文件的功能。利用GNOME VFS库,它还可以编辑远程文件。它支持完整的恢复和重做系统以及查找和替换。
优点:
图形化界面,易上手,操作习惯与Windows类似,包括常用的快捷键如复制粘贴等
缺点:
需要安装图形化桌面才能使用。
Linux文本编辑器 - kedit
与gedit类似,kedit是KDE图形化桌面中常用的一种文本编辑器。kedit是一个非常小的编辑器,特别适用于浏览文本和各种配置文件。
优点:
图形化界面,易上手,操作习惯与Windows类似,包括常用的快捷键如复制粘贴等。
缺点:
需要安装图形化桌面才能使用。
Linux文本编辑器 - vi
vi是标准的Unix文本编辑器,也是最古老的文本编辑器、最通用的文本编辑器。所有的Linux、Unix都默认带有vi文本编辑器。虽然vi的操作方式与其他常用的文本编辑器(如gedit)很不相同 ,但是由于其运行于字符界面,并可用于所有unix/linux环境,仍被经常使用。
vi的三种命令模式:
Command:命令模式,用于输入命令
Insert:插入模式,用于插入文本
Visual:可视模式,用于浏览文本
优点:通用,几乎所有的Unix、Linux都自带vi
缺点:功能简单,显示效果单一
Linux文本编辑器 - vim
Vim是从vi发展出来的一个文本编辑器。其代码补完、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。和Emacs并列成为类Unix系统用户最喜欢的编辑器。
Vim的第一个版本由布莱姆·米勒在1991年发布。最初的简称是Vi IMitation,随着功能的不断增加,正式名称改成了Vi IMproved。现在是在开放源代码方式下发行的自由软件。
从vi派生出来的Vim具有多种模式:
基本模式:普通模式、插入模式、可视模式、选择模式、命令行模式、Ex模式
派生模式:操作符等待模式、插入普通模式、插入可视模式、插入选择模式、替换模式
其他:Evim
openEuler 20.03 LTS系统安装后默认没有安装vim,需要手动安装vim
基本模式
普通模式:在普通模式中,用的编辑器命令,比如移动光标,删除文本等等。这也是Vim启动后的默认模式。这正好和许多新用户期待的操作方式相反(大多数编辑器默认模式为插入模式)。Vim强大的编辑能力来自于其普通模式命令。普通模式命令往往需要一个操作符结尾。例如普通模式命令"dd"删除当前行,但是第一个"d"的后面可以跟另外的移动命令来代替第二个"d",比如用移动到下一行的"j"键就可以删除当前行和下一行。另外还可以指定命令重复次数,"2dd"(重复"dd"两次),和"dj"的效果是一样的。用户学习了各种各样的文本间移动/跳转的命令和其他的普通模式的编辑命令,并且能够灵活组合使用的话,能够比那些没有模式的编辑器更加高效的进行文本编辑。在普通模式中,有很多方法可以进入插入模式。比较普通的方式是按"a"(append/追加)键或者"i"(insert/插入)键。
插入模式:在这个模式中,大多数按键都会向文本缓冲区中插入文本。大多数新用户希望文本编辑器编辑过程中一直保持这个模式。在插入模式中,可以按ESC键回到普通模式。
可视模式:这个模式与普通模式比较相似。但是移动命令会扩大高亮的文本区域。高亮区域可以是字符、行或者是一块文本。当执行一个非移动命令时,命令会被执行到这块高亮的区域上。Vim的"文本对象"也能和移动命令一样用在这个模式中。
选择模式:这个模式和无模式编辑器的行为比较相似(Windows标准文本控件的方式)。这个模式中,可以用鼠标或者光标键高亮选择文本,不过输入任何字符的话,Vim会用这个字符替换选择的高亮文本块,并且自动进入插入模式。
命令行模式:在命令行模式中可以输入会被解释成并执行的文本。例如执行命令(":"键),搜索("/"和"?"键)或者过滤命令("!"键)。在命令执行之后,Vim返回到命令行模式之前的模式,通常是普通模式。
Ex模式:这和命令行模式比较相似,在使用":visual"命令离开Ex模式前,可以一次执行多条命令。
派生模式
操作符等待模式:这个派生模式指普通模式中,执行一个操作命令后Vim等待一个"动作"来完成这个命令。Vim也支持在操作符等待模式中使用"文本对象"作为动作,包括"aw"一个单词(a word)、"as"一个句子(a sentence)、"ap"一个段落(a paragraph)等等。
插入普通模式:这个模式是在插入模式下按下ctrl-o键的时候进入。这个时候暂时进入普通模式,执行完一个命令之后,Vim返回插入模式
插入可视模式:这个模式是在插入模式下按下ctrl-o键并且开始一个可视选择的时候开始。在可视区域选择取消的时候,Vim返回插入模式。
插入选择模式:通常这个模式由插入模式下鼠标拖拽或者shift方向键来进入。当选择区域取消的时候,Vim返回插入模式。
替换模式:这是一个特殊的插入模式,在这个模式中可以做和插入模式一样的操作,但是每个输入的字符都会覆盖文本缓冲中已经存在的字符。在普通模式下按"R"键进入。
其他
Evim:Evim(Easy Vim)是一个特殊的GUI模式用来尽量的表现的和"无模式"编辑器一样。编辑器自动进入并且停留在插入模式,用户只能通过菜单、鼠标和键盘控制键来对文本进行操作。可以在命令行下输入"evim"或者"vim -y"进入。
使用vim编辑器
vim编辑器命令格式
命令格式:
vim [options] [file]... 编辑指定文件
vim [options] - 从标准输入 (stdin) 读取文本
vim [options] -t tag 编辑tag定义出的文件
vim [options] -q [errorfile] 编辑第一个出错处的文件
常见参数:
-c :打开文件前线执行指定的命令
-R :以只读方式打开,但是可以强制保存
-M :以只读方式打开,不可以强制保存
-r :回复崩溃的会话
+*num* :从第*num*行开始
vim基础操作-打开文件
[root@openEuler ~]# vim filename
如果filename 文件存在,则会打开文件并显示文件内容;
如果filename 文件不存在,vim会在下面提示 [New File],并且会在第一次保存时创建该文件
[root@openEuler ~]# vim test.txt
~
~
~
~
~
“test.txt” [New File]
vim基础操作-移动光标
快速移动光标:
上下左右键或k、j、h、l键上下左右移动光标
0 移动到行首
g0 移到光标所在屏幕行行首
:n 移动到第n行。
gg: 到文件头部。
G: 到文件尾部。
数据操作:
yy or Y: 复制整行文本。
y[n]w: 复制一(n)个词。
d[n]w: 删除(剪切)1(n)个单词
[n] dd: 删除(剪切)1(n)行。
vim基础操作 - 行号显示与取消
显示行号:set nu
1 hello
2 openEuler
~
~
~
~
~
:set nu
取消显示行号:set nonu
vim基础操作 - 查找与替换
查找
:/word 在光标之后查找一个字符串word,按n向后继续搜索,shift+n向上搜索。
:?word 在光标之前查找一个字符串word,按n向后继续搜索。
替换
:1,5s/word1/word2/g 将文档中1-5行的word1替换为word2,不加g则只替换每行的第一个word1。
%s/word1/word2/gi 将文档所有的word1替换为word2,不区分大小写。
vim基础操作 - 设置搜索高亮
临时设置时,在命令模式下输入:
:set hlsearch
hello
openEuler
hello
world
~
~
:set nu
永久设置,需要在/etc/vimrc中配置,增加一行set hlsearch,然后更新变量即可。
vim基础操作 - 修改文件
使用vim filename打开文件后,进入的是普通模式。当想要修改文件时,可以按i键进入插入模式。进入插入模式时,会在最下面提示当前模式是Insert。按ecs可以退出插入模式,回到普通模式。
[root@openEuler ~]# vim test.txt
#按i进入插入模式
~
~
~
~
~
~
~
-- INSERT --
vim基础操作 - 撤销或重做
u 撤销最近的改变
U 撤销当前行自从光标定位在上面开始的所有改变
Ctrl+r 重做最后一次“撤销”改变
vim基础操作 - 保存文件并退出
退出插入模式:
在插入模式下按ecs键退出插入模式
常用的保存/退出的命令:
:w 保存
:q 退出
:wq 保存并退出
:q! 强制退出
:wq! 强制保存并退出
文本处理
查看文件-cat
cat 是一个文本文件查看和连接工具。cat有如下功能:
显示文件内容,cat filename
编辑一个文件,cat > filename。
将几个文件合并为一个文件,cat file1 file2 > file3
cat常用选项有:
-n:从1开始对所有行编号并显示在每行开头
-b:从1开始对非空行编号并显示在每行开头
-s:当有多个空行在一起时只输出一个空行
-E:在每行结尾增加$
--help:显示帮助信息
cat查看文件用法举例
[root@openEuler ~]# cat /etc/profile #查看/etc/profile文件内容
[root@openEuler ~]# cat -b /etc/profile #查看/etc/profile文件内容,并对非空白行进行编号,编号从1开始
[root@openEuler ~]# cat -n /etc/profile #查看/etc/profile文件内容,并在每行前面显示行号。
[root@openEuler ~]# cat -E /etc/profile #查看/etc/profile文件内容,并且在每行的结尾处附加$符号
[root@openEuler ~]# cat -s /etc/profile #查看/etc/profile文件内容,但是不输出多行空行,当有多个空行在一起时,只输出一个空行
查看文件 - more
more可以一次查看文件或者标准输入的一页,与cat不同的是more可以按页来查看文件的内容,还支持直接跳转行等功能。
命令格式:more [options] <file>...
more 常用的选项有:
+n:从第n行开始显示
-n:定义屏幕大小为n行
-c:从顶部清屏,然后显示
-s :把连续的多个空行显示为一行
more的常用操作:
Enter:默认向下滚动1行
Ctrl+F:向下滚动一屏
空格键:向下滚动一屏
Ctrl+B:向上滚动一屏
b:向上滚动一屏
=:输出当前行号
:f :输出文件名和当前行号
q:退出more
查看文件 - less
less 可以一次查看文件或者标准输入的一页,less 的用法比起 more 更加的有弹性。
命令格式: less [option] 文件
less常用的选项有:
-f:强制打开特殊文件,例如外围设备代号、目录和二进制文件
-g:只标志最后搜索到的关键字
-i:忽略搜索时的大小写
-N:显示每行的行号
-s:当有多个空行在一起时只输出一个空行
-o <文件名> :将less输出的内容保存到指定文件
less常用的操作:
b:向上翻一页
d:向下翻半页
h:显示帮助界面
q:退出less
u:向上翻半页
y:向上翻一行
空格键:向下翻一行
Enter:向下翻一页
上下键:向上/下翻一行
文件摘选 - head
head用来显示文件的开头至标准输出中,默认head命令可以显示文件的前10行
命令格式:head [option]... [文件]...
head常用的选项有:
-q:输出时隐藏文件名,head默认不显示文件名
-v:输出时显示文件名
-c *num*:显示前*num* 个字节
-n *num*:显示前*num* 行
文件摘选 - tail
tail用来显示文件的末尾至标准输出中,默认tail命令可以显示文件的后10行 命令格式:tail [option]... [file]...
tail常用的选项有:
-f:循环读取,对于日志文件的监控非常有用
-q:不显示文件名,tail默认不显示文件名
-v显示文件名
-c num:显示文件最后num 个字节
-n num:显示文件最后num 行
提取列或字段 - cut
cut用于显示文件或者标准输入的特定列,如:
[root@openEuler ~]# cut -d: -f1 /etc/passwd #显示/etc/passwd文件以 : 间隔的第一列
命令格式:cut [option]... [文件]
cut常用的选项有:
-b [范围] :仅显示行中指定直接范围的内容
-c[范围] :仅显示行中指定范围的字符
-d:指定字段的分隔符,默认的字段分隔符为“TAB”
-f [范围]:显示指定第num 个字段的内容,可以用逗号隔开显示多个字段
cut指定字符或者范围的字符记法:
N-:从第N个字节、字符、字段到结尾
N-M:从第N个字节、字符、字段开始到第M个(包括M在内)字节、字符、字段结束
-M:从第一个字节、字符、字段开始到第M个(包括M在内)字节、字符、字段结束
提取列或字段 - awk
awk是一个强大的文本分析工具,简单来说awk就是把文件或者标准输入逐行读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。
[root@openEuler ~]# last -n 5 | awk ‘{print $1}’ #显示最近登录系统的5个账号
awk基本命令格式:awk 动作 文件名,如:awk ‘{print $0}’ test.txt
提取关键字 - grep
grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容。
命令格式:grep [option] [file]...
grep常用的选项有:
-c:统计符合样式的行数
-i:忽略大小写
-w:只显示全子符合的行
-x:只显示全行符合的行
文本统计 - wc
wc命令用于计算字数。利用wc指令我们可以计算文件的字节数、字数、或是列数,若不指定文件名称、或是所给予的文件名为"-",则wc指令会从标准输入设备读取数据。
命令格式:wc [option]... [file]...
wc常用选项有:
-c或--bytes或--chars:只显示字节数
-l或--lines:只显示行数
-w或--words:只显示字数
文本排序 - sort
sort命令可以将文件进行排序,并将排序结果标准输出。sort命令既可以从特定的文件,也可以从stdin中获取输入。
命令格式:sort [option]... [file]...
sort常用的选项有:
-b:忽略每行前面开始的空格字符
-c:检查文件是否已经按照顺序排序
-d:排序时,处理英文字母、数字及空格字符外,忽略其他字符
-f:排序时,将小写字母视为大写字母
-n:依照数值的大小排序
-r:以相反的顺序排序
-o <文件>:将排序后的结果存入指定的文件
-u:忽略相同行
文本比较 - diff
diff以逐行的方式,比较文本文件的异同处。如果指定要比较目录,则diff会比较目录中相同文件名的文件,但不会比较其中子目录。
命令格式:diff [option]... file
diff常用的选项有:
-B:不检查空白行
-c:显示全部内文,并标出不同之处
-i:忽略大小写的不同
-r:比较子目录中的文件
-w:忽略全部的空格字符
文本操作工具 - tr
tr 指令从标准输入设备读取数据,经过字符串转译后,将结果输出到标准输出设备,常用于转换或删除文件中的字符。
命令格式:tr [option]... set1 [set2]
[root@openEuler ~]# cat text.txt | tr a-z A-Z #将小写转换为大写输出
tr常用的选项有:
-c:反选设定字符,也就是符合set1的部分不做处理,不符合的剩余部分才进行转换
-d:删除字符
-s缩减连续重复的字符成指定的单个字符
-t:削减set1指定范围,使之与set2设定长度相等
文本操作工具 - sed
相比较tr,sed可以修改字符串。sed是一种在线编辑器,可以对来自文件、以及标准输入的文本进行编辑。执行时,sed会从文件或者标准输入中读取一行,将其复制到缓冲区,对文本编辑完成之后,读取下一行直到所有的文本行都编辑完毕。所以sed命令处理时只会改变缓冲区中文本的副本,如果想要直接编辑原文件,可以使用-i选项或者将结果重定向到新的文件中。
命令格式:sed [option]... [option] {script-only-if-no-other-script} [input-file]...
sed常用的选项:
-n:取消默认输出
-e:多点编辑,可以执行多个子命令
-f:从脚本文件中读取命令
-i:直接编辑原文件
-l:指定行的长度
-r:在脚本中使用扩展表达式