第十二章 字符转换、删除及压缩工具:tr命令
名字解释
tr命令 对来自标准输入的字符进行替换、压缩和删除。它可以将一组字符变成另一组字符,经常用来编写优美的单行命令,作用很强大。
语法
tr (选项) (参数)
选项
- -c或--complerment:[set2]取代所有不属于[set1]的字符;
- -d或--delete:删除[set1]的指定字符;
- -s或--squeeze-repeats:把连续重复的字符以一个字符表示;去重;
- -t或--truncate-set1:将[set1]用[set2]替换,tr缺省为-t 。
参数
[set1][set2]
- 字符集1:指定要转换或删除的原字符集。当执行转换操作时,必须使用参数“字符集2”指定转换的目标字符集。但执行删除操作时,不需要参数“字符集2”;
- 字符集2:指定要转换成的目标字符集。
实例
-c [set2]替换[set1]中不包含的字符串
[root@localhost ~]# cat time.txt
Monday 001
Tuesday 002
Wednesday 003
Thursday 004
Friday 005
Saturday 006
Sunday 007
[root@localhost ~]# cat time.txt | tr -cs "a-z,A-Z" "\n"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
# tr 利用-c 选项指定[set1]的内容包含:"a-z,A-Z",然后用\n 取代time.txt中的其他字符,在这里也就是替代里边的数字;-s 代表去重 将多个\n 去重成为一个\n 就够了。
#用可以写成:
[root@localhost ~]# cat time.txt | tr -cs [a-z][A-Z] "\n"
-d 删除[set1] 指定字符
使用tr删除字符:
[root@ceshi xargs]# echo "hello 123 world" | tr -d '0-9'
hello world
字符集补集,从输入文本中将不再补集中的所有字符删除:
[root@ceshi xargs]# echo "a 1 b@ 2# c 3 d 4 " | tr -d -c '0-9 \n'
1 2 3 4
此例中,因为字符集1包含了数字0-9、空格和换行\n,所以这些元素没有被删除,而其他字符都被删除掉了。
-s 去重
使用tr压缩字符,可以压缩输入中重复的字符:
[root@ceshi xargs]# echo "thissss isss a test lineee" | tr -s 'se'
this is a test line
-t [set1]替换成[set2]
将输入字符由大写转换成小写:
[root@localhost ~]# echo "HELLO WORLD" | tr 'A-Z' 'a-z'
hello world
#和-t 一样的作用
[root@localhost ~]# echo "HELLO WORLD" | tr -t "A-Z" "a-z"
hello world
'A-Z'和'a-z’ 都是集合,集合是可以自己制定的,例如:‘{ABCD}’、‘bB,.’、‘a-de-h’、‘a-c0-9’都属于集合,集合里可以使用’\n‘、’\t‘,也可以使用其他ASCII字符。
将空格转换为+:
[root@ceshi xargs]# echo "a b c d " | tr ' ' '+'
a+b+c+d+
巧妙使用tr做数字相加操作:
echo '1 2 3 4 5' | xargs -n1 | echo $[ $(tr '\n' '+') 0 ]
删除windows文件造成的 ’^M‘ 字符:
cat file | tr -s "\r" "\n" > new_file
或
cat file | tr -d "\r" > new_file
tr可以使用的字符类:
[:alnum:]:字母和数字
[:alpha:]:字母
[:cntrl:]:控制(非打印)字符
[:digit:]:数字
[:graph:]:图形字符
[:lower:]:小写字母
[:print:]:可打印字符
[:punct:]:标点符号
[:space:]:空白字符
[:upper:]:大写字母
[:xdigit:]:十六进制字符
使用方式:
tr '[:lower:]' '[:upper:]'
[root@ceshi xargs]# echo "AbCdefg" | tr '[:lower:]' '[:upper:]'
ABCDEFG