1. 用途

tr,translate的简写,主要用于压缩重复字符,删除文件中的控制字符以及进行字符转换操作。

2. 语法



  1. tr [OPTION]... SET1 [SET2]

3. 参数

3.1 -s 压缩重复字符

-s: squeeze-repeats,用SET1指定的字符来替换对应的重复字符 (replace each input sequence of  a  repeated  character  that  is listed in SET1 with a single occurrence of that character)



  1. xiaosi@Qunar:~/test$ echo "aaabbbaacccfddd" | tr -s [abcdf] // abacfd


可以使用这一特点,删除文件中的空白行,实质上跟上面一样,都是用SET1指定的字符来替换对应的重复字符




  1. xiaosi@Qunar:~/test$ cat b.txt
  2. I like football


  3. Football is very fun!

  4. Hello
  5. xiaosi@Qunar:~/test$ cat b.txt | tr -s ["\n"]
  6. I like football
  7. Football is very fun!
  8. Hello



3.2 -d 删除字符

-d:delete,删除SET1中指定的所有字符,不转换(delete characters in SET1, do not translate)



  1. xiaosi@Qunar:~/test$ echo "a12HJ13fdaADff" | tr -d "[a-z][A-Z]"
  2. 1213
  3. xiaosi@Qunar:~/test$ echo "a1213fdasf" | tr -d [adfs]
  4. 1213


3.3 字符替换

-t:truncate,将SET1中字符用SET2对应位置的字符进行替换,一般缺省为-t



  1. xiaosi@Qunar:~/test$ echo "a1213fdasf" | tr -t [afd] [AFO] // A1213FOAsF


上述代码将a转换为A,f转换为F,d转换为O。

可以利用这一特点,实现大小字母的转换



  1. xiaosi@Qunar:~/test$ echo "Hello World I Love You" |tr -t [a-z] [A-Z]
  2. HELLO WORLD I LOVE YOU
  3. xiaosi@Qunar:~/test$ echo "HELLO WORLD I LOVE YOU" |tr -t [A-Z] [a-z]
  4. hello world i love you

也可以利用字符集合进行转换


  1. xiaosi@Qunar:~/test$ echo "Hello World I Love You" |tr -t [:lower:] [:upper:]
  2. HELLO WORLD I LOVE YOU
  3. xiaosi@Qunar:~/test$ echo "HELLO WORLD I LOVE YOU" |tr -t [:upper:] [:lower:]
  4. hello world i love you



备注:

字符集合如下



  1. \NNN 八进制值的字符 NNN (1 to 3 为八进制值的字符)
  2. \\ 反斜杠
  3. \a Ctrl-G 铃声
  4. \b Ctrl-H 退格符
  5. \f Ctrl-L 走行换页
  6. \n Ctrl-J 新行
  7. \r Ctrl-M 回车
  8. \t Ctrl-I tab键
  9. \v Ctrl-X 水平制表符
  10. CHAR1-CHAR2 从CHAR1 到 CHAR2的所有字符按照ASCII字符的顺序
  11. [CHAR*] in SET2, copies of CHAR until length of SET1
  12. [CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0
  13. [:alnum:] 所有的字母和数字
  14. [:alpha:] 所有字母
  15. [:blank:] 水平制表符,空白等
  16. [:cntrl:] 所有控制字符
  17. [:digit:] 所有的数字
  18. [:graph:] 所有可打印字符,不包括空格
  19. [:lower:] 所有的小写字符
  20. [:print:] 所有可打印字符,包括空格
  21. [:punct:] 所有的标点字符
  22. [:space:] 所有的横向或纵向的空白
  23. [:upper:] 所有大写字母



3.4 字符补集替换

-c:complement,用SET2替换SET1中没有包含的字符



  1. xiaosi@Qunar:~/test$ cat a.txt
  2. Monday 09:00
  3. Tuesday 09:10
  4. Wednesday 10:11
  5. Thursday 11:30
  6. Friday 08:00
  7. Saturday 07:40
  8. Sunday 10:00
  9. xiaosi@Qunar:~/test$ cat a.txt | tr -c "[a-z][A-Z]" "#" | tr -s "#" | tr -t "#" "\n"
  10. Monday
  11. Tuesday
  12. Wednesday
  13. Thursday
  14. Friday
  15. Saturday
  16. Sunday


上面代码中 tr -c "[a-z][A-Z]" "#" 表示将除大小字母以外的所有的字符都替换为#。

上面代码可优化为:



    1. xiaosi@Qunar:~/test$ cat a.txt | tr -cs "[a-z][A-Z]" "\n"
    2. Monday
    3. Tuesday
    4. Wednesday
    5. Thursday
    6. Friday
    7. Saturday
    8. Sunday


技术链接