-diff -comm

原创

87305931 2012-09-27 22:42:19 ©著作权

文章标签 shell 文章分类 软件测试

©著作权归作者所有：来自51CTO博客作者87305931的原创作品，请联系作者获取转载授权，否则将追究法律责任

-diff

这又是一个文件比较命令，熟练掌握会节省你很多工作。还记得comm命令吗？diff比他更加复杂，好用，不仅能比较文件，还能比较目录。当一个文件有多个版本时候，或者更多复杂的文件，目录比较时，你会期望有一个比comm更有用的命令，diff正是为此而生。
全称：different file
实例：
文件1： v1.txt

hello
world v1_echo
v1_diff
v1_comm
shell is easy!文件2： v2.txt

hello world!
v2_echo
v1_diff
easy shell!

1.普通比较：

$diff v1.txt v2.txt

1,2c1,2
< hello world
< v1_echo
---
> hello world!
> v2_echo
4c4
< v1_comm
---
> easy shell!

列出比较的区别，数字为行数，c是compare
2.一体化输出：

$diff -u v1.txt v2.txt > version.patch

-v1_echo
+hello world!
+v2_echo
v1_diff
-v1_comm
+easy shell!
shell is easy!

"+"表示补充的行，"-"表示删去的行
3. 更新覆盖v1.txt,注意这里借用了patch

$patch –p1 v1.txt< version.patch

4. 比较v1,v2文件，仅输出v2的变化

$diff -e v1.txt v2.txt

4c
easy shell!
.
1,2c
hello world!
v2_echo
.

5.比较目录
借用书上一段解释：
-N 将所有确实的文件视为空文件
-a 将所有文件市委文件文本
-u 生成一体化输出
-r 遍历目录下的所有文件
比较两个目录下所有文本信息

$diff –Naur directory1 directory2

除非你确定这两个目录基本相同，不然不推荐这么用。

6.工作疲劳后，尤其同时做很多事情的时候，会忘了有没有做过上传，或者修改某个目录下的文件。可以这样：

$diff v1.txt /${dir}

直接比较同名文件，高强度下的工作者相信真有体会。

解读下—help
太长，截取少部分解读一下。

Mandatory arguments to long options are mandatory for short options too.
--normal                                     output a normal diff (the default)
-q, --brief                                     report only when files differ
-s, --report-identical-files             report when two files are the same
-c, -C NUM, --context[=NUM] output NUM (default 3) lines of copied context
-u, -U NUM, --unified[=NUM]    output NUM (default 3) lines of unified context
-e, --ed                                        output an ed script
-n, --rcs                                        output an RCS format diff
-y, --side-by-side                         output in two columns
FILES 的格式可以是‘FILE1 FILE2’、‘DIR1 DIR2’、‘DIR FILE...’或
‘FILE... DIR’。

解读：
1.-q –s
-q: 只有两个不同是，提示“两个文件不同”
-s: 两个文件相同时，提示“两个文件相同”
$diff -qs v1.txt v2.txt
(有点无聊的命令 )
2. –y
按照列的方式输出，增加了直观性

hello world             | hello world!
v1_echo                   | v2_echo
v1_diff                      v1_diff
v1_comm                | easy shell!
shell is easy!             shell is easy!

3. file 后面的格式
可以是1.文件文件  2.目录与目录  3.文件与目录 4. 目录与文件
解释一下，文件与目录的形式，比较的是该目录下与比较文件同名的文件比较
如：$ diff v1.txt  diff/
则实际是v1.txt 与 diff/v1.txt的比较。这是个很常用的功能。

对比comm
就比较文件而言，comm功能比较简单，但是也很直观，方便
而diff 提供了更强大，更复杂的比较方式，还能对比目录，遍历目录。

-comm

题外话：说到比较文件，过来人都用过Beyond Compare，老版本时候，我们只能右键选中用于比较的文件，再选中被比较文件,对比。如今他有了丰富的界面，支持linux上比较文件。干什么用的？svn管理不善的时候，版本控制做的不好的时候，你就会期望他了。这都是经验- -！
回到正题：在shell中，也有个这么个命令---comm。 comm可用于两个文件之间的比较。可以用于文件的比较，交集，求差以及差集操作。
这个定义其实不够详细，应该是 comm逐行比较已排序的文件1和文件2.
全称：
（惭愧）没有找到合适的全称。 com 很明显是compare开头，m为mode。望高手指正。
查看—help
用法：comm [选项]... 文件1 文件2
逐行比较已排序的文件文件1 和文件2。
如果不附带选项，程序会生成三列输出。第一列包含文件1 特有的行，第二列包含文件2 特有的行，而第三列包含两个文件共有的行。
  -1       不输出文件1 特有的行
  -2       不输出文件2 特有的行
  -3       不输出两个文件共有的行
  --check-order          检查输入是否被正确排序，即使所有输入行均成对
  --nocheck-order       不检查输入是否被正确排序
  --output-delimiter=STR 依照STR 分列
解读：
1. --check-order
该命令默认情况下  如果希望不检验排序，可以--nocheck-order。
2. --output-delimiter=STR
STR 就是个表达式。可以是任何非特殊字符
3. -1，-2
  可以写成 -12 与普通命令用起来一样
  实例：
1.建立A.txt
加入元素
apple
orange
gold
silver
steel
iron
2. 建立B.txt
加入元素
orange
gold
cookies
carrot
可以尝试直接比较: comm A.txt B.txt
你会发现提示一个错误，没有排序。
3. 排序

sort A.txt -o A.txt; sort B.txt -o B.txt

4. 比较

$comm A.txt B.txt

carrot cookies
gold iron
orange silver
steel

结果实际为3列其中第一列是文件1特有 -1表示删除第一列
第二列是文件2特有的  -2代表删除第二列
第三列代表共同有的  -3代表删除共有的列

4.1 打印交集：
$comm –12 A.txt B.txt
4.2 打印两个文件中不同的行
$comm –3 A.txt B.txt
补充个小修改，两列不好看，用sed删除行首的\t
$comm –3 A.txt B.txt | sed 's/^\t//'

实战：
  comm在实战中，只会在一些非常特殊的场景中用到。比较简单，就不举例了。（笔者遇到的场景中，仍然坚持有更好的方案时候，不用这个命令）。