基于图的图像分割

精选转载

donglindonglin 2015-05-07 15:31:13 博主文章分类：matlab

图像分割—基于图的图像分割（Graph-Based Image Segmentation）

Reference:

Efficient Graph-Based Image Segmentation,IJCV 2004,MIT Code

Graph-Based Segmentation 是经典的图像分割算法，作者Felzenszwalb也是提出DPM算法的大牛。该算法是基于图的贪心聚类算法，实现简单，速度比较快，精度也还行。不过，目前直接用它做分割的应该比较少，毕竟是99年的跨世纪元老，但是很多算法用它作垫脚石，比如Object Propose的开山之作《Segmentation as Selective Search for Object Recognition》就用它来产生过分割（oversegmentation）。还有的语义分割(senmatic segmentation )算法用它来产生超像素（superpixels）具体忘记了……

图的基本概念

因为该算法是将照片用加权图抽象化表示，所以补充图的一些基本概念。

图是由顶点集基于图的图像分割_基于图论的图像分割（vertices）和边集基于图的图像分割_基于图论的图像分割_02 （edges）组成，表示为基于图的图像分割_基于图论的图像分割_03 ，顶点基于图的图像分割_基于图论的图像分割_04 ，在本文中即为单个的像素点，连接一对顶点的边基于图的图像分割_基于图论的图像分割_05 具有权重，本文中的意义为顶点之间的不相似度，所用的是无向图。

基于图的图像分割_基于图论的图像分割_07

树：特殊的图，图中任意两个顶点，都有路径相连接，但是没有回路。如上图中加粗的边所连接而成的图。如果看成一团乱连的珠子，只保留树中的珠子和连线，那么随便选个珠子，都能把这棵树中所有的珠子都提起来。如果，i和h这条边也保留下来，那么h,I,c,f,g就构成了一个回路。

最小生成树（MST, minimum spanning tree）：特殊的树，给定需要连接的顶点，选择边权之和最小的树。上图即是一棵MST

基于图的图像分割_基于图论的图像分割_08

本文中，初始化时每一个像素点都是一个顶点，然后逐渐合并得到一个区域，确切地说是连接这个区域中的像素点的一个MST。如图，棕色圆圈为顶点，线段为边，合并棕色顶点所生成的MST，对应的就是一个分割区域。分割后的结果其实就是森林。

相似性

既然是聚类算法，那应该依据何种规则判定何时该合二为一，何时该继续划清界限呢？

对于孤立的两个像素点，所不同的是颜色，自然就用颜色的距离来衡量两点的相似性，本文中是使用RGB的距离，即基于图的图像分割_基于图论的图像分割_09

当然也可以用perceptually uniform的Luv或者Lab色彩空间，对于灰度图像就只能使用亮度值了，此外，还可以先使用纹理特征滤波，再计算距离，比如，先做Census Transform再计算Hamming distance距离。

全局阈值à自适应阈值

上面提到应该用亮度值之差来衡量两个像素点之间的差异性。对于两个区域（子图）或者一个区域和一个像素点的相似性，最简单的方法即只考虑连接二者的边的不相似度。

基于图的图像分割_基于图论的图像分割_10

如图，已经形成了棕色和绿色两个区域，现在通过紫色边来判断这两个区域是否合并。那么我们就可以设定一个阈值，当两个像素之间的差异（即不相似度）小于该值时，合二为一。迭代合并，最终就会合并成一个个区域，这就是区域生长的基本思想：星星之火，可以燎原。

基于图的图像分割_基于图论的图像分割_11 基于图的图像分割_基于图论的图像分割_12

显然，上面这张图应该聚成右图所思的3类，高频区h,斜坡区s,平坦区p。如果我们设置一个全局阈值，那么如果h区要合并成一块的话，那么该阈值要选很大，但是那样就会把p和s区域也包含进来，分割结果太粗。如果以p为参考，那么阈值应该选特别小的值，那样的话，p区是会合并成一块，但是，h区就会合并成特别特别多的小块，如同一面支离破碎的镜子，分割结果太细。

显然，全局阈值并不合适，那么自然就得用自适应阈值。对于p区该阈值要特别小，s区稍大，h区巨大。

对于两个区域（原文中叫Component,实质上是一个MST,单独的一个像素点也可以看成一个区域）,本文使用了非常直观，但抗干扰性并不强的方法。先来两个定义，原文依据这两个附加信息来得到自适应阈值。

一个区域的类内差异：

基于图的图像分割_基于图论的图像分割_14

可以近似理解为一个区域内部最大的亮度差异值，定义是MST中不相似度最大的一条边。

两个区域的类间差异：

基于图的图像分割_基于图论的图像分割_16

即连接两个区域所有边中，不相似度最小的边的不相似度，也就是两个区域最相似的地方的不相似度。

那么直观的判断是否合并的标准：

基于图的图像分割_基于图论的图像分割_17

等价条件

基于图的图像分割_基于图论的图像分割_18

解释：基于图的图像分割_基于图论的图像分割_19 ，基于图的图像分割_基于图论的图像分割_20 分别是区域基于图的图像分割_基于图论的图像分割_21 和基于图的图像分割_基于图论的图像分割_22 所能忍受的最大差异，当二者都能忍受当前差异基于图的图像分割_基于图论的图像分割_23 时，你情我愿，一拍即合，只要有一方不愿意，就不能强求。

特殊情况，当二者都是孤立的像素值时，基于图的图像分割_基于图论的图像分割_24 ，所有像素都是"零容忍"只有像素值完全一样才能合并，自然会导致过分割。所以刚开始的时候，应该给每个像素点设定一个可以容忍的范围，当生长到一定程度时，就应该去掉该初始容忍值的作用。原文条件如下

基于图的图像分割_基于图论的图像分割_25 增加项基于图的图像分割_基于图论的图像分割_26 :

基于图的图像分割_基于图论的图像分割_27

其中基于图的图像分割_基于图论的图像分割_28 为区域基于图的图像分割_基于图论的图像分割_29 所包含的像素点的个数，如此，随着区域逐渐扩大，这一项的作用就越来越小，最后几乎可以忽略不计。那么基于图的图像分割_基于图论的图像分割_30 就是一个可以控制所形成的的区域的大小，如果，基于图的图像分割_基于图论的图像分割_31 那么，几乎每个像素都成为了一个独立的区域，如果基于图的图像分割_基于图论的图像分割_32 ，显然整张图片都会聚成一块。所以，基于图的图像分割_基于图论的图像分割_33 越大，分割后的图片也就越大。

当然，可以采用中位数来应对超调，不过这就变成了一个NP难问题，证明见原文

形状相似

前面提到的用颜色信息来聚类，修改相似性衡量标准，可以聚类成我们想要的特定形状。比如我们希望得到很多长条形的区域，那么可以用聚类后的所形成的区域的 面积/周长 + 亮度值的差 衡量两个子图或者两个像素之间的相似度。因为长条形的面积/周长会比较小。

算法步骤

Step 1: 计算每一个像素点与其8邻域或4邻域的不相似度。

基于图的图像分割_基于图论的图像分割_34

如左边所示，实线为只计算4领域，加上虚线就是计算8邻域，由于是无向图，按照从左到右，从上到下的顺序计算的话，只需要计算右图中灰色的线即可。

Step 2: 将边按照不相似度non-decreasing排列（从小到大）排序得到基于图的图像分割_基于图论的图像分割_35 。

Step 3: 选择基于图的图像分割_基于图论的图像分割_36

Step 4: 对当前选择的边基于图的图像分割_基于图论的图像分割_37 进行合并判断。设其所连接的顶点为基于图的图像分割_基于图论的图像分割_38 。如果满足合并条件：

（1）基于图的图像分割_基于图论的图像分割_39 不属于同一个区域基于图的图像分割_基于图论的图像分割_40 ；

（2）不相似度不大于二者内部的不相似度。基于图的图像分割_基于图论的图像分割_41 则执行Step 4。否则执行Step 5

Step 5: 更新阈值以及类标号。

更新类标号：将基于图的图像分割_基于图论的图像分割_42 的类标号统一为基于图的图像分割_基于图论的图像分割_43 的标号。

更新该类的不相似度阈值为：基于图的图像分割_基于图论的图像分割_44 。

注意：由于不相似度小的边先合并，所以，基于图的图像分割_基于图论的图像分割_45 即为当前合并后的区域的最大的边，即基于图的图像分割_基于图论的图像分割_46 。

Step 6: 如果基于图的图像分割_基于图论的图像分割_47 ，则按照排好的顺序，选择下一条边执行Step 4，否则结束。

结果

基于图的图像分割_基于图论的图像分割_48

基于图的图像分割_基于图论的图像分割_49 基于图的图像分割_基于图论的图像分割_50

Segmentation parameters: sigma = 0.5, k= 500, min = 50.

Sigma：先对原图像进行高斯滤波去噪，sigma即为高斯核的基于图的图像分割_基于图论的图像分割_51

k: 控制合并后的区域的大小，见前文

min: 后处理参数，分割后会有很多小区域，当区域基于图的图像分割_基于图论的图像分割_52 像素点的个数基于图的图像分割_基于图论的图像分割_53 小于min时，选择与其差异最小的区域基于图的图像分割_基于图论的图像分割_54 合并即基于图的图像分割_基于图论的图像分割_55 。

性质讨论

结果虽然不是很好，但有很好的全局性质，结论很有意思，有兴趣的可以看看。

首先要说明的是，对于任何图像，始终存在一种分割方法，使得分割的结果既不过细，也不过粗。但是并不唯一。

引理

如果step 4 时，基于图的图像分割_基于图论的图像分割_56 ，但并没有合并，即基于图的图像分割_基于图论的图像分割_57 ，那么肯定有一个区域已经分割好了，比如基于图的图像分割_基于图论的图像分割_58 ，那么区域基于图的图像分割_基于图论的图像分割_59 的范围就不会再有增加，它将会成为最终的分割区域中的一个区域。

Proof:

假设，基于图的图像分割_基于图论的图像分割_60 ，由于边是按照non-decreasing排序，所以剩下的连接基于图的图像分割_基于图论的图像分割_61 的边的不相似度肯定都不低于基于图的图像分割_基于图论的图像分割_62 ，最小的边都不行，其余的边自然是靠边站了。

不过，原文说只能只有一个已经分割好了，但是我觉得还有一种情况，基于图的图像分割_基于图论的图像分割_63 并且基于图的图像分割_基于图论的图像分割_64 ，那么这两个区都应该分好了才对呀。

Not Too fine

分割太细，也就是本来不应该分开的区域被拦腰截断，但是本算法是能保证有情人终成眷属的，绝对不会干棒打鸳鸯拆散一对是一对的事。

Proof:

基于图的图像分割_基于图论的图像分割_65

反证法：如上图。本不应该分割，则应该满足条件基于图的图像分割_基于图论的图像分割_66 。如果分开了，那么必定存在一条边基于图的图像分割_基于图论的图像分割_67 导致二者没有合并，那么由前面的引理，必定存在一个区域成为最终分割结果的一部分，假设为A部分，再回溯到判断这条边的时候，必定有，基于图的图像分割_基于图论的图像分割_68 ，从而基于图的图像分割_基于图论的图像分割_69 ，由于是按non-decreasing 顺序，所以A部分和B部分最小的边就是基于图的图像分割_基于图论的图像分割_70 ，那么基于图的图像分割_基于图论的图像分割_71 与假设条件矛盾。

Not Too coarse

分割太粗，也就是本应该分开的区域没有分开。但本算法能保证当断则断，不会藕断丝连。

反证法：如上图。本应该分割，则应满足条件基于图的图像分割_基于图论的图像分割_72 。假设还是基于图的图像分割_基于图论的图像分割_73 ，基于图的图像分割_基于图论的图像分割_74 为连接A,B最小的边。如果合并了，由于基于图的图像分割_基于图论的图像分割_75 ，而且是non-decreasing 顺序，所以在判定边基于图的图像分割_基于图论的图像分割_76 之前A区域已经形成。如果分割过粗，则判定这条边时最小的边满足基于图的图像分割_基于图论的图像分割_77 ，则必定基于图的图像分割_基于图论的图像分割_78 使得二者合并了。和条件矛盾。

等权边处理先后次序的影响

如果两条边基于图的图像分割_基于图论的图像分割_79 ，基于图的图像分割_基于图论的图像分割_80 的权值相同，那么排序时候，谁排前头，谁落后面有影响吗？结论是木有。

Proof:

Case1：基于图的图像分割_基于图论的图像分割_81 ，基于图的图像分割_基于图论的图像分割_82 连接的区域相同，即基于图的图像分割_基于图论的图像分割_83 ，基于图的图像分割_基于图论的图像分割_84 连接的都是区域基于图的图像分割_基于图论的图像分割_85 ，那么它俩谁在前面都没关系。

Case2：基于图的图像分割_基于图论的图像分割_86 ，基于图的图像分割_基于图论的图像分割_87 连接的区域完全不同，比如基于图的图像分割_基于图论的图像分割_88 连接区域，基于图的图像分割_基于图论的图像分割_89 ，基于图的图像分割_基于图论的图像分割_90 连接区域基于图的图像分割_基于图论的图像分割_91 ,那么谁先谁后，都不影响基于图的图像分割_基于图论的图像分割_92 是否合并，也不影响基于图的图像分割_基于图论的图像分割_93 是否合并。

Case3：基于图的图像分割_基于图论的图像分割_94 连接基于图的图像分割_基于图论的图像分割_95 , 基于图的图像分割_基于图论的图像分割_96 连接基于图的图像分割_基于图论的图像分割_97

Case3-1：基于图的图像分割_基于图论的图像分割_98 在先，基于图的图像分割_基于图论的图像分割_99 在后，并且，基于图的图像分割_基于图论的图像分割_100 使得基于图的图像分割_基于图论的图像分割_101 合并，交换二者处理顺序，先处理基于图的图像分割_基于图论的图像分割_102 ，后处理基于图的图像分割_基于图论的图像分割_103 。如果基于图的图像分割_基于图论的图像分割_104 不合并基于图的图像分割_基于图论的图像分割_105 ，那不影响基于图的图像分割_基于图论的图像分割_106 合并基于图的图像分割_基于图论的图像分割_107 ；如果基于图的图像分割_基于图论的图像分割_108 合并基于图的图像分割_基于图论的图像分割_109 ，那么合并后的基于图的图像分割_基于图论的图像分割_110 ，照样合并。

Case3-2：基于图的图像分割_基于图论的图像分割_111 在先，基于图的图像分割_基于图论的图像分割_112 在后，并且，基于图的图像分割_基于图论的图像分割_113 不合并基于图的图像分割_基于图论的图像分割_114 ，交换二者处理顺序，先处理基于图的图像分割_基于图论的图像分割_115 ，后处理基于图的图像分割_基于图论的图像分割_116 。如果是基于图的图像分割_基于图论的图像分割_117 。那基于图的图像分割_基于图论的图像分割_118 是否合并基于图的图像分割_基于图论的图像分割_119 ，都不会使得基于图的图像分割_基于图论的图像分割_120 合并；如果基于图的图像分割_基于图论的图像分割_121 ,那同样也有基于图的图像分割_基于图论的图像分割_122 ，同样也没影响。

补充：彩***片

对于彩***片，上文是将R,G,B作为距离，整张图片只进行一次分割，原文说对每一个通道都进行一次分割，最后对结果取交集，也就是说图片中的两个点要划分到同一个区域，则在R,G,B三个通道的划分结果中，它俩得始终在同一个区域。原文说这样效果更好……不过他的程序是采用一次分割。

Nearest Neighbor Graphs

前文是只用了空间位置基于图的图像分割_基于图论的图像分割_123 来构件图的连接关系，缺点是明显的，空间不相邻，色彩完全一样也白搭，于是中间稍微有断开都会分成多个部分。于是另一种更为平等的策略是二者一块考虑，先映射到特征空间基于图的图像分割_基于图论的图像分割_124 ，再构建图。此时有连接关系的就不一定是4/8邻域了，由于有基于图的图像分割_基于图论的图像分割_125 对边，因此如果考虑所有边的连接关系的话，太恐怖了！原文是对每个像素点找10个欧氏距离最近的点即10最近邻，构建图，当然，另外一种方法不是固定邻居数目，而是限定距离范围。